人人書

雜誌

保存到桌面 | 簡體人人書 | 手機版
傳記回憶文學理論偵探推理驚悚懸疑詩歌戲曲雜文隨筆小故事書評雜誌
人人書 > 雜誌 > 機器人試圖擺平高考

機器人試圖擺平高考

時間:2024-10-19 06:54:45

6月7日17點,2017年高考第一日結束,數學學科停筆交卷的鈴聲劃破長空。北京第八十中學望京校區人潮湧動,結束數學厮殺的考生正陸續走出考場,有歡有悲,神色各異。

此時,相隔5公裡外的麗都皇冠假日酒店,另一場同樣試題的考試已經展開,考生是名為Aidam的人工智能程序。經曆3年研發,被學霸君的200位技術工程師喂下50萬道考題後,Aidam開始正式嘗試2017年新課标文科數學卷。

同一時間,相隔千裡之外的四川省成都市高新區,另一場機器人答題的活動也已經開始。比起Aidam,準星雲學科技(以下簡稱準星)取名更為直接:AIMATHS,據說已經是一位平均分達90的數學答題機手。

2017年的高考是兩家科技公司——學霸君和準星要征服的目标。事實上,這場AI與人的角逐6年前就開始了,而且還是“國家任務”。

從“拍照搜題”開始學習

2012年6月的某一天,在投資公司工作的張凱磊坐在辦公室,收到一封同學發來的群郵件,内容是一篇Google尚未發表的論文,揭示這一輪人工智能學習的大浪潮。

這篇論文将在發表後引起巨大反響,很快,全世界都将知道Google在秘密實驗室Xlab做出關于“貓臉識别”的驚人研究。

“教學會因此迎來徹底變革。”張凱磊說。張凱磊是南開大學數學系出身,曾在大二辍學創辦過一家教育培訓機構,因此這成了第一個跳入他腦中的想法。

10月,張凱磊果斷辭掉投資公司的工作,邀請陳銳峰博士加入,開始籌備創業。一年後,主打“拍照搜題”的學霸君面世,它将為日後的高考機器人Aidam提供大量的題庫儲備。

這個時期的中國高考機器人,正在襁褓中孕育着能量。

高考機器人開端于2011年。來自日本國立情報學研究所(NII)的新井紀子教授領頭發起“東大機器人計劃”。她召集超過100名人工智能領域的專家組成專項團隊,目标是讓機器人Torobo能在2021年前通過東京大學的入學考試。

這一年,另一個中國人林輝,在無數次碰壁後,找到清華大學蘇研院。那時人工智能的概念尚未在國内蘇醒,這個領域的創業公司寥寥,很多投資人不理解這個概念,“聊項目之前得先給他們科普”。

清華大學蘇研院大數據中心的成立,加速研發進程。林輝擔任數據中心主任,到2014年,大數據中心旗下的智慧教育事業部将被分出來成立為準星雲學科技有限公司,林輝任CEO,并在不久後承擔起開發高考機器人AI-MATHS的責任。

“國家任務”

2015年7月21日,合肥一間會議室裡,數十位專家領導圍坐在一張棕色的圓桌旁,圓桌中間擺着一大簇鮮花,每個人身邊都放着一個白色茶杯,頭頂上拉着一條紅底黃字的大橫幅。在這個極其傳統的會議場景中,正讨論着十分前沿的主題。

這裡正召開國家“十二五”863計劃信息技術領域“基于大數據的類人智能關鍵技術與系統”項目啟動會暨研讨會。會議探讨并啟動“國家863類人智能項目”,主要任務是在3-5年時間内研制出能夠參加高考并考取大學的智能機器人。

這款智能機器人不僅可以儲存知識和高考題型,還将具有邏輯推理能力。此外,通過建立模型和算法,可以讓機器在大數據中找到數據之間的關系和差異,讓這個模型的結果和人的表現很接近,甚至在最終結果上超過人的表現。

項目由科大訊飛牽頭,聯合包括清華大學在内的30家院校和單位。當天,日本教授新井紀子也出現在會議席上。

時間回溯到5月的某一天,正在NII工作的新井紀子收到一封郵件,郵件由科大訊飛發出,意欲與NII共同開發考試機器人。郵件提到,中國将推出一個國家級項目來開發考試機器人,前三年的預算大概是30億日元,新井紀子在收到郵件後很感慨,他們在“東大機器人計劃”上的花費大概為每年數百萬日元。

她很快同意這項合作,并在7月到訪中國。

林輝的準星在人工智能領域的長期研究起到了作用。立項後,準星一舉中标高考機器人的數學應考項目,成為數學組别的組長單位。當時,人工智能識别、大數據處理等難關已經被準星攻破。

研發團隊立下目标,要在2017年6月與全國文科生一起考試,目标是考上一本。

這并不是一個容易實現的目标。當時,已經研究四年的Torobo還無法達到日本入學考試分數線。上線兩年的學霸君隻能在數學考試中得到30分。消息一出,有網友評論下四個字:“坐等打臉。”

日本的高考機器人有兩條可以靈巧活動的機械臂,左手捏着固定爪,右手握着圓珠筆在試卷上進行答題(東方IC圖)找到數千萬學霸的解題經驗

“參加大學入學考試對人工智能來說是一個很好的目标。”新井紀子說。

從2013年開始,Torobo每年都會參加日本大學入選考試,2015年的11月,它在考試中取得511分的成績,總分950分,平均分數416分。這意味着,它可以進入全日本441家私立大學和33所全國性大學就讀,排名在全國前20%,其中數學排名前1%。

這是Torobo迄今為止取得的最佳成績。但它仍然未能考入東京大學。與中國機器人的虛拟系統不同,Torobo擁有一個真實的身體。它是白色的,有兩條可以靈巧活動的機械臂,左手捏着固定爪,右手握着圓珠筆在試卷上進行答題。

确切說,高考是比圍棋更難的實驗,它要求機器有感知分析、認知聯想和推理驗證的能力,其泛化知識庫裡的規則,遠比圍棋的黑白、點位置和吃子規則複雜得多。

科大訊飛輪值總裁吳曉如指出,在具體攻關中,讓機器人高考包括題目理解、知識表現、邏輯推理等,涉及怎樣用人機互助的方式獲得知識。此外,還要讓機器學會表達,比如作文、閱讀理解,就既需要讀懂文章、去理解題目的意思,同時還需要去理解相應常識。

微軟亞洲研究院非常具體地解釋過機器在考數學方面會遭遇的挑戰:一方面,對于一道題目的文字描述,計算機需要知道并理解其中包含的概念,對于人類很簡單的概念,對機器卻需要自然語言理解方面的“造詣”。

舉例來說,“一加一等于幾”以及“小明有一個蘋果和一個梨,問小明有幾個水果”,同樣本質是“1+1=?”的兩道題,在題型概念上是一樣的,表達方式卻截然不同。計算機需要知道如何把以上兩道問題都抽象成兩個對象相加。

另一方面,機器抽取題目中各個概念變量的關系也很有難度。其次,在一定程度上理解文字之後,數學解題需要通過邏輯推理生成解題公式。最後,計算機需要具有一定有關現實世界的常識去理解自然語言裡面一些隐式的指代。

93分

2月23日,林輝的數學高考機器人AI-MATHS第一次測試。

這一天,林輝帶着他的系統來到成都石室天府中學,将與高三文科班的43名學生進行一場“人機大戰”。這是AIMATHS首次與學生對決。

氣氛很緊張。高三數學老師拿着一個黃色密封袋,嚴肅地走進高三5班和6班的教室,密封袋裡裝着即将測試的數學試卷,老師站在講台上,舉起密封袋,展示其完好無損,接着解開密封袋的繩索,抽出一疊試卷。學生們端坐在下面,望着他,激動中帶着忐忑。

旁邊的辦公室裡,一個隔間的工位上放着兩台未聯網的台式電腦,穿黑色外套的技術人員将一個磁盤插入主機,随後坐在電腦面前,開始快速地點擊鼠标,電腦屏幕上出現一行行密密麻麻的數字。

試卷被一張張依次發到學生桌上,同時題目被一道道地輸入電腦,答題開始了,接下來兩個小時是緊張的等待。

林輝不知道結果會如何,他感慨了一句:“想給系統燒上幾炷香。”高三學生佘雨佳覺得自己肯定要輸給人工智能了,她略顯悲壯地說:“感覺我們是為人類的榮譽而戰”。

答題結束,電腦連上打印機,打印出紙質版的試卷答案,老師收上學生試卷,當場批改了這44份試卷。

事實證明,這一戰,人類赢了。高考機器人的試卷審批完畢,老師在分數欄寫下了數字“93”,而43名學生的平均成績在計算器上的顯示結果是“106”。

結果在林輝的預料之中。當時的AIMATHS每天要吃10套題,運算量可達2的800次方。截止這次測試,機器僅有100套試題的訓練量。“它不是題庫,而是理解答題的邏輯。”這是林輝對數學機器人的解釋。

他給AI-MATHS定下目标:6月7号上重本分數線。

考試前三個月還讀不懂幾何

很長一段時間,學霸君在機器學習上的進展極其緩慢。從2012年10月創業以來,學霸君的工程師做過許多努力,三年時間隻把分數從0分提高到40分左右,其中從0分到30分大概用6個月,之後兩年多的時間基本在原地踏步,無法取得突破,很多做這個項目的人最終都選擇離開。

2016年3月20号,張凱磊正在美國出差。晚上11點,他接到首席科學家陳銳鋒打來的電話,對方告訴他說,最近兩個禮拜,機器學習突然取得實質性突破,智能機器人項目可以開始做了。

陳銳鋒告訴張凱磊,一批龐大的數據喂進去之後,突然發現增速變快,兩周内分數增加了2到3分,這在之前是從未發生過的。在排除誤差之後,工程師們認定,新的方法被證實有效,雖然風險仍舊存在,但這個項目有了可預見的實現可能性。

難題一個接着一個。今年3月之前,學霸君一直無法攻克一個難題——如何将幾何語言轉換為機器能理解的語言。

他在上海組建了一個專攻幾何的團隊,8個人,包括老師和技術人員,每天坐在辦公室裡思考、運算,就這樣過了一整年,一無所獲。

幾何問題解決不了,挑戰高考試題就是無稽之談,張凱磊焦慮地在辦公室走來走去,突然靈機一動,想到一個無策之策。他召集幾何團隊的人員,命令說,從今年往後,老師來學寫代碼,工程師學備課。

前期并無效果,經過幾個月的積累,3月的某一天,就像突然開竅了一樣,這個難題就這麼消失了,張凱磊把這歸功于工程師與老師長期融合的結果。

以“拍照搜題”起家的學霸君,4年來累積超過7000萬道數學題目的題庫系統,加上學生大量手寫和上傳的題目,以及教輔書籍中的題目,共同構成Aidam的訓練數據庫。

階段性成果取得,張凱磊也定下目标——6月7日Aidam将在媒體見證下挑戰高考數學題,與數名高考狀元同台對戰。

但與斷網單機,使用11台服務器的AI-MATHS不同,Aidam需要聯網。這意味着兩者有不同的邏輯。

機器人考生AI-MATHS位于一個關閉外部網絡的房間内參加高考(@視覺中國圖)

一分之差

6月7日,決戰的日子到了。下午5點過後,兩場千裡之隔的“機器高考”開始了。

AI-MATHS機器人的“身體”并非模仿人類的樣子,而是10餘台服務器組成像冰箱一樣的櫃子。它被放在會議室旁邊的休息室裡,孤零零地站在房間中央,被一條白線與外界隔開。

“105分。”主持人說出AI-MATHS的數學高考成績。這張高考試卷,花費了AI-MATHS22分鐘。

與此同時,另一個高考機器人Aidam也在北京的一間會議室裡快速地運算着,它這次的任務是與6名來自不同省份的高考狀元來一次對決。

比賽采用全國高考文科數學二卷,在一小時的考試時間内,兩人合力完成一套試卷。雖然是兩人合作,但中途不可以交流,開考前已決定好分工。最終,三組高考狀元分别得分為146分、140分、119分,平均分為135分,而Aidam的成績為134分。

1分之差,曾經輸給阿法狗的人類,這次在高考面前打敗AI。

不過,毫無疑問的是,在運算速度上人工智能擁有巨大的優勢,Aidam在錄入完整的數學題目後,僅僅在9分47秒就完成所有答題,而高考狀元們則花了1小時。

當然,這兩個高考機器人還不是全部。

科大訊飛研發的是一個“高考文科AI”,他們将進行語文、數學、地理和曆史等四門學科的集中研發。據悉,科大訊飛聯合哈工大進行的英語完形填空和閱讀理解有不錯進展,準确率達70%以上。

相對其他學科,機器考高考數學要“相對”容易一些。一方面,數學更多的是依據符号邏輯,另一方面,數學中很少有“一千個讀者有一千個哈姆雷特”的現象。

從1977年到2017年,大型知識競賽高考——迎來它的四十周年,每年誕生數百萬考生,很多人事後回憶起來,覺得當年沒日沒夜做題的自己與機器人無異,多年過後,高考在命運的不可掌控中消逝它的意義。

那麼,為什麼我們還要耗費如此多的人力物力财力,造出一個機器人來,迎合我們所謂的“應試教育”?

學霸君CEO張凱磊的回答是,如果機器人能夠挑戰高考,有理由相信機器人可以輔道學生,在自動解題、自動批改與個性化作業上幫助學生,這對中國教育來說具有革命性意義。

AI-MATHS的負責人林輝覺得,技術要應用在教育評測上,保證教師、學生、家長的“三減負一增效”。

新井紀子則沒有那麼樂觀。高考機器人的研究讓她重新審視已有的教育方式。“如果AI在那方面能夠做得更好,那說明,我們需要新型教育。”她憂心忡忡地說。
   

熱門書籍

熱門文章