(圖:日本高考機器人 Torobo-kun)
芥末堆 阿槑 6 月 7 日
繼 AlphaGo 與眾多圍棋高手對戰(zhàn)之后,人工智能挑戰(zhàn)中國高考成為新的熱點:兩款數(shù)學(xué)高機器人將參加今年的高考,包括由國家科技部 863 計劃牽頭研制的機器人 AI-MATHS,以及 K12 在線教育公司學(xué)霸君旗下的 Aidam。今天,它們將在斷網(wǎng)環(huán)境下做數(shù)學(xué)高考題。
2011 年,IBM 沃森在智力問答競賽中擊敗人類,贏得冠軍,成為人工智能史上一個里程碑。此后,IBM 沃森向醫(yī)療、法律等領(lǐng)域拓展,轉(zhuǎn)型成為智能醫(yī)療系統(tǒng),以及如果高考機器人考上清華北大,也許會成為另一個里程碑。
會思考的高考機器人
與 AlphaGo 一樣,高考機器人并沒有實體,而是一個能自動解題的人工智能系統(tǒng)。據(jù)介紹,跟以圖像識別和匹配為主的拍照搜題技術(shù)不同,通過提前學(xué)習(xí)和訓(xùn)練,高考機器人能夠解答從未出現(xiàn)過的新題目,并給出詳細的解題步驟。
為什么選擇參加高考?日本高考機器人 Torobo-kun 的研發(fā)團隊曾對此作出過解釋,計算機擅長計算,因此,它能夠輕易在專業(yè)象棋、將棋等對弈游戲擊敗職業(yè)選手,但高考是人類社會的一項高難度測試,對計算機來說,答高考題需不僅僅需要強大的計算能力,更重要的是理解人類的思考過程,以及處理信息的過程。如果通過高考,也代表著人工智能領(lǐng)域的新突破。
學(xué)霸君創(chuàng)始人張凱磊稱,希望通過此次 PK 展示人工智能在教育領(lǐng)域的進展,他對這場特殊的高考充滿信心,“在學(xué)習(xí)了幾千萬道題目之后,機器已經(jīng)能夠像人一樣思考知識點,并一步一步輸出解題過程,而不是簡單的暴力計算”。
據(jù)了解,AI-MATHS 學(xué)習(xí)了小學(xué)到高中的 7000 多個考點,運算量可達到 2 的 800 次方,其研發(fā)團隊準星云學(xué)的創(chuàng)始人林輝認為,跟 AlphaGo 相比,高考機器人的研發(fā)難度更大,原因在于,用計算機語言描述圍棋規(guī)則相對容易,但研發(fā)高考機器人,首先需要讓系統(tǒng)理解人類語言?!氨热缬龅?jīng)]學(xué)過的生詞,人類會聯(lián)系上下文去推測詞義,猜對是比較容易的事;而機器人卻會卡殼?!彼忉屨f。
這正是日本高考機器人 Torobo-kun 放棄高考的原因。自 2013 年起,Torobo-kun 每年都會參加日本高考,它的目標是考入東京大學(xué),在此前的多次考試中,其物理成績不錯,但受制于語言處理能力,在其他科目的成績并不理想。日本高考機器人的研發(fā)負責(zé)人 Noriko Arai 教授表示,在目前的技術(shù)條件下,考上東大很難,她解釋道:“人工智能系統(tǒng)無法理解必要的信息,閱讀和理解句子含義的能力存在局限。”接下來,放棄高考的 Torobo-kun 會被應(yīng)用到數(shù)據(jù)分析領(lǐng)域。
其實,早在高考機器人的概念成為熱門關(guān)鍵詞之前,針對各個專業(yè)領(lǐng)域知識處理的自動問答系統(tǒng)的研發(fā),全球頂尖的研究機構(gòu)已經(jīng)有各類嘗試。比如 1984 年啟動的塞克(Cyc)工程,其目標是建立一個龐大的人類常識知識庫,用于回答和解決一系列的科學(xué)和技術(shù)難題。2002 年啟動的 Project Halo 則是要研發(fā)一個科學(xué)知識庫,用于回答學(xué)生或?qū)I(yè)人員提出的復(fù)雜科學(xué)問題,Project Aristo 則致力于解答標準化考試問題。
AI 如何自動解題?
自動解題系統(tǒng)是人工智能領(lǐng)域的前沿性研究,涉及到人工智能技術(shù)的多個領(lǐng)域,包括圖像識別、語音識別、自然語言處理等,據(jù)學(xué)霸君的首席科學(xué)家陳銳鋒介紹,其解題過程涉及到三個步驟:
一是理解和識別人類語言,把題目變成機器人可解碼、可理解的語言,即通過自然語言處理將人類語言轉(zhuǎn)換為形式語言。
二是邏輯推理,利用計算機的知識語言網(wǎng)絡(luò),模擬人類處理信息的方式和策略,找出最佳解題路徑。
三是用人類的語言回答問題,并給出詳細的解題步驟,即將形式語言轉(zhuǎn)化為自然語言。
其中最大的難點在于讓機器理解人類語言,這也是自動解題系統(tǒng)被公認的核心問題之一:自然語言處理中的語義分析。機器需要首先識別人類的語言,并分析其含義,其中包括各類常識、謎語等隱性的線索,比如數(shù)學(xué)經(jīng)典問題雞兔同籠,其隱含條件是雞有兩條腿,兔有四條腿,而計算機可能并不知道這類常識,它更擅長規(guī)則下的精確計算,但人類的自然語言并不精確。比如在物理解題過程中,假設(shè)忽視物體的大小,以及假設(shè)摩擦為零之類的思考方式,計算機并不能理解。
AI-MATHS 同樣遇到了這樣的情況,當題目中出現(xiàn)機器人從未“學(xué)習(xí)”過的生詞,比如投資、理財?shù)?,它會由于無法理解而卡住。
另外一點則是邏輯推理能力,不同國家的高考機器人研究團隊發(fā)現(xiàn)同一個問題:在不同科目的嘗試中,機器人在文科解題中表現(xiàn)更好。原因在于,理科強調(diào)邏輯理解和推理能力,而機器學(xué)習(xí)在這個領(lǐng)域還未取得重大進展,目前更強調(diào)記憶、計算等能力。因此,數(shù)學(xué)自動解題
高考機器人如何改變教育?
正如研發(fā) IBM 沃森并不僅僅是為了參加智力答題競賽,高考機器人也并不是人工智能系統(tǒng)研發(fā)的最終目的。從學(xué)術(shù)上來講,高考機器人可以檢驗人工智能在多大程度上能夠模擬人類的思考和理解過程,就實際應(yīng)用而言,則是要利用技術(shù)進一步提升老師和學(xué)生教與學(xué)的效率與效果。
2014 年,科技部啟動 863 項目“基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)”,訊飛研究院副院長王士進表示,三年來取得了很多進展,包括認知推理解題、語文學(xué)科自動作文寫作、地理學(xué)科基于知識圖譜自動知識抽取的主觀題答題、歷史學(xué)科基于深度學(xué)習(xí)的推理解題、基于 OCR 手寫文字識別的多維度智能答題評閱等。
這些技術(shù)在教育領(lǐng)域都有其應(yīng)用場景。
>>智能助教
可以為學(xué)生提供實時答疑服務(wù)。IBM Waston 在教育領(lǐng)域推出了Jill Watson 應(yīng)用,試圖成為課堂里面的新助教,負責(zé)為學(xué)生提供實時反饋和答疑服務(wù)。2014 年,該應(yīng)用在佐治亞理工等學(xué)校投入使用。經(jīng)過研究團隊的調(diào)試,Jill 能達到 97% 的正確率。
>>自動批改、閱卷
借助圖像識別和語義分析技術(shù)的融合,實現(xiàn)主觀題的自動批改以及評分,減輕老師的教學(xué)負擔(dān),同時能夠加速在線教學(xué)數(shù)據(jù)的搜集。
>>自適應(yīng)教學(xué)系統(tǒng)
搜集學(xué)生的學(xué)習(xí)行為數(shù)據(jù),基于人工智能和大數(shù)據(jù)的技術(shù)做出診斷和分析,幫助老師更好地了解學(xué)生的學(xué)習(xí)情況,為其下一步的教學(xué)活動提供參考,同時,課后為學(xué)生推薦適合的學(xué)習(xí)材料,在學(xué)生遇到困難時為其提供解題思路,以此達到個性化學(xué)習(xí)的效果。
此外,人工智能的發(fā)展為教育從業(yè)者提出了一個新的問題:在人工智能時代,我們需要什么樣的教育?日本的 Noriko Arai 教授表示了自己的擔(dān)憂:“一個沒有閱讀和理解能力的機器人,成績居然超過絕大多數(shù)高中生,而大多數(shù)學(xué)生只是填鴨式學(xué)習(xí),并沒有真正理解知識,相較而言,AI 在記憶方面做得更好,因此我們需要新型的教育?!?br/>
>>互動
你怎么看待高考機器人?歡迎留言(選1 or 2)或投稿,分享你的觀點。
1/ 機器人的理解能力在不斷提高,五年之內(nèi),高考機器人會考上北大清華。
2/ 在科學(xué)家對人腦的思考和運作方式還知之甚少的情況下,會思考的人工智能系統(tǒng)只是噱頭。
2、芥末堆不接受通過公關(guān)費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。