學(xué)霸君研發(fā)的高考機器人 Aidam
6月7日,學(xué)霸君研發(fā)的高考機器人 Aidam 挑戰(zhàn)全國卷二文科數(shù)學(xué)卷,用時 9 分 47 秒,取得 134 分的成績(滿分 150 分),表現(xiàn)非常驚艷。
在擁有了如此亮眼成績之后,AI 未來到底是霸權(quán)力量還是水和電這樣的基礎(chǔ)設(shè)施?學(xué)霸君在擁有了挑戰(zhàn)高考的 AI 能力之后,是否愿意把 Aidam 的技術(shù)算力開放給教育行業(yè)呢?
在完成了 AI 高考的當(dāng)晚,學(xué)霸君創(chuàng)始人張凱磊在第一時間接受了藍(lán)象的獨家專訪,表示將逐漸把手寫識別的能力、自動解題能力、自動批改能力開放出來,支持更多創(chuàng)業(yè)者進(jìn)入教育科技領(lǐng)域。
作為藍(lán)象營的行業(yè)顧問,張凱磊尤其強調(diào)到,未來學(xué)霸君的所有合作都會通過藍(lán)象資本開放。教育行業(yè)未來的發(fā)展需要技術(shù)、認(rèn)知與資本的增量與共享。藍(lán)象資本也將與學(xué)霸君一起,為行業(yè)提供底層發(fā)展所需要的 AI 算法與算力、資本加速、行業(yè)認(rèn)知與資源。
以下為部分分享干貨整理:
1、這次 Aidam 的失分點在哪里?
張凱磊:失分點一個是沒有理解題目,一個是超出了系統(tǒng)可以理解的范圍。計算機還是有很多缺陷的,他有時不能理解題目本身是什么,有時不能緊緊抓住信息重點,難以把握題目的要旨。
2、Aidam 如何讀試卷?Aidam 解題的步驟是什么樣的?
張凱磊:讀試卷的關(guān)鍵點是把自然語言翻譯成機器能理解的形式語言。這個是非常難、很具有挑戰(zhàn)性的事情。假設(shè)一段語言包含一千維度的熵,這個熵是最小維度的信息。機器真正需要做的事情是把里面有效的熵傳遞出去,而把無效的熵省略。這個非常的難。
準(zhǔn)確傳遞信息是整個技術(shù)期里面最難的部分之一,需要不多一毫,不少一絲。
學(xué)霸君用的是 SVO 模型,當(dāng) SVO 模型工作的時候,就是在傳遞一個最小可用的信息模型。傳遞過后再進(jìn)行符號計算和邏輯推理。我們向計算機內(nèi)輸入公理、定理,跟經(jīng)典題目形成一系列的計算規(guī)則。然后快速做搜索,窮盡計算規(guī)則,看它能不能解出來。這兩部分是計算機相對而言比較擅長的。最后,它會把形式語言變成自然語言輸出,讓人能讀懂步驟。
簡單而言包含三個步驟:自然語言翻譯成形式語言,形式語言做邏輯計算,邏輯計算翻譯成自然語言。這是自動解題的核心邏輯。
3、從算法來說 Aidam 用了多少數(shù)據(jù)訓(xùn)練,這需要多大的計算量呢?
張凱磊:我們有400臺至強十二核 64G 內(nèi)存的服務(wù)器加上1000臺左右的輔助服務(wù)器,這400臺基本都是 Tesla,容量很大。一個Aidam 的背后大概有7個引擎,代數(shù)和幾何使用的是完全不同的引擎,從算法、邏輯到推理全都不一樣,技術(shù)上難度很大。
數(shù)學(xué)公式非常重要的是需要翻譯成 LaTex ,通過 LaTex 進(jìn)行閱讀理解和輸出。Aidam 每天訓(xùn)練30萬道到50萬道題目, 訓(xùn)練時間基本是全天的。但是因為白天有大量的中斷性測試,所以晚上訓(xùn)練的時間更長。
4、這次 Aidam 是參加數(shù)學(xué)考試的,當(dāng)初我們?yōu)槭裁催x擇數(shù)學(xué)?如果語文、英語等科目考試,預(yù)計可以考多少分?
張凱磊:一千個人眼里有一千個哈姆雷特,但是這個世界上只有一個勾股定理。如果今天做一個語文賞析,這道題目要評3分還是8分,都是有爭議的。但是數(shù)學(xué)的邏輯很清晰,對就是對,錯就是錯,很難有一個隨意改變分?jǐn)?shù)的場景,比較公正。
我們在語文和英語方面有積累,但是因為瞄準(zhǔn)的目標(biāo)是數(shù)理化,文科方面還比較弱。按照之前的測試結(jié)果,語文跟英語只有不到一百分的水平。
5、Aidam 參加高考對學(xué)霸君的意義是什么?
張凱磊:我們希望通過這個活動告訴業(yè)界,今天的人工智能已經(jīng)做到一種什么程度了。他能不能做自動解題,能不能做自動批改,能不能做自動推薦。
高考機器人是人工智能在教育領(lǐng)域的一個樞紐點,它模仿人腦的感知、記憶、認(rèn)知、分析、建立經(jīng)驗知識庫、聯(lián)想、判斷、決策,還結(jié)合了跨學(xué)科、跨領(lǐng)域的知識研究,一旦做好之后,用機器人進(jìn)行判題、個性化指導(dǎo)、學(xué)生管理、家校溝通、教案改進(jìn)都變成可能。
6、自動批改對于客觀題很好理解,但是主觀題中每個人的字跡都不同,機器的手寫識別能力如何呢?
目前我們在手寫識別方面識別率已經(jīng)超過 98.7%,建立了超過7萬人左右的個性化書寫庫,到達(dá)了接近于商業(yè)可用的程度。
7、Aidam 能夠勝任一些更高難度的數(shù)學(xué)問題甚至數(shù)學(xué)界的一些前沿問題嗎?
張凱磊:沒有辦法做到更前沿的問題。它是在一個有限額范圍內(nèi)的搜索行為,并不能協(xié)助人類去探索更多的東西,這是今天的機器還不能做到的事情。
8、藍(lán)象資本專注投資教育早期項目。您作為藍(lán)象資本的行業(yè)顧問,會以某種形式開放計算能力,與教育行業(yè)內(nèi)的創(chuàng)業(yè)者一起合作嗎?
張凱磊:會的。我們會逐漸把手寫識別的能力、自動解題能力、自動批改能力開放出來,歡迎更多的人來做這些事情。今年我們與皖新傳媒合作,能夠鋪很多班級,積累出大量數(shù)據(jù)。
學(xué)霸君在 OCR 層面已經(jīng)做了大量的事情,未來還會持續(xù)做。我們希望自己可以成為全球范圍內(nèi)真正把 OCR,包括印刷體、手寫體做到頂尖水平的載體。
本文轉(zhuǎn)載自藍(lán)象營。
2、芥末堆不接受通過公關(guān)費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。