學(xué)霸君研發(fā)的高考機(jī)器人 Aidam
6月7日,學(xué)霸君研發(fā)的高考機(jī)器人 Aidam 挑戰(zhàn)全國(guó)卷二文科數(shù)學(xué)卷,用時(shí) 9 分 47 秒,取得 134 分的成績(jī)(滿分 150 分),表現(xiàn)非常驚艷。
在擁有了如此亮眼成績(jī)之后,AI 未來(lái)到底是霸權(quán)力量還是水和電這樣的基礎(chǔ)設(shè)施?學(xué)霸君在擁有了挑戰(zhàn)高考的 AI 能力之后,是否愿意把 Aidam 的技術(shù)算力開放給教育行業(yè)呢?
在完成了 AI 高考的當(dāng)晚,學(xué)霸君創(chuàng)始人張凱磊在第一時(shí)間接受了藍(lán)象的獨(dú)家專訪,表示將逐漸把手寫識(shí)別的能力、自動(dòng)解題能力、自動(dòng)批改能力開放出來(lái),支持更多創(chuàng)業(yè)者進(jìn)入教育科技領(lǐng)域。
作為藍(lán)象營(yíng)的行業(yè)顧問(wèn),張凱磊尤其強(qiáng)調(diào)到,未來(lái)學(xué)霸君的所有合作都會(huì)通過(guò)藍(lán)象資本開放。教育行業(yè)未來(lái)的發(fā)展需要技術(shù)、認(rèn)知與資本的增量與共享。藍(lán)象資本也將與學(xué)霸君一起,為行業(yè)提供底層發(fā)展所需要的 AI 算法與算力、資本加速、行業(yè)認(rèn)知與資源。
以下為部分分享干貨整理:
1、這次 Aidam 的失分點(diǎn)在哪里?
張凱磊:失分點(diǎn)一個(gè)是沒(méi)有理解題目,一個(gè)是超出了系統(tǒng)可以理解的范圍。計(jì)算機(jī)還是有很多缺陷的,他有時(shí)不能理解題目本身是什么,有時(shí)不能緊緊抓住信息重點(diǎn),難以把握題目的要旨。
2、Aidam 如何讀試卷?Aidam 解題的步驟是什么樣的?
張凱磊:讀試卷的關(guān)鍵點(diǎn)是把自然語(yǔ)言翻譯成機(jī)器能理解的形式語(yǔ)言。這個(gè)是非常難、很具有挑戰(zhàn)性的事情。假設(shè)一段語(yǔ)言包含一千維度的熵,這個(gè)熵是最小維度的信息。機(jī)器真正需要做的事情是把里面有效的熵傳遞出去,而把無(wú)效的熵省略。這個(gè)非常的難。
準(zhǔn)確傳遞信息是整個(gè)技術(shù)期里面最難的部分之一,需要不多一毫,不少一絲。
學(xué)霸君用的是 SVO 模型,當(dāng) SVO 模型工作的時(shí)候,就是在傳遞一個(gè)最小可用的信息模型。傳遞過(guò)后再進(jìn)行符號(hào)計(jì)算和邏輯推理。我們向計(jì)算機(jī)內(nèi)輸入公理、定理,跟經(jīng)典題目形成一系列的計(jì)算規(guī)則。然后快速做搜索,窮盡計(jì)算規(guī)則,看它能不能解出來(lái)。這兩部分是計(jì)算機(jī)相對(duì)而言比較擅長(zhǎng)的。最后,它會(huì)把形式語(yǔ)言變成自然語(yǔ)言輸出,讓人能讀懂步驟。
簡(jiǎn)單而言包含三個(gè)步驟:自然語(yǔ)言翻譯成形式語(yǔ)言,形式語(yǔ)言做邏輯計(jì)算,邏輯計(jì)算翻譯成自然語(yǔ)言。這是自動(dòng)解題的核心邏輯。
3、從算法來(lái)說(shuō) Aidam 用了多少數(shù)據(jù)訓(xùn)練,這需要多大的計(jì)算量呢?
張凱磊:我們有400臺(tái)至強(qiáng)十二核 64G 內(nèi)存的服務(wù)器加上1000臺(tái)左右的輔助服務(wù)器,這400臺(tái)基本都是 Tesla,容量很大。一個(gè)Aidam 的背后大概有7個(gè)引擎,代數(shù)和幾何使用的是完全不同的引擎,從算法、邏輯到推理全都不一樣,技術(shù)上難度很大。
數(shù)學(xué)公式非常重要的是需要翻譯成 LaTex ,通過(guò) LaTex 進(jìn)行閱讀理解和輸出。Aidam 每天訓(xùn)練30萬(wàn)道到50萬(wàn)道題目, 訓(xùn)練時(shí)間基本是全天的。但是因?yàn)榘滋煊写罅康闹袛嘈詼y(cè)試,所以晚上訓(xùn)練的時(shí)間更長(zhǎng)。
4、這次 Aidam 是參加數(shù)學(xué)考試的,當(dāng)初我們?yōu)槭裁催x擇數(shù)學(xué)?如果語(yǔ)文、英語(yǔ)等科目考試,預(yù)計(jì)可以考多少分?
張凱磊:一千個(gè)人眼里有一千個(gè)哈姆雷特,但是這個(gè)世界上只有一個(gè)勾股定理。如果今天做一個(gè)語(yǔ)文賞析,這道題目要評(píng)3分還是8分,都是有爭(zhēng)議的。但是數(shù)學(xué)的邏輯很清晰,對(duì)就是對(duì),錯(cuò)就是錯(cuò),很難有一個(gè)隨意改變分?jǐn)?shù)的場(chǎng)景,比較公正。
我們?cè)谡Z(yǔ)文和英語(yǔ)方面有積累,但是因?yàn)槊闇?zhǔn)的目標(biāo)是數(shù)理化,文科方面還比較弱。按照之前的測(cè)試結(jié)果,語(yǔ)文跟英語(yǔ)只有不到一百分的水平。
5、Aidam 參加高考對(duì)學(xué)霸君的意義是什么?
張凱磊:我們希望通過(guò)這個(gè)活動(dòng)告訴業(yè)界,今天的人工智能已經(jīng)做到一種什么程度了。他能不能做自動(dòng)解題,能不能做自動(dòng)批改,能不能做自動(dòng)推薦。
高考機(jī)器人是人工智能在教育領(lǐng)域的一個(gè)樞紐點(diǎn),它模仿人腦的感知、記憶、認(rèn)知、分析、建立經(jīng)驗(yàn)知識(shí)庫(kù)、聯(lián)想、判斷、決策,還結(jié)合了跨學(xué)科、跨領(lǐng)域的知識(shí)研究,一旦做好之后,用機(jī)器人進(jìn)行判題、個(gè)性化指導(dǎo)、學(xué)生管理、家校溝通、教案改進(jìn)都變成可能。
6、自動(dòng)批改對(duì)于客觀題很好理解,但是主觀題中每個(gè)人的字跡都不同,機(jī)器的手寫識(shí)別能力如何呢?
目前我們?cè)谑謱懽R(shí)別方面識(shí)別率已經(jīng)超過(guò) 98.7%,建立了超過(guò)7萬(wàn)人左右的個(gè)性化書寫庫(kù),到達(dá)了接近于商業(yè)可用的程度。
7、Aidam 能夠勝任一些更高難度的數(shù)學(xué)問(wèn)題甚至數(shù)學(xué)界的一些前沿問(wèn)題嗎?
張凱磊:沒(méi)有辦法做到更前沿的問(wèn)題。它是在一個(gè)有限額范圍內(nèi)的搜索行為,并不能協(xié)助人類去探索更多的東西,這是今天的機(jī)器還不能做到的事情。
8、藍(lán)象資本專注投資教育早期項(xiàng)目。您作為藍(lán)象資本的行業(yè)顧問(wèn),會(huì)以某種形式開放計(jì)算能力,與教育行業(yè)內(nèi)的創(chuàng)業(yè)者一起合作嗎?
張凱磊:會(huì)的。我們會(huì)逐漸把手寫識(shí)別的能力、自動(dòng)解題能力、自動(dòng)批改能力開放出來(lái),歡迎更多的人來(lái)做這些事情。今年我們與皖新傳媒合作,能夠鋪很多班級(jí),積累出大量數(shù)據(jù)。
學(xué)霸君在 OCR 層面已經(jīng)做了大量的事情,未來(lái)還會(huì)持續(xù)做。我們希望自己可以成為全球范圍內(nèi)真正把 OCR,包括印刷體、手寫體做到頂尖水平的載體。
本文轉(zhuǎn)載自藍(lán)象營(yíng)。
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。