芥末堆 子航 6月15日
6 月 7 日下午,學(xué)霸君高考機(jī)器人 Aidam 公開挑戰(zhàn) 2017 年全國卷二文科數(shù)學(xué)卷,并取得 134 分的成績(滿分 150 分)。今日,天涯社區(qū)一篇名為“這是學(xué)渣榮譽(yù)的一刻→揭秘高考機(jī)器人‘騙局’”的帖子公開質(zhì)疑這一“高考成績”。
在天涯的帖子中,首先質(zhì)疑了 Aidam 解答數(shù)學(xué)卷第 17 題的答題過程,存在題目錄入錯(cuò)誤、推導(dǎo)結(jié)論與題干不符等問題,同時(shí)還引用了知乎上對(duì)數(shù)學(xué)卷第 18 題答題過程的質(zhì)疑,如知識(shí)元公布順序存疑、存在沒有意義和邏輯關(guān)系的解題步驟等。
該帖引發(fā)了業(yè)界對(duì)于學(xué)霸君高考機(jī)器人真實(shí)能力的質(zhì)疑,一度成為關(guān)注焦點(diǎn)的高考機(jī)器人,是否只是鏡花水月?甚至有相關(guān)公司向?qū)W霸君隔空喊話,希望學(xué)霸君接受原創(chuàng)命題的實(shí)測(cè)。
對(duì)此,學(xué)霸君在接受芥末堆收集時(shí)表示,“不想陷入口水戰(zhàn)中”。
Aidam 解題過程受質(zhì)疑
帖子中提到,數(shù)學(xué)卷第 17 題學(xué)霸君錄入的題目與真實(shí)題目不同,在學(xué)霸君錄入的題干里,兩個(gè)條件相互矛盾,但最終這道題機(jī)器人卻拿到了滿分 12 分。
學(xué)霸君輸入的題目
正確的題目
此外,第 17 題的解答過程,也引起了網(wǎng)友質(zhì)疑。網(wǎng)友指出,根據(jù)學(xué)霸君錄入的題干,無法得出其解答過程中展示的結(jié)果。
網(wǎng)友認(rèn)為,在第 18 題解題過程中,知識(shí)元公布順序存疑,沒有公布題意理解過程,存在沒有意義和邏輯關(guān)系的解題步驟。其中最顯著的問題是,在解題過程中給出的兩個(gè)互相垂直平面的法向量是一樣的。
兩個(gè)互相垂直平面的法向量是一樣的
根據(jù)對(duì)答題過程的質(zhì)疑,文中提出了學(xué)霸君是否真的沒有發(fā)現(xiàn)問題;為什么錄錯(cuò)題目,機(jī)器仍能答對(duì);機(jī)器在題目尚未錄入時(shí)就已經(jīng)知道答案;是否有“隱形手”幫忙填寫正確答案等質(zhì)疑問題。
除了解題過程本身的質(zhì)疑,網(wǎng)絡(luò)上還有學(xué)霸君團(tuán)隊(duì)本身學(xué)術(shù)能力的質(zhì)疑。
在知乎問題“如何看待學(xué)霸君的高考機(jī)器人 Aidam 高考全國文科數(shù)學(xué)卷考了 134 分?”中,排名第一的是一個(gè)超過七百個(gè)贊的答案。答案質(zhì)疑了學(xué)霸君人工智能團(tuán)隊(duì)成員沒有相關(guān)學(xué)術(shù)論文的發(fā)表記錄,因此不具備相應(yīng)學(xué)術(shù)能力。
學(xué)霸君如何才能自證清白?
“如果被質(zhì)疑的內(nèi)容是真實(shí)的,這個(gè)質(zhì)疑確實(shí)是十分有力度的。”另一家研發(fā)了高考機(jī)器人的準(zhǔn)星云學(xué) CEO 林輝認(rèn)為,學(xué)霸君現(xiàn)在最需要做的是公布發(fā)布會(huì)現(xiàn)場(chǎng)全流程視頻,因?yàn)榘l(fā)布會(huì)是要展示出系統(tǒng)經(jīng)過訓(xùn)練后能夠自我分析、自我推理的能力,而非通過題目進(jìn)行搜索匹配的能力。
林輝對(duì)學(xué)霸君目前沒有公開全流程視頻表示疑惑。在他看來,切斷互聯(lián)網(wǎng)和數(shù)據(jù)庫,全程透明公正是特別重要的,錄題和批閱過程是沒有必要保密的,而沒有斷掉互聯(lián)網(wǎng)也肯定會(huì)被質(zhì)疑。
據(jù)悉,6 月 7 日下午,準(zhǔn)星云學(xué)研發(fā)的“準(zhǔn)星數(shù)學(xué)高考機(jī)器人”AI-MATHS 在成都先后解答了北京高考數(shù)學(xué)文科卷、全國卷二文科數(shù)學(xué)卷等多張?jiān)嚲恚⒎謩e獲得 105 分和 100 分的成績。林輝表示,準(zhǔn)星云學(xué)的高考機(jī)器人從錄題目、解題目、到人工批閱、全都在會(huì)場(chǎng)上接受 863 監(jiān)督單位科大訊飛的現(xiàn)場(chǎng)監(jiān)督,執(zhí)行了全程錄制視頻和斷庫斷網(wǎng)。
此外,自然語言科學(xué)家、艾耕科技 CTO 曹斌則認(rèn)為,除了公開視頻之外,學(xué)霸君還可以通過提供 demo 或者 API 讓大家測(cè)試來證明自己。
對(duì)于學(xué)霸君被質(zhì)疑的“學(xué)術(shù)問題”,林輝認(rèn)為,技術(shù)團(tuán)隊(duì)并不一定要發(fā)表論文,有時(shí)也有可能會(huì)出現(xiàn)一些“黑科技”。他表示,準(zhǔn)星云學(xué)的團(tuán)隊(duì)也積累了很多文章,但沒有很多時(shí)間去寫;曹斌則認(rèn)為,團(tuán)隊(duì)成員之前是不是發(fā)表過較高質(zhì)量的 paper 確實(shí)可以成為衡量團(tuán)隊(duì)實(shí)力的參照,但是一個(gè)技術(shù)是否愿意發(fā) paper,這是公司的選擇
Aidam 每天訓(xùn)練 40-50 萬道題是否靠譜?
在接受公開收集中,學(xué)霸君創(chuàng)始人張凱磊曾說過,高考機(jī)器人 Aidam 每天自己訓(xùn)練 40-50 萬道題目。
“單從數(shù)量來看,40-50 萬對(duì)于機(jī)器學(xué)習(xí)來說并不能算是一個(gè)很大的訓(xùn)練量,相反還有些偏小。”但曹斌認(rèn)為,需要關(guān)注的是 40-50 萬什么樣的題目,是否經(jīng)過人工標(biāo)注以及是怎么標(biāo)注的?例如,從以文字表達(dá)的題目到機(jī)器能理解的結(jié)構(gòu)化信息,這樣的數(shù)據(jù)就需要人去標(biāo)注。而且不同類型的題目,可能需要的模型也會(huì)有區(qū)別,這里就需要大量的人工。
林輝認(rèn)為,學(xué)霸君對(duì)于高考機(jī)器人的訓(xùn)練,只可能是在一種無監(jiān)督或者半監(jiān)督的狀態(tài)下完成,這就代表機(jī)器可能并不知道所解題目的正確與否?!敖忸}與下圍棋的 AlphaGo 并不一樣,AlphaGo 可以根據(jù)圍棋的特點(diǎn)計(jì)算目數(shù)來驗(yàn)證結(jié)果,雖然要求較高的計(jì)算量但是并不復(fù)雜,但通過自動(dòng)推理或者邏輯關(guān)系,系統(tǒng)難以判斷數(shù)學(xué)題目的對(duì)錯(cuò)。”他解釋道。
相較于學(xué)霸君公開的 40-50 萬道的數(shù)據(jù)量,準(zhǔn)星云學(xué)的高考機(jī)器人只訓(xùn)練了400多套卷子。但林輝告訴芥末堆,準(zhǔn)星云學(xué)所有的系統(tǒng)測(cè)試均是在系統(tǒng)中有標(biāo)注,而且完成 400 多套的數(shù)量已經(jīng)是準(zhǔn)星云學(xué)現(xiàn)有人力能夠完成的數(shù)目。
對(duì)于網(wǎng)上的質(zhì)疑,學(xué)霸君也在今天下午給出了回應(yīng),“作為一家技術(shù)公司,不想陷入到這種口水戰(zhàn)中,一切看實(shí)際情況說話,以后會(huì)做出更多的成績?!睂W(xué)霸君方面回應(yīng)稱。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。