芥末堆 子航 6月15日
6 月 7 日下午,學霸君高考機器人 Aidam 公開挑戰(zhàn) 2017 年全國卷二文科數(shù)學卷,并取得 134 分的成績(滿分 150 分)。今日,天涯社區(qū)一篇名為“這是學渣榮譽的一刻→揭秘高考機器人‘騙局’”的帖子公開質疑這一“高考成績”。
在天涯的帖子中,首先質疑了 Aidam 解答數(shù)學卷第 17 題的答題過程,存在題目錄入錯誤、推導結論與題干不符等問題,同時還引用了知乎上對數(shù)學卷第 18 題答題過程的質疑,如知識元公布順序存疑、存在沒有意義和邏輯關系的解題步驟等。
該帖引發(fā)了業(yè)界對于學霸君高考機器人真實能力的質疑,一度成為關注焦點的高考機器人,是否只是鏡花水月?甚至有相關公司向學霸君隔空喊話,希望學霸君接受原創(chuàng)命題的實測。
對此,學霸君在接受芥末堆收集時表示,“不想陷入口水戰(zhàn)中”。
Aidam 解題過程受質疑
帖子中提到,數(shù)學卷第 17 題學霸君錄入的題目與真實題目不同,在學霸君錄入的題干里,兩個條件相互矛盾,但最終這道題機器人卻拿到了滿分 12 分。
學霸君輸入的題目
正確的題目
此外,第 17 題的解答過程,也引起了網(wǎng)友質疑。網(wǎng)友指出,根據(jù)學霸君錄入的題干,無法得出其解答過程中展示的結果。
網(wǎng)友認為,在第 18 題解題過程中,知識元公布順序存疑,沒有公布題意理解過程,存在沒有意義和邏輯關系的解題步驟。其中最顯著的問題是,在解題過程中給出的兩個互相垂直平面的法向量是一樣的。
兩個互相垂直平面的法向量是一樣的
根據(jù)對答題過程的質疑,文中提出了學霸君是否真的沒有發(fā)現(xiàn)問題;為什么錄錯題目,機器仍能答對;機器在題目尚未錄入時就已經知道答案;是否有“隱形手”幫忙填寫正確答案等質疑問題。
除了解題過程本身的質疑,網(wǎng)絡上還有學霸君團隊本身學術能力的質疑。
在知乎問題“如何看待學霸君的高考機器人 Aidam 高考全國文科數(shù)學卷考了 134 分?”中,排名第一的是一個超過七百個贊的答案。答案質疑了學霸君人工智能團隊成員沒有相關學術論文的發(fā)表記錄,因此不具備相應學術能力。
學霸君如何才能自證清白?
“如果被質疑的內容是真實的,這個質疑確實是十分有力度的?!绷硪患已邪l(fā)了高考機器人的準星云學 CEO 林輝認為,學霸君現(xiàn)在最需要做的是公布發(fā)布會現(xiàn)場全流程視頻,因為發(fā)布會是要展示出系統(tǒng)經過訓練后能夠自我分析、自我推理的能力,而非通過題目進行搜索匹配的能力。
林輝對學霸君目前沒有公開全流程視頻表示疑惑。在他看來,切斷互聯(lián)網(wǎng)和數(shù)據(jù)庫,全程透明公正是特別重要的,錄題和批閱過程是沒有必要保密的,而沒有斷掉互聯(lián)網(wǎng)也肯定會被質疑。
據(jù)悉,6 月 7 日下午,準星云學研發(fā)的“準星數(shù)學高考機器人”AI-MATHS 在成都先后解答了北京高考數(shù)學文科卷、全國卷二文科數(shù)學卷等多張試卷,并分別獲得 105 分和 100 分的成績。林輝表示,準星云學的高考機器人從錄題目、解題目、到人工批閱、全都在會場上接受 863 監(jiān)督單位科大訊飛的現(xiàn)場監(jiān)督,執(zhí)行了全程錄制視頻和斷庫斷網(wǎng)。
此外,自然語言科學家、艾耕科技 CTO 曹斌則認為,除了公開視頻之外,學霸君還可以通過提供 demo 或者 API 讓大家測試來證明自己。
對于學霸君被質疑的“學術問題”,林輝認為,技術團隊并不一定要發(fā)表論文,有時也有可能會出現(xiàn)一些“黑科技”。他表示,準星云學的團隊也積累了很多文章,但沒有很多時間去寫;曹斌則認為,團隊成員之前是不是發(fā)表過較高質量的 paper 確實可以成為衡量團隊實力的參照,但是一個技術是否愿意發(fā) paper,這是公司的選擇
Aidam 每天訓練 40-50 萬道題是否靠譜?
在接受公開收集中,學霸君創(chuàng)始人張凱磊曾說過,高考機器人 Aidam 每天自己訓練 40-50 萬道題目。
“單從數(shù)量來看,40-50 萬對于機器學習來說并不能算是一個很大的訓練量,相反還有些偏小?!钡鼙笳J為,需要關注的是 40-50 萬什么樣的題目,是否經過人工標注以及是怎么標注的?例如,從以文字表達的題目到機器能理解的結構化信息,這樣的數(shù)據(jù)就需要人去標注。而且不同類型的題目,可能需要的模型也會有區(qū)別,這里就需要大量的人工。
林輝認為,學霸君對于高考機器人的訓練,只可能是在一種無監(jiān)督或者半監(jiān)督的狀態(tài)下完成,這就代表機器可能并不知道所解題目的正確與否?!敖忸}與下圍棋的 AlphaGo 并不一樣,AlphaGo 可以根據(jù)圍棋的特點計算目數(shù)來驗證結果,雖然要求較高的計算量但是并不復雜,但通過自動推理或者邏輯關系,系統(tǒng)難以判斷數(shù)學題目的對錯?!彼忉尩?。
相較于學霸君公開的 40-50 萬道的數(shù)據(jù)量,準星云學的高考機器人只訓練了400多套卷子。但林輝告訴芥末堆,準星云學所有的系統(tǒng)測試均是在系統(tǒng)中有標注,而且完成 400 多套的數(shù)量已經是準星云學現(xiàn)有人力能夠完成的數(shù)目。
對于網(wǎng)上的質疑,學霸君也在今天下午給出了回應,“作為一家技術公司,不想陷入到這種口水戰(zhàn)中,一切看實際情況說話,以后會做出更多的成績?!睂W霸君方面回應稱。
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。