芥末堆芥末堆

揭秘首個AI數(shù)學(xué)大賽:為防止人類替考,AI“先交代”再交卷

作者:昆布 發(fā)布時間:

揭秘首個AI數(shù)學(xué)大賽:為防止人類替考,AI“先交代”再交卷

作者:昆布 發(fā)布時間:

摘要:統(tǒng)計顯示,參賽隊伍中,00后占比超50%,年輕一代正在成為AI生力軍。

alili.jpg

圖源:Pixabay

北京時間4月15日上午8點,2024阿里巴巴全球數(shù)學(xué)競賽預(yù)選賽正式交卷,58個國家與地區(qū)的選手在線鏖戰(zhàn)48小時,更有來自全球知名高校院所與企業(yè)的563支隊伍使用AI作答,其中00后占比超50%。

阿里巴巴全球數(shù)學(xué)競賽組委會介紹,當(dāng)前,AI已經(jīng)在不少領(lǐng)域展現(xiàn)超越人類的能力,但在“人類智慧的皇冠”數(shù)學(xué)領(lǐng)域還頗為受限。因此,從2024年起,阿里巴巴全球數(shù)學(xué)競賽決定向AI開放,鼓勵探索AI的潛力上限,推動AI在數(shù)學(xué)領(lǐng)域的研究和應(yīng)用創(chuàng)新。

在這場48小時的預(yù)選賽中,AI和人類選手共用一套試卷,題目包括選擇題、解答題與證明題。為了保證公平,防止“人類替考”,組委會制定了“賽前固定方案、賽中誠實答題、賽后復(fù)現(xiàn)總結(jié)”的三步走規(guī)則。因此,在正式開考之前,AI參賽團(tuán)隊就需要完成模型的訓(xùn)練或微調(diào),并鎖定做題版本;如使用提示詞工程,也需要提前提交相應(yīng)方案。

AI挑戰(zhàn)賽吸引了全球563支隊伍踴躍報名,主要來自全球知名高校院所與企業(yè),包括北大、清華、牛津、中國科學(xué)院、AWS、字節(jié)跳動等,大多具有AI專業(yè)背景,也有部分來自數(shù)學(xué)、物理等專業(yè)。

統(tǒng)計顯示,參賽隊伍中,00后占比超50%,年輕一代正在成為AI生力軍。他們有的在開源大模型的基礎(chǔ)上進(jìn)行專項微調(diào),讓AI從初等數(shù)學(xué)進(jìn)階到高等數(shù)學(xué);他們有的構(gòu)建起AI Agent,結(jié)合提示詞工程來調(diào)用GPT-4等閉源模型,使得GPT-4的數(shù)學(xué)解題能力有大幅提升。

西南交通大學(xué)應(yīng)用物理系的大四學(xué)生向勁宇是一名AI開發(fā)者,也是MetaGPT-MC小組貢獻(xiàn)者之一,這次他和多位開發(fā)者組隊參賽,使用GPT-4與Claude 3組成Multi-Agent的方案,讓AI分飾多個角色、相互驗證來完成答題步驟,改善了AI“一本正經(jīng)的胡說八道”的通病,提升了AI做題的準(zhǔn)確性。在AWS從事AI研究的毛帽,是數(shù)學(xué)專業(yè)的博士,已連續(xù)三年參賽,今年轉(zhuǎn)換身份,從人類選手轉(zhuǎn)為AI的競賽輔導(dǎo)員,與同事組成一支“豪華團(tuán)隊”,集合了數(shù)學(xué)、統(tǒng)計、地球物理及機(jī)器學(xué)習(xí)背景的4名博士,希望能向人類選手們秀一把AI的實力。

據(jù)介紹,本次AI挑戰(zhàn)賽結(jié)果將于6月與人類選手成績同期公布,AI前三名分別獲得獎金10000美元、5000美元、2000美元。不少選手表示,他們更期待的是,AI的成績能否達(dá)到人類優(yōu)秀選手水平,能否達(dá)到?jīng)Q賽資格線?在往年的阿里巴巴全球數(shù)學(xué)競賽中,只有1%的預(yù)選賽選手能夠晉級決賽。

由阿里巴巴公益、達(dá)摩院共同舉辦的阿里巴巴全球數(shù)學(xué)競賽,截至目前共舉辦6屆。今年,這項賽事緊扣AI與數(shù)學(xué)融合的技術(shù)趨勢,首次向AI開放,不限選手是碳基還是硅基。

阿里.png

1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權(quán)拒絕一切形式轉(zhuǎn)載,違者必究;
2、芥末堆不接受通過公關(guān)費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。
來源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • 揭秘首個AI數(shù)學(xué)大賽:為防止人類替考,AI“先交代”再交卷分享二維碼