圖源:作業(yè)幫
芥末堆文 根據(jù)作業(yè)幫微信公眾號消息,9月2日,作業(yè)幫正式發(fā)布自研“銀河大模型”,同時公布了銀河大模型在C-Eval、CMMLU兩大權威大語言模型評測基準的成績。
今年6月,有消息稱作業(yè)幫正在內(nèi)測基于中國市場的教育大模型,包含多學科解題、中英文作文批改、多語言對話方向等多個教育應用場景,涉及工具類App、智能硬件、圖書等業(yè)務。該項目由CTO羅亮牽頭進行底層研發(fā)支持及AIGC大方向建設,研發(fā)經(jīng)費優(yōu)先調(diào)撥。同時,除了組織架構調(diào)整,作業(yè)幫產(chǎn)研團隊中近百人也已并入GPT相關項目,估計有兩百人以上的團隊規(guī)模。
據(jù)悉,銀河大模型是一款專為教育領域打造的覆蓋多學科、多學段、多場景的教育大模型,具備智能解題、知識問答、中英文寫作及AI伴學等方面的能力。
作業(yè)幫數(shù)據(jù)顯示,作業(yè)幫銀河大模型以平均分73.7分位居C-Eval榜首;同時在CMMLU榜單Five-shot和Zero-shot測評中分別以平均分74.03分及73.85分位列第一,成為首個同時在上述兩大權威榜單平均分排名第一的教育大模型。
據(jù)介紹,C-Eval是由清華大學、上海交通大學和愛丁堡大學合作構建的面向中文語言模型的綜合性考試評測集,包含13948道多項選擇題,涵蓋52個不同學科和四個難度級別。CMMLU榜單則由MBZUAI、上海交通大學、微軟亞洲研究院共同推出。
圖源:作業(yè)幫
作業(yè)幫表示,作業(yè)幫銀河大模型即將在作業(yè)幫APP等學習工具、智能硬件、智能圖書、教育數(shù)字化等業(yè)務場景中實現(xiàn)應用,同時將持續(xù)優(yōu)化銀河大模型性能與多模態(tài)能力,加速推進在更多教育場景的落地實踐。
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。