圖源:作業(yè)幫
芥末堆文 根據(jù)作業(yè)幫微信公眾號消息,9月2日,作業(yè)幫正式發(fā)布自研“銀河大模型”,同時(shí)公布了銀河大模型在C-Eval、CMMLU兩大權(quán)威大語言模型評測基準(zhǔn)的成績。
今年6月,有消息稱作業(yè)幫正在內(nèi)測基于中國市場的教育大模型,包含多學(xué)科解題、中英文作文批改、多語言對話方向等多個(gè)教育應(yīng)用場景,涉及工具類App、智能硬件、圖書等業(yè)務(wù)。該項(xiàng)目由CTO羅亮牽頭進(jìn)行底層研發(fā)支持及AIGC大方向建設(shè),研發(fā)經(jīng)費(fèi)優(yōu)先調(diào)撥。同時(shí),除了組織架構(gòu)調(diào)整,作業(yè)幫產(chǎn)研團(tuán)隊(duì)中近百人也已并入GPT相關(guān)項(xiàng)目,估計(jì)有兩百人以上的團(tuán)隊(duì)規(guī)模。
據(jù)悉,銀河大模型是一款專為教育領(lǐng)域打造的覆蓋多學(xué)科、多學(xué)段、多場景的教育大模型,具備智能解題、知識問答、中英文寫作及AI伴學(xué)等方面的能力。
作業(yè)幫數(shù)據(jù)顯示,作業(yè)幫銀河大模型以平均分73.7分位居C-Eval榜首;同時(shí)在CMMLU榜單Five-shot和Zero-shot測評中分別以平均分74.03分及73.85分位列第一,成為首個(gè)同時(shí)在上述兩大權(quán)威榜單平均分排名第一的教育大模型。
據(jù)介紹,C-Eval是由清華大學(xué)、上海交通大學(xué)和愛丁堡大學(xué)合作構(gòu)建的面向中文語言模型的綜合性考試評測集,包含13948道多項(xiàng)選擇題,涵蓋52個(gè)不同學(xué)科和四個(gè)難度級別。CMMLU榜單則由MBZUAI、上海交通大學(xué)、微軟亞洲研究院共同推出。
圖源:作業(yè)幫
作業(yè)幫表示,作業(yè)幫銀河大模型即將在作業(yè)幫APP等學(xué)習(xí)工具、智能硬件、智能圖書、教育數(shù)字化等業(yè)務(wù)場景中實(shí)現(xiàn)應(yīng)用,同時(shí)將持續(xù)優(yōu)化銀河大模型性能與多模態(tài)能力,加速推進(jìn)在更多教育場景的落地實(shí)踐。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請您 填寫信息告訴我們。