圖源:Unsplash
面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu),計(jì)劃于年內(nèi)推出
據(jù)了解,學(xué)而思正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā),命名為MathGPT,面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu),以數(shù)學(xué)領(lǐng)域的解題和講題算法為核心,目前已經(jīng)取得階段性成果,并將于年內(nèi)推出基于該自研大模型的產(chǎn)品級(jí)應(yīng)用。
據(jù)悉,學(xué)而思已將MathGPT作為公司核心項(xiàng)目,由CTO田密負(fù)責(zé),今年春節(jié)前,該項(xiàng)目已經(jīng)啟動(dòng)相應(yīng)的團(tuán)隊(duì)建設(shè)、數(shù)據(jù)、算力準(zhǔn)備和技術(shù)研發(fā)。此外,學(xué)而思已經(jīng)啟動(dòng)在美國(guó)硅谷的團(tuán)隊(duì)建設(shè),將成立一支海外算法和工程團(tuán)隊(duì),在全球范圍內(nèi)招募優(yōu)秀的人工智能專家加入。
MathGPT與大語(yǔ)言模型(LLM)的差異
美國(guó)OpenAI公司在今年三月份發(fā)布了大語(yǔ)言模型GPT-4,國(guó)內(nèi)百度、阿里也發(fā)布了各自的大模型產(chǎn)品,但通用語(yǔ)言模型更像一個(gè)“文科生”,在語(yǔ)言翻譯、摘要、理解和生成等任務(wù)上有出色表現(xiàn),在數(shù)學(xué)問(wèn)題的解決、講解、問(wèn)答和推薦方面則存在明顯不足:解答數(shù)學(xué)問(wèn)題經(jīng)常出錯(cuò),有些數(shù)學(xué)問(wèn)題雖然能夠解決,但方法更偏成年人,無(wú)法針對(duì)適齡孩子的知識(shí)結(jié)構(gòu)和認(rèn)知水平做適配。
“這種不足是由LLM模型的自身特點(diǎn)決定的。”學(xué)而思AI團(tuán)隊(duì)負(fù)責(zé)人介紹,LLM大模型來(lái)自對(duì)海量語(yǔ)言文本的訓(xùn)練,因此最擅長(zhǎng)語(yǔ)言處理。行業(yè)內(nèi)偏向基于LLM大模型做閱讀、寫作類應(yīng)用,但如果想要在數(shù)學(xué)能力上有突破,就需要研發(fā)新的大模型。因此,學(xué)而思決心組建團(tuán)隊(duì)專研MathGPT——數(shù)學(xué)領(lǐng)域大模型,用自己在數(shù)學(xué)和AI上的多年積累,面向全球范圍內(nèi)的數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu),做好AI大模型時(shí)代的數(shù)學(xué)基礎(chǔ)工作。
學(xué)而思希望通過(guò)MathGPT彌補(bǔ)和攻克大語(yǔ)言模型的三個(gè)問(wèn)題:第一,題目要解對(duì),現(xiàn)在GPT結(jié)果經(jīng)常出現(xiàn)錯(cuò)誤;第二,解題步驟要穩(wěn)定、清晰,現(xiàn)在GPT的解題步驟每次都不一樣,而且生成內(nèi)容經(jīng)常很冗余;第三,解題要講的有趣、個(gè)性化,現(xiàn)在GPT的解釋過(guò)于“學(xué)術(shù)”和機(jī)械,對(duì)孩子的學(xué)習(xí)體驗(yàn)很不友好。
做MathGPT,學(xué)而思憑什么
學(xué)而思作為獲國(guó)家科技部批準(zhǔn)的“智慧教育國(guó)家新一代人工智能開放創(chuàng)新平臺(tái)”建設(shè)單位,也是教育行業(yè)唯一一家人工智能“國(guó)家隊(duì)”成員,在人工智能領(lǐng)域有著多年的深入研究,早在2017年,學(xué)而思便成立了AI lab 人工智能實(shí)驗(yàn)室。
據(jù)公開信息顯示,基于智慧教育人工智能開放創(chuàng)新平臺(tái)助力,學(xué)而思AI lab獲得各類頂級(jí)學(xué)術(shù)會(huì)議比賽冠軍16項(xiàng),亞軍6項(xiàng);發(fā)表國(guó)際期刊和會(huì)議高水平學(xué)術(shù)論文31篇,包含光學(xué)字符識(shí)別、圖像、自然語(yǔ)言處理、語(yǔ)音以及多模態(tài)等多領(lǐng)域的學(xué)術(shù)研究,在計(jì)算機(jī)視覺(jué)頂會(huì)以及自然語(yǔ)言頂會(huì)中均有多篇論文發(fā)表;申請(qǐng)專利220余項(xiàng),授權(quán)專利150余項(xiàng),軟件著作權(quán)60余項(xiàng)。
學(xué)而思AI lab在各類頂級(jí)學(xué)術(shù)會(huì)議比賽獲獎(jiǎng)情況
“以數(shù)學(xué)起家”的學(xué)而思至今已有20年的數(shù)學(xué)教學(xué)經(jīng)驗(yàn),積累了龐大的數(shù)學(xué)相關(guān)數(shù)據(jù),這些數(shù)據(jù)是進(jìn)行MathGPT訓(xùn)練的必備物料。另外,學(xué)而思的海外業(yè)務(wù)Think Academy在全球若干國(guó)家和地區(qū)深受數(shù)學(xué)愛(ài)好者喜歡,學(xué)而思的學(xué)生在每年的IMO和AMC等國(guó)際數(shù)學(xué)競(jìng)賽中表現(xiàn)優(yōu)異,每年都有多位學(xué)生在國(guó)際奧林匹克數(shù)學(xué)競(jìng)賽中拿到金牌。所以,學(xué)而思選擇在MathGPT方向發(fā)力也順理成章。
另?yè)?jù)了解,學(xué)而思學(xué)習(xí)機(jī)近期將會(huì)上線一款“AI助手”,涵蓋作文助手、口語(yǔ)助手、閱讀助手、數(shù)學(xué)助手等相關(guān)功能,該AI產(chǎn)品將于5月11日開啟內(nèi)測(cè)。
MathGPT的挑戰(zhàn)和技術(shù)難題
如何利用大語(yǔ)言模型服務(wù)各行各業(yè)是當(dāng)下社會(huì)的焦點(diǎn)問(wèn)題。比如在教育領(lǐng)域,Duolingo、Quizlet、可汗學(xué)院等產(chǎn)品主要和OpenAI合作,在GPT大模型上做微調(diào)和接口調(diào)用,增強(qiáng)原有的產(chǎn)品體驗(yàn)。但也有一些領(lǐng)域如數(shù)學(xué)、醫(yī)學(xué)等,對(duì)AI的需求是準(zhǔn)確、清晰、具備強(qiáng)大的邏輯推理能力,且容錯(cuò)率低,通用LLM目前的性能表現(xiàn)還無(wú)法在上述領(lǐng)域取得突破,未來(lái)是否可能取得突破尚不清晰。
以數(shù)學(xué)領(lǐng)域?yàn)槔壳笆袌?chǎng)上有幾個(gè)主要流派。比如Google收購(gòu)的Photomath、微軟數(shù)學(xué)、Mathway、專注數(shù)學(xué)計(jì)算的WolframAlpha等產(chǎn)品,主要利用非LLM的傳統(tǒng)AI技術(shù)加上數(shù)據(jù)庫(kù)的方式解決數(shù)學(xué)問(wèn)題。走AGI路線的公司則嘗試讓通用LLM“更懂?dāng)?shù)學(xué)”,比如GPT4在數(shù)學(xué)任務(wù)上比之前的3.5版本性能更好,谷歌旗下的Minerva模型也專門針對(duì)數(shù)學(xué)問(wèn)題進(jìn)行調(diào)優(yōu)。學(xué)而思選擇了另一條少有人走的路,不基于現(xiàn)有LLM做微調(diào)和接口調(diào)用、不做通用LLM,而是自研基于專業(yè)領(lǐng)域的“數(shù)學(xué)大模型”MathGPT,致力于打造自主、穩(wěn)定、可持續(xù)、高質(zhì)量的學(xué)習(xí)解決方案。
在大語(yǔ)言模型不斷進(jìn)化的浪潮下,不同的技術(shù)路線選擇孰優(yōu)孰劣,仍有待討論和驗(yàn)證。學(xué)而思自研獨(dú)立的MathGPT大模型是否成立,是否能夠超越通用模型在數(shù)學(xué)任務(wù)上的表現(xiàn),是否更匹配不同人群的數(shù)學(xué)學(xué)習(xí)場(chǎng)景,這個(gè)問(wèn)題還需要在創(chuàng)新實(shí)踐中尋找答案。隨著整個(gè)行業(yè)的深化發(fā)展和越來(lái)越多人才參與到這個(gè)領(lǐng)域,相信不久的將來(lái)就能看到更為成熟的解決方案。
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。