圖源:Pixabay
芥末堆文 毫不夸張地說(shuō),2023年可以被看做是國(guó)內(nèi)“大模型元年”,科創(chuàng)公司、教育企業(yè)全都摩拳擦掌躍躍欲試,只要身處互聯(lián)網(wǎng)就一定會(huì)在任一平臺(tái)刷到過(guò)“大模型”、“AIGC”、“LLM”等關(guān)鍵詞,所有人都樂(lè)于見(jiàn)證并參與到“大模型改變世界”的新浪潮中去。
科技界人士將大模型創(chuàng)業(yè)的生態(tài)分為四層——芯片層、框架層、模型層、應(yīng)用層。整體來(lái)看,多數(shù)教育公司基于開(kāi)源的大模型,快速做出了一些有意思的新產(chǎn)品,但主要還是集中在“應(yīng)用層”。而近段時(shí)間,對(duì)“大模型”創(chuàng)業(yè)的質(zhì)疑聲也不少:先是ChatGPT的訪問(wèn)量出現(xiàn)負(fù)增長(zhǎng),窗口期短,開(kāi)始出現(xiàn)唱衰大模型的聲音;再有業(yè)內(nèi)人士斷言大模型難以落地產(chǎn)業(yè),改變世界言之尚早。
據(jù)量子位統(tǒng)計(jì),包含通用與垂直、開(kāi)源與閉源不同類(lèi)型在內(nèi),國(guó)產(chǎn)大模型數(shù)量已超百家。那么,目前各大公司的教育大模型產(chǎn)品進(jìn)度如何?
1.網(wǎng)易有道:聚焦辦公及學(xué)習(xí)場(chǎng)景中的效率提升
網(wǎng)易有道被認(rèn)為具備底層技術(shù)基因,同時(shí)由于在智能學(xué)習(xí)領(lǐng)域的深耕,也積累了很多教育領(lǐng)域的業(yè)務(wù)數(shù)據(jù)和理解。在國(guó)內(nèi)的教育科技公司中,網(wǎng)易有道較早宣布要推出大模型產(chǎn)品。
今年2月,先是有爆料稱(chēng)網(wǎng)易有道AI技術(shù)團(tuán)隊(duì)已投入到ChatGPT同源技術(shù)(AIGC)在教育場(chǎng)景的落地研發(fā)中,并在AI口語(yǔ)老師、中文作文批改等細(xì)分學(xué)習(xí)場(chǎng)景中嘗試應(yīng)用,將盡快推出相關(guān)的demo版產(chǎn)品。3月,網(wǎng)易有道還推出系列AI應(yīng)用課程,其中包括“ChatGPT從入門(mén)到精通”等。
到了7月,網(wǎng)易正式推出了教育領(lǐng)域垂直大模型“子曰”,并發(fā)布了基于“子曰”大模型研發(fā)的六大創(chuàng)新應(yīng)用——“LLM翻譯”、“虛擬人口語(yǔ)教練”、“AI作文指導(dǎo)”、“語(yǔ)法精講”、“AI Box”以及“文檔問(wèn)答”。
8月9日,網(wǎng)易有道發(fā)布了“子曰”教育大模型首次落地的硬件產(chǎn)品——有道詞典筆X6 Pro,有道詞典筆S6和有道聽(tīng)力寶Pro三款新品,分別定價(jià)1399元、499元和1099元。
網(wǎng)易有道介紹,功能上,子曰大模型它能夠作為基座模型支持諸多下游任務(wù),向所有下游場(chǎng)景提供語(yǔ)義理解、知識(shí)表達(dá)等基礎(chǔ)能力。基于此,有道研發(fā)團(tuán)隊(duì)在“子曰”大模型的基礎(chǔ)上,為不同學(xué)習(xí)場(chǎng)景設(shè)計(jì)了定制化的模型。例如其推出的虛擬人口語(yǔ)教練Hi Echo,主要功能在于理解場(chǎng)景和上下文并給出反饋,發(fā)音可關(guān)注到重音、弱讀、升降調(diào)等細(xì)節(jié),采用啟發(fā)式對(duì)話并給出針對(duì)性建議。
網(wǎng)易大模型產(chǎn)品的落地方向在教育行業(yè)很具代表性——集中在辦公及學(xué)習(xí)場(chǎng)景中,聚焦于to c的效率提升方向。在開(kāi)源模型變多后,小團(tuán)隊(duì)就可以做出類(lèi)似應(yīng)用,這些產(chǎn)品可能會(huì)受到?jīng)_擊。而另一方面,雖然模型技術(shù)在翻譯和語(yǔ)法講解等領(lǐng)域較為成熟,但目前仍舊與真人精講有一定差距,網(wǎng)易稱(chēng)“產(chǎn)品在英語(yǔ)場(chǎng)景下已經(jīng)能夠做到98%的答題準(zhǔn)確率”,不過(guò)在學(xué)習(xí)考試領(lǐng)域,2%的容錯(cuò)率仍可能讓用戶(hù)產(chǎn)生疑慮。
除了教育,網(wǎng)易還主要落地在游戲、工業(yè)、音樂(lè)場(chǎng)景。上個(gè)月,在浙江省召開(kāi)的全省平臺(tái)經(jīng)濟(jì)高質(zhì)量發(fā)展大會(huì)上,丁磊表示,當(dāng)前網(wǎng)易的首要任務(wù)是用最快的速度探索AI大模型的創(chuàng)新應(yīng)用,最近三年,網(wǎng)易研發(fā)總投入近400億。
2.好未來(lái):自研數(shù)學(xué)領(lǐng)域千億級(jí)大模型
不同于其他大模型產(chǎn)品多集中于“文本范疇”,5 月 5 日,學(xué)而思對(duì)外表示,公司正在研發(fā)數(shù)學(xué)大模型,命名為「MathGPT」,面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu),以數(shù)學(xué)領(lǐng)域的解題和講題算法為導(dǎo)向,將于 2023 年內(nèi)推出基于該大模型的產(chǎn)品級(jí)應(yīng)用。
由于大語(yǔ)言模型來(lái)自對(duì)海量語(yǔ)言文本的訓(xùn)練,因此更擅長(zhǎng)語(yǔ)言處理,在數(shù)理邏輯方面表現(xiàn)一般。Google收購(gòu)的Photomath、微軟數(shù)學(xué)、Mathway、專(zhuān)注數(shù)學(xué)計(jì)算的WolframAlpha等產(chǎn)品,主要利用非LLM的傳統(tǒng)AI技術(shù)加上數(shù)據(jù)庫(kù)的方式解決數(shù)學(xué)問(wèn)題,學(xué)而思則選擇自研基于專(zhuān)業(yè)領(lǐng)域的“數(shù)學(xué)大模型”MathGPT。8月24日,好未來(lái)自研的數(shù)學(xué)領(lǐng)域千億級(jí)大模型MathGPT正式上線并開(kāi)啟公測(cè),具體效果還需要時(shí)間的檢驗(yàn)。
這當(dāng)然具有很強(qiáng)的意義,根據(jù)世界教育不平等數(shù)據(jù)庫(kù),在印度,來(lái)自最貧困20%的家庭的15歲學(xué)生,在數(shù)學(xué)方面只有最富裕20%的家庭的15歲學(xué)生的一半水平,所以ChatGPT在數(shù)學(xué)領(lǐng)域的應(yīng)用會(huì)讓教育普及的門(mén)檻更低。學(xué)而思以數(shù)學(xué)起家”,積累了大量數(shù)學(xué)相關(guān)數(shù)據(jù),但訓(xùn)練MathGPT需要的不只是數(shù)據(jù)——GPT沒(méi)有數(shù)據(jù)飛輪,所以在一定意義上來(lái)說(shuō)并非用的人越多越好;并且數(shù)學(xué)領(lǐng)域容錯(cuò)率更低,如何將準(zhǔn)確率提升至100%?如何匹配不同人群的數(shù)學(xué)學(xué)習(xí)場(chǎng)景?可能還有很長(zhǎng)一段路要走。
此外,好未來(lái)還入股人工智能公司深言科技,深言科技核心成員來(lái)自智源悟道大模型研發(fā)團(tuán)隊(duì),致力于用最前沿的人工智能和自然語(yǔ)言處理技術(shù),尤其是大規(guī)模預(yù)訓(xùn)練模型技術(shù)。
3.科大訊飛:從AI學(xué)習(xí)機(jī)硬件切入
談到大模型,科大訊飛可能是不得不提的公司。
梳理時(shí)間線,今年2月,科大訊飛稱(chēng)已于“2022年12月進(jìn)一步啟動(dòng)生成式預(yù)訓(xùn)練大模型任務(wù)攻關(guān),科大訊飛AI學(xué)習(xí)機(jī)、訊飛聽(tīng)見(jiàn)等產(chǎn)品將率先落地”。4月該公司發(fā)布AIGC內(nèi)容創(chuàng)作平臺(tái)“訊飛智作”,用于音視頻創(chuàng)作場(chǎng)景。
5月6日,科大訊飛正式發(fā)布了訊飛星火認(rèn)知大模型及應(yīng)用成果,科大訊飛AI學(xué)習(xí)機(jī)T20系列率先在語(yǔ)數(shù)英主學(xué)科上進(jìn)行了大模型應(yīng)用落地,首批上線了中英文作文類(lèi)人批改(學(xué)習(xí)機(jī)端)和生成(家長(zhǎng)端)、數(shù)學(xué)個(gè)性化精準(zhǔn)學(xué)類(lèi)人互動(dòng)輔學(xué)、英語(yǔ)類(lèi)人口語(yǔ)陪練功能。6月9日,訊飛星火V1.5突破開(kāi)放式問(wèn)答,并在數(shù)學(xué)能力和多輪對(duì)話能力上迭代升級(jí),面向教育、醫(yī)療、工業(yè)、辦公等領(lǐng)域的應(yīng)用全面升級(jí)。
在AI學(xué)習(xí)機(jī)領(lǐng)域,科大訊飛又于7月6日發(fā)布了搭載訊飛星火大模型的首款立式大屏 LUMIE 10 系列,進(jìn)一步擴(kuò)充了學(xué)習(xí)機(jī)全系列品類(lèi),當(dāng)前已搭載星火大模型的學(xué)習(xí)機(jī)系列包括 T20、LUMIE 10、T10、 X3。
8月15日,訊飛星火V2.0升級(jí):發(fā)布代碼和多模態(tài)能力,同時(shí)發(fā)布搭載訊飛星火V2.0的多項(xiàng)應(yīng)用和產(chǎn)品;與華為聯(lián)合發(fā)布企業(yè)私有專(zhuān)屬大模型解決方案——星火一體機(jī),合作共建全國(guó)產(chǎn)化算力底座。
科大訊飛選擇從AI學(xué)習(xí)機(jī)硬件切入,是因?yàn)榻逃布暙I(xiàn)了重要的營(yíng)收占比。財(cái)報(bào)顯示,今年5月、6月,大模型加持后學(xué)習(xí)機(jī)GMV分別同比增長(zhǎng)136%和217%。與此同時(shí),2023年上半年,科大訊飛的研發(fā)費(fèi)用為15.17億元,同比增長(zhǎng)5.42%。然而,8月1日,蘋(píng)果應(yīng)用商店下架訊飛星火APP,這多少對(duì)科大訊飛的大模型之路產(chǎn)生了一些影響。
摩根商研所觀點(diǎn)認(rèn)為:“現(xiàn)階段較為成熟的生成式AI產(chǎn)品,大都是從模仿ChatGPT起步,功能區(qū)塊可謂是大同小異?!倍紺hatGPT的關(guān)鍵一方面是在技術(shù)層面實(shí)現(xiàn)更快速精準(zhǔn)的運(yùn)算效率;再有就是尋求特色化突破,釋放更多AI工具想象力。
4.百度:ToB和ToC領(lǐng)域兩手布局
在今年5月26日的中關(guān)村論壇上,百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏,發(fā)表了題為《大模型改變世界》的演講。李彥宏稱(chēng):“ 未來(lái),所有的應(yīng)用都將基于大模型來(lái)開(kāi)發(fā),每一個(gè)行業(yè)都應(yīng)該有屬于自己的大模型,大模型會(huì)深度融合到實(shí)體經(jīng)濟(jì)當(dāng)中去?!?nbsp;
此前,百度推出大語(yǔ)言模型生成式AI產(chǎn)品“文心一言”及百度智能云發(fā)布企業(yè)級(jí)大語(yǔ)言模型服務(wù)平臺(tái)“文心千帆”。百度在今年5月發(fā)布的小度青禾學(xué)習(xí)手機(jī)也搭載了小度靈機(jī)大模型,并提供AI互動(dòng)講題、寫(xiě)作指導(dǎo)、口語(yǔ)練習(xí)等功能。6月,百度推出基于大模型的代碼編寫(xiě)助手“Comate”,據(jù)百度內(nèi)部人士透露,輔助代碼撰寫(xiě)是第一階段的主要產(chǎn)品功能,第二階段,“Comate”將實(shí)現(xiàn)在特定領(lǐng)域、場(chǎng)景的自然語(yǔ)言代碼生成,第三階段將實(shí)現(xiàn)全領(lǐng)域的自然語(yǔ)言開(kāi)發(fā)。
李彥宏曾透露:“自三月文心一言發(fā)布以來(lái),百度收到來(lái)自企業(yè)用戶(hù)超10萬(wàn)份針對(duì)文心一言的測(cè)試請(qǐng)求,包括金融,軟件,教育,在線旅游等等。”他還預(yù)測(cè),隨著文心一言不斷整合至各個(gè)app,尤其是搜索app之中,預(yù)計(jì)用戶(hù)參與度和流量將進(jìn)一步提升,由此支持在線營(yíng)銷(xiāo)業(yè)務(wù)營(yíng)收的增長(zhǎng)。
百度是國(guó)內(nèi)最早推出類(lèi)ChatGPT產(chǎn)品并開(kāi)放內(nèi)測(cè)的公司,且ToB和ToC領(lǐng)域均有布局。在資金、算力、人才乃至視野上,大廠的優(yōu)勢(shì)都很明顯。李彥宏旗下三亞百川致新私募股權(quán)投資基金合伙企業(yè)(有限合伙)還投資了前華為“天才少年”稚暉君的機(jī)器人項(xiàng)目。外界普遍認(rèn)為,百度投資智元機(jī)器人的真正目的是布局 AGI機(jī)器人市場(chǎng)。
5.作業(yè)幫:正在內(nèi)測(cè)基于中國(guó)市場(chǎng)的教育大模型
6月,媒體披露作業(yè)幫正在內(nèi)測(cè)基于中國(guó)市場(chǎng)的教育大模型,包含多學(xué)科解題、中英文作文批改、多語(yǔ)言對(duì)話方向等多個(gè)教育應(yīng)用場(chǎng)景,涉及工具類(lèi)App、智能硬件、圖書(shū)等業(yè)務(wù)。
知情人士透露,作業(yè)幫在今年年初啟動(dòng)了自研教育大模型項(xiàng)目,目前該項(xiàng)目由CTO羅亮牽頭進(jìn)行底層研發(fā)支持及AIGC大方向建設(shè),研發(fā)經(jīng)費(fèi)優(yōu)先調(diào)撥。同時(shí),除了組織架構(gòu)調(diào)整,作業(yè)幫產(chǎn)研團(tuán)隊(duì)中近百人也已并入GPT相關(guān)項(xiàng)目,估計(jì)有兩百人以上的團(tuán)隊(duì)規(guī)模。
6.阿里云:未來(lái)所有產(chǎn)品都將接入大模型
8月3日,阿里云開(kāi)源通義千問(wèn)70億參數(shù)模型,包括通用模型Qwen-7B和對(duì)話模型Qwen-7B-Chat,兩款模型均已上線AI模型社區(qū)魔搭 ModelScope ,且兩款模型都是開(kāi)源、免費(fèi)、可商用的。
6月末,阿里云與復(fù)旦大學(xué)、中國(guó)電信共同打造的中國(guó)高校最大的云上科研智算平臺(tái)CFFF(Computing for the Future at Fudan)上線,CFFF定位是為發(fā)現(xiàn)和解決復(fù)雜科學(xué)問(wèn)題而建設(shè)的科研“超級(jí)計(jì)算機(jī)”,由面向多學(xué)科融合創(chuàng)新的AI for Science(人工智能用于科研)智能計(jì)算集群“切問(wèn)”一號(hào)和面向高精尖研究的專(zhuān)用高性能計(jì)算集群“近思”一號(hào)兩部分組成。接下來(lái),平臺(tái)還將持續(xù)擴(kuò)大其算力規(guī)模,并向復(fù)旦校外的科研機(jī)構(gòu)、高校、醫(yī)院、高科技企業(yè)等開(kāi)放。
在IaaS、PaaS之外,阿里云還推出了MaaS(模型即服務(wù)),阿里云還官宣:未來(lái)阿里所有的產(chǎn)品都將接入大模型進(jìn)行全面升級(jí),并向全行業(yè)開(kāi)放通義千問(wèn)的能力。據(jù)悉,阿里云的單位算力成本較之十年前下降了80%,存儲(chǔ)成本降低90%,但也仍面臨著高昂的訓(xùn)練成本壓力。
“教育是大模型最容易落地的領(lǐng)域”,大模型賽道中不光有教育巨頭與科技、互聯(lián)網(wǎng)企業(yè),不少有實(shí)力的科研院所也紛紛下場(chǎng)。一組數(shù)據(jù)顯示:3月中旬,剛發(fā)布幾天的GPT4回答準(zhǔn)確率超過(guò)70%,同期已發(fā)布的國(guó)產(chǎn)大模型平均準(zhǔn)確率20%。5 月,國(guó)產(chǎn)大模型的平均準(zhǔn)確率已經(jīng)追到50%以上。彼時(shí),一位業(yè)內(nèi)人士告訴我們,教育行業(yè)在對(duì)大模型的探索上,國(guó)內(nèi)外最大的差異是時(shí)間,本質(zhì)上這種差距花更多時(shí)間、投入算力和資金就能追上。截至目前,包含通用與垂直、開(kāi)源與閉源不同類(lèi)型在內(nèi),國(guó)產(chǎn)大模型數(shù)量已超百家。
7月,《生成式人工智能服務(wù)管理暫行辦法》正式頒布,明確推動(dòng)生成式人工智能基礎(chǔ)設(shè)施和公共訓(xùn)練數(shù)據(jù)資源平臺(tái)建設(shè),促進(jìn)算力資源協(xié)同共享,提升算力資源利用效能。在基礎(chǔ)設(shè)施層面,國(guó)內(nèi)一直在前進(jìn),教育行業(yè)真正需要思考的,也許是如何讓大模型真正落地產(chǎn)業(yè)以及如何回?fù)艚逃竽P彤a(chǎn)品同質(zhì)化、缺乏突破性產(chǎn)品的質(zhì)疑聲。
參考資料:
1.《ChatGPT的應(yīng)用場(chǎng)景暢想:教育篇》https://36kr.com/p/2262739375272073
2.《科大訊飛的機(jī)遇,藏在垂類(lèi)大模型?》https://36kr.com/p/2378266100873217
3.《國(guó)產(chǎn)大模型已無(wú)公司可投》https://36kr.com/p/2385973327640581
4.《阿里云大模型之戰(zhàn):逍遙子不能輸》https://36kr.com/p/2217597900895617
5.《大模型的“高考沖刺”,教育行業(yè)已率先交卷?》https://36kr.com/p/2291324087834626
6.《大模型不能再繼續(xù)“裸奔”了》https://36kr.com/p/2394442594753673
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車(chē)馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫(xiě)信息告訴我們。