圖源:Pixabay
芥末堆文 毫不夸張地說,2023年可以被看做是國內(nèi)“大模型元年”,科創(chuàng)公司、教育企業(yè)全都摩拳擦掌躍躍欲試,只要身處互聯(lián)網(wǎng)就一定會(huì)在任一平臺(tái)刷到過“大模型”、“AIGC”、“LLM”等關(guān)鍵詞,所有人都樂于見證并參與到“大模型改變世界”的新浪潮中去。
科技界人士將大模型創(chuàng)業(yè)的生態(tài)分為四層——芯片層、框架層、模型層、應(yīng)用層。整體來看,多數(shù)教育公司基于開源的大模型,快速做出了一些有意思的新產(chǎn)品,但主要還是集中在“應(yīng)用層”。而近段時(shí)間,對(duì)“大模型”創(chuàng)業(yè)的質(zhì)疑聲也不少:先是ChatGPT的訪問量出現(xiàn)負(fù)增長,窗口期短,開始出現(xiàn)唱衰大模型的聲音;再有業(yè)內(nèi)人士斷言大模型難以落地產(chǎn)業(yè),改變世界言之尚早。
據(jù)量子位統(tǒng)計(jì),包含通用與垂直、開源與閉源不同類型在內(nèi),國產(chǎn)大模型數(shù)量已超百家。那么,目前各大公司的教育大模型產(chǎn)品進(jìn)度如何?
1.網(wǎng)易有道:聚焦辦公及學(xué)習(xí)場景中的效率提升
網(wǎng)易有道被認(rèn)為具備底層技術(shù)基因,同時(shí)由于在智能學(xué)習(xí)領(lǐng)域的深耕,也積累了很多教育領(lǐng)域的業(yè)務(wù)數(shù)據(jù)和理解。在國內(nèi)的教育科技公司中,網(wǎng)易有道較早宣布要推出大模型產(chǎn)品。
今年2月,先是有爆料稱網(wǎng)易有道AI技術(shù)團(tuán)隊(duì)已投入到ChatGPT同源技術(shù)(AIGC)在教育場景的落地研發(fā)中,并在AI口語老師、中文作文批改等細(xì)分學(xué)習(xí)場景中嘗試應(yīng)用,將盡快推出相關(guān)的demo版產(chǎn)品。3月,網(wǎng)易有道還推出系列AI應(yīng)用課程,其中包括“ChatGPT從入門到精通”等。
到了7月,網(wǎng)易正式推出了教育領(lǐng)域垂直大模型“子曰”,并發(fā)布了基于“子曰”大模型研發(fā)的六大創(chuàng)新應(yīng)用——“LLM翻譯”、“虛擬人口語教練”、“AI作文指導(dǎo)”、“語法精講”、“AI Box”以及“文檔問答”。
8月9日,網(wǎng)易有道發(fā)布了“子曰”教育大模型首次落地的硬件產(chǎn)品——有道詞典筆X6 Pro,有道詞典筆S6和有道聽力寶Pro三款新品,分別定價(jià)1399元、499元和1099元。
網(wǎng)易有道介紹,功能上,子曰大模型它能夠作為基座模型支持諸多下游任務(wù),向所有下游場景提供語義理解、知識(shí)表達(dá)等基礎(chǔ)能力。基于此,有道研發(fā)團(tuán)隊(duì)在“子曰”大模型的基礎(chǔ)上,為不同學(xué)習(xí)場景設(shè)計(jì)了定制化的模型。例如其推出的虛擬人口語教練Hi Echo,主要功能在于理解場景和上下文并給出反饋,發(fā)音可關(guān)注到重音、弱讀、升降調(diào)等細(xì)節(jié),采用啟發(fā)式對(duì)話并給出針對(duì)性建議。
網(wǎng)易大模型產(chǎn)品的落地方向在教育行業(yè)很具代表性——集中在辦公及學(xué)習(xí)場景中,聚焦于to c的效率提升方向。在開源模型變多后,小團(tuán)隊(duì)就可以做出類似應(yīng)用,這些產(chǎn)品可能會(huì)受到?jīng)_擊。而另一方面,雖然模型技術(shù)在翻譯和語法講解等領(lǐng)域較為成熟,但目前仍舊與真人精講有一定差距,網(wǎng)易稱“產(chǎn)品在英語場景下已經(jīng)能夠做到98%的答題準(zhǔn)確率”,不過在學(xué)習(xí)考試領(lǐng)域,2%的容錯(cuò)率仍可能讓用戶產(chǎn)生疑慮。
除了教育,網(wǎng)易還主要落地在游戲、工業(yè)、音樂場景。上個(gè)月,在浙江省召開的全省平臺(tái)經(jīng)濟(jì)高質(zhì)量發(fā)展大會(huì)上,丁磊表示,當(dāng)前網(wǎng)易的首要任務(wù)是用最快的速度探索AI大模型的創(chuàng)新應(yīng)用,最近三年,網(wǎng)易研發(fā)總投入近400億。
2.好未來:自研數(shù)學(xué)領(lǐng)域千億級(jí)大模型
不同于其他大模型產(chǎn)品多集中于“文本范疇”,5 月 5 日,學(xué)而思對(duì)外表示,公司正在研發(fā)數(shù)學(xué)大模型,命名為「MathGPT」,面向全球數(shù)學(xué)愛好者和科研機(jī)構(gòu),以數(shù)學(xué)領(lǐng)域的解題和講題算法為導(dǎo)向,將于 2023 年內(nèi)推出基于該大模型的產(chǎn)品級(jí)應(yīng)用。
由于大語言模型來自對(duì)海量語言文本的訓(xùn)練,因此更擅長語言處理,在數(shù)理邏輯方面表現(xiàn)一般。Google收購的Photomath、微軟數(shù)學(xué)、Mathway、專注數(shù)學(xué)計(jì)算的WolframAlpha等產(chǎn)品,主要利用非LLM的傳統(tǒng)AI技術(shù)加上數(shù)據(jù)庫的方式解決數(shù)學(xué)問題,學(xué)而思則選擇自研基于專業(yè)領(lǐng)域的“數(shù)學(xué)大模型”MathGPT。8月24日,好未來自研的數(shù)學(xué)領(lǐng)域千億級(jí)大模型MathGPT正式上線并開啟公測,具體效果還需要時(shí)間的檢驗(yàn)。
這當(dāng)然具有很強(qiáng)的意義,根據(jù)世界教育不平等數(shù)據(jù)庫,在印度,來自最貧困20%的家庭的15歲學(xué)生,在數(shù)學(xué)方面只有最富裕20%的家庭的15歲學(xué)生的一半水平,所以ChatGPT在數(shù)學(xué)領(lǐng)域的應(yīng)用會(huì)讓教育普及的門檻更低。學(xué)而思以數(shù)學(xué)起家”,積累了大量數(shù)學(xué)相關(guān)數(shù)據(jù),但訓(xùn)練MathGPT需要的不只是數(shù)據(jù)——GPT沒有數(shù)據(jù)飛輪,所以在一定意義上來說并非用的人越多越好;并且數(shù)學(xué)領(lǐng)域容錯(cuò)率更低,如何將準(zhǔn)確率提升至100%?如何匹配不同人群的數(shù)學(xué)學(xué)習(xí)場景?可能還有很長一段路要走。
此外,好未來還入股人工智能公司深言科技,深言科技核心成員來自智源悟道大模型研發(fā)團(tuán)隊(duì),致力于用最前沿的人工智能和自然語言處理技術(shù),尤其是大規(guī)模預(yù)訓(xùn)練模型技術(shù)。
3.科大訊飛:從AI學(xué)習(xí)機(jī)硬件切入
談到大模型,科大訊飛可能是不得不提的公司。
梳理時(shí)間線,今年2月,科大訊飛稱已于“2022年12月進(jìn)一步啟動(dòng)生成式預(yù)訓(xùn)練大模型任務(wù)攻關(guān),科大訊飛AI學(xué)習(xí)機(jī)、訊飛聽見等產(chǎn)品將率先落地”。4月該公司發(fā)布AIGC內(nèi)容創(chuàng)作平臺(tái)“訊飛智作”,用于音視頻創(chuàng)作場景。
5月6日,科大訊飛正式發(fā)布了訊飛星火認(rèn)知大模型及應(yīng)用成果,科大訊飛AI學(xué)習(xí)機(jī)T20系列率先在語數(shù)英主學(xué)科上進(jìn)行了大模型應(yīng)用落地,首批上線了中英文作文類人批改(學(xué)習(xí)機(jī)端)和生成(家長端)、數(shù)學(xué)個(gè)性化精準(zhǔn)學(xué)類人互動(dòng)輔學(xué)、英語類人口語陪練功能。6月9日,訊飛星火V1.5突破開放式問答,并在數(shù)學(xué)能力和多輪對(duì)話能力上迭代升級(jí),面向教育、醫(yī)療、工業(yè)、辦公等領(lǐng)域的應(yīng)用全面升級(jí)。
在AI學(xué)習(xí)機(jī)領(lǐng)域,科大訊飛又于7月6日發(fā)布了搭載訊飛星火大模型的首款立式大屏 LUMIE 10 系列,進(jìn)一步擴(kuò)充了學(xué)習(xí)機(jī)全系列品類,當(dāng)前已搭載星火大模型的學(xué)習(xí)機(jī)系列包括 T20、LUMIE 10、T10、 X3。
8月15日,訊飛星火V2.0升級(jí):發(fā)布代碼和多模態(tài)能力,同時(shí)發(fā)布搭載訊飛星火V2.0的多項(xiàng)應(yīng)用和產(chǎn)品;與華為聯(lián)合發(fā)布企業(yè)私有專屬大模型解決方案——星火一體機(jī),合作共建全國產(chǎn)化算力底座。
科大訊飛選擇從AI學(xué)習(xí)機(jī)硬件切入,是因?yàn)榻逃布暙I(xiàn)了重要的營收占比。財(cái)報(bào)顯示,今年5月、6月,大模型加持后學(xué)習(xí)機(jī)GMV分別同比增長136%和217%。與此同時(shí),2023年上半年,科大訊飛的研發(fā)費(fèi)用為15.17億元,同比增長5.42%。然而,8月1日,蘋果應(yīng)用商店下架訊飛星火APP,這多少對(duì)科大訊飛的大模型之路產(chǎn)生了一些影響。
摩根商研所觀點(diǎn)認(rèn)為:“現(xiàn)階段較為成熟的生成式AI產(chǎn)品,大都是從模仿ChatGPT起步,功能區(qū)塊可謂是大同小異?!倍紺hatGPT的關(guān)鍵一方面是在技術(shù)層面實(shí)現(xiàn)更快速精準(zhǔn)的運(yùn)算效率;再有就是尋求特色化突破,釋放更多AI工具想象力。
4.百度:ToB和ToC領(lǐng)域兩手布局
在今年5月26日的中關(guān)村論壇上,百度創(chuàng)始人、董事長兼CEO李彥宏,發(fā)表了題為《大模型改變世界》的演講。李彥宏稱:“ 未來,所有的應(yīng)用都將基于大模型來開發(fā),每一個(gè)行業(yè)都應(yīng)該有屬于自己的大模型,大模型會(huì)深度融合到實(shí)體經(jīng)濟(jì)當(dāng)中去。”
此前,百度推出大語言模型生成式AI產(chǎn)品“文心一言”及百度智能云發(fā)布企業(yè)級(jí)大語言模型服務(wù)平臺(tái)“文心千帆”。百度在今年5月發(fā)布的小度青禾學(xué)習(xí)手機(jī)也搭載了小度靈機(jī)大模型,并提供AI互動(dòng)講題、寫作指導(dǎo)、口語練習(xí)等功能。6月,百度推出基于大模型的代碼編寫助手“Comate”,據(jù)百度內(nèi)部人士透露,輔助代碼撰寫是第一階段的主要產(chǎn)品功能,第二階段,“Comate”將實(shí)現(xiàn)在特定領(lǐng)域、場景的自然語言代碼生成,第三階段將實(shí)現(xiàn)全領(lǐng)域的自然語言開發(fā)。
李彥宏曾透露:“自三月文心一言發(fā)布以來,百度收到來自企業(yè)用戶超10萬份針對(duì)文心一言的測試請(qǐng)求,包括金融,軟件,教育,在線旅游等等。”他還預(yù)測,隨著文心一言不斷整合至各個(gè)app,尤其是搜索app之中,預(yù)計(jì)用戶參與度和流量將進(jìn)一步提升,由此支持在線營銷業(yè)務(wù)營收的增長。
百度是國內(nèi)最早推出類ChatGPT產(chǎn)品并開放內(nèi)測的公司,且ToB和ToC領(lǐng)域均有布局。在資金、算力、人才乃至視野上,大廠的優(yōu)勢(shì)都很明顯。李彥宏旗下三亞百川致新私募股權(quán)投資基金合伙企業(yè)(有限合伙)還投資了前華為“天才少年”稚暉君的機(jī)器人項(xiàng)目。外界普遍認(rèn)為,百度投資智元機(jī)器人的真正目的是布局 AGI機(jī)器人市場。
5.作業(yè)幫:正在內(nèi)測基于中國市場的教育大模型
6月,媒體披露作業(yè)幫正在內(nèi)測基于中國市場的教育大模型,包含多學(xué)科解題、中英文作文批改、多語言對(duì)話方向等多個(gè)教育應(yīng)用場景,涉及工具類App、智能硬件、圖書等業(yè)務(wù)。
知情人士透露,作業(yè)幫在今年年初啟動(dòng)了自研教育大模型項(xiàng)目,目前該項(xiàng)目由CTO羅亮牽頭進(jìn)行底層研發(fā)支持及AIGC大方向建設(shè),研發(fā)經(jīng)費(fèi)優(yōu)先調(diào)撥。同時(shí),除了組織架構(gòu)調(diào)整,作業(yè)幫產(chǎn)研團(tuán)隊(duì)中近百人也已并入GPT相關(guān)項(xiàng)目,估計(jì)有兩百人以上的團(tuán)隊(duì)規(guī)模。
6.阿里云:未來所有產(chǎn)品都將接入大模型
8月3日,阿里云開源通義千問70億參數(shù)模型,包括通用模型Qwen-7B和對(duì)話模型Qwen-7B-Chat,兩款模型均已上線AI模型社區(qū)魔搭 ModelScope ,且兩款模型都是開源、免費(fèi)、可商用的。
6月末,阿里云與復(fù)旦大學(xué)、中國電信共同打造的中國高校最大的云上科研智算平臺(tái)CFFF(Computing for the Future at Fudan)上線,CFFF定位是為發(fā)現(xiàn)和解決復(fù)雜科學(xué)問題而建設(shè)的科研“超級(jí)計(jì)算機(jī)”,由面向多學(xué)科融合創(chuàng)新的AI for Science(人工智能用于科研)智能計(jì)算集群“切問”一號(hào)和面向高精尖研究的專用高性能計(jì)算集群“近思”一號(hào)兩部分組成。接下來,平臺(tái)還將持續(xù)擴(kuò)大其算力規(guī)模,并向復(fù)旦校外的科研機(jī)構(gòu)、高校、醫(yī)院、高科技企業(yè)等開放。
在IaaS、PaaS之外,阿里云還推出了MaaS(模型即服務(wù)),阿里云還官宣:未來阿里所有的產(chǎn)品都將接入大模型進(jìn)行全面升級(jí),并向全行業(yè)開放通義千問的能力。據(jù)悉,阿里云的單位算力成本較之十年前下降了80%,存儲(chǔ)成本降低90%,但也仍面臨著高昂的訓(xùn)練成本壓力。
“教育是大模型最容易落地的領(lǐng)域”,大模型賽道中不光有教育巨頭與科技、互聯(lián)網(wǎng)企業(yè),不少有實(shí)力的科研院所也紛紛下場。一組數(shù)據(jù)顯示:3月中旬,剛發(fā)布幾天的GPT4回答準(zhǔn)確率超過70%,同期已發(fā)布的國產(chǎn)大模型平均準(zhǔn)確率20%。5 月,國產(chǎn)大模型的平均準(zhǔn)確率已經(jīng)追到50%以上。彼時(shí),一位業(yè)內(nèi)人士告訴我們,教育行業(yè)在對(duì)大模型的探索上,國內(nèi)外最大的差異是時(shí)間,本質(zhì)上這種差距花更多時(shí)間、投入算力和資金就能追上。截至目前,包含通用與垂直、開源與閉源不同類型在內(nèi),國產(chǎn)大模型數(shù)量已超百家。
7月,《生成式人工智能服務(wù)管理暫行辦法》正式頒布,明確推動(dòng)生成式人工智能基礎(chǔ)設(shè)施和公共訓(xùn)練數(shù)據(jù)資源平臺(tái)建設(shè),促進(jìn)算力資源協(xié)同共享,提升算力資源利用效能。在基礎(chǔ)設(shè)施層面,國內(nèi)一直在前進(jìn),教育行業(yè)真正需要思考的,也許是如何讓大模型真正落地產(chǎn)業(yè)以及如何回?fù)艚逃竽P彤a(chǎn)品同質(zhì)化、缺乏突破性產(chǎn)品的質(zhì)疑聲。
參考資料:
1.《ChatGPT的應(yīng)用場景暢想:教育篇》https://36kr.com/p/2262739375272073
2.《科大訊飛的機(jī)遇,藏在垂類大模型?》https://36kr.com/p/2378266100873217
3.《國產(chǎn)大模型已無公司可投》https://36kr.com/p/2385973327640581
4.《阿里云大模型之戰(zhàn):逍遙子不能輸》https://36kr.com/p/2217597900895617
5.《大模型的“高考沖刺”,教育行業(yè)已率先交卷?》https://36kr.com/p/2291324087834626
6.《大模型不能再繼續(xù)“裸奔”了》https://36kr.com/p/2394442594753673
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。