圖源:Pixabay
芥末堆文 近期,Meta發(fā)布免費且可商用的大模型系列——Llama 2。8月3日,阿里云開源通義千問70億參數(shù)模型,包括通用模型Qwen-7B和對話模型Qwen-7B-Chat,兩款模型均已上線AI模型社區(qū)魔搭 ModelScope ,且兩款模型都是開源、免費、可商用的。
據(jù)悉,魔搭ModelScope為阿里巴巴達摩院模型開源社區(qū),阿里云成為國內首個加入大模型開源行列的大型科技企業(yè)。
今年4月,阿里云推出自研大模型通義千問,據(jù)科技媒體介紹,Qwen-7B是基于Transformer的大語言模型,在超大規(guī)模預訓練數(shù)據(jù)上訓練得到。預訓練數(shù)據(jù)包括大量網(wǎng)絡文本、專業(yè)書籍、代碼等。它是支持中、英等多種語言的基座模型,在超過2萬億 token 數(shù)據(jù)集上訓練,上下文窗口長度達到8k;Qwen-7B-Chat是基 Qwen-7B基座模型的中英文對話模型,已實現(xiàn)與人類認知對齊。
根據(jù)魔搭ModelScope社區(qū)消息,上個月,智譜AI及清華KEG實驗室發(fā)布允許ChatGLM-6B和ChatGLM2-6B完全免費商用,希望為開源社區(qū)發(fā)展作出貢獻,為此,在中國中文信息學會社會媒體處理專委會的支持下,智譜AI及清華KEG實驗室聯(lián)合安碩信息、阿里云、魔搭社區(qū)、北京交通大學,推出了“ChatGLM金融大模型挑戰(zhàn)賽”。比賽要求參賽選手以ChatGLM2-6B模型為中心制作一個問答系統(tǒng),回答用戶的金融相關的問題,不允許使用其他的大語言模型。
據(jù)悉,近日騰訊自研的 “騰訊混元大模型”也已經(jīng)進入應用內測階段,騰訊內部多個業(yè)務已經(jīng)接入混元大模型進行測試。
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。