3月19日,阿里大模型產(chǎn)品“通義聽悟”發(fā)布多項(xiàng)新功能。音視頻問答助手“小悟”上線,在業(yè)界首次實(shí)現(xiàn)單記錄、跨記錄、多語(yǔ)言自由問,支持對(duì)單個(gè)最長(zhǎng)6小時(shí)、一次性上百條音視頻的內(nèi)容理解問答,用戶可對(duì)超長(zhǎng)音視頻隨心提問,讓AI 總結(jié)任意知識(shí)點(diǎn)。此外,針對(duì)學(xué)習(xí)科研場(chǎng)景對(duì)AI工具的強(qiáng)烈需求,通義聽悟推出“高校公益計(jì)劃”,向所有中國(guó)大陸高校師生直接贈(zèng)送價(jià)值數(shù)千元的500小時(shí)音視頻轉(zhuǎn)寫時(shí)長(zhǎng)。
超長(zhǎng)音視頻自由提問,AI秒速總結(jié)知識(shí)點(diǎn)、潤(rùn)色口語(yǔ)、做腦圖
音視頻承載了密集的信息內(nèi)容,但因涉及多模態(tài)理解、自然語(yǔ)言處理、搜索等多項(xiàng)復(fù)雜技術(shù),長(zhǎng)期以來(lái)內(nèi)容查找難、回顧難、提煉難。阿里通義聽悟產(chǎn)品負(fù)責(zé)人楊帆介紹,通義聽悟?yàn)檫@一需求而生?!白鳛橐豢罟ぷ鲗W(xué)習(xí)AI助手,通義聽悟希望讓高知識(shí)附加值的音視頻被輕松閱讀、整理和分享?!?/p>
通義聽悟接入通義千問大模型,融合了十多項(xiàng)AI功能,包括轉(zhuǎn)寫、翻譯、角色分離、全文摘要、章節(jié)速覽、發(fā)言總結(jié)、PPT提取等,并支持標(biāo)重點(diǎn)、記筆記,被許多用戶稱為“寶藏AI工具”。
楊帆介紹通義聽悟歷程
通義聽悟本次升級(jí)上新了六大功能點(diǎn)。最重磅的是音視頻問答助手“小悟”,關(guān)鍵信息直接“問”出來(lái)。小悟通過多語(yǔ)言Query處理、長(zhǎng)篇章文本理解、指令演化框架優(yōu)化及檢索增強(qiáng)生成算法,在業(yè)內(nèi)首次實(shí)現(xiàn)對(duì)超長(zhǎng)音視頻的單記錄、跨記錄、多語(yǔ)言自由問答,支持內(nèi)容問答的音視頻時(shí)長(zhǎng)和文件數(shù)均突破業(yè)界上限。
用戶不僅可在單一記錄頁(yè)呼喚小悟,對(duì)最高6小時(shí)、6G大小的音視頻提問任何相關(guān)話題,或直接要求小悟整理金句、梳理結(jié)論、寫會(huì)議紀(jì)要;更可在首頁(yè)針對(duì)用戶所有記錄提問,支持一次性掃描理解上百條音視頻內(nèi)容;也可花式對(duì)英文視頻用中文提問,小悟?qū)⒅苯咏o出中文回答,省去翻譯。作為一個(gè)“懂你”的AI,小悟還會(huì)智能推薦問題。
隨時(shí)喚起“小悟”課代表
針對(duì)用戶需求,通義聽悟還上線了一鍵AI改寫、思維導(dǎo)圖生成等新能力。例如,一鍵AI改寫,將口語(yǔ)轉(zhuǎn)為書面表達(dá),尤其適合整理采訪;思維導(dǎo)圖自動(dòng)生成,最多支持五級(jí)xmind腦圖,適合播客摘要。
通義聽悟思維導(dǎo)圖示例
產(chǎn)品細(xì)節(jié)體驗(yàn)也進(jìn)一步升級(jí),包括筆記支持一鍵插入視頻時(shí)間戳及截圖、音視頻文件語(yǔ)種自動(dòng)識(shí)別等。
教育福利上線,郵箱認(rèn)證即可得500小時(shí)免費(fèi)時(shí)長(zhǎng)
學(xué)生和科研群體對(duì)AI新工具有普遍需求,但目前音視頻AI轉(zhuǎn)寫工具普遍收費(fèi),或僅提供如每月1小時(shí)的少量免費(fèi)時(shí)長(zhǎng)。
通義聽悟推出“高校公益計(jì)劃”,推動(dòng)AI算力普惠。所有中國(guó)大陸高校師生通過后綴edu.cn的教育郵箱進(jìn)行認(rèn)證后,均可直接獲贈(zèng)500小時(shí)轉(zhuǎn)寫時(shí)長(zhǎng),存儲(chǔ)空間從20G拓展至200G。按目前市面上語(yǔ)音廠商9.9元每小時(shí)的折扣價(jià),這一教育福利價(jià)值數(shù)千元。
通義聽悟能聽、能看、能讀,還能實(shí)現(xiàn)速覽加精聽,正成為學(xué)霸們的全新學(xué)習(xí)方式。楊帆介紹,調(diào)研中發(fā)現(xiàn)約一半用戶是學(xué)生,他們活躍度相當(dāng)高,后臺(tái)每天收到大量私信“求時(shí)長(zhǎng)”。
有的同學(xué)上課、開組會(huì)“無(wú)時(shí)無(wú)刻不聽悟”;有的用通義聽悟兩倍速上網(wǎng)課備考;有的每天在“發(fā)現(xiàn)”欄目中閱讀數(shù)十檔播客節(jié)目,“獲取最前沿新鮮的觀點(diǎn)內(nèi)容”。
成都一位管理學(xué)博士生蔡同學(xué)在社交媒體上寫道,“通義聽悟絕對(duì)是最強(qiáng)科研神器”,她向身邊幾乎所有親朋好友推薦了這款產(chǎn)品。通義聽悟發(fā)布才9個(gè)月,她的使用時(shí)長(zhǎng)已近7000小時(shí),平均每天轉(zhuǎn)寫20小時(shí)以上,包括分析網(wǎng)絡(luò)視頻進(jìn)行學(xué)術(shù)研究,以及日常學(xué)習(xí)工作隨時(shí)使用,這款軟件已成為她沉淀知識(shí)和科研成果的重要平臺(tái)。
作為國(guó)內(nèi)首個(gè)開放公測(cè)的大模型產(chǎn)品,去年6月發(fā)布以來(lái),通義聽悟累計(jì)已有上百萬(wàn)用戶,包括學(xué)生、老師、白領(lǐng)、記者、律師、金融分析師等群體,活躍用戶日均轉(zhuǎn)寫音視頻3次以上,平臺(tái)每天處理字符數(shù)約20億字。
2、芥末堆不接受通過公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。