芥末堆芥末堆

用AI一鍵搞定雅思口語 | 扣子coze.cn最佳實踐 Vol.1

作者:昆布 發(fā)布時間:

用AI一鍵搞定雅思口語 | 扣子coze.cn最佳實踐 Vol.1

作者:昆布 發(fā)布時間:

摘要:一鍵復制創(chuàng)造屬于你的24小時口語專家。

7.png

??Bot現(xiàn)已開源,一鍵復制創(chuàng)造屬于你的24小時口語專家

8.gif

9.jpg掃碼體驗/復刻雅思口語專家

提到備考雅思

第一反應是不是擼起袖子報個班?

等等打??!

現(xiàn)在流行的“電子專家”不會還有人不知道吧?

全能專家助你雅思保7爭8,輕松拿捏!

還能1V1口語陪練,免費的啊?。?!

沒有語言環(huán)境,那就自己創(chuàng)造!

---嚴肅分割線---下面,讓我們帶你五步搭建你的 AI 口語產(chǎn)品!

                                                                                                                                                 

Step 1:明確產(chǎn)品價值

經(jīng)過與伙伴的深入討論,我們明確了雅思 AI 口語陪練產(chǎn)品的市場價值:

1. 明確市場價值

用戶畫像高度重合

  • 雅思考試市場年規(guī)??蛇_數(shù)十億元人民幣,包含報名費、培訓費等。

用戶驅(qū)動力強

  • 雅思考生具有強烈的自我驅(qū)動力,對新產(chǎn)品接受度高。

用戶痛點明顯口語是中國考生的主要難點,缺乏語言環(huán)境尤為不利;

  • 口語能力對申請出國留學的學生來說是面試成功的關鍵因素之一。

訓練場景高留存率

  • 雅思口語的訓練場景有短期高頻的需求,題庫難度要求考生至少預留一周以上準備時間。

產(chǎn)品迭代增量可控

  • 每年1月、5月、9月更新,新增內(nèi)容占30%,替換70%;

  • Part 1題庫包括30-50道題,Part 2和Part 3的題庫涵蓋50-60道題。

2. 明確可實現(xiàn)性

基于對大模型的了解,口語陪練產(chǎn)品與大模型能力高度契合。語言訓練非常符合Transformer架構(gòu)的特性,是其最佳實踐之一。

10.jpg

Step 2:明確產(chǎn)品功能框架

為了做一款針對雅思口語訓練的AI產(chǎn)品,我們首先需要明確雅思口語的考試結(jié)構(gòu)&備考方式:

考試結(jié)構(gòu)

  • Part1(4-5分鐘): 日??谡Z交流,范圍覆蓋工作、學習、興趣愛好、家庭等;

  • Part2(3-4分鐘):根據(jù)考題準備1 分鐘,并進行 2 分鐘左右的陳述;

  • Part3(4-5分鐘):基于 Part 2 的話題,和考官進行更深入、更抽象和更具思辨性的討論。

備考方式

  • 題庫復習;

  • 教學反饋(實時打分、優(yōu)化建議、范文梳理);

  • 考試模擬;

  • 口語素材輔助整理,串題輔導;

  • 訓練進度管理。

11.png

產(chǎn)品功能框架

來,掌聲送給這位全能的專家!

(靴靴大家?(? ???ω??? ?)?)

Step 3:功能開發(fā)

利用Prompt工程和多Agent機制,我們完成了整個產(chǎn)品的功能設計。整體的功能實現(xiàn)思路如下:

1. 利用COT+Fewshot,讓模型能夠基本準確執(zhí)行任務鏈路。

以Part1的出題Prompt為例:

19.png

2. 通過Prompt結(jié)構(gòu)性的優(yōu)化,使得模型具備準確召回,并處理特殊情況的能力。

以題庫的結(jié)構(gòu)化邏輯為例,我們通過準確定義的Markdown語言邏輯,讓模型實現(xiàn)的復雜的題庫召回:

20.png
下面看看效果實現(xiàn)?

多 Agent 設計

在多 Agent 的跳轉(zhuǎn)邏輯設定中,在Part1/2的模型中,我們選擇了“在當前節(jié)點的運行過程中識別”的模式,讓Part之間的跳轉(zhuǎn)決策后置,讓跳轉(zhuǎn)行為更為可控。但是對于希望用戶能夠沉浸完成正??荚嚨摹澳M考試”節(jié)點,我們選擇了“獨立于當前節(jié)點的模型識別-大語言模型”模式,增加跳轉(zhuǎn)決策受到Prompt影響的權重,對跳轉(zhuǎn)行為做出了更多強制性的限制。下面是我們用于“模擬考試”節(jié)點的提示詞:

17.jpg多Agent設計

Step 4:能力評測與迭代

通過模擬不同類型的用戶行為,來制定Bot功能的評測集,從而衡量Bot表現(xiàn)是否符合預期。下面是制定評測集的思路:

Session 1: 模擬學霸類用戶對 Part 1/2/3 進行評測

重點評測方向:

  • 回復的準確性與穩(wěn)定性;

  • 逐句優(yōu)化的穩(wěn)定性;

  • 在引入一定干擾情況下,測試 Bot 的記憶能力至穩(wěn)定。

Session 2: 模擬口語較差用戶對 Part 1/2/3進行評測

重點評測方向:

  • 回復的準確性與穩(wěn)定性;

  • 逐句優(yōu)化的穩(wěn)定性;

  • 在存在較多干擾情況下,測試 Bot 的記憶能力上限。

Session 3: 模擬準備初期用戶梳理 Part 2 材料與串題

重點評測方向:

  • 梳理提問思路是否合理;

  • 材料整理的質(zhì)量;

  • 串題的準確性。

Step 5:數(shù)據(jù)回收&優(yōu)化

根據(jù)多輪真實用戶的反饋,我們針對性地對Prompt和功能邏輯做了優(yōu)化,從而在語氣優(yōu)化和細節(jié)處理方面更有把握。

Bot上線后,已經(jīng)有大約4500名用戶使用,人均對話輪數(shù)超過10輪,人均對話時長超過10分鐘,更懂同學們的Bot,就更厲害哦~

最最最最后!

歡迎大家打開扣子 Bot 進行雅思口語的練習

給我們真實反饋!

我們也將整體配置在我們的 Bot 商店公開了

一起創(chuàng)造更多 AI + 語言的場景!

掃碼加入交流群

18.png


1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權拒絕一切形式轉(zhuǎn)載,違者必究;
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。
來源: 芥末堆
芥末堆商務合作:王老師 18710003484
  • 用AI一鍵搞定雅思口語 | 扣子coze.cn最佳實踐 Vol.1分享二維碼