芥末堆芥末堆

用AI創(chuàng)立中文閱讀新標準,考拉閱讀獲數(shù)千萬人民幣Pre-A輪融資

作者:荔閩 發(fā)布時間:

用AI創(chuàng)立中文閱讀新標準,考拉閱讀獲數(shù)千萬人民幣Pre-A輪融資

作者:荔閩 發(fā)布時間:

摘要:閱讀不是一件小事兒。

WechatIMG130.jpeg                                                          考拉閱讀團隊)

“美國有著一套非常完整的閱讀體系,從藍思創(chuàng)立的分級閱讀標準,到Renaissance Learning 的閱讀評測體系、Raz - Kid 所搭建的系列課堂材料等等,而中文閱讀,連分級標準尚未建立,課堂上的閱讀教學(xué),老師們都在‘摸著石頭過河’,缺少科學(xué)的指導(dǎo)”。

這是一位來自教學(xué)一線的老師心聲,她在美國的小學(xué)教過英文和中文的閱讀課程。考拉閱讀的 CEO 趙梓淳說,這樣的聲音不是“孤例”,自 2016 年 10 月正式開始中文分級閱讀的創(chuàng)業(yè)開始,在北京、河南等地的學(xué)校調(diào)研中,越發(fā)認識到中文分級閱讀在一線教學(xué)里的迫切性:“沒有任何數(shù)據(jù)來告訴老師,到底一個班級里每個同學(xué)的閱讀水平到底如何,也就無從給予相應(yīng)的輔導(dǎo)。當然,到底如何科學(xué)地輔導(dǎo),也是一個難題?!?/p>

目前,趙梓淳和他的團隊共開發(fā)了 3 款產(chǎn)品,主要針對的是小學(xué)階段孩子的閱讀能力發(fā)展,分別是享閱中文分級系統(tǒng);考拉閱讀(類似于 Renaissance Learning,提供閱讀能力測驗,記錄和追蹤學(xué)生閱讀能力發(fā)展);針對公立學(xué)校的閱讀整體解決方案,包括教師培訓(xùn)、分級短文材料等等。整套產(chǎn)品已經(jīng)進入兩百所中小學(xué),收入過百萬,團隊也在近日獲得由清科領(lǐng)投數(shù)千萬人民幣的 Pre-A輪投資,愛佑慈善基金跟投,此前的天使投資方真格基金、伽利略資本增持。 

  • 為什么中文需要分級閱讀?

對于美國的孩子,Literacy (讀寫能力)是比數(shù)學(xué)、科學(xué)以及其他 STEM 學(xué)科更為被家長和社會重視的技能,特別是在 K- K8 階段(初中之前)。之所以如此重視 Literacy 的背后,是因為一個重要的教育理念 ——  “Learning by Reading” (通過閱讀來學(xué)習(xí))。讀寫能力,尤其是閱讀能力被認定是一項終身技能,影響個人在其他學(xué)科上的學(xué)習(xí)效果。因此,與國內(nèi)的閱讀喜歡讀經(jīng)典不同,美國的分級閱讀產(chǎn)品里,包括大量的非小說類閱讀材料,尤其是社會科學(xué)和科學(xué)類的相關(guān)文章,這些文章所提供的信息構(gòu)成了孩子們對于世界的基礎(chǔ)認識。

長遠的,從職業(yè)發(fā)展的角度來說,閱讀技能也同樣重要。一份針對 CEO 的 2020 年人才技能要求調(diào)查顯示,絕大多數(shù)的工作 ,都要求有優(yōu)秀的閱讀能力,位列前三。還必須注意到的是,閱讀和思維訓(xùn)練、表達能力和寫作水平密切相關(guān),這些都是企業(yè)主所看重的技能。

Screenshot 2017-08-12 21.04.42.png

將英語的情況投射到漢語學(xué)習(xí)中,閱讀的重要性不言而喻。而分級閱讀對于中小學(xué)階段的讀寫能力培養(yǎng),則是起到了科學(xué)指導(dǎo)和跟蹤的作用。趙梓淳說到目前語文教學(xué)的評測方式主要以背誦、默寫為主,這主要測驗學(xué)生對于字詞的掌握能力,而閱讀更為重要的是通篇理解、批判性思辯能力的培養(yǎng)。這些需要在課外進行專門的閱讀訓(xùn)練進行提高和強化。

另外,分級閱讀標準的出現(xiàn)也更好地促進教育公平的實施。在針對北京、河南等多地的實際閱讀能力調(diào)研中發(fā)現(xiàn),北京地區(qū)的孩子閱讀能力遠遠高于其他地區(qū),以中關(guān)村實驗二小二年級的孩子為例,其閱讀能力可以達到河南一些地區(qū)五六年級孩子的水平?!叭绻麤]有一套標準,我們無法對各地學(xué)生的閱讀水平有一個全景式的了解?!?/p>

  • 英漢差異,AI 助力中文分級閱讀新標準

英語分級閱讀體系非常成熟,最為核心的兩大標準是:語義難度(Semantic Difficulty)和句法難度(Syntactic Complexity)。語義難度根據(jù)詞頻來判斷,越常見難度越低;而句法難度則根據(jù)句長來判斷,句子越長,難度越高。但將這套標準放在漢語上,則可能會出現(xiàn)很多不同的問題:

  •  第一,漢語本身的基本單元多,常用字 3000 多個,辭海里更是收錄了上萬個漢字,排列組合后造成單字常見,組合不常見;

  •  第二,漢語的分詞難度大,相對于英文以空格為界,漢語并無明顯的句法標志,主要基于上下文的分析;

  •  第三,漢語的句長并不主要影響語義的理解,古詩、文言文更是相反,《道德經(jīng)》洋洋灑灑五千言,都是常用字,但句意理解上則艱澀難懂。

針對漢語本身的特點,考拉閱讀團隊結(jié)合北大語言學(xué)多年的科研結(jié)果,從字、詞、句、段、篇五個方面,給語料進行多個緯度的標簽分類打分。整套模型的底本是以目前新課標下多套語文教材和課外輔導(dǎo)書作為基本參考,并輔之以幾百萬字的非平衡語料,對標準進行校對。

Screenshot 2017-08-12 23.33.15.png

         (考拉團隊在中文分級閱讀上采用的多維標準)

“由于中文閱讀標準的維度十分復(fù)雜,我們從一開始就引入 AI 來學(xué)習(xí)專家們對于語料的分類“,在收集過程中, 趙梓淳對于其團隊的技術(shù)能力非常自豪,CTO 任易曾就職于 IBM Waston 實驗室,以及參與 Windows 10 中文手寫輸入法的開發(fā),同時首席數(shù)據(jù)科學(xué)家 Jake Zhao 則是師從機器學(xué)習(xí)、深度學(xué)習(xí)的大師 Yann LeCun 教授?!?strong>用 AI 的方式來不斷地調(diào)整目前已有的分級閱讀標準,不論是對于漢語還是英文,都是領(lǐng)先的,這是分級閱讀的未來態(tài)。”

  • 2B 天花板易見,未來會推出 2C 產(chǎn)品

不僅僅是在產(chǎn)品研發(fā)上,分級閱讀產(chǎn)品有著漢語獨特的路徑,在商業(yè)模式變現(xiàn)上,考拉閱讀的方式與國外的同類產(chǎn)品也略有不同,側(cè)重于為學(xué)校提供完整的解決方案,從每半年一次的閱讀能力測驗、到分級閱讀的短文材料,再到閱讀課堂的教師培訓(xùn),以及系統(tǒng)的數(shù)據(jù)報告平臺和家校之間的互動機制?!爸袊墓W(xué)校市場與國外不大相同,都是由校方統(tǒng)一采購,大部分教師都缺乏專業(yè)的閱讀教學(xué)方法訓(xùn)練,因此,必須是一套完整的方案?!?/p>

考拉團隊將目前的分級閱讀標準和新課標體系下的日常教學(xué)相結(jié)合,變成一套具有指導(dǎo)性意義的課堂標準,除此之外還提供:

  • 閱讀能力測評,由專家團隊研發(fā)整套試卷,定期測驗,同時在班級、校園和區(qū)域不同層級上做數(shù)據(jù)分析,真正展示一個學(xué)生的閱讀能力水平。

  • 分級短文研發(fā)和撰寫,結(jié)合北大中文系的團隊和各個地區(qū)的一線教研員,撰寫出符合分級閱讀標準的內(nèi)容,用來支持課外閱讀輔導(dǎo)的開展。

  • 教師培訓(xùn)有20課時和40課時不同版本,由其團隊里有豐富教研經(jīng)驗的老師進行研發(fā),分為線下集中輔導(dǎo)和線上遠程支持。

WechatIMG128.jpeg

   (考拉目前所研發(fā)的中文分級閱讀標準)

不過,在趙梓淳看來,國內(nèi)分級閱讀市場更大的在于 2C 消費市場的發(fā)展。隨著文化消費的升級,越來越多的家長開始注重自己孩子在文學(xué)素養(yǎng)上的提高,目前許多 KOL 的繪本、圖書的團購市場發(fā)展熱烈,也是側(cè)面證明了這一點。不過,對于考拉閱讀來說,目前最為重要的核心,仍然是收集數(shù)據(jù),完善其標準,開發(fā)完整的評測體系。在此基礎(chǔ)上,再推出適應(yīng)于家長端的消費產(chǎn)品?!?strong>相信隨著語文的重要性不斷提高,中文分級閱讀會成為一個共識,被家長、教師、社會所認可”。趙梓淳如是說道。

1、本文是 芥末堆網(wǎng)原創(chuàng)文章,轉(zhuǎn)載可點擊 芥末堆內(nèi)容合作 了解詳情,未經(jīng)授權(quán)拒絕一切形式轉(zhuǎn)載,違者必究;
2、芥末堆不接受通過公關(guān)費、車馬費等任何形式發(fā)布失實文章,只呈現(xiàn)有價值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。
來源: 芥末堆
芥末堆商務(wù)合作:王老師 18710003484
  • 用AI創(chuàng)立中文閱讀新標準,考拉閱讀獲數(shù)千萬人民幣Pre-A輪融資分享二維碼