摘要:新技術(shù)帶來(lái)的教育變革方興未艾,人工智能與智慧教育引領(lǐng)教育教學(xué)的創(chuàng)新,已經(jīng)成為教育信息化發(fā)展的必然趨勢(shì)。隨著教育大數(shù)據(jù)的崛起,如何對(duì)大量數(shù)據(jù)進(jìn)行分析以支持精準(zhǔn)預(yù)測(cè),是人工智能時(shí)代面對(duì)的一個(gè)新課題。機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支,能夠滿足教育大數(shù)據(jù)分析預(yù)測(cè)的需求。為此,基于“為何分析、分析什么、以何分析、何以應(yīng)用”一系列問(wèn)題,通過(guò)對(duì)機(jī)器學(xué)習(xí)的作用對(duì)象、作用過(guò)程、具體方法和利益相關(guān)者等方面的分析,探討了機(jī)器學(xué)習(xí)和智慧教育的適切性。結(jié)合對(duì)近年來(lái)國(guó)外基于真實(shí)數(shù)據(jù)的機(jī)器學(xué)習(xí)教育應(yīng)用案例研究成果的梳理和歸納,發(fā)現(xiàn)目前機(jī)器學(xué)習(xí)教育應(yīng)用主要集中在學(xué)生建模、學(xué)生行為建模、預(yù)測(cè)學(xué)習(xí)行為、預(yù)警失學(xué)風(fēng)險(xiǎn)、學(xué)習(xí)支持和評(píng)測(cè)和資源推薦等六大方面。從跨界、技術(shù)和教學(xué)三個(gè)層面出發(fā),基于智慧教育的框架對(duì)機(jī)器學(xué)習(xí)的教育應(yīng)用與創(chuàng)新提出了相關(guān)建議。
一、引言
智能革命浪潮正席卷全球。2017年開(kāi)年,神秘棋手Master連勝中日韓多名世界級(jí)頂尖棋手的跨年圍棋大戰(zhàn)落下帷幕,隨即Master被證實(shí)正是2016年3月戰(zhàn)勝李世石的AlphaGo。這是人工智能(Artifi-cial Intelligence,AI)史上絕對(duì)的“歷史事件”。AI也正沖擊著人們的日常生活。Google提出的自動(dòng)駕駛汽車(Autonomous Vehicles)已經(jīng)從教科書照進(jìn)了現(xiàn)實(shí),依靠車內(nèi)的智能駕駛儀便可實(shí)現(xiàn)無(wú)人駕駛。機(jī)器人的腳步也從探索火星拓展到人體內(nèi),一種可吞服的微型折疊機(jī)器人進(jìn)入人體,可以幫助修復(fù)傷口或挪走被誤食的紐扣電池
在研究領(lǐng)域,美國(guó)國(guó)家安全與技術(shù)理事會(huì)于2016年5月和10月分別發(fā)布了《為人工智能的未來(lái)做準(zhǔn)備》和《國(guó)家人工智能研發(fā)戰(zhàn)略規(guī)劃》兩份報(bào)告,指出人工智能研究在經(jīng)歷了20世紀(jì)80年代“專注于人類知識(shí)”和21世紀(jì)00年代“機(jī)器學(xué)習(xí)的興起”兩次浪潮后,即將迎來(lái)“解釋性和通用人工智能技術(shù)”的第三次浪潮。而實(shí)現(xiàn)和推動(dòng)AI研究的核心技術(shù)正是當(dāng)下最熱門的機(jī)器學(xué)習(xí)(Machine Learning)。
教育領(lǐng)域在人工智能研究浪潮的影響和滲透下,也正發(fā)生改變。一方面,人工智能和學(xué)習(xí)科學(xué)相結(jié)合形成新領(lǐng)域——教育人工智能(Educational Ar-tificial Intelligence,EAI),其核心目標(biāo)是“通過(guò)計(jì)算獲得精準(zhǔn)和明確的教育、心理和社會(huì)知識(shí)形式,這些知識(shí)往往是隱式的”。知識(shí)以學(xué)習(xí)者模型、領(lǐng)域知識(shí)模型和教學(xué)模型等形式呈現(xiàn),算法是獲得這些知識(shí)的核心技術(shù)。目前,已有大量教育人工智能系統(tǒng)被應(yīng)用于學(xué)校,這些系統(tǒng)整合了教育人工智能和教育數(shù)據(jù)挖掘(Educational Data Mining,EDM)技術(shù)(如,機(jī)器學(xué)習(xí)算法)來(lái)跟蹤學(xué)生行為數(shù)據(jù),預(yù)測(cè)其學(xué)習(xí)表現(xiàn)以支持個(gè)性化學(xué)習(xí)。
另一方面,以智慧教育引領(lǐng)教育信息化的創(chuàng)新發(fā)展,從而帶動(dòng)教育教學(xué)的創(chuàng)新發(fā)展,已成為信息時(shí)代的必然趨勢(shì)。個(gè)性化學(xué)習(xí)作為智慧教育的核心要素,如何通過(guò)技術(shù)更好地支持和促進(jìn)個(gè)性化學(xué)習(xí)的開(kāi)展,已經(jīng)成為智慧教育研究領(lǐng)域的訴求。目前,個(gè)性化學(xué)習(xí)的實(shí)踐應(yīng)用主要集中于自定步調(diào)學(xué)習(xí)、個(gè)別化指導(dǎo)和學(xué)習(xí)內(nèi)容自適應(yīng)等方面,但在整個(gè)學(xué)習(xí)過(guò)程中尚未實(shí)現(xiàn)差異化的學(xué)習(xí)服務(wù),主要原因在于技術(shù)的發(fā)展尚不能充分滿足個(gè)性化學(xué)習(xí)的需求。
美國(guó)2017國(guó)家教育技術(shù)計(jì)劃《重塑技術(shù)的教育角色》,在學(xué)習(xí)部分指出:在移動(dòng)數(shù)據(jù)收集工具和在線協(xié)作平臺(tái)的支持下,能夠?yàn)樗袑W(xué)生獲得個(gè)性化學(xué)習(xí)服務(wù)提供機(jī)遇;在領(lǐng)導(dǎo)力部分指出:個(gè)性化學(xué)生學(xué)習(xí)將作為有效領(lǐng)導(dǎo)力的核心關(guān)注領(lǐng)域之一,技術(shù)能夠?yàn)閷W(xué)生提供個(gè)性化學(xué)習(xí)路徑;在測(cè)評(píng)部分指出:形成性和總結(jié)性評(píng)價(jià)數(shù)據(jù)的收集和整合,能支持學(xué)習(xí)者生成個(gè)性化數(shù)字學(xué)習(xí)體驗(yàn),以及教師制定教學(xué)干預(yù)和決策。由此可見(jiàn),收集和整合大量的、不同源的數(shù)據(jù)支持實(shí)現(xiàn)個(gè)性化學(xué)習(xí)是必然趨勢(shì),而人工智能技術(shù)的應(yīng)用將是實(shí)現(xiàn)這些數(shù)據(jù)價(jià)值最大化的關(guān)鍵。
機(jī)器學(xué)習(xí)作為人工智能領(lǐng)域最核心、最熱門的技術(shù),能夠基于大量數(shù)據(jù)的自動(dòng)識(shí)別模式、發(fā)現(xiàn)規(guī)則,預(yù)測(cè)學(xué)生學(xué)習(xí)表現(xiàn),為滿足智慧教育和個(gè)性化學(xué)習(xí)的需求提供了可能。目前,國(guó)內(nèi)外尚未有研究對(duì)機(jī)器學(xué)習(xí)的教育應(yīng)用進(jìn)行系統(tǒng)梳理。為此,我們?cè)噲D通過(guò)全方位地梳理機(jī)器學(xué)習(xí)教育應(yīng)用的發(fā)展現(xiàn)狀、潛力和進(jìn)展、面臨的挑戰(zhàn)等,為研究者和教育者開(kāi)展智慧教育和個(gè)性化學(xué)習(xí)提供一定的理論和實(shí)踐依據(jù)。
二、機(jī)器學(xué)習(xí)的概念梳理
(一)機(jī)器學(xué)習(xí)的定義
機(jī)器學(xué)習(xí)是人工智能和數(shù)據(jù)挖掘中最重要也是最熱門的算法。國(guó)外有些學(xué)者對(duì)機(jī)器學(xué)習(xí)進(jìn)行了定義,Mitchell認(rèn)為,機(jī)器學(xué)習(xí)是對(duì)能通過(guò)經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法的研究[10];Alpaydin認(rèn)為,機(jī)器學(xué)習(xí)是指利用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)[11]。由此可知,機(jī)器學(xué)習(xí)是通過(guò)經(jīng)驗(yàn)或數(shù)據(jù)來(lái)改進(jìn)算法的研究,旨在通過(guò)算法讓機(jī)器從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,自動(dòng)發(fā)現(xiàn)模式并用于預(yù)測(cè)。換句話說(shuō),機(jī)器學(xué)習(xí)即機(jī)器從數(shù)據(jù)中學(xué)習(xí),其處理的數(shù)據(jù)越多,預(yù)測(cè)就越精準(zhǔn)。
(二)機(jī)器學(xué)習(xí)的兩大階段
機(jī)器學(xué)習(xí)的發(fā)展可以分為兩個(gè)階段:淺層學(xué)習(xí)(Shallow Learning) 和深度學(xué)習(xí)(Deep Learing)。
1、淺層學(xué)習(xí)
20世紀(jì)80年代末期,用于人工神經(jīng)網(wǎng)絡(luò)的反向傳播算法(也稱為Back Propagation算法或者BP算法)[12]的出現(xiàn),拉開(kāi)了淺層學(xué)習(xí)的帷幕。利用BP算法可以讓人工神經(jīng)網(wǎng)絡(luò)模型從大量樣本中學(xué)習(xí)出規(guī)律,并進(jìn)行預(yù)測(cè)。但是,淺層學(xué)習(xí)模型依靠人工經(jīng)驗(yàn)來(lái)抽取樣本的特征,往往要求開(kāi)發(fā)人員挖掘出好的特征。
2、深度學(xué)習(xí)
2006年,加拿大多倫多大學(xué)教授、機(jī)器學(xué)習(xí)領(lǐng)域的泰斗Hinton和學(xué)生Salakhutdinov在上Science發(fā)表文章Reducing the Dimensionalitg of Data with Neural Networks[13],翻開(kāi)了深度學(xué)習(xí)的新篇章。隨后,深度學(xué)習(xí)在學(xué)術(shù)界持續(xù)升溫,目前有多所知名高校紛紛加入深度學(xué)習(xí)的研究。與淺層學(xué)習(xí)模型依賴人工經(jīng)驗(yàn)不同,深層學(xué)習(xí)模型通過(guò)構(gòu)建機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù),來(lái)學(xué)習(xí)更有用的特征,從而最終提升分類或預(yù)測(cè)的準(zhǔn)確性。2013年4月,深度學(xué)習(xí)技術(shù)被《麻省理工學(xué)院技術(shù)評(píng)論》(MIT Technology Review)雜志列為2013年十大突破性技術(shù)(Break-through Technology)之首[14]。
(三)機(jī)器學(xué)習(xí)的發(fā)展現(xiàn)狀
機(jī)器學(xué)習(xí)的研究主要分為基于小數(shù)據(jù)和大數(shù)據(jù)環(huán)境下兩類。一般而言,小數(shù)據(jù)指的是基于內(nèi)存的數(shù)據(jù)?;谛?shù)據(jù)環(huán)境下的機(jī)器學(xué)習(xí)通常被認(rèn)為是傳統(tǒng)的機(jī)器學(xué)習(xí),研究問(wèn)題主要包括理解并模擬人類的學(xué)習(xí)過(guò)程、研究計(jì)算機(jī)系統(tǒng)和人類用戶之間的自然語(yǔ)言接口、針對(duì)不完全的信息進(jìn)行推理的能力、構(gòu)造可發(fā)現(xiàn)新事物的程序[15]。而隨著傳感器和連接設(shè)備的廣泛使用,每年都有數(shù)百“澤字節(jié)”(ZettaByte,簡(jiǎn)稱ZB,)數(shù)據(jù)產(chǎn)生[16],可見(jiàn),大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。一般而言,大數(shù)據(jù)是無(wú)法裝載進(jìn)內(nèi)存的數(shù)據(jù),如何從復(fù)雜、真實(shí)、凌亂和無(wú)模式的大數(shù)據(jù)中挖掘出對(duì)人類有用的知識(shí),是目前迫切需要解決的問(wèn)題,也是大數(shù)據(jù)時(shí)代下機(jī)器學(xué)習(xí)面臨的挑戰(zhàn)。目前,大數(shù)據(jù)環(huán)境下的機(jī)器學(xué)習(xí)研究主要包括大數(shù)據(jù)分治策略與抽樣、特征選擇、分類、聚類和關(guān)聯(lián)分析等[17]。
三、機(jī)器學(xué)習(xí)與智慧教育的適切性
技術(shù)中介的智慧教育已經(jīng)成為教育信息化的新境界、新訴求[18],通過(guò)構(gòu)建技術(shù)融合的學(xué)習(xí)環(huán)境,讓教師能夠施展高效的教學(xué)法,讓學(xué)習(xí)者能夠獲得適宜的個(gè)性化學(xué)習(xí)服務(wù)和美好的發(fā)展體驗(yàn),是智慧教育的核心目標(biāo)[19]。在智慧教育環(huán)境中,學(xué)習(xí)者的數(shù)據(jù)被收集形成教育大數(shù)據(jù),迫切需要智能化手段挖掘這些數(shù)據(jù),以發(fā)現(xiàn)潛在模式和知識(shí)來(lái)支持智慧教育的創(chuàng)新發(fā)展。機(jī)器學(xué)習(xí)的本質(zhì)是使用計(jì)算機(jī)從大量數(shù)據(jù)中學(xué)習(xí)規(guī)律,自動(dòng)發(fā)現(xiàn)模式并用于預(yù)測(cè)。因此,機(jī)器學(xué)習(xí)助力智慧教育深度理解學(xué)習(xí)者的學(xué)習(xí)是確定無(wú)疑的。
(一)作用對(duì)象和環(huán)境
機(jī)器學(xué)習(xí)方法的作用對(duì)象是教育數(shù)據(jù),包括學(xué)習(xí)者與教育系統(tǒng)交互產(chǎn)生的所有數(shù)據(jù),以及人口統(tǒng)計(jì)、情感、協(xié)作和管理數(shù)據(jù)等,這些數(shù)據(jù)源來(lái)自不同的教育環(huán)境。Romero和Ventura認(rèn)為,教育環(huán)境可以分為傳統(tǒng)教育環(huán)境和基于計(jì)算機(jī)的教育環(huán)境[20];Papamitsiou和Economides認(rèn)為,教育環(huán)境包括虛擬學(xué)習(xí)環(huán)境(Virtual Learning Environment,VLE)和學(xué)習(xí)管理系統(tǒng)(Learning Management System,LMS)、MOOCs和社會(huì)性學(xué)習(xí)、基于網(wǎng)絡(luò)的教育、認(rèn)知導(dǎo)師系統(tǒng)、基于計(jì)算機(jī)的教育、多模態(tài)和移動(dòng)環(huán)境[21]。
我們認(rèn)為,智慧教育環(huán)境可以分為傳統(tǒng)教育環(huán)境和網(wǎng)絡(luò)教育環(huán)境,如圖1所示。
傳統(tǒng)教育環(huán)境一般基于學(xué)?;蛘n堂。根據(jù)數(shù)據(jù)存儲(chǔ)的不同,可分為封閉式教學(xué)環(huán)境和開(kāi)放式教學(xué)環(huán)境。其中,封閉式教學(xué)環(huán)境指單機(jī)版、在本地部署的教學(xué)平臺(tái)或桌面版應(yīng)用,數(shù)據(jù)存儲(chǔ)于內(nèi)存;開(kāi)放式教學(xué)環(huán)境指基于網(wǎng)絡(luò)的遠(yuǎn)程教育平臺(tái)(受控環(huán)境,用來(lái)收集學(xué)習(xí)者和活動(dòng)數(shù)據(jù)),數(shù)據(jù)存儲(chǔ)于網(wǎng)絡(luò)空間。
網(wǎng)絡(luò)教育環(huán)境分為開(kāi)放式教學(xué)環(huán)境和非正式社會(huì)性教育環(huán)境,其中,非正式社會(huì)性教育環(huán)境是指基于智能終端(如,PC、移動(dòng)終端等)和以自主學(xué)習(xí)為主的學(xué)習(xí)環(huán)境,數(shù)據(jù)存儲(chǔ)于網(wǎng)絡(luò)空間。從數(shù)據(jù)的角度看,封閉式教學(xué)環(huán)境是教育小數(shù)據(jù)環(huán)境,開(kāi)放式教學(xué)環(huán)境和網(wǎng)絡(luò)教育環(huán)境是教育大數(shù)據(jù)環(huán)境。
(二)作用過(guò)程
機(jī)器學(xué)習(xí)一般作用于教育數(shù)據(jù)挖掘過(guò)程。教育數(shù)據(jù)挖掘涉及開(kāi)發(fā)、研究和應(yīng)用計(jì)算機(jī)方法在收集的大量教育數(shù)據(jù)中檢測(cè)模式,是教育與數(shù)據(jù)挖掘的融合。數(shù)據(jù)挖掘技術(shù)最早于1995年應(yīng)用于教育領(lǐng)域,拉開(kāi)了教育數(shù)據(jù)挖掘研究的帷幕,此后逐漸發(fā)展成為獨(dú)立的研究領(lǐng)域。教育數(shù)據(jù)挖掘涉及的學(xué)科主要包括教育學(xué)、計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)[22],如圖2所示。其中,機(jī)器學(xué)習(xí)作為計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)的融合,為教育數(shù)據(jù)挖掘提供了強(qiáng)有力的技術(shù)支持。
在教育數(shù)據(jù)挖掘過(guò)程中,機(jī)器學(xué)習(xí)主要作用于數(shù)據(jù)挖掘和解釋部分,實(shí)現(xiàn)傳統(tǒng)教育中缺少或人工難以完成的功能,通過(guò)對(duì)數(shù)據(jù)進(jìn)行自動(dòng)化分析來(lái)發(fā)現(xiàn)未知的新知識(shí)和模式,如圖3所示。
其中,在數(shù)據(jù)解釋部分,機(jī)器學(xué)習(xí)方法通過(guò)建立預(yù)測(cè)模型(Predictive Model)和描述模型(Descriptive Model)分析教育數(shù)據(jù)來(lái)發(fā)現(xiàn)模式和知識(shí)。預(yù)測(cè)模型通過(guò)已知的數(shù)據(jù)預(yù)測(cè)未知的數(shù)據(jù),例如,通過(guò)分析學(xué)生的成績(jī)來(lái)預(yù)測(cè)學(xué)習(xí)表現(xiàn);描述模型通過(guò)分析數(shù)據(jù)發(fā)現(xiàn)新的模式或結(jié)構(gòu)。
知識(shí)是機(jī)器學(xué)習(xí)的發(fā)現(xiàn),主要分為原理類、實(shí)踐類和優(yōu)化類知識(shí)[23]。其中,原理類知識(shí)旨在驗(yàn)證或修正現(xiàn)有的教育理論,例如,發(fā)現(xiàn)新的學(xué)習(xí)規(guī)律;實(shí)踐類知識(shí)旨在幫助教師開(kāi)展教學(xué)實(shí)踐,例如,預(yù)測(cè)學(xué)生表現(xiàn)和成績(jī);優(yōu)化類知識(shí)旨在改進(jìn)學(xué)習(xí)系統(tǒng)的效果和性能,例如,通過(guò)分析學(xué)習(xí)者知識(shí)提高系統(tǒng)的自適應(yīng)能力。這些知識(shí)將最終反饋給教育系統(tǒng)進(jìn)行迭代循環(huán),以促進(jìn)和改善學(xué)習(xí)。
(三)作用方法
目前,應(yīng)用于教育領(lǐng)域的機(jī)器學(xué)習(xí)方法有很多,例如,分類、回歸、聚類、文本挖掘、異常檢查、關(guān)聯(lián)規(guī)則挖掘、社會(huì)網(wǎng)絡(luò)分析、模式發(fā)現(xiàn)和序列模式分析等[24-26]。其中,預(yù)測(cè)和聚類是目前最熱門的。
1、預(yù)測(cè)(Prediction)
預(yù)測(cè)旨在開(kāi)發(fā)一個(gè)模型,從數(shù)據(jù)其他方面的集合(預(yù)測(cè)變量)中,推斷數(shù)據(jù)的一個(gè)單一方面(被預(yù)測(cè)變量)。簡(jiǎn)言之,就是從已知事件推測(cè)未知事件的過(guò)程。在教育應(yīng)用中,常用的預(yù)測(cè)方法是分類(Classi-fication)和回歸(Regression),一般用來(lái)預(yù)測(cè)學(xué)生的表現(xiàn)和檢測(cè)學(xué)生行為。
(1)分類:一般用于預(yù)測(cè)學(xué)生的學(xué)習(xí)表現(xiàn),常用算法有決策樹(shù)、隨機(jī)森林、角色規(guī)則、逐步回歸和邏輯回歸等。例如,Lauria等使用邏輯回歸、支持向量機(jī)和C4.5決策樹(shù)等機(jī)器學(xué)習(xí)方法分析了不同數(shù)據(jù)源的學(xué)生數(shù)據(jù)集[27];Thammasiri等使用邏輯回歸、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等機(jī)器學(xué)習(xí)技術(shù)對(duì)七年的學(xué)生學(xué)習(xí)數(shù)據(jù)進(jìn)行分析,來(lái)預(yù)測(cè)新生是否會(huì)在第二學(xué)期繼續(xù)學(xué)習(xí)[28]。
(2)回歸:一般用于分析學(xué)習(xí)行為與學(xué)習(xí)表現(xiàn)之間的關(guān)系,常用算法有線性回歸和回歸樹(shù)等。例如,Kotsiantis采用回歸算法分析學(xué)生在線提交作業(yè)的評(píng)分?jǐn)?shù)據(jù)和學(xué)生的關(guān)鍵人口特征數(shù)據(jù),來(lái)預(yù)測(cè)學(xué)生的學(xué)習(xí)表現(xiàn)[29];Hachey等采用二元邏輯回歸算法分析學(xué)生在線課程記錄及其GPA,來(lái)預(yù)測(cè)學(xué)生能否完成在線課程[30]。
2、聚類(Clustering)
聚類通常用于發(fā)現(xiàn)數(shù)據(jù)集中事先未知的常見(jiàn)分類。在教育應(yīng)用中,通常用來(lái)基于學(xué)生學(xué)習(xí)和交互模式對(duì)學(xué)生分組或?qū)ο嗨频恼n程材料分組。例如,Yanto等基于使用屬性變精度的近似值的精度均值,論證了使用變精度粗糙集模型對(duì)焦慮學(xué)生進(jìn)行聚類的適用性[31];Aher和Lobo采用聚類算法和關(guān)聯(lián)規(guī)則挖掘,對(duì)Moodle課程的學(xué)習(xí)記錄進(jìn)行聚類和分析,然后向?qū)W習(xí)者推薦合適的課程[32]。
(四)利益相關(guān)者與目標(biāo)
我們通過(guò)梳理文獻(xiàn)發(fā)現(xiàn),機(jī)器學(xué)習(xí)教育應(yīng)用的利益相關(guān)者包括學(xué)習(xí)者、教育者、教育管理者、教育研究者和開(kāi)發(fā)人員(課程或軟件)等,如表1所示。其中主要目標(biāo)體現(xiàn)在:支持學(xué)習(xí)者開(kāi)展個(gè)性化學(xué)習(xí),通過(guò)學(xué)習(xí)行為分析預(yù)測(cè)和可視化反饋,提高學(xué)習(xí)者的學(xué)習(xí)表現(xiàn);支持教育者掌握整體和個(gè)體學(xué)生的學(xué)習(xí)情況,自動(dòng)獲得實(shí)時(shí)客觀的教學(xué)反饋,促進(jìn)教學(xué)表現(xiàn)的改善;支持教育管理者制定決策,提供客觀全面的教育反饋;支持教育研究者和開(kāi)發(fā)人員更精準(zhǔn)地評(píng)估和維護(hù)教育系統(tǒng)和在線課程。
綜上可知,機(jī)器學(xué)習(xí)方法能夠自動(dòng)從大量數(shù)據(jù)中提取隱含的、未知的、卻潛在有用的信息和知識(shí),支持智慧教育教師開(kāi)展智能化教學(xué)和學(xué)生進(jìn)行個(gè)性化學(xué)習(xí)。因此,機(jī)器學(xué)習(xí)應(yīng)用于智慧教育是適合的,也是必要的。
四、機(jī)器學(xué)習(xí)教育應(yīng)用的潛力與進(jìn)展
如前文所述,機(jī)器學(xué)習(xí)屬于數(shù)據(jù)挖掘的分析技術(shù),而數(shù)據(jù)挖掘技術(shù)最早于1995年應(yīng)用于教育領(lǐng)域。由此推論,機(jī)器學(xué)習(xí)教育應(yīng)用的研究于1995年拉開(kāi)序幕。同時(shí),通過(guò)文獻(xiàn)梳理發(fā)現(xiàn),教育數(shù)據(jù)挖掘的研究成果在2000年前僅有7篇[33],其具有代表性的文獻(xiàn)綜述主要集中于2009-2010年前后[34-36],這一階段的教育數(shù)據(jù)挖掘研究正接近青春期[37]。因此,從2010年起至今的國(guó)外基于真實(shí)數(shù)據(jù)的機(jī)器學(xué)習(xí)以教育應(yīng)用案例研究成果為主,我們通過(guò)對(duì)機(jī)器學(xué)習(xí)技術(shù)在教育數(shù)據(jù)挖掘青春期階段的研究進(jìn)展及其教育應(yīng)用的潛力進(jìn)行梳理,以期為教育者、教育研究者和開(kāi)發(fā)人員等在智慧教育中的應(yīng)用提供理論和實(shí)踐指導(dǎo)。 其中,機(jī)器學(xué)習(xí)教育應(yīng)用概念圖如圖4所示。
(一)研究目標(biāo)
我們通過(guò)對(duì)文獻(xiàn)梳理發(fā)現(xiàn),機(jī)器學(xué)習(xí)教育應(yīng)用主要集中在學(xué)生建模、學(xué)生行為建模、預(yù)測(cè)學(xué)習(xí)表現(xiàn)、預(yù)警失學(xué)風(fēng)險(xiǎn)、學(xué)習(xí)支持和評(píng)測(cè)以及資源推薦等方面(見(jiàn)表2)。
1、學(xué)生建模
學(xué)生建模是創(chuàng)建和維護(hù)學(xué)生模型模塊的過(guò)程,學(xué)生模型模塊主要負(fù)責(zé)學(xué)生當(dāng)前知識(shí)狀態(tài)模型的開(kāi)發(fā)和維護(hù),旨在對(duì)學(xué)生的誤解和次優(yōu)表現(xiàn)做出假設(shè),以便教師能夠指出并建議修正。學(xué)生建模包括學(xué)生模型和診斷模型,學(xué)生模型存儲(chǔ)學(xué)生知識(shí)的數(shù)據(jù)結(jié)構(gòu),診斷模型執(zhí)行診斷過(guò)程并更新學(xué)生模型。其中,領(lǐng)域模型是學(xué)生模型的基礎(chǔ)。例如,Yudelson等通過(guò)使用自動(dòng)化方法提取領(lǐng)域模型來(lái)支持大學(xué)生編程語(yǔ)言的學(xué)習(xí),在解決程序練習(xí)的過(guò)程中對(duì)學(xué)生知識(shí)進(jìn)行建模,以支持系統(tǒng)推薦下一個(gè)解決問(wèn)題。該研究所用的數(shù)據(jù)來(lái)自某大學(xué)三門程序入門課程的代碼快照數(shù)據(jù),處理方法主要基于兩點(diǎn):在每個(gè)程序提交之后,使用程序語(yǔ)言的內(nèi)在結(jié)構(gòu)來(lái)建模知識(shí);使用一組測(cè)驗(yàn)自動(dòng)測(cè)試程序的正確性。該研究選擇Null模型和Rasch模型用于學(xué)生建模,并使用AFM模型結(jié)合PC算法對(duì)學(xué)生學(xué)習(xí)建模。研究發(fā)現(xiàn),PC算法的使用能夠提高AFM模型對(duì)過(guò)濾概念列表的精準(zhǔn)度。
貝葉斯知識(shí)跟蹤作為一種用戶建模方法,常被應(yīng)用于智能教學(xué)系統(tǒng)。例如,Eagle等在傳統(tǒng)貝葉斯知識(shí)跟蹤模型中插入學(xué)生個(gè)體參數(shù),基于學(xué)生的活動(dòng)數(shù)據(jù),來(lái)預(yù)測(cè)其在智能教學(xué)系統(tǒng)中學(xué)習(xí)和表現(xiàn)的個(gè)體差異權(quán)重。該方法的優(yōu)點(diǎn)是,如果個(gè)體差異權(quán)重在學(xué)生開(kāi)始使用系統(tǒng)前能被賦值,將更容易集成入智能教學(xué)系統(tǒng)。研究中的學(xué)生活動(dòng)數(shù)據(jù)包括閱讀表現(xiàn)數(shù)據(jù)和概念知識(shí)預(yù)備測(cè)試數(shù)據(jù),其中,閱讀表現(xiàn)數(shù)據(jù)包括閱讀時(shí)間和重訪文本頁(yè)面(與元認(rèn)知自我監(jiān)管技能有關(guān));概念知識(shí)預(yù)備測(cè)試數(shù)據(jù)包括預(yù)備測(cè)試的準(zhǔn)確性、問(wèn)題變化和任務(wù)完成時(shí)間。研究結(jié)果得到了四組最佳匹配的個(gè)體差異權(quán)重和三個(gè)貝葉斯知識(shí)跟蹤模型的變體模型。研究發(fā)現(xiàn),學(xué)生閱讀文本的數(shù)據(jù)在智能教學(xué)系統(tǒng)中對(duì)于預(yù)測(cè)學(xué)習(xí)和表現(xiàn)非常有用。
類似的,Baker等采用貝葉斯知識(shí)跟蹤和線性回歸等方法構(gòu)建學(xué)生模型,對(duì)學(xué)生在特定問(wèn)題步驟中已獲得技能的可能性進(jìn)行檢測(cè)。研究基于232名中學(xué)生的數(shù)學(xué)課程數(shù)據(jù),主要分為兩步建模:使用標(biāo)準(zhǔn)貝葉斯知識(shí)跟蹤結(jié)合數(shù)據(jù)和貝葉斯定理來(lái)預(yù)測(cè)學(xué)生知識(shí),生成可能性的標(biāo)簽;訓(xùn)練模型,使用更廣泛的特征集來(lái)預(yù)測(cè)標(biāo)簽數(shù)據(jù)。
2、學(xué)生行為建模
學(xué)生行為建模是分析學(xué)生表現(xiàn)、排除潛在的誤區(qū)、呈現(xiàn)學(xué)生目標(biāo)和計(jì)劃、確定先驗(yàn)和獲得的知識(shí)、保持情景記憶,以及描述個(gè)性特征等的過(guò)程。機(jī)器學(xué)習(xí)方法能夠支持學(xué)習(xí)行為的自動(dòng)檢測(cè)、識(shí)別和建模,旨在通過(guò)描述或預(yù)測(cè)模式行為讓系統(tǒng)適應(yīng)學(xué)習(xí)者的偏好傾向。例如,Doleck等使用機(jī)器學(xué)習(xí)方法來(lái)挖掘?qū)W習(xí)環(huán)境中與診斷推理的過(guò)程、結(jié)果相關(guān)的學(xué)習(xí)者行為,其中,隱馬爾可夫模型用于問(wèn)題解決的行為熟練指標(biāo)建模,文本分類算法用于分析學(xué)習(xí)者的案例總結(jié)報(bào)告,這些算法的應(yīng)用描述了不同問(wèn)題解決階段的學(xué)習(xí)者行為,旨在為系統(tǒng)的維護(hù)提供設(shè)計(jì)指導(dǎo)。
類似的,Huang等使用歸納推理(基于相似的學(xué)習(xí))、演繹推理(基于解釋的學(xué)習(xí))和類比推理(案例推理)等多策略機(jī)器學(xué)習(xí)構(gòu)建了黑板多策略機(jī)器學(xué)習(xí)模型,學(xué)習(xí)和發(fā)現(xiàn)學(xué)生學(xué)習(xí)過(guò)程中不一致行為的屬性。根據(jù)這些屬性,智能教學(xué)系統(tǒng)可以采取適當(dāng)?shù)姆椒ǚ乐箤W(xué)生不一致行為的再次發(fā)生,例如,加強(qiáng)教學(xué)和實(shí)踐。
Wen和Rosé提出通過(guò)點(diǎn)擊流分析確定學(xué)生的行為模式,以便為學(xué)生搜索信息和在線學(xué)習(xí)提供更有效的個(gè)性化支持。該研究分析了與課程成功高低有關(guān)的學(xué)生習(xí)慣性行為,以及情境信息對(duì)會(huì)話的影響。通過(guò)挖掘?qū)W生單個(gè)會(huì)話的習(xí)慣性行為,描述了MOOCs中的會(huì)話類型,采用局部6元模型對(duì)學(xué)習(xí)會(huì)話進(jìn)行建模,以支持系統(tǒng)自動(dòng)分配學(xué)習(xí)活動(dòng)和活動(dòng)序列。
也有研究對(duì)學(xué)生的分心行為進(jìn)行了分析,例如,等提出使用機(jī)器學(xué)習(xí)模型來(lái)支持智能教學(xué)系統(tǒng)自動(dòng)檢測(cè)學(xué)生的分心行為,數(shù)據(jù)來(lái)源于12名小學(xué)生行為記錄的日志文件,方法采用最小二乘法和脊回歸算法。該研究發(fā)現(xiàn),結(jié)合時(shí)間、表現(xiàn)和鼠標(biāo)移動(dòng)等特征的模型對(duì)檢測(cè)分心行為最有用,而考慮學(xué)生的個(gè)性化也能提高檢測(cè)的有效性;同時(shí)發(fā)現(xiàn),使用脊回歸算法的模型比使用標(biāo)準(zhǔn)最小二乘法的表現(xiàn)更佳。
3、預(yù)測(cè)學(xué)習(xí)表現(xiàn)
預(yù)測(cè)學(xué)習(xí)表現(xiàn),一般包括預(yù)測(cè)學(xué)生的最終分?jǐn)?shù)或?qū)W術(shù)表現(xiàn)等,主要影響因素包括人口特征、分?jǐn)?shù)(平時(shí)測(cè)驗(yàn)和最終成績(jī))、學(xué)生學(xué)檔、多模能力、學(xué)生參與、活動(dòng)的注冊(cè)和參與以及情緒情感狀態(tài)等。有些研究通過(guò)分析學(xué)生數(shù)據(jù)直接預(yù)測(cè)學(xué)習(xí)結(jié)果。例如,使用機(jī)器學(xué)習(xí)回歸算法,對(duì)學(xué)生少量寫作任務(wù)的分?jǐn)?shù)和學(xué)生的關(guān)鍵人口特征數(shù)據(jù)進(jìn)行分析,以預(yù)測(cè)學(xué)生的成績(jī)。研究實(shí)驗(yàn)分為兩個(gè)階段,其中,訓(xùn)練階段使用收集的數(shù)據(jù)來(lái)訓(xùn)練算法;測(cè)試階段使用收集的10組數(shù)據(jù)來(lái)檢測(cè)算法的精確度。
San Pedro等將學(xué)生知識(shí)、學(xué)生情感和行為的細(xì)粒度模型,應(yīng)用于3747名學(xué)生的數(shù)據(jù)分析來(lái)理解學(xué)生學(xué)習(xí)的發(fā)展和投入,以預(yù)測(cè)學(xué)生能否考上大學(xué)。該研究開(kāi)發(fā)了一個(gè)邏輯回歸模型,并且發(fā)現(xiàn),學(xué)生投入和學(xué)生成功的特征組合作為預(yù)測(cè)指標(biāo),可以辨別出將考入大學(xué)的學(xué)生。
類似的,Hachey等使用二元邏輯斯蒂回歸算法,對(duì)962名學(xué)生的先前在線課程結(jié)果和GPA進(jìn)行分析,來(lái)預(yù)測(cè)學(xué)生完成在線課程的成功率。其中,先前在線課程結(jié)果和GPA作為自變量,在線課程成功率作為因變量。在二元邏輯斯蒂回歸模型中,GPA作為連續(xù)變量。該研究結(jié)果發(fā)現(xiàn),先前在線學(xué)習(xí)體驗(yàn)作為預(yù)測(cè)指標(biāo)比GPA能更好地預(yù)測(cè)成功率。
也有研究對(duì)學(xué)習(xí)表現(xiàn)的影響因素進(jìn)行了分析。Firmin等米用邏輯回歸,基于三門MOOCs課程分析了學(xué)生及格與學(xué)習(xí)努力程度和個(gè)人基本特征的相關(guān)性。該研究采用二元邏輯斯蒂回歸算法,發(fā)現(xiàn)學(xué)生的努力變量是學(xué)生及格唯一有效的預(yù)測(cè)指標(biāo),如,登錄次數(shù)、學(xué)習(xí)時(shí)長(zhǎng)和完成作業(yè)情況等,與學(xué)生基本特征無(wú)關(guān),如,性別、年齡和家庭收入等。
4、預(yù)警失學(xué)風(fēng)險(xiǎn)
綴學(xué)率一直是教育管理領(lǐng)域的重要指標(biāo)。機(jī)器學(xué)習(xí)方法能夠?qū)W(xué)生數(shù)據(jù)特征進(jìn)行分析和歸類,分析學(xué)生綴學(xué)原因,預(yù)測(cè)綴學(xué)行為。雖然教育管理部門存有大量的學(xué)生數(shù)據(jù),但是由于缺乏適當(dāng)?shù)臄?shù)據(jù)或受數(shù)據(jù)隱私性限制,預(yù)警失學(xué)的定量研究相對(duì)較少。
例如,Thammasiri等和Lauía等基于大量的真實(shí)學(xué)生數(shù)據(jù)對(duì)學(xué)生的學(xué)術(shù)成功展開(kāi)了研究。其中,Thammasiri等使用機(jī)器學(xué)習(xí)技術(shù)對(duì)長(zhǎng)達(dá)七年、特征豐富的真實(shí)學(xué)生數(shù)據(jù)進(jìn)行分析,來(lái)預(yù)測(cè)新生是否會(huì)在第二個(gè)學(xué)期注冊(cè)繼續(xù)學(xué)習(xí)。該研究比較了不同的數(shù)據(jù)平衡技術(shù)來(lái)提高少數(shù)類的預(yù)測(cè)準(zhǔn)確度,其中包括過(guò)抽樣算法、欠抽樣算法和合成少數(shù)類過(guò)抽樣算法,并連同邏輯回歸、決策樹(shù)、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等四種流行的分類方法,構(gòu)建預(yù)測(cè)模型來(lái)進(jìn)行比較。研究結(jié)果發(fā)現(xiàn),支持向量機(jī)結(jié)合合成少數(shù)類過(guò)抽樣算法數(shù)據(jù)平衡技術(shù)是表現(xiàn)最佳的分類器,三個(gè)數(shù)據(jù)平衡技術(shù)都能提高少數(shù)類的預(yù)測(cè)準(zhǔn)確度。在開(kāi)發(fā)的模型中應(yīng)用靈敏度分析,能夠?yàn)閷W(xué)生流失的準(zhǔn)確預(yù)測(cè)識(shí)別出最重要的變量。這些模型的應(yīng)用能夠預(yù)測(cè)高危學(xué)生,開(kāi)發(fā)有效的干預(yù)方法來(lái)減少學(xué)生的失學(xué)率。
類似的,Lauría等使用數(shù)據(jù)挖掘方法檢測(cè)學(xué)生的學(xué)術(shù)危機(jī)來(lái)提高大學(xué)生的保留率。該研究的數(shù)據(jù)挖掘模型基于監(jiān)督式學(xué)習(xí)技術(shù),用來(lái)區(qū)分表現(xiàn)好和不好的學(xué)生。研究的方法框架包括收集數(shù)據(jù)、轉(zhuǎn)化數(shù)據(jù)、分割數(shù)據(jù)、平衡訓(xùn)練數(shù)據(jù)、構(gòu)建預(yù)測(cè)模型和使用測(cè)試數(shù)據(jù)評(píng)價(jià)模型。在構(gòu)建預(yù)測(cè)模型階段,該研究方法選用了三個(gè)分類器作比較:邏輯回歸、支持向量機(jī)和C4.5決策樹(shù)。數(shù)據(jù)來(lái)自四個(gè)不同數(shù)據(jù)源的3877條記錄:學(xué)生履歷數(shù)據(jù)和課程相關(guān)數(shù)據(jù)、課程管理事件數(shù)據(jù)和Sakai成績(jī)單數(shù)據(jù)。研究結(jié)果發(fā)現(xiàn),邏輯回歸和支持向量機(jī)算法比C4.5決策樹(shù)能夠更精準(zhǔn)地分類。
人口統(tǒng)計(jì)和學(xué)習(xí)成績(jī)是預(yù)測(cè)學(xué)生綴學(xué)的重要數(shù)據(jù)。例如,Aulck等采用機(jī)器學(xué)習(xí)方法跟蹤32500名學(xué)生收集成績(jī)數(shù)據(jù)和人口統(tǒng)計(jì)數(shù)據(jù),使用邏輯回歸正則化、k最近鄰算法和隨機(jī)森林等方法來(lái)預(yù)測(cè)輟學(xué)變量,并對(duì)學(xué)生數(shù)據(jù)中預(yù)測(cè)輟學(xué)的最佳要素進(jìn)行了檢測(cè)。研究結(jié)果發(fā)現(xiàn),邏輯回歸正則化相比另外兩種算法能夠提供最有力的預(yù)測(cè),并檢測(cè)出學(xué)生流失的個(gè)人預(yù)測(cè)指標(biāo),包括數(shù)學(xué)、英語(yǔ)、化學(xué)和心理學(xué)課程的GPA以及入學(xué)和出生年月等。
5、學(xué)習(xí)支持和評(píng)測(cè)
學(xué)習(xí)支持和反饋是増強(qiáng)在線教育系統(tǒng)個(gè)性化和定制化的關(guān)鍵。在學(xué)習(xí)者與系統(tǒng)交互的過(guò)程中,學(xué)習(xí)支持提供個(gè)性化學(xué)習(xí)服務(wù)提高學(xué)習(xí)表現(xiàn),或者糾正學(xué)生的學(xué)習(xí)誤區(qū)。前者是“先發(fā)制人”,后者是“亡羊補(bǔ)牢”。例如,Ahadi等將機(jī)器學(xué)習(xí)方法和大學(xué)生編程過(guò)程中的源代碼快照數(shù)據(jù)相結(jié)合,讓系統(tǒng)能夠在課程入門第一周,就精準(zhǔn)地檢測(cè)出高表現(xiàn)和低表現(xiàn)的學(xué)生。該研究首先對(duì)特征進(jìn)行了抽取和選擇,然后選擇最精確的分類器來(lái)檢測(cè)預(yù)測(cè)模型。其中,選取了貝葉斯(樸素貝葉斯、貝葉斯網(wǎng)絡(luò))、規(guī)則學(xué)習(xí)者(決策表、連接規(guī)則和PART)和決策樹(shù)(AD樹(shù)、J48、隨機(jī)森林和決策樹(shù))等分類器進(jìn)行評(píng)估,發(fā)現(xiàn)決策樹(shù)分類器的整體準(zhǔn)確度最高,而在決策樹(shù)中隨機(jī)森林的預(yù)測(cè)準(zhǔn)確度最高,因此,選擇隨機(jī)森林作為分類器來(lái)評(píng)價(jià)學(xué)生的表現(xiàn)。
Xing等結(jié)合學(xué)習(xí)分析和教育數(shù)據(jù)挖掘方法,基于小數(shù)據(jù)來(lái)預(yù)測(cè)學(xué)生在CSCL學(xué)習(xí)環(huán)境中的表現(xiàn),從而為學(xué)生提供相應(yīng)的教學(xué)干預(yù)。該研究使用活動(dòng)理論來(lái)整體量化環(huán)境中的學(xué)生參與情況,并得到六個(gè)特征變量,然后使用遺傳規(guī)劃技術(shù)來(lái)構(gòu)建預(yù)測(cè)模型。結(jié)果顯示,基于遺傳規(guī)劃的模型是可解釋的,并且與傳統(tǒng)建模算法相比預(yù)測(cè)率得到優(yōu)化。
對(duì)學(xué)習(xí)者的領(lǐng)域知識(shí)獲取、技能發(fā)展和完成結(jié)果,以及反思、探究和情緒等的監(jiān)控和評(píng)價(jià),也是機(jī)器學(xué)習(xí)研究的重要主題。例如,Kinnebrew和Biswas使用探索性數(shù)據(jù)挖掘方法,從學(xué)生的交互軌跡中評(píng)測(cè)和比較學(xué)生的學(xué)習(xí)行為。其中,核心方法結(jié)合迭代行為抽象和逐段線性分割,迭代行為抽象是區(qū)別識(shí)別頻繁活動(dòng)模式的序列挖掘技術(shù),逐段線性分割是關(guān)于評(píng)估表現(xiàn)或進(jìn)展衡量的活動(dòng)階段。研究結(jié)果發(fā)現(xiàn),高表現(xiàn)和低表現(xiàn)學(xué)生具有不同的閱讀行為模式和監(jiān)控行為。
6、資源推薦
資源推薦通過(guò)分析學(xué)習(xí)者學(xué)習(xí)記錄來(lái)預(yù)測(cè)學(xué)習(xí)者的喜好,為學(xué)習(xí)者推薦最合適的資源(內(nèi)容、活動(dòng)或服務(wù))或資源序列。其最大的特征是通過(guò)分析學(xué)習(xí)者的行為,來(lái)“猜”學(xué)習(xí)者的表現(xiàn)和興趣,并生成個(gè)性化推薦,旨在幫助學(xué)習(xí)者選擇感興趣的課程、科目、學(xué)習(xí)材料和學(xué)習(xí)活動(dòng)等。例如,等使用機(jī)器學(xué)習(xí)方法構(gòu)建編程學(xué)習(xí)系統(tǒng)的推薦模型,能夠自動(dòng)地適應(yīng)學(xué)習(xí)者的興趣和知識(shí)水平。系統(tǒng)通過(guò)測(cè)試學(xué)習(xí)者學(xué)習(xí)風(fēng)格和挖掘服務(wù)日志,來(lái)識(shí)別學(xué)習(xí)風(fēng)格和學(xué)習(xí)者習(xí)慣的不同模式。研究首先基于不同的學(xué)習(xí)風(fēng)格處理集群,然后,通過(guò)AprioriAll算法挖掘頻繁序列,分析學(xué)習(xí)者的習(xí)慣和興趣,最后,系統(tǒng)根據(jù)頻繁序列的等級(jí)推薦個(gè)性化學(xué)習(xí)內(nèi)容。
Wang和Liao設(shè)計(jì)了一個(gè)基于不同學(xué)生特征推薦個(gè)性化教學(xué)內(nèi)容的英語(yǔ)自適應(yīng)學(xué)習(xí)系統(tǒng)。系統(tǒng)的核心技術(shù)是人工神經(jīng)網(wǎng)絡(luò)(ANN),并選擇ANN的BP算法用于學(xué)生特征和學(xué)習(xí)表現(xiàn)的監(jiān)督聚類分類。該研究應(yīng)用了一個(gè)四步核心方法來(lái)構(gòu)建每個(gè)學(xué)生的特征與詞匯、語(yǔ)法和閱讀的學(xué)習(xí)表現(xiàn)的關(guān)系,方法步驟包括構(gòu)建學(xué)生特征和學(xué)習(xí)表現(xiàn)的關(guān)系、獲得所有不同特征組合的學(xué)習(xí)表現(xiàn)、設(shè)置α-截和不同學(xué)習(xí)表現(xiàn)水平的α-截,以及為不同學(xué)生特征組合設(shè)置教學(xué)
內(nèi)容的不同等級(jí)。該方法支持系統(tǒng)根據(jù)學(xué)生的性別、性格和學(xué)習(xí)焦慮程度等特征,來(lái)適應(yīng)、推薦不同層次的學(xué)習(xí)內(nèi)容。
同樣,Aher和Lobo發(fā)現(xiàn)聚類和關(guān)聯(lián)規(guī)則算法等數(shù)據(jù)挖掘技術(shù)可用于課程推薦系統(tǒng),系統(tǒng)能夠基于其他學(xué)生在Moodle選擇的課程來(lái)為學(xué)生推薦相關(guān)課程。該研究發(fā)現(xiàn),使用樸素K均值聚類技術(shù)和Apriori關(guān)聯(lián)規(guī)則算法的綜合方法,無(wú)需經(jīng)歷數(shù)據(jù)準(zhǔn)備階段,而且關(guān)聯(lián)規(guī)則的數(shù)目還更多。課程推薦系統(tǒng)能夠根據(jù)學(xué)生的興趣,幫助學(xué)生選擇適當(dāng)?shù)恼n程組合。
(二)典型應(yīng)用:個(gè)性化自適應(yīng)學(xué)習(xí)平臺(tái)
個(gè)性化學(xué)習(xí)是指優(yōu)化學(xué)習(xí)步調(diào)和教學(xué)方法來(lái)滿足每位學(xué)習(xí)者需求的教學(xué)[58]。基于學(xué)習(xí)者的需求,學(xué)習(xí)目標(biāo)、教學(xué)方法和教學(xué)內(nèi)容是不同的,并且對(duì)于學(xué)習(xí)者來(lái)說(shuō),學(xué)習(xí)活動(dòng)是有意義且相關(guān)的,是受興趣驅(qū)動(dòng)且經(jīng)常是自我發(fā)起的。智慧教育的發(fā)展目標(biāo)之一就是為學(xué)習(xí)者提供個(gè)性化學(xué)習(xí)服務(wù),體現(xiàn)學(xué)生的差異化,改變傳統(tǒng)教育一刀切的局面。
根據(jù)前文的梳理可知,機(jī)器學(xué)習(xí)能夠結(jié)合學(xué)生的知識(shí)、行為和情緒等有效地支持個(gè)性化自適應(yīng)學(xué)習(xí)平臺(tái)的構(gòu)建。其中,在知識(shí)維度,機(jī)器學(xué)習(xí)支持學(xué)生建模,能夠?qū)γ總€(gè)學(xué)生的知識(shí)進(jìn)行建模和跟蹤,支持生成形成性評(píng)價(jià),為學(xué)習(xí)者推薦自適應(yīng)的課程和資源。在行為維度,機(jī)器學(xué)習(xí)支持學(xué)習(xí)行為建模,根據(jù)學(xué)生不同學(xué)習(xí)表現(xiàn)的行為模式對(duì)學(xué)生自動(dòng)分組,提供相應(yīng)的學(xué)習(xí)支持;通過(guò)分析學(xué)習(xí)歷史(如,活動(dòng)日志、學(xué)習(xí)結(jié)果等)和人口特征等數(shù)據(jù),來(lái)預(yù)測(cè)學(xué)生的學(xué)習(xí)表現(xiàn)和成績(jī)。在情感維度,機(jī)器學(xué)習(xí)能夠發(fā)現(xiàn)學(xué)習(xí)者情緒狀態(tài)與學(xué)習(xí)行為、結(jié)果的相關(guān)性,從而根據(jù)學(xué)生的情緒狀態(tài)推薦課程資源。
目前,Knewton、DreamBox、ALEKS、Gooru等個(gè)性化自適應(yīng)學(xué)習(xí)平臺(tái),結(jié)合機(jī)器學(xué)習(xí)技術(shù)已經(jīng)得到了廣泛應(yīng)用。其中,Knewton作為目前影響力最大的自適應(yīng)學(xué)習(xí)平臺(tái),能夠?yàn)閷W(xué)習(xí)者提供自適應(yīng)學(xué)習(xí)體驗(yàn)和預(yù)測(cè)分析,來(lái)提高學(xué)生的學(xué)習(xí)成就。在技術(shù)層面,平臺(tái)使用機(jī)器學(xué)習(xí)方法作為核心技術(shù),構(gòu)建了分析引擎和推薦引擎,分析引擎結(jié)合內(nèi)容數(shù)據(jù)和學(xué)生響應(yīng)數(shù)據(jù)實(shí)時(shí)地對(duì)學(xué)生能力進(jìn)行推斷,然后,推斷結(jié)果與學(xué)生學(xué)習(xí)結(jié)果結(jié)合,支持預(yù)測(cè)學(xué)生的學(xué)習(xí)表現(xiàn),從而為學(xué)習(xí)者生成下一步的個(gè)性化學(xué)習(xí)路徑。
隨著收集的數(shù)據(jù)越來(lái)越多,基于機(jī)器學(xué)習(xí)的推薦引擎和分析引擎模型和參數(shù)會(huì)不斷修改與更新,讓預(yù)測(cè)更加精準(zhǔn)。Knewton在學(xué)習(xí)過(guò)程中主要提供三種工具和三種核心服務(wù),其中,工具包括個(gè)別化指導(dǎo)、預(yù)測(cè)分析和學(xué)習(xí)報(bào)告;服務(wù)包括為學(xué)生提供個(gè)性化推薦、為教師和學(xué)生提供分析、為應(yīng)用和內(nèi)容創(chuàng)建者提供內(nèi)容解讀。通過(guò)使用Knewton自適應(yīng)學(xué)習(xí)平臺(tái),學(xué)生的通過(guò)率、退出率、提早完成率均有顯著變化。
五、機(jī)器學(xué)習(xí)應(yīng)用于智慧教育的幾點(diǎn)建議
機(jī)器學(xué)習(xí)作為人工智能的核心技術(shù)作用于教育大數(shù)據(jù),將幫助我們更好地理解數(shù)據(jù)、信息、知識(shí)與智慧之間的關(guān)系。但機(jī)器學(xué)習(xí)教育應(yīng)用在技術(shù)方面尚不成熟,在教育框架下也沒(méi)有規(guī)?;?。因此,基于智慧教育框架,對(duì)機(jī)器學(xué)習(xí)的教育應(yīng)用提出以下建議:
(一)跨界方面——支持智慧教育與機(jī)器學(xué)習(xí)的融合創(chuàng)新
1、機(jī)器學(xué)習(xí)與智慧教育的跨界融合
機(jī)器學(xué)習(xí)與智慧教育的融合存在跨界問(wèn)題。一般情況下,懂教育的未必懂技術(shù),懂技術(shù)的則未必深度理解教育。這就容易導(dǎo)致技術(shù)人員對(duì)數(shù)據(jù)挖掘結(jié)果無(wú)法從教育的本質(zhì)出發(fā)進(jìn)行解讀,而教育者無(wú)法從技術(shù)的角度對(duì)機(jī)器學(xué)習(xí)應(yīng)用提出準(zhǔn)確需求,對(duì)預(yù)測(cè)結(jié)果也無(wú)法充分理解。因此,研究教育領(lǐng)域與機(jī)器學(xué)習(xí)和人工智能領(lǐng)域如何深度融合非常必要。例如,加大兩個(gè)領(lǐng)域人員的合作、交流和協(xié)同開(kāi)發(fā)等;在高校中加大機(jī)器學(xué)習(xí)與學(xué)習(xí)科學(xué)的跨學(xué)科人才培養(yǎng);目前,利用可視化技術(shù)開(kāi)發(fā)人機(jī)界面,可有效幫助教育者理解機(jī)器學(xué)習(xí)和人工智能系統(tǒng),以促進(jìn)跨領(lǐng)域深度融合。可視化學(xué)術(shù)交互平臺(tái)也能支持教育領(lǐng)域人員更好地理解機(jī)器學(xué)習(xí),例如,谷歌日前聯(lián)手OpenAI等發(fā)布了一個(gè)交互視覺(jué)化期刊平臺(tái)Distill(http://distill.pub/),支持讀者理解機(jī)器學(xué)習(xí)的研究成果。
2、機(jī)器學(xué)習(xí)應(yīng)用的教學(xué)場(chǎng)景提煉
機(jī)器學(xué)習(xí)助力智慧教育發(fā)展的潛力和價(jià)值是毋庸置疑的,但目前缺少機(jī)器學(xué)習(xí)教育應(yīng)用的成熟案例,尤其是在不同教學(xué)場(chǎng)景中的應(yīng)用,這將是機(jī)器學(xué)習(xí)應(yīng)用發(fā)展的一大短板。機(jī)器學(xué)習(xí)雖然本身具有智能性,但是也具有一定局限性,尤其表現(xiàn)為容易被復(fù)雜的場(chǎng)景所迷惑,人們可能很容易完成的場(chǎng)景分析,對(duì)于機(jī)器來(lái)說(shuō)卻依舊困難。如果一直強(qiáng)調(diào)機(jī)器學(xué)習(xí)技術(shù)本身,而不直接面向教育應(yīng)用提供整體的解決方案,隨著技術(shù)壁壘越來(lái)越低,其教育應(yīng)用的未來(lái)價(jià)值可能會(huì)越來(lái)越小。因此,基于智慧教育框架梳理和提煉機(jī)器學(xué)習(xí)不同教學(xué)場(chǎng)景應(yīng)用的案例,將有助于體現(xiàn)機(jī)器學(xué)習(xí)的教學(xué)應(yīng)用價(jià)值。
(二)技術(shù)方面——支持智慧環(huán)境的技術(shù)創(chuàng)新
1、教育大數(shù)據(jù)治理
教育大數(shù)據(jù)是機(jī)器學(xué)習(xí)應(yīng)用研究的基礎(chǔ),其大量的、復(fù)雜的和凌亂的特點(diǎn),給數(shù)據(jù)的采集和存儲(chǔ)帶來(lái)了難度。同時(shí),在數(shù)據(jù)共享方面通常涉及數(shù)據(jù)隱私和倫理問(wèn)題,如何保護(hù)人們隱私又最大化地合理利用數(shù)據(jù)支持科學(xué)研究,也是當(dāng)前面臨的挑戰(zhàn)。因此,需要協(xié)同多方開(kāi)展教育大數(shù)據(jù)治理,以提升教育數(shù)據(jù)質(zhì)量、保障數(shù)據(jù)合理使用、保護(hù)數(shù)據(jù)隱私安全,以及促進(jìn)數(shù)據(jù)合法共享。例如,建立健全的教育大數(shù)據(jù)治理模式,制定教育數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)和管理規(guī)范,規(guī)范化采集和匯聚、共享不同平臺(tái)的數(shù)據(jù),形成智慧教育數(shù)據(jù)中心等。
2、數(shù)據(jù)標(biāo)準(zhǔn)化
在機(jī)器學(xué)習(xí)應(yīng)用之前,通常使用標(biāo)準(zhǔn)化之后的數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)標(biāo)準(zhǔn)化是支撐機(jī)器學(xué)習(xí)應(yīng)用和發(fā)展的重要基礎(chǔ)。因此,為了實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化,需要對(duì)智慧環(huán)境技術(shù)架構(gòu)進(jìn)一步作頂層設(shè)計(jì)和研究,以考慮數(shù)據(jù)標(biāo)準(zhǔn)化,以及不同工具和平臺(tái)之間的兼容性。智慧環(huán)境的技術(shù)架構(gòu)應(yīng)該融合學(xué)習(xí)內(nèi)容、軟件和平臺(tái)等支持系統(tǒng)集成和資源共享,以開(kāi)放標(biāo)準(zhǔn)和相關(guān)服務(wù)(網(wǎng)絡(luò)服務(wù)和應(yīng)用編程接口)為中心,制定統(tǒng)一的數(shù)據(jù)交換標(biāo)準(zhǔn),實(shí)現(xiàn)低成本、敏捷無(wú)縫整合和數(shù)據(jù)交換。
(三)教學(xué)方面——支持智慧教學(xué)法的方法創(chuàng)新
1、提升教師素養(yǎng)
機(jī)器學(xué)習(xí)作為一種新型技術(shù),容易造成教師對(duì)新型機(jī)器學(xué)習(xí)支持的教育軟件和服務(wù)的用戶體驗(yàn)不佳,原因在于教師信息素養(yǎng)與此類新型軟件的不匹配。使用新型軟件加重了教師的工作負(fù)載,如何將其與現(xiàn)有的教學(xué)進(jìn)行整合,對(duì)教師來(lái)說(shuō)也是一大挑戰(zhàn)。因此,一方面需要不斷提升教師的信息素養(yǎng)來(lái)適應(yīng)新型技術(shù)的應(yīng)用,另一方面在軟件開(kāi)發(fā)過(guò)程中需要考慮教師的需求,幫助教師更容易地接受新型技術(shù)并融入教學(xué)中。
2、提高教師參與
機(jī)器學(xué)習(xí)常應(yīng)用于智能教學(xué)系統(tǒng)中,而這類系統(tǒng)通常會(huì)弱化教師的參與,學(xué)習(xí)者根據(jù)自己的學(xué)習(xí)步調(diào)就能開(kāi)展學(xué)習(xí)。從短期來(lái)看,智能化推送減少了學(xué)習(xí)者的認(rèn)知負(fù)載;但從長(zhǎng)遠(yuǎn)來(lái)看,過(guò)度依賴系統(tǒng)建議,學(xué)習(xí)者自我反省、自我意識(shí)和自主學(xué)習(xí)的能力將不斷弱化。雖然機(jī)器學(xué)習(xí)應(yīng)用能夠?qū)崿F(xiàn)智能化和自動(dòng)化,但是教師能為學(xué)生提供情感交互、學(xué)習(xí)輔導(dǎo)和教學(xué)法設(shè)計(jì),這是機(jī)器學(xué)習(xí)目前無(wú)法實(shí)現(xiàn)的。因此,應(yīng)該強(qiáng)調(diào)機(jī)器學(xué)習(xí)應(yīng)用系統(tǒng)與教師的協(xié)作而非取代教師來(lái)優(yōu)化效能。在應(yīng)用過(guò)程中需要不斷提高教師的參與并激發(fā)其積極性,從而與系統(tǒng)優(yōu)勢(shì)互補(bǔ)、共同參與,促進(jìn)教學(xué)法的創(chuàng)新。
綜上所述,機(jī)器學(xué)習(xí)可以有效助力智慧教育,其在教育人工智能和教育數(shù)據(jù)挖掘方面發(fā)揮的作用也是其他技術(shù)無(wú)法取代的。隨著機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展和應(yīng)用,其與教育領(lǐng)域的融合定會(huì)不斷推動(dòng)教育創(chuàng)新。
本文轉(zhuǎn)載自MOOC
2、芥末堆不接受通過(guò)公關(guān)費(fèi)、車馬費(fèi)等任何形式發(fā)布失實(shí)文章,只呈現(xiàn)有價(jià)值的內(nèi)容給讀者;
3、如果你也從事教育,并希望被芥末堆報(bào)道,請(qǐng)您 填寫信息告訴我們。