圖片來源:unsplash
今日起,全國多個省份高考成績相繼出爐,各地高考閱卷工作也基本接近尾聲。據北京教育考試院副院長李鴻江介紹,北京 2022 年高考閱卷將于 6 月 24 日結束,會嚴格按照《國家教育考試網上評卷管理規(guī)范》要求,加強閱卷工作規(guī)范管理和質量監(jiān)控。作為一場影響千萬人命運的大考,高考在閱卷環(huán)節(jié)更需嚴謹認真,容不得半點草率馬虎。那么,經過近半個世紀的演變,高考閱卷如今發(fā)展到怎樣的階段,背后有哪些技術變革作為支撐,未來前進發(fā)展的方向又是哪里呢?
從紅筆到鼠標,高考閱卷簡史
自從 1977 年底國家正式恢復高考以來,這項關乎人生命運的制度已經走過了 45 個年頭,背后的閱卷環(huán)節(jié)也在不斷發(fā)生變遷。這四十五年間,高考閱卷歷經了從單純依靠人力手工批閱到使用計算機簡單介入,再到利用人工智能高效輔助的過程。閱卷教師手中掌握考生“生殺大權”的工具也一點點由“紅筆”變?yōu)榱恕笆髽恕薄?img src="http://cdn.jiemodui.com/img/Public/Uploads/item/20220623/1655975125798590.jpg" title="" alt="ec60a137fe758b5b047283f42d66e7cd.jpg"/>
1. 閱卷“1.0時代”——人工撐起一片天
1977 年,全國恢復了中斷十年的高考制度。彼時的高考,保密意識和閱卷制度都尚不完善,考試結束后,試卷經過基礎信息遮擋、簡單裝訂就被裝進密封袋,送到閱卷組。等到開始閱卷的時候,再發(fā)放到閱卷教師手中。
在閱卷時,閱卷教師拿到答題紙后,直接在上面進行批閱核分。并沒有我們現在熟知的“雙批”“三批”乃至“四批”的要求。且試卷一般只交由一位閱卷教師手工批閱核分,就決定了考生的命運。據那一時期的閱卷人員回憶,當時閱卷能否做到公平公正,基本全憑自己的責任感和良心。
一直到 20 世紀 90 年代之前,我國高考閱卷的各個環(huán)節(jié)包括試卷的運輸、裝訂、分發(fā)、批閱、復核等,基本都交由人工全權負責完成。但隨著時代的變革、技術的創(chuàng)新,人工閱卷模式很快迎來了挑戰(zhàn)。由于程序上的繁瑣,效率低下成為了其硬傷。再加上當時高考命題多使用主觀開放性題型,間接放大了閱卷教師批閱時主觀思維的影響,產生誤差的情況在所難免,結果易遭人質疑詬病。因此,建立一個更高效、更標準的高考閱卷制度迫在眉睫。
2. 閱卷2.0時代——光標閱讀機助力客觀題批閱
將閱卷教師從繁重工作中解放出來的曙光,出現在 1985 年。這一年,國家出臺了一系列高考政策和試驗方案,其中,推進標準化考試就是一項重大舉措;次年,廣東、山東、遼寧、廣西四省聯合試驗高考標準化考試;到了 1988 年,全國已有 16 個省份參加高考標準化試驗。
時間來到 1989 年,經過此前多地試點探索后,國家教委頒發(fā)了《普通高等學校招生全國統(tǒng)一考試標準化實施規(guī)劃》,規(guī)定從 1991 年起所有高考科目實行標準化考試,即將高考試卷被分成客觀題和主觀題兩部分,前者將答案寫在特制的答題卡上,后者則繼續(xù)在試卷上作答。
高考命題的日趨標準化,使得計算機在閱卷環(huán)節(jié)有了施展拳腳的機會。1988 年,山東大學和重慶大學聯合研制的國產光標閱讀機推出,并應用于當年高考閱卷領域。其能通過光學掃描和石墨感應技術,識別答題卡上的客觀題答案,自動給考生批閱核分。此后的十年時光中,光標閱讀機迅速普及開來,廣泛應用于高考等各類標準化考試當中。
毫無疑問,光標閱讀機的出現,有效為閱卷教師分擔了壓力,減少了無謂的消耗。但值得注意的是,這一時期,雖然客觀題可以借助計算機實現“人卷分離”批閱,但主觀題部分依然需要閱卷教師在紙上進行批閱,仍不可避免人為因素摻雜其中。
3. 閱卷3.0時代——高速掃描儀實現無紙化閱卷
前文提到,光標閱讀機雖存在優(yōu)勢,卻只能處理客觀題,主觀題依然十分有賴于人工。且由于考生數量的逐年增加,讀取速度也愈發(fā)疲軟。于是,更先進的高速掃描儀便登上歷史舞臺。
其工作原理是先對試卷進行整張掃描,再由計算機對圖像進行切割。其中,客觀題直接由計算機評分,主觀題則分成小份由系統(tǒng)發(fā)送給閱卷教師批閱。掃描后的試卷會以照片形式存檔,試卷的分發(fā)、批閱、核分等各個環(huán)節(jié)均在網上完成,降低繁重運輸成本的同時,也讓閱卷教師無法直接接觸考生試卷,實現無紙化、零接觸閱卷。
1999 年,廣西率先在高考英語科目上試點網上無紙化閱卷。第二年,又把試點范圍從英語進一步擴大到語文。此外,云南、江西、遼寧等省份也開始推行,在保送生能力測試等考試中嘗試網上無紙化閱卷。
到了 2013 年,全國各地都已實現高考網上無紙化閱卷,主客觀題答題卡也合二為一,除部分科目外基本都由一張 A3 尺寸的紙張構成。這種由“高速掃描儀+網上閱卷軟件”組成的閱卷模式,也被各地教育考試院一直沿用至今,成為當下主流。
人工智能輔助,閱卷邁入4.0時代
在教育領域,人工智能技術正在全面、深刻地影響著教育理念、教學模式和考試方式。隨著圖像文字轉寫識別、自然語言處理、深度學習和評分算法等核心技術的發(fā)展,使計算機運用人工智能技術完成諸如語文作文、英語作文、英語聽說、數學證明等智能輔助閱卷已經成為可能。[1]人工智能閱卷實施主要流程步驟
當下,高考閱卷所用的智能閱卷技術,主要分為英語聽說測試以及全學科的紙筆輔助閱卷兩個大類。其中,英語聽說閱卷相關的研發(fā)工作早在 2005 年就啟動了。到了 2012 年,科大訊飛已研發(fā)構建了廣東省高考英語聽說考試和智能評測系統(tǒng),并首次在廣東高考中驗證成功實用。該系統(tǒng)通過人工智能技術的應用,可實現自動化考試和評分,現已推廣到全國 20 多個省市的中高考英語口語考試中使用。
2015 年,科大訊飛率先在安徽、湖南等地的多項作文考試中,利用人工智能輔助完成評分質檢工作;2016 年,又對安徽、江蘇兩地高考考生的語文作文和英語作文進行了后臺離線智能評分;到了 2017 年,阿里 AI 又在浙江外國語學院的一次考試中,利用人工智能輔助,準確指出學生在作文寫作中出現的多詞、缺詞、錯詞等錯誤。
[2]高考網上閱卷系統(tǒng)和人工智能輔助
評分系統(tǒng)融合示意圖
經過多方努力探索,去年年初,教育部教育考試院已將智能評分技術納入網評暫行標準。再把目光聚焦到剛剛結束不久的高考,據悉,科大訊飛今年將承擔 119 個省市區(qū)的中高考掃描閱卷工作,同時還會在安徽、江蘇、廣西、天津、廣東、上海等十余個省市范圍內,進行高考智能閱卷的輔助評分應用。
某種意義上看,高考閱卷 4.0 時代或許只是 3.0 時代的延續(xù),它并未打破既有的閱卷模式和體系,只是在以往“人工+計算機”的基礎上更進一步,加大了計算機的介入比重。但長遠而言,其產生的影響不容小覷。過往,計算機在主觀題上往往捉襟見肘,現在卻能運用先進的人工智能技術,在中英作文、幾何證明等題型上嶄露頭角,幫助閱卷教師更快速準確地批閱。
根據對上述科目及題型的探索驗證和經驗積累,未來,人工智能完全有可能在更大范圍內建立起科學的閱卷模型,實現對具有確定答案的填空題、改錯題、文科類簡答題以及包含公式和解題過程的數學、物理、化學、生物等特定題型的智能批閱,將智能閱卷成果向縱深擴展。并且,伴隨更多企業(yè)參與到教育考試及閱卷工作中來,勢必將對現有網上閱卷技術服務商提出更多更高的要求,給行業(yè)更多發(fā)展想象的空間。
“人機協(xié)作”是必然,但也要拎清其中利害
其實,自人工智能技術誕生以來,關于計算機會不會完全取代人工的探討就一直未曾停息,高考閱卷領域同樣如此。科大訊飛考試與語言學習產品線副總經理竺博認為,未來在學業(yè)水平考試、自學考試及社會化考試等相對低利害的考試中,人工智能閱卷替代一評或部分替代人力是發(fā)展方向,人機協(xié)作的智能閱卷組織管理模式,也將成為未來考試閱卷智能化應用的潮流。
[3]人機協(xié)作閱卷的智能評分流程
他表示,“人機協(xié)作”閱卷模式的技術特點可以總結歸納為 3 點:一是高融合性。將智能評分參與一評獨立部署,通過增加數據接口,擴充“閱卷輔助平臺”應用功能,保持與網上閱卷系統(tǒng)之間的密切聯系。在網上閱卷系統(tǒng)中增加驗標集專家評分功能模塊,使智能評分參與一評成為替代一評的標準流程,既保證人工正式閱卷流程的順暢,又確保各系統(tǒng)獨立運行和相互之間的數據安全性。
二是高可用性。“網上閱卷系統(tǒng)”支持隨時在“人一評”+“機一評”+“人二評”模式和“人工雙評”模式之間的切換,智能評分系統(tǒng)支持在“機一評”模式和“智能評分輔助網評質量監(jiān)控”模式之間的切換,能夠切實降低智能評分參與一評的風險,確保閱卷進度和質量。
三是可追溯性。單獨部署的“驗標集專家評分系統(tǒng)”、用于人工閱卷的“網上閱卷系統(tǒng)”和“智能評分系統(tǒng)”3 個系統(tǒng)之間數據獨立運行、獨立存儲,通過“閱卷輔助平臺”進行數據交換,完成在線實時對接,并形成操作日志,關鍵節(jié)點均可實現可追溯、可審計、可恢復的設計目標。
人工智能輔助閱卷發(fā)展方向及核心能力
與此同時,竺博強調,人工智能閱卷不會完全取代人工,尤其在高考這種高利害性的考試中,其扮演的是工具、幫手的角色,是為了更好地服務閱卷工作,而非為了把人比下去。他表示,計算機智能閱卷更準確的表達應該為數字化考試。這點上看,教育考試領域中,以人工智能為代表的新型基礎設施建設剛剛處于起步階段,有著廣闊的應用前景和上升空間。
通過業(yè)內人士觀點不難看出,隨著人工智能技術、5G 高速網絡、數據中心、數字孿生等一批新型基礎設施建設的規(guī)劃與落地,教育考試業(yè)務中的信息化與數字化也將進入新階段。未來,對行業(yè)各大廠商而言,“抓手”可能會由做好信息技術的單點應用,發(fā)展為新基建與教育考試業(yè)務各環(huán)節(jié)的全面協(xié)同;由信息技術滿足部分考試業(yè)務需求,轉變?yōu)樾禄ㄙx能教育考試業(yè)務;由單一的技術補缺,轉變?yōu)橹逃荚嚇I(yè)務變革升級。
結語
高考作為舉國關注的大考,不僅是對廣大高三學子的一次檢驗,更是對背后閱卷各個環(huán)節(jié)的一場考核。經過近半個世紀的演變,從“攥紅筆”到“握鼠標”,從“翻試卷”到“看屏幕”,我們有幸領略技術在高考閱卷上的推力,也很欣慰成為這個特殊時代的見證者。但無論技術怎樣發(fā)展變革,我們應始終秉承“人本位”的理念,讓技術服務于人,而非束縛于人。
參考資料及部分文獻引用:
1. [1][3]何屹松,孫媛媛,汪張龍,竺博. 人工智能評測技術在大規(guī)模中英文作文閱卷中的應用探索[J]. 中國考試, 2018(6):9.
2. [2]何屹松,徐飛,劉惠,孫媛媛,竺博,儲林林. 新一代智能網上評卷系統(tǒng)的技術實現及在高考網評中的應用實例分析[J]. 中國考試, 2019, 000(001):57-65.
3. 何屹松,孫媛媛,江光賢,張凱. 人工智能評分參與高考網評一評的應用實踐[J]. 中國考試, 2021(9):7.
4. 楊景治. 給1078萬考生批卷的,可能不是個人[OL]. 果殼硬科技, 2021-06-07
5. 制造的小助理. 給1193萬高考生判卷,究竟有多難?[OL]. 了不起的中國制造, 2022-06-09
本文轉自微信公眾號“黑板洞察”(ID:heibandongcha),作者王瑋。文章為作者獨立觀點,不代表芥末堆立場,轉載請聯系原作者。
2、芥末堆不接受通過公關費、車馬費等任何形式發(fā)布失實文章,只呈現有價值的內容給讀者;
3、如果你也從事教育,并希望被芥末堆報道,請您 填寫信息告訴我們。