《教育部關(guān)于加強(qiáng)和改進(jìn)中小學(xué)實(shí)驗(yàn)教學(xué)的意見》明確指出:“2023年前要將實(shí)驗(yàn)操作納入初中學(xué)業(yè)水平考試,考試成績(jī)納入高中階段學(xué)校招生錄取依據(jù);在普通高中學(xué)業(yè)水平考試中,有條件的地區(qū)可將理化生實(shí)驗(yàn)操作納入省級(jí)統(tǒng)一考試”。在教育部這一文件出臺(tái)之前,多個(gè)省市已經(jīng)發(fā)文在轄區(qū)內(nèi)開展中考實(shí)驗(yàn)操作考評(píng)。
傳統(tǒng)實(shí)驗(yàn)考評(píng)方式存在著集中調(diào)配大量專業(yè)教師難度大、教師主觀評(píng)分個(gè)人差異大、學(xué)生操作過程難以復(fù)制、靠后數(shù)據(jù)整理工作量大等問題?;?/span>此,人工智能(AI)再中考實(shí)驗(yàn)考評(píng)中有著非常廣闊的應(yīng)用前景。西南交通大學(xué)黃進(jìn)教授就AI在中考實(shí)驗(yàn)考評(píng)及整個(gè)基礎(chǔ)教育領(lǐng)域的應(yīng)用情況進(jìn)行了訪談。具體如下:
問:提起AI這個(gè)詞,很多人都熟悉,但對(duì)它的準(zhǔn)確含義可能就不是很清楚了。您能簡(jiǎn)單解釋一下AI的準(zhǔn)確含義嗎?目前AI技術(shù)發(fā)展到了什么水平?
答:這個(gè)問題可以說很簡(jiǎn)單,也可以說很復(fù)雜。AI即人工智能,不同學(xué)者有不同的定義,其基本內(nèi)涵簡(jiǎn)單來說就是研究具有人類智能的人工系統(tǒng)的學(xué)科。具體來說,Al就是用人工系統(tǒng)來模擬人類的行為過程和思維過程的學(xué)科。行為過程包括走、跑、跳等運(yùn)動(dòng)行為,視覺、聽覺、味覺、嗅覺、觸覺等感官行為,喜、怒、哀、樂等情緒行為,聚會(huì)、聯(lián)歡、結(jié)伴等社群行為,等等。思維過程包括學(xué)習(xí)、總結(jié)、思考、規(guī)劃、推理等。人類行為學(xué)和人類思維學(xué)本身就是兩門學(xué)科,內(nèi)涵非常豐富,這也體現(xiàn)出AI技術(shù)的實(shí)現(xiàn)難度。
1956年達(dá)特茅斯會(huì)議的召開標(biāo)志著AI技術(shù)的誕生,隨后這一學(xué)科經(jīng)歷了幾次高低潮的起落。2006年深度學(xué)習(xí)的提出以及相關(guān)算力設(shè)施的高速發(fā)展,讓AI再次獲得突破性進(jìn)展,得到社會(huì)、政府、行業(yè)、企業(yè)的高度認(rèn)可和重視,被譽(yù)為第四次工業(yè)革命的技術(shù)皇冠。AI可以應(yīng)用于千行百業(yè),目前我們身邊能夠親歷或耳聞的應(yīng)用包括車牌識(shí)別、人臉識(shí)別、違章抓拍、無人駕駛等,但這些都停留在低層次智能和零星點(diǎn)應(yīng)用上,行為邏輯、思維推理等高層次智能還沒有出現(xiàn)具有較大影響力的工程應(yīng)用案例。從產(chǎn)業(yè)發(fā)展的角度來說,絕大部分行業(yè)和應(yīng)用 場(chǎng)景還沒有實(shí)現(xiàn)人工智能,但政府、社會(huì)、產(chǎn)業(yè)、行業(yè)對(duì)AI的共同認(rèn)知和發(fā)展意志又推動(dòng)著干行百業(yè)開始或準(zhǔn)備開始走上AI發(fā)展之路。當(dāng)前,Al應(yīng)用是一片廣闊的藍(lán)海市場(chǎng),對(duì)產(chǎn)業(yè)升級(jí)和社會(huì)發(fā)展具有重大戰(zhàn)略意義。
問:請(qǐng)您談?wù)?/span>AI在實(shí)驗(yàn)考評(píng)中的應(yīng)用現(xiàn)狀,您在研究中遇到的主要難點(diǎn)在哪里?
答:2019年發(fā)布的《教育部關(guān)于加強(qiáng)和改進(jìn)中小學(xué)實(shí)驗(yàn)教學(xué)的意見》明確規(guī)定:“2023年前要將實(shí)驗(yàn)操作納入初中學(xué)業(yè)水平考試,考試成績(jī)納入高中階段學(xué)校招生錄取依據(jù)”。這為Al應(yīng)用于中考理化生實(shí)驗(yàn)操作考試提供了政策支持。隨后,全國各省區(qū)市相繼出臺(tái)關(guān)于中考理化生實(shí)驗(yàn)操作考試的指導(dǎo)意見,不約而同地提到采用創(chuàng)新技術(shù)手段保障實(shí)驗(yàn)操作考試高效組織、客觀評(píng)價(jià)和公平公正的重要性。
傳統(tǒng)實(shí)驗(yàn)操作考試存在調(diào)配大量考官難、主觀評(píng)分差異大、實(shí)驗(yàn)過程復(fù)現(xiàn)難、考后數(shù)據(jù)整理難等問題,AI技術(shù)是解決問題的關(guān)鍵所在。當(dāng)前,AI在實(shí)驗(yàn)操作考試中的應(yīng)用還處于起步階段,全國還沒有完全采用AI進(jìn)行正式考試的案例,走在創(chuàng)新應(yīng)用前沿的上海、深圳等地仍以教師評(píng)分為主,AI評(píng)分僅作為輔助手段在小范圍開展試點(diǎn)。究其原因,在于AI評(píng)分存在很多難點(diǎn):
(1)評(píng)分標(biāo)準(zhǔn)不一。相同實(shí)驗(yàn)的評(píng)分標(biāo)準(zhǔn),各地市存在差異,甚至較大的差異。截至目前,我看到過全國50多個(gè)地市的理化生實(shí)驗(yàn)評(píng)分標(biāo)準(zhǔn),幾乎沒有完全相同的,有些甚至差異很大。要么評(píng)分項(xiàng)數(shù)量不一樣,要么評(píng)分項(xiàng)考點(diǎn)不一樣,要么考點(diǎn)分值不一樣,等等。如何實(shí)現(xiàn)AI算法基于不同地市、不同評(píng)分標(biāo)準(zhǔn)的通用性和可擴(kuò)展性是一個(gè)難點(diǎn)。
(2)實(shí)驗(yàn)數(shù)量較多。據(jù)不完全統(tǒng)計(jì),中學(xué)物理、化學(xué)、生物實(shí)驗(yàn)總共有200多個(gè),其中比較重20票的有50個(gè)左右,例如測(cè)量小燈泡的電功率、高錳酸鉀固體制取氧氣、制作番茄果肉細(xì)胞臨時(shí)裝片
算法針對(duì)不同實(shí)驗(yàn)的普適性是一個(gè)難點(diǎn)。
(3)儀器類型多樣。據(jù)不完全統(tǒng)計(jì),中學(xué)物理、化學(xué)、生物實(shí)驗(yàn)涉及的儀器有1000余種,如電流表、電壓表、滑動(dòng)變阻器、試管、燒杯、漏斗、顯微鏡、放大鏡、玻片等。如何實(shí)現(xiàn)AI算法針對(duì)不同雙獎(jiǎng)型55別的準(zhǔn)確性是一個(gè)難點(diǎn)。
(4)儀器型號(hào)繁多。對(duì)于每一種儀器類型,不同生產(chǎn)廠家的產(chǎn)品外觀幾乎都不會(huì)相同;即便是同一生產(chǎn)廠家,不同型號(hào)儀器的外觀絕大部分也不會(huì)相同。例如物理實(shí)驗(yàn)中常用的電流表,按測(cè)量電流量分有微安表、毫安表、安培表,按工作原理分有磁電式、電磁式、電子數(shù)字式,按工作方式分有豎式、平式等。為了實(shí)現(xiàn)對(duì)儀器的充分利用,AI算法需要針對(duì)海量的儀器型號(hào)實(shí)現(xiàn)儀器讀數(shù)的精準(zhǔn)識(shí)別,這需要建立海量樣本庫,工作量巨大,而且很難保證樣本庫的完整性。
(5)實(shí)驗(yàn)步驟嚴(yán)謹(jǐn)。中學(xué)物理、化學(xué)、生物實(shí)驗(yàn)的實(shí)驗(yàn)步驟要求嚴(yán)謹(jǐn),步驟之間大部分具有時(shí)序性和強(qiáng)關(guān)聯(lián)性,操作不當(dāng)輕則導(dǎo)致實(shí)驗(yàn)失敗,重則可能導(dǎo)致人身傷害。例如,高錳酸鉀固體制取氧氣實(shí)驗(yàn),導(dǎo)管移出水面操作和熄滅酒精燈操作的時(shí)序性就非常重要。如何實(shí)現(xiàn)AI算法針對(duì)不同實(shí)驗(yàn)步驟及其步驟時(shí)序性組合識(shí)別的完備性和準(zhǔn)確性是一個(gè)難點(diǎn)。
(6)操作細(xì)節(jié)精準(zhǔn)。中學(xué)物理、化學(xué)、生物實(shí)驗(yàn)的操作細(xì)節(jié)要求精準(zhǔn),有些細(xì)節(jié)的精度要求達(dá)到毫米級(jí)。例如,使用量筒進(jìn)行液體讀數(shù)時(shí),要求液體凹液面和量筒刻度線相切;使用漏斗進(jìn)行液體引流時(shí),要求玻璃棒靠觸三層濾紙引流。如何實(shí)現(xiàn)Al算法針對(duì)相切與否、濾紙厚薄等微觀操作識(shí)別的精準(zhǔn)性是一個(gè)難點(diǎn)。
(7)操作主觀性強(qiáng)。中學(xué)物理、化學(xué)、生物實(shí)驗(yàn)的操作流程存在主觀性,為達(dá)到同樣的目標(biāo),不同學(xué)生可能有不同的操作方法。例如在探究電阻上的電流跟兩端電壓的關(guān)系實(shí)驗(yàn)中,電流表、電壓表、定阻電阻、滑動(dòng)變阻器、電池盒、開關(guān)等儀器的連接順序存在多種可能組合。如何實(shí)現(xiàn)AI算法針對(duì)不同實(shí)驗(yàn)操作組合的評(píng)分準(zhǔn)確性是一個(gè)難點(diǎn)。
問:當(dāng)所有困難都突破之后,AI技術(shù)在實(shí)驗(yàn)考評(píng)中應(yīng)用的終極場(chǎng)景是什么樣的?
答:雖然AI應(yīng)用于中考理化生實(shí)驗(yàn)操作考評(píng)在技術(shù)上困難重重,但我們基于20多年的技術(shù)和2人才積累已經(jīng)組織了強(qiáng)有力的團(tuán)隊(duì)全力開展技術(shù)攻關(guān),每個(gè)技術(shù)難點(diǎn)都制定了詳細(xì)的技術(shù)路線和解決方案,正在穩(wěn)步、快速和高效地實(shí)施。今年5月22日,我們?cè)谏钲谀持袑W(xué)中考期間開展了AI 評(píng)分考場(chǎng)實(shí)測(cè),采用24位學(xué)生1組,其中物理、化學(xué)、生物各8位學(xué)生,學(xué)生同時(shí)考試,即考即評(píng), Al評(píng)分與老師人工評(píng)分逐項(xiàng)對(duì)比,測(cè)試準(zhǔn)確率達(dá)到95.78%。緊接著的6月7日,我們?cè)谏钲诹硪凰袑W(xué)又開展了AI評(píng)分現(xiàn)場(chǎng)測(cè)試,采用12位學(xué)生1組,其中物理、化學(xué)、生物各4位學(xué)生,學(xué)生同時(shí)考試,即考即評(píng),Al評(píng)分與老師人工評(píng)分逐項(xiàng)對(duì)比,測(cè)試準(zhǔn)確率達(dá)到96.33%,取得了理想的成效!我們有信心在今年年底左右實(shí)現(xiàn)重要實(shí)驗(yàn)AI評(píng)分的正式考試應(yīng)用。
待所有技術(shù)難點(diǎn)攻克后,中考理化生實(shí)驗(yàn)操作考試將以無人化、智能化、實(shí)時(shí)化為特點(diǎn),即考試現(xiàn)場(chǎng)無需監(jiān)考老師(或僅需1-2位巡考老師),考試成績(jī)智能評(píng)分,考試報(bào)告即考即出,整個(gè)考務(wù)工作將呈現(xiàn)工作人員少、工作效率高、考務(wù)成本低的智慧考務(wù)新模式。
問:除了實(shí)驗(yàn)考評(píng)這一應(yīng)用場(chǎng)景,AI在基礎(chǔ)教育領(lǐng)域還有哪些應(yīng)用場(chǎng)景?這些應(yīng)用的現(xiàn)狀和前景如何?
答:AI在基礎(chǔ)教育領(lǐng)域的應(yīng)用場(chǎng)景非常多。例2/04/29 15:58如,仕體育教育方面,基于AI的仰臥起坐、引體向作將呈現(xiàn)工作人員少、工作效率同智慧考務(wù)新模式。
問:除了實(shí)驗(yàn)考評(píng)這一應(yīng)用場(chǎng)景,AI在基礎(chǔ)教育領(lǐng)域還有哪些應(yīng)用場(chǎng)景?這些應(yīng)用的現(xiàn)狀和前景如何?
答:AI在基礎(chǔ)教育領(lǐng)域的應(yīng)用場(chǎng)景非常多。例如,在體育教育方面,基于AI的仰臥起坐、引體向上、立定跳遠(yuǎn)評(píng)分等智慧體育技術(shù);在課堂教學(xué)方面,基于目標(biāo)檢測(cè)、運(yùn)動(dòng)跟蹤和行為識(shí)別的課堂教學(xué)質(zhì)量評(píng)價(jià)技術(shù);在校園管理方面,基于AI的人群聚集檢測(cè)、可疑行人跟蹤、異常行為識(shí)別等智慧校園技術(shù)等。在國家創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略和產(chǎn)教融合戰(zhàn)略的大背景下,基礎(chǔ)教育領(lǐng)域基于AI技術(shù)的智慧應(yīng)用必定是未來發(fā)展的趨勢(shì),擁有極其廣闊的發(fā)展前景。
不瞞您說,對(duì)這些應(yīng)用場(chǎng)景我們已經(jīng)開始了技術(shù)預(yù)研和攻關(guān)。只要國家和行業(yè)需要,我們能夠在第一時(shí)間開展算法模型的成果轉(zhuǎn)化和工程應(yīng)用,在科學(xué)研究、技術(shù)創(chuàng)新、成果轉(zhuǎn)化和工程應(yīng)用的創(chuàng)新發(fā)展道路上肩負(fù)起科研工作者應(yīng)盡的責(zé)任。
來源:秘書處