當前位置: 華文世界 > 教育

以資訊科技為支撐 推進學生綜合素質評價改革

2024-01-20教育

感謝您關註「永大英語」!

以資訊科技為支撐 推進學生綜合素質評價改革

陳 麗

對於教育評價的重要性,社會各界已有高度共識,認為它是教育改革、教育高品質發展的指揮棒。教育評價作用的大小和指揮得好壞,不僅取決於我們對教育的重視,還取決於對培養方向的準確把握,更取決於我們的評價手段和能力。我們的評價能力決定了我們能評價的東西。事實上,由於評價能力的局限,許多我們倡導和重視的學生有價值的發展變化並不能被科學、客觀地評價,這是制約教育高品質發展的最大瓶頸。當前,由於教育評價能力的不足,導致許多問題不能很好地解決,如「雙減」政策落地難、各種教育內卷越來越嚴重、拔尖創新人才選拔和辨識難等。通常,拔尖創新人才的發展是不平衡的,他們往往有顯著的優勢,也有顯著的短板。我們如何辨識那些有潛力的學生?這取決於我們有沒有能力把他們評出來。

一、中國綜合素質評價狀況及面臨的挑戰

綜合素質評價能力不足是制約基礎教育過去、今天和未來高品質發展的瓶頸。從2004年教育部出台檔首次提出要開展學生綜合素質評價至今,我們在綜合素質發展過程的評價方面取得顯著進展。很多地區、學校建立學生綜合素質評價的平台,記錄學生綜合素質發展的關鍵事件,一定程度上扭轉了教師、家長和學生的學習觀,促進了學校和社會對學生綜合素質發展的重視。但我們仍無法科學、客觀地評價學生綜合素質發展的水平,學生綜合素質評價改革仍面臨諸多挑戰。首先,對於什麽是綜合素質,尚未有清晰的界定,綜合素質與德智體美勞之間的關系也尚未厘清。「五育」的口徑和基礎教育課程標準中以核心素養為培養目標的口徑不太一樣,造成中小學教學實踐中對接的困難。其次,過程評價、記錄學生成長的過程數據非常重要,但用過程數據來反映學生發展水平還是有問題的。過程可以反映努力程度,但無法準確反映結果。過程評價中采用了很多自評和他評,遇到的問題是客觀性和可信性不足。尤其是當這類評價結果與高利害選拔結合的時候,還可能導致材料造假的嚴重問題。最後,各省各地的指標差距特別大,難以支持跨校和跨地區的比較;地方學校對收集到的數據進行分析時,也遇到不少技術難題。

二、資訊科技支撐綜合素質評價改革

資訊科技的發展,特別是人工智慧技術的發展,為破解上述挑戰提供了前所未有的機遇。【深化新時代教育評價改革總體方案】指出,要創新評價工具,利用人工智慧、大數據等現代資訊科技,探索開展學生各年級學習情況全過程縱向評價、德智體美勞全要素橫向評價。過去幾年,在科技部和教育部的支持下,北京師範大學聯合8個大學和教育機構,基於38個試點區域的試驗,創新性地提出基於人工智慧技術的中小學生綜合素質評價方案。

2021年,科技部設立一個重大科技專項,其核心就是采用新技術手段探索出一套中國學生綜合素質發展水平的評價方案。在此基礎上,教育部於2022年啟動資訊科技支撐學生綜合素質評價試點工作。經申報與評審,教育部設立38個試點區域。科技部計畫為試點提供理論和技術支撐,試點區域進行在地化檢驗和轉化。

就評價方案而言,我們實作了三個方面的突破。第一個突破是理論模型的構建。我們將學生綜合素質定義為跨越學科的通用的品格、能力和價值觀,並以核心素養為基座,重新構建由三個方面(自主發展、文化修養、社會參與)、10個維度、36個要點構成的學生綜合素質評價模型。第二個突破是創新表現性評價方法,研發了一系列評價工具,形成全新的學生綜合素質評價解決方案。與紙筆考試不同,表現性評價透過記錄學生在完成真實、復雜的任務過程中的表現數據,套用多模態智慧分析技術,實作對學生綜合素質的評價,如要求學生上傳1分鐘跳繩視訊,以此辨識其體能耐力。第三個突破是研發了三類關鍵技術,包括多場景的數據采集和匯聚技術、多模態數據智慧處理技術和大規模數據分析技術。這些關鍵技術成果、測評工具、資料探勘引擎被全部整合到學生綜合評價與發展平台上。學生透過平台上的各類評價活動參與測試,平台可以向試點區域、學校和家長反饋評價結果分析報告,這對於改進各地實踐很有幫助。許多區域和學校透過測評分析報告,重新審視辦學情況,針對學生綜合素質發展存在的短板,制定整改措施。家長基於測評分析報告,可以清楚地了解學生的潛力和不足。

三、試點工作進展情況

目前,科技部科技攻關計畫已進入第三年,教育試點工作進入第二年。在第一學年中,38個試點區域近400萬中小學生參加測評,280萬學生完成所有測試活動並得到測試報告。總體來看,全國學生平均需要6.5個小時完成測評,多數學生在5小時內基本完成所有測評。透過第一學年測評和反饋,我們對測評工具作了進一步整合與最佳化,第二年的測評活動由32個減至16個。測評活動均與學生日常生活場景有關,與基礎教育課程標準要求相關。基於全國280萬學生的測評數據,建設中小學生綜合素質發展基礎資料庫,這是中國關於學生綜合素質發展的第一個資料庫。基於這個資料庫,透過深入分析,認識中國學生綜合素質的發展性、比較性和歸因等方面的規律,進而準確把脈中國推進素質教育改革的狀況。

我們的攻關方向是運用資訊科技創新評價方法和工具,破解中國中小學綜合素質評價的卡脖子問題,提高綜合素質評價的科學性、客觀性,解釋中國學生綜合素質發展的內在規律,透過試點和積累形成國家層面的評價方案,助力精準選拔,促進個性發展。同時,我們也期待這樣大規模的調查數據和測評數據能夠為政府部門科學決策提供證據支持。

(本文首次發表在【中國考試】2024年第1期)