当前位置: 华文世界 > 教育

以信息技术为支撑 推进学生综合素质评价改革

2024-01-20教育

感谢您关注「永大英语」!

以信息技术为支撑 推进学生综合素质评价改革

陈 丽

对于教育评价的重要性,社会各界已有高度共识,认为它是教育改革、教育高质量发展的指挥棒。教育评价作用的大小和指挥得好坏,不仅取决于我们对教育的重视,还取决于对培养方向的准确把握,更取决于我们的评价手段和能力。我们的评价能力决定了我们能评价的东西。事实上,由于评价能力的局限,许多我们倡导和重视的学生有价值的发展变化并不能被科学、客观地评价,这是制约教育高质量发展的最大瓶颈。当前,由于教育评价能力的不足,导致许多问题不能很好地解决,如「双减」政策落地难、各种教育内卷越来越严重、拔尖创新人才选拔和识别难等。通常,拔尖创新人才的发展是不平衡的,他们往往有显著的优势,也有显著的短板。我们如何识别那些有潜力的学生?这取决于我们有没有能力把他们评出来。

一、我国综合素质评价状况及面临的挑战

综合素质评价能力不足是制约基础教育过去、今天和未来高质量发展的瓶颈。从2004年教育部出台文件首次提出要开展学生综合素质评价至今,我们在综合素质发展过程的评价方面取得显著进展。很多地区、学校建立学生综合素质评价的平台,记录学生综合素质发展的关键事件,一定程度上扭转了教师、家长和学生的学习观,促进了学校和社会对学生综合素质发展的重视。但我们仍无法科学、客观地评价学生综合素质发展的水平,学生综合素质评价改革仍面临诸多挑战。首先,对于什么是综合素质,尚未有清晰的界定,综合素质与德智体美劳之间的关系也尚未厘清。「五育」的口径和基础教育课程标准中以核心素养为培养目标的口径不太一样,造成中小学教学实践中对接的困难。其次,过程评价、记录学生成长的过程数据非常重要,但用过程数据来反映学生发展水平还是有问题的。过程可以反映努力程度,但无法准确反映结果。过程评价中采用了很多自评和他评,遇到的问题是客观性和可信性不足。尤其是当这类评价结果与高利害选拔结合的时候,还可能导致材料造假的严重问题。最后,各省各地的指标差距特别大,难以支持跨校和跨地区的比较;地方学校对收集到的数据进行分析时,也遇到不少技术难题。

二、信息技术支撑综合素质评价改革

信息技术的发展,特别是人工智能技术的发展,为破解上述挑战提供了前所未有的机遇。【深化新时代教育评价改革总体方案】指出,要创新评价工具,利用人工智能、大数据等现代信息技术,探索开展学生各年级学习情况全过程纵向评价、德智体美劳全要素横向评价。过去几年,在科技部和教育部的支持下,北京师范大学联合8个大学和教育机构,基于38个试点区域的试验,创新性地提出基于人工智能技术的中小学生综合素质评价方案。

2021年,科技部设立一个重大科技专项,其核心就是采用新技术手段探索出一套中国学生综合素质发展水平的评价方案。在此基础上,教育部于2022年启动信息技术支撑学生综合素质评价试点工作。经申报与评审,教育部设立38个试点区域。科技部项目为试点提供理论和技术支撑,试点区域进行本地化检验和转化。

就评价方案而言,我们实现了三个方面的突破。第一个突破是理论模型的构建。我们将学生综合素质定义为跨越学科的通用的品格、能力和价值观,并以核心素养为基座,重新构建由三个方面(自主发展、文化修养、社会参与)、10个维度、36个要点构成的学生综合素质评价模型。第二个突破是创新表现性评价方法,研发了一系列评价工具,形成全新的学生综合素质评价解决方案。与纸笔考试不同,表现性评价通过记录学生在完成真实、复杂的任务过程中的表现数据,应用多模态智能分析技术,实现对学生综合素质的评价,如要求学生上传1分钟跳绳视频,以此识别其体能耐力。第三个突破是研发了三类关键技术,包括多场景的数据采集和汇聚技术、多模态数据智能处理技术和大规模数据分析技术。这些关键技术成果、测评工具、数据挖掘引擎被全部整合到学生综合评价与发展平台上。学生通过平台上的各类评价活动参与测试,平台可以向试点区域、学校和家长反馈评价结果分析报告,这对于改进各地实践很有帮助。许多区域和学校通过测评分析报告,重新审视办学情况,针对学生综合素质发展存在的短板,制定整改措施。家长基于测评分析报告,可以清楚地了解学生的潜力和不足。

三、试点工作进展情况

目前,科技部科技攻关项目已进入第三年,教育试点工作进入第二年。在第一学年中,38个试点区域近400万中小学生参加测评,280万学生完成所有测试活动并得到测试报告。总体来看,全国学生平均需要6.5个小时完成测评,多数学生在5小时内基本完成所有测评。通过第一学年测评和反馈,我们对测评工具作了进一步整合与优化,第二年的测评活动由32个减至16个。测评活动均与学生日常生活场景有关,与基础教育课程标准要求相关。基于全国280万学生的测评数据,建设中小学生综合素质发展基础数据库,这是我国关于学生综合素质发展的第一个数据库。基于这个数据库,通过深入分析,认识我国学生综合素质的发展性、比较性和归因等方面的规律,进而准确把脉我国推进素质教育改革的状况。

我们的攻关方向是运用信息技术创新评价方法和工具,破解我国中小学综合素质评价的卡脖子问题,提高综合素质评价的科学性、客观性,解释我国学生综合素质发展的内在规律,通过试点和积累形成国家层面的评价方案,助力精准选拔,促进个性发展。同时,我们也期待这样大规模的调查数据和测评数据能够为政府部门科学决策提供证据支持。

(本文首次发表在【中国考试】2024年第1期)