作业和考试是教学的必要环节,是考核学生知识掌握程度的主要手段。但是这些也耗费了大量教育资源去重复完成相关工作内容。
作业和考试分为书面形式和口头形式,其中书面形式分为客观题目和主观题目。目前针对书面形式中的客观题目,已实现通过机读卡(一种简单的光学字符识别技术)的方式自动阅卷,但对于书面形式中的主观题目及口语测试还基本上以教师人工批阅为主。人工方式主要存在以下问题。
1.人工批阅效率低,教师负担重
教师是作业批改和试卷批阅的主体。在目前一对多的教学方式下,一个教师每天通常承担几十甚至上百个学生的作业批改工作,加上需要对学生作业或试卷进行及时反馈,具有时间短、任务重的特点。根据日本文部科学省估算[28]对主观问答题进行评分时,假设在一场大型考试中考生有53万人,阅卷者有800人的话,就算将培训中的阅卷者也包括在内,阅完所有试卷也需要20~60天。这便意味着,从考试到公布分数的等待时间内,不仅阅卷者工作量庞大,等待分数结果的人们也会承受很大的心理压力。中国教育部公布的数据显示,2016年全国高考报名人数约有940万,阅卷时间通常要求不到20天[29],这对于阅卷者的要求和考验可想而知。因此解放教师、提高阅卷效率也是教育教学工作亟须解决的问题。
2.人工阅卷受个体差异和外界环境的影响,容易产生误差
主观题阅卷虽然在阅卷过程中有一套相对客观的标准,但是评分结果有可能受到阅卷老师状态、考生书面整洁程度等外界因素影响。而且在高强度、高密度的阅卷工作中,阅卷老师很容易由于“眼疾手快”导致阅卷过程中出现纰漏。同时,阅卷者个体之间受资历等影响,存在差异,对于考生的评判标准无法做到完全意义上的统一,容易在评判结果上形成差异。虽然传统人工阅卷为了减少这种误差往往还会出现三评卷、四评卷等场景,但这也同时意味着需要耗费很大的人力成本。
3.学生对学习内容的掌握程度主要通过作业和考试反映出来
目前每个学生各门课程的掌握程度均由单科老师分别把关,一名学生的整体学习过程情况需要多位老师靠亲自沟通、观察的方式去系统掌握,或只能通过成绩表以结果的形式展现。学习进程中的问题了解、反馈和程度把握对于学生更好地掌握学习内容其实更有意义。(www.xing528.com)
感知智能技术的突破,使得教育领域考试阅卷和作业批改的自动化水平升上一个新台阶。即基于图像识别技术完成手写体自动识别、基于语音识别技术完成口语结果自动识别,对于识别后的结果基于自然语言理解和深度学习技术进行复杂算法计算与分析,最终完成结果评判。使书面考试(主要是主观题目)和口语考试实行机器全自动智能阅卷,从而解放人力、提高效率、节约成本。
对于主观题目评判,如问答题、作文,实现机器自动智能阅卷一般分为两步。
第一步,识别。首先需要识别手写体,目前基本是采用图像识别、手写识别、大数据分析,结合文档处理相关技术,形成深度神经网络模型,通过不断搜集试卷数据和手写体数据,形成迭代,不断提高识别准确率。目前准确率已能够达到93%(科大讯飞)。
第二步,语义的分解和评分。智能阅卷系统首先自身有一套标准的主观题知识库,其次是完善的评分规则。按照主观题的评分流程,分为五个部分:分句、分词、句法分析、词语相似度计算以及句子的相似度计算,同时结合自然语言处理技术。评分时,一方面通过对语句语法的相似度直接进行机器打分,另一方面通过自然语言处理进行分析并对结果进行评判。在整个打分的过程中,通过深度学习技术,机器自动学习并记住评判标准,进而优化评分规则,最终形成更加准确的评分机制。人的精力有限,但机器可以无间断地进行阅卷,机器智能阅卷不仅可以减轻教师负担,让教师有更多精力从事其他重要教学活动。另一方面,所有阅卷标准统一,不受个体能力差异和环境因素的影响,可减少误差,使评判结果更加公平。
对于口语考试评判,首先是基于语音识别技术识别个体口语,其次是针对识别后的口语,结合语言知识库、统计声学建模和变换技术进行评判,同时评判结果自动积累形成大数据库,利用深度学习技术针对评判结果不断优化,提高准确率。
当前在阅卷智能自动化实际应用方面[30],国内在2015年合肥、安庆的会考中,在作文题目评判试点采用科大讯飞的智能阅卷系统。人机阅卷对比结果显示:计算机在评分一致率、平均分差、相关度以及与仲裁分更接近的比例等指标上都已达到或超过人工评分水平。机器已可以辅助人工进行阅卷,一定程度上减轻了教师阅卷的压力。语音识别技术准确率已超过95%,广东省2015年高考中的英语口语评阅已采用机器为主、人工为辅的方式,相比之前的纯人工评阅,省时省力,提高了效率。每次口语考试评判的完成,也是数据积累的过程,通过对积累数据的分析可以使评判准确率进一步提升。在智能作业批改方面,国内的智学网已在做尝试,主要采用教辅作业、Word试卷和答题卡三种模式相结合的方式:针对日常教学过程中学生直接作答的教辅作业本,在不改变学生作答习惯和教师批阅习惯的前提下,系统采用先阅后扫的模式,自动进行统计;日常测验中教师出题的Word试卷,系统采用卡卷合一的模式,扫描后客观题自动计分,主观题识别手写分数而后利用机器进行誊分统计分析;系统支持创建答题卡,对英语试卷扫描后自动评分并给出批改意见,支持学生在线修改和练习。三种模式相结合提高了作业批改的效率,同时可以便捷地实现日常教学数据采集、系统自动分析学生知识点掌握情况与答题情况,自动生成连续性的错题本,为个性化辅导提供依据。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。