首页 理论教育 教育大数据解析:走进学校3.0时代

教育大数据解析:走进学校3.0时代

时间:2023-08-04 理论教育 版权反馈
【摘要】:所以,国际上教育大数据有“4V”特征,是数字走向数据的大前提。江苏教育信息化研究中心做了一项研究:学生一个学期包含结构化数据大概在1.68PB,非结构化数据远远大于35EB,其实教育行政部门所掌握的是非常简单的结构化数据,大量的课堂实验数据、教学过程数据、课程信息数据往往没有被挖掘出来或没有作为大数据统筹在范围之内。教育大数据能不能采集到全流程、全方位的大数据,这是未来大数据发展的一种理想状态。

教育大数据解析:走进学校3.0时代

信息技术专家角度看,一切行为皆有数据,一切数据均可被挖掘。我们知道,对一个人来说,最强大的数据藏在基因中,基因中的信息演变成世界上其他信息,但是普通人并不能通过DNA找到数据及所需要的信息。我们通常所说的大数据的种类有:第一种有可能是散落在图书馆等各个地方的资源;第二种有可能是具体到教育教学部门和教育管理的数据,包括学籍管理系统、成绩档案系统等,这些往往以纸质载体保存为主;第三种是教与学的行为数据和结果数据。尤其是第三种,有很多是非结构化的数据,量很大但不容易捕捉,常常没有被记载下来,因此被误认为不存在,其实这些大量的结果和行为数据就是我们要研究的对象。

每位学生的成长数据有多少?举例说明,过去学生完成九年义务教育初中毕业时,学校就把其个人和家长的基本信息、教师与学校相关信息、各个学科的考试成绩、身高体重等数据填入记录表中,大部分学生毕业时也许就这点数据。除此以外,许多学校还留下图书馆和体育馆的使用记录、医疗信息和保险信息等,这些结构化的数据最多不超过10KB。根据荷兰著名行为观察软件公司研究,发现在一节四十分钟的普通中学课堂中,动作、姿势、运动、表情、情绪、社会交往与人际交互中各种信息的全部数据大概有6GB,其中可以归类、分析、标签的可分析量化的数据大概有60MB,是传统方式中要积累五万年才能达到的数据量。从过去简单的定量描述到后来开展的质性分析,教育大数据为我们提供了可能性。以前并不是没有这些数据,也不是没有意识到这些数据的价值,而是被表象的结构化数据所掩盖。例如,一位学生考了78分,这是一个数字,78分背后蕴含的信息我们忽略了,只知道排名、位置、是否会进入上一级学校读书,其实努力程度、家庭背景、学习态度、智力水平等相当多信息与78分紧密联系在一起,这些就是数据。所以,国际上教育大数据有“4V”特征,是数字走向数据的大前提。江苏教育信息化研究中心做了一项研究:学生一个学期包含结构化数据大概在1.68PB,非结构化数据远远大于35EB,其实教育行政部门所掌握的是非常简单的结构化数据,大量的课堂实验数据、教学过程数据、课程信息数据往往没有被挖掘出来或没有作为大数据统筹在范围之内。例如,记录一个人在课堂上的表现,以前有很多所谓的录播教室,当学生站起来时一个摄像头会对准他,当他站起来回答问题时,数据被采集,现在流行的是全息摄像,对教师和每位学生都可以追踪,所以在全部四十分钟所经历的每一个细节,包括微表情、眼球的运动,从举手、投足、回答问题一直到深层次的情绪变化、心理反应、人际交互等都可能被跟踪,这是K-12教育评估中所蕴含的一个巨大的矿藏。

学生在成长过程中会有各种各样的学习经历,如大规模的考试数据(考试中写的作文多年后是找不到的)、面试数据、阅读数据,很多信息被采集。也许曾经翻过的纸质书或在纸上画过的画找不到了,但数据实验,如DIS的信息数据、交往社交圈关键词检索数据、购买数据及在各种学习平台上开展教与学的数据,包括慕课平台、其他泛在学习平台等各种各样的教育软件和教育学习平台等,这些都是大数据隐藏的地方,同时也是值得挖掘的地方。(www.xing528.com)

当我们在采集数据时,往往采集的是经过处理的数据,如当问到喜不喜欢某位老师,这样的信息被呈现出来时,被采集者往往忽略自己内心的真实感受,看周围的环境及这件事带来的后果,从而进行加工。在中国有一句话“人在做,天在看”。很多人忽略了“天”的存在。当你知道,每天有一双眼睛在盯着你时,你就不会这样想,当你看到摄像头盯着你时,你会装出微笑的表情,因此数据就会失真。采集数据要在自然状态下采集,保持本真状态,这是大数据采集的基本原则。教育大数据能不能采集到全流程、全方位的大数据,这是未来大数据发展的一种理想状态。这种理想状态的大数据就是“看不见的眼”。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈