首页 理论教育 新教学:机器教案、文本识别及信息检索

新教学:机器教案、文本识别及信息检索

时间:2023-10-21 理论教育 版权反馈
【摘要】:图3-21文本识别技术实现路径该文本信息识别提取方法将达到:识别特殊领域内的相关专业字符;提取连贯信息;对信息进行检索、整合,优化机器人教师检索结果;机器学习,提高新教学师生与系统搜索效率。

新教学:机器教案、文本识别及信息检索

(1)教案构成

新教学的教案由两部分组成:一是呈现在屏幕上的屏幕放映;二是经过文本分类转化、机器人识别的文本,这是真实的写给机器人读取的教案。

教案是教师为顺利而有效地开展教学活动,根据课程标准、教学大纲和教科书要求及学生的实际情况,以课时或课题为单位,对教学内容、教学步骤、教学方法等进行具体设计和安排的一种实用性教学文书。教案包括教材简析、学生分析、教学目的、重难点、教学准备、教学过程及练习设计等。

新教学教案的受众由传统教师转变成机器人教师,这就对教案的可读取性提出了更高的要求。

由于新教学课程内容的不同,机器人教案会因不同学科涉及的不同专业术语作相应调整,大学的学科包括自然科学、农业科学、医药科学、工程与技术科学、人文社会科学五大知识体系。我国高等学校本科教育专业则设置了哲学经济学、法学、教育学文学历史学、理学工学农学、医学、军事学、管理学、艺术学这13个学科门类。针对不同的知识体系与学科门类,新教学的机器教师分别有相应的储备术语知识库。如人文与社会科学知识体系下的教案涵盖了古今中外人类对人文、社会科学的认识与观点,其术语知识库将侧重于储备精神文化奠基者的姓名与经典理论。对于自然科学领域知识体系下的教案,则需涉及探究物质世界规律下的客观定律,包括物理学、化学、生物学、工程学等方面的公式与代表符号,如符号“∑”在知识库中有所储备后,机器将同时识别出“求和”与“Summation”的含义,并在讲授中以语言形式加以表达。图3-20中的示例为新教学《高等数学——关键词3 函数的极限》中的一页投屏,输入给机器人教师的脚本文字为:对于任意epsilon大于零,存在正整数大n,当n大于大n时,有f(n)减a的绝对值小于epsilon,这里f(n)无限接近于确定的数a,则我们引入epsilon,用f(n)减a的绝对值小于epsilon来刻画,这里n趋于无穷大,我们引入大n,用小n大于大n来刻画。

图3-20 《高等数学——关键词3 函数的极限》投屏

(2)文本分类

文本识别技术是新教学的机器教案读取中最重要的技术,机器人教师的储备术语知识库中涵盖了五大学科知识体系下的关键术语,并通过“术语储备”“文本分类”的方式读取,将其转化成机器人“读得懂”的教案。

文本分类(Text Categorization,TC)技术是信息检索和文本挖掘的重要基础,其主要任务是在预先给定的类别标记(label)集合下,根据文本内容判定它的类别。这有助于机器人对自然语言处理与理解、信息组织与管理、内容信息过滤等。20世纪90年代逐渐成熟的基于机器学习的文本分类方法,更注重分类器的模型自动挖掘和生成及动态优化能力,在分类效果和灵活性上都比之前基于知识工程和专家系统的文本分类模式有所突破,成为相关领域研究和应用的经典范例。

新教学基于机器学习的文本信息识别提取方法,在技术上实现以下步骤(图3-21):

连接数据库:在移动终端上下载对应的端口,利用端口并通过无线网络与服务器终端进行连接,服务器终端内建立相应的数据库。(www.xing528.com)

文本识别提取:电子版教材将由摄像头直接扫描。如对照片、纸张、手机中的图片上的文本进行识别提取时,将其平放,由文字扫描摄像头读取、扫描并借助蓝牙功能发送至系统移动终端识别。同时,机器间隔时间将在脚本中标明。

建立模型:移动终端将不同使用者使用所形成的历史记录存储信息通过无线网络发送到服务终端上,由服务终端上的智能程序对这些信息进行分类整理,并通过机械学习方法建立不同的模型,从而模拟使用者的搜索习惯。当使用者再次搜索某些信息时,可优化其搜索目标,提高使用者的搜索效率

筛选结果:文本识别完成后,智能系统可根据关键字信息模拟出使用者的使用习惯自动筛选,将使用者所需要的信息进行显示,由使用者将所需要的搜索结果打开,并将使用者的使用历史进行记录,再次上传,不断进行优化。

图3-21 文本识别技术实现路径

该文本信息识别提取方法将达到:

识别特殊领域内的相关专业字符

提取连贯信息;

对信息进行检索、整合,优化机器人教师检索结果;

机器学习,提高新教学师生与系统搜索效率。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈