首页 理论教育 话题检测与跟踪的发展与现状-信息内容安全的处理技术

话题检测与跟踪的发展与现状-信息内容安全的处理技术

时间:2023-11-23 理论教育 版权反馈
【摘要】:TDT研究中对话题的定义描述不同于传统的话题定义描述。TDT的Topic描述倾向于某一特定事件及其相关活动等描述,从而TDT主要将事件作为分析与处理的对象。到目前为止,总共进行了7次TDT评测。国内这方面的研究开展的明显晚些,1999年中国台湾大学参加了话题检测任务的评测,2000年中国香港中文大学参加了TDT某些子任务的评测。

话题检测与跟踪的发展与现状-信息内容安全的处理技术

TDT技术研究的最初想法起源于1996年,当时美国国防高级研究计划署(DARPA)根据自己的要求,提出要开发一种新技术,能在没有人工干预的情况下自动判断和识别新闻数据流的话题。TDT的研究工作不同于传统的信息检索、信息抽取、文档分类、信息管理和数据挖掘等文档管理技术,主要原因在于TDT技术更多地关注如何识别新的话题和获取特定话题相关的数据。TDT研究中对话题的定义描述不同于传统的话题定义描述。TDT的Topic描述倾向于某一特定事件及其相关活动等描述,从而TDT主要将事件作为分析与处理的对象。

TDT项目开始于1997年,开始阶段主要发表了包括卡耐基-梅隆大学、马萨诸塞大学、宾州大学等系统的研究报告,这些机构对这项技术进行了初步研究,并做了一些基础工作。TDT的研究人员力求设计一种功能强大、通用、自动的学习算法,能够识别和获取人类语言数据的话题结构,独立于数据的来源、媒介、语种、领域和具体应用。(www.xing528.com)

从1998年开始,在DARPA发起和支持下,美国国家标准技术研究所(NIST)每年都举办TDT评测。每次先在评测计划中公布当年的评测标准,然后经过一段时期的研究,再进行评测,最后工作组讨论评测结果和研究进展。到目前为止,总共进行了7次TDT评测。TDT评测采用的语料是由语言数据联盟(LDC)提供的TDT系列语料,这些语料都人工标注了若干事件话题作为标准答案。TDT评测越来越受到人们的重视,已成为一个新兴的研究热点,国内外的很多著名的大学、公司和研究机构都参加了该评测。国外的机构主要有:IBM Wat-son研究中心、BBN公司、卡耐基-梅隆大学、马萨诸塞大学、宾州大学、爱荷华州大学、马里兰大学等。国内这方面的研究开展的明显晚些,1999年中国台湾大学参加了话题检测任务的评测,2000年中国香港中文大学参加了TDT某些子任务的评测。目前,北京大学计算语言学研究所、中科院计算所、哈尔滨工业大学东北大学复旦大学、微软亚洲研究院、清华大学等一些国内有名的研究机构的研究人员也开始进行TDT相关关键技术的研究。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈