首页 理论教育 从文本到内容:如何提高文章的阅读价值?

从文本到内容:如何提高文章的阅读价值?

时间:2023-06-26 理论教育 版权反馈
【摘要】:早期的图像检索技术普遍采用基于文本或关键词的方式,即首先对图像进行文本注释,然后通过文本或关键词之间的精确匹配实现图像检索,被称为基于文本的图像检索。这种对专家知识的高度依赖性,阻碍了TBIR的实际应用。图1-1TBIR的局限性随着数字图像数据的急剧增加,TBIR的问题越来越突出。从基于文本到基于内容的发展,体现了图像检索技术发展的必然趋势。

从文本到内容:如何提高文章的阅读价值?

图像检索技术的研究可以追溯到20世纪70年代。早期的图像检索技术普遍采用基于文本或关键词的方式,即首先对图像进行文本注释,然后通过文本或关键词之间的精确匹配实现图像检索,被称为基于文本的图像检索(text-based image retrieval,TBIR)。然而,正所谓“一幅图像胜过千言万语”,基于文本的图像检索存在一些明显的不足之处,如图1-1所示。这些不足大致可以归纳为以下三个方面:

(1)不同的人对于同一幅图像往往存在不同的理解和认知,因此很可能会用不同的文本或关键词对其进行描述。如图1-1(a)所示,甲可能描述为“人、灯、鲜花”,而乙则可能描述为“聚会、微笑、同学”。这种描述歧义会造成基于文本或关键词的检索精度降低。另外,随着图像数量的急剧增加,人工注释文本信息的工作量将变得难以承受。

(2)并非所有的图像都能通过文字或关键词进行完整、全面、准确的描述,例如情感。如图1-1(b)所示,图像所表达出来的复杂情感难以用几个关键词进行准确的描述。

(3)对于特定领域的图像(如医学、遥感等),需要标注人员具备相应的专业知识。这种对专家知识的高度依赖性,阻碍了TBIR的实际应用。如对图1-1(c)所示的医学图像进行标注时,需要标注人员有医学背景知识,具备解译核磁共振图像的能力。(www.xing528.com)

图1-1 TBIR的局限性

随着数字图像数据的急剧增加,TBIR的问题越来越突出。人们开始尝试从理解图像本身的角度实现图像检索,基于内容的图像检索(content-based image retrieval,CBIR)技术于20世纪90年代初应运而生,并迅速成为计算机视觉、信息检索、数据挖掘等领域的研究热点。基于内容的图像检索,是从不同于传统的基于文本或者关键词的图像检索技术的角度出发,试图通过图像内容[1]来有效利用图像数据资源的一项技术。基于内容的图像检索采用从图像中自动提取的视觉特征代替文本或关键词描述图像,能够有效克服文本描述歧义、繁重的人工标注工作以及对用户专业背景知识的依赖等问题。从基于文本到基于内容的发展,体现了图像检索技术发展的必然趋势。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈