首页 理论教育 文本信息隐匿的基本技术

文本信息隐匿的基本技术

时间:2023-06-20 理论教育 版权反馈
【摘要】:语义隐匿是有别于技术隐匿的一种隐匿方法,它在信息隐匿的发展历史中占有重要地位。目前,基于图像的信息隐匿方法有很多,但这些方法多数不适用于文本图像。这是因为文本图像通常是二值图像,缺少丰富灰度,在二值化过程中隐匿的数据容易被丢失。目前的技术包括字编码、行编码、字符特征编码。目前有关文本文档的版权保护技术的探讨大多集中在这方面。

文本信息隐匿的基本技术

1.语义隐匿

语义隐匿利用了语言文字自身及其修辞方面的知识和技巧,通过对原文进行一定规则下的重新排列或剪裁,从而隐匿和提取密文。它的主要思想类似于密码学的置换加密,其算法包括根据文字表达多样性进行同义词置换,以及嵌入信息与单词或语句的映射等。

语义隐匿是有别于技术隐匿的一种隐匿方法,它在信息隐匿的发展历史中占有重要地位。如离合诗、漏格等就是早期被广泛应用的语言掩密术方法,按一定规则,读取特定位置上的字符,从而合成秘密信息。

目前的语义隐匿技术有两种:映射、词(词组)替换:

(1)映射隐匿

映射隐匿是将待传输的秘密信息按一定的规则与语言空间的元素相对应。为了达到隐藏的目的,通常是根据待嵌入信息的对应关系,以常用的单词(词组)组合成文件。这类软件有:Nicetext等。

(2)词(词组)替换隐匿

词(词组)替换隐匿根据待嵌入信息及预先确定的对应关系,将文档内容中的词(词组)用其他不影响意义表达的词(词组,如同义词、近义词等)替换,以代表“1”或“0”。如可以约定,当待嵌入信息为“1”时,以“信息”取代“消息”;当嵌入信息为“1”时,不做替换。而在解码端,按一定的规则(算法)扫描文字内容,对应“消息”则输出“0”,对应“信息”输出的是“1”。

在一些软件中,如Textmark(http://www.textmark.com),考虑到表达方式对作品质量的重要性(如散文、诗),对替换做严格的限制,以保证替换对的严格对等性。

此外,有的软件,是通过拼写错误或标点符号的修改来实现数据隐匿。(www.xing528.com)

2.显示特征隐匿

显示特征隐匿就是利用显示工具的显示特性,以一定的方式对文档及数据进行修改(如加入不显示信息),而不会产生视觉上的异常。

目前的技术是针对相关编辑显示软件的特点,利用可编辑但无法在屏幕上显示的字节将数据嵌入文档文件中,而文档内容的显示不发生变化。由于文本文件格式很多,相应的编辑显示软件不同,隐藏的方法也不尽一致。通常的做法是在文件头尾中加入信息,或利用文件格式的特点嵌入信息。如htm1格式文件是由普通的文本文件和各种标记组成,在标记描述行的回车前(OxOD)加上空格(Ox09)不改变其文件结构,对其屏幕显示也不会产生影响,因而,可通过对空格字符进行编码实现信息隐匿。利用该类技术的软件有WbStego(ht-tp://www.menbers.xoom.com/wbailer/wbstego)等。另一种做法是在文件内容中插入不显示字节,如在行结束处插入空格(Ox20或Ox00)达到隐匿的目的。在txt格式文件和html格式文件中通常使用此类方式,如Snow软件(http://www.darkside.com.au/snow)。

3.格式特征隐匿

格式特征隐匿就是利用文本文档格式特征的随机性,以一定的方式对文档的诸元素[字(词)、语句、行等]特征(如字形/字体、位置等)进行修改,而不会引起文档阅读者的怀疑。

这种方法通常是用于在文档图像表示文件中进行隐匿。目前,基于图像的信息隐匿方法有很多,但这些方法多数不适用于文本图像。这是因为文本图像通常是二值图像,缺少丰富灰度,在二值化过程中隐匿的数据容易被丢失。

在文档图像表示文件中,文档是由字符、字、行、段落等不同大小的掩护文档组成。如果对这些掩护文档的位置做少量修改,如在分辨力为300dpi情况下移动一个像素点是不易被察觉的。目前的技术包括字编码、行编码、字符特征编码。

字符特征编码利用字符特征信息,如对b、d、h、k等字符中的垂直线的长度稍作修改,达到隐匿的目的。目前有关文本文档的版权保护技术的探讨大多集中在这方面。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈