DNA密码学的研究主要包括DNA加密技术、DNA隐写技术和DNA认证三个方向的研究。现在,人们已经提出了几种DNA密码方案。比较有代表性的方案包括Gehani的基于DNA的加密技术,Clelland等人提出的DNA隐写技术等。Gehani的方案体现了DNA的超高存储密度,但实现困难。Clelland的方案实现相对容易,其用PCR技术解密的方法既与DNA计算相关联,又在后续的DNA密码研究中得到了广泛应用。
1.DNA加密技术
在DNA密码系统中,需要对输入的明文进行分割,使其成为具有固定长度的短的明文段。一次一密的加密方法是使用随机密码本将明文新消息转换成加密的文本。关于一次性密码本的安全性有两点很关键:一是密码本必须确实是随机的;二是密码本只使用一次。这种使用随机一次性密码本的密码系统是唯一一种被认为是绝对不可破译的密码系统。同样,重复使用密码本就会增加被窃听器解密消息的风险。这两点原则规定了DNA序列所应具有的性质。首先以DNA链的形式秘密地建立随机的一次性密码本,进一步假设发送端和接收端预先共享特定的一次性密码本。这一假设需要初始时刻在发送端和接收端进行一次性密码本的传递,而溶液中DNA非常紧密的特性可以使这一传递过程比较容易。
美国杜克大学的Gehani教授等人设计了两种DNA序列的一次一密加密方案:其一是映射替代法;其二是异或法。利用这两种方案实现的一次一密加密体制是具有绝对安全性的。Gehani等人也将DNA计算引入非对称加密体制中,他们提出利用DNA极强的并行计算能力与巨大的信息存储容量,采用比通常加密算法具有更高复杂度的算法以提高密码系统的强度。Gehani的方法在本质上是利于DNA作为信息载体,利用生化技术在DNA分子上实现传统的密码算法,但它对密码算法本身并没有作出任何改进。
(1)映射替代法
映射替代的DNA加密系统也就是一次性密码本的替代加密系统。其输入是长为n的被分割成固定长度的二进制明文消息。替代的一次性密码本由一张表组成,该表将所有可能的明文字符串映射为固定长度的密文字符,因此存在唯一对应的逆映射。在加密过程中,明文中的每个块被替代表中的密文字符取代,而解密则是反替代过程。
在使用替代加密的情况下,希望以随机而可逆的方式,将试管中的DNA链(明文消息)转换成另一组完全不同的链(密文消息)。将明文加密为DNA密文链,同时将明文链移出。替代算法需要一次性密码本DNA序列来完成这种转换。该方法需要有许多小段构成的长的DNA密码本,每个小段又包括密文字符及附加在后面的与其相应的明文。在明文转换成密文的第一步中,可以将字符对DNA链看做一张查询表。理想的一次性密码本是由大量的密码本组成的,每个密码本提供完全唯一的随机的从明文到密文字符对的映射。
(2)异或法
异或法是采用生物分子技术进行DNA明文序列与密码本序列的异或操作。下面对如何进行逐位比特异或运算做简要介绍。
对于消息的每个比特Mi,构造一个序列ai,它代表了一个长的输入序列的比特。通过利用适当的粘接序列,将消息M的n比特组合为一个序列a1a2…an作为每个二进制输入的染色体支架链。另有一部分染色体支架链a′1a2′…an′建立在随机输入的基础上,并作为一次性密码本。
设想许多最初由PCR或适当的技术来创建和克隆的形式,如a′1a2′…an′的染色体支架,在发送端和接收端进行分离和存储。当发送端需要加密时,通过引入染色体支架、一次性密码本染色体支架、分子瓦和各种不同的用来完备分子瓦的序列,以及收发端都知道的前缀索引标志等来传递染色体支架。创建输入染色体支架和在支架上组合分子瓦的过程,已由LaBean在实验室中成功实现。最终,加法粘接酶产生了连续的报告链R=a1a2…an||a1′a2′…an′||b1b2…bn,它贯穿在整个组装过程中。可以通过溶解和净化分子瓦的小序列来提取这一包括了输入消息、密钥和明文的报告链。
DNA具有体积小、存储量大的优点。1克DNA就包含有1021个碱基,或者说108TB,几克DNA就能够储存世界上现有的所有数据。所以,DNA非常适合用做存储一次一密乱码本。Gehani的方案考虑到了DNA的高容量存储特性,具有潜在的使用价值,也许会成为解决一次一密乱码本存储的有效方法。不过,制备一个能够方便地分离并读取出数据的大规模DNA一次一密乱码本非常困难。对于发送者和接收者来说,都要进行目前看来还有些复杂的生物学实验,需要在一个装备精良的实验室里才能实现,因此加密和解密的成本也很高,严重限制该方案的可行性。(www.xing528.com)
2.DNA隐写技术
隐写术是一种将秘密信息隐藏到其他信息中的技术。在隐写术系统中,初始明文并不用加密,而是伪装或隐藏在其他的数据中。已有的一些隐写术系统使用网格来显示图像中除秘密消息以外的所有信息,有的系统在大型图像中隐入微型图片,有的系统使用不可见的水印,等等。密码学文献一般认为,传统的隐写技术的安全性比较低,并且还有许多实际中隐写技术被破译的例子。但是,由于隐写术的简易性,人们还是非常关注隐写术。很多技术把隐写术应用到生物分子计算的内容中。DNA隐写技术的原理,就是利用大量的与DNA无关的信息隐藏加密后的信息,使得攻击者难以确定正确的DNA片断。因此,只有正确的接收者才能根据事前双方约定的信息找到正确的DNA片段,并获取隐藏于其中的信息。
关于DNA隐写术的试验最早是由美国纽约市立大学西奈山医学院Clelland等人完成的,他们将一个二战中的著名信息进行了DNA隐写,并成功将其提取出来。Clelland等人的试验方法如下:
1)编码方式。他们没有采用传统的二进制编码方式,而是把核苷酸看做四进制编码,用3位核苷酸表示1个字母。例如,字母A用核苷酸序列CGA表示,字母B用核苷酸序列CCA表示。
2)合成消息序列。把需要传送的消息按上面的编码方式编成相应的DNA序列,如AB用CCGCCA表示。编码结束以后,人工合成相应的69个核苷酸的DNA序列,并在DNA序列前后各链接上有20个核苷酸的5′和3′引物。这样,需要隐藏的DNA消息序列就准备好了。
3)信息隐藏。用超声波把人类基因序列粉碎成长度为50~100的核苷酸双链,并变性成单链,作为冗余的DNA使用,再把含有信息的DNA序列混杂到冗余的DNA序列中,喷到信纸上形成无色的微点(Microdots,每个微点包含数量以亿计的DNA分子),就可以通过普通的非保密途径传送了。
4)信息读取。接收方和发送方的共享秘密是编码方式和引物。接收方收到含有消息DNA微点的信纸后,提取出微点中的DNA。由于接收方预先通过安全的途径得到了引物,所以他可以用已有的引物对DNA微点中的消息序列进行聚合酶链反应(PCR)扩增,通过测序得出消息DNA序列,然后根据预先约定的编码方式恢复出消息(明文)。
这项技术的安全性基于这样一个概念:其他人(截获者或攻击者)在没有特征或者标记的情况下,无法区分“混淆”链和消息链,因此,为了得到消息链,截获者需要寻遍整个空间。换句话说,只有在已知密钥相关消息的情况下,截获者才能够成功解密。任何单一的攻击都不能产生比随机抽取一个链获得更多的信息。为了达到这一安全性要求,必须考虑两个方面:第一,每一个“混淆”链都需要有和消息链同样的结构,也就是不可分;第二,对消息的DNA编码可以抗拒语言统计攻击。
3.DNA认证
严格来说,DNA认证利用的是DNA的生物特性,并未涉及太多DNA计算。目前,DNA认证已用于司法、金融等领域来准确认证生物个体的身份。
DNA认证技术是利用分子生物的DNA具有的序列专一性及复杂性,将DNA进行特殊强化处理,使得DNA可与特殊媒介均匀混合,并且能于常态下长久保存,以达到广泛应用的目的。2000年加拿大DNA Technology公司把DNA序列用于当年悉尼奥运会的授权产品认证。近5000万个纪念品,从奥运T恤到咖啡杯都被一种特殊的墨水做了标记。标记中的DNA片段随机地取自近百名运动员中的某一位的基因组,伪造这一DNA信息是十分困难的。这种用一个便携扫描器扫描上的墨水标记中的DNA信息就可以鉴别纪念品是否是真品,而所增加的成本仅为5美分,比通常的全息商标更便宜。当前,国内的陆博生物科技公司、南开大学戈德集团公司等均已推出了类似的产品用于DNA防伪认证。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。