姓氏是家系的文字代码,由于历史原因,这种编码体系虽然有一定的科学性,但并不彻底,所以实用性打了折扣。这是因为:①大的家系内部有很多分支,有不同的源流和历史文化背景,单从姓氏区分不了不同的Y-DNA家系;②由于入赘、收养等原因产生改姓,不同姓氏间的Y-DNA有交叉。也就是说,不同姓氏的男性可以有相同或相近的Y染色体遗传。
为了改变这一状况,在遗传学上对家系重新编码尤其重要。一般而言,多于10个的Y-STR基因座的组合会编码产生1个大于100万的十进制数据。将不同家系数据按照大小排列,中国约100万个Y-DNA家系会形成一个序列号码,产生相应的编号。这个体系恰好可以用民间喜闻乐见的麻将牌的形式来表现。也就是说,1副麻将牌,任意取4张牌,每一种排列组合都对应着中国的某一个姓氏家系。
常用的麻将牌包括有“条”“饼”“万”“中”“发”“白”和“东”“南”“西”“北”,计34种花色,每种花色4张牌,共计136张。当使用1张牌时,可以编码34个家系;使用2张牌时,可以编码34×34=1 156个家系;使用3张牌时,可以编码34×34×34=39 304个家系;使用4张牌时,可以编码34×34×34×34=1 336 336个家系。可见,任意选择4张麻将牌,不同的排列组合涵盖了中国几乎所有的Y-DNA姓氏家系,因而可以用“麻将牌”方法对中国的Y-DNA家系进行编码。
中国家系数量虽多,但在某时某地与某人有具体联系的家系是有限的,将8位数的十进制编码等值无损压缩,转换为三十四进制的麻将牌编码,使数值的长度大为缩短。(www.xing528.com)
村镇是基层单位,家系的数量最少,市地、省区进一步增多,直至全国。乡镇家系的编号1~2张麻将牌即可完成,市地需要2~3张,省区需要3~4张,全国需要4张。覆盖中国全部男性人群家系的34进制编码只需4张麻将牌。也就是说,34种136张麻将牌任意取出4张,就可以涵盖中国姓氏家系的全部数据,因此显示了很高的信息压缩效率。简单的表象背后是大量的数值计算,但大量的计算留给了计算机,提高了工作效率。
一个家系的Y-STR复合检测在对每个Y-STR编码后形成数据,在村镇、市地、省区和全国等不同的地域范围内,这个数据可以按照一定的规律进行有损压缩,成为不同区域内的家系编号。将实测得到的家系数据通过进位制转换和有损压缩,并以麻将牌表现出来,有很强的保密性,且为群众喜闻乐见,便于记忆,也便于查找和对比。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。