生物特征数据库对于学术研究和系统开发的意义都很大。生物特征识别是一个模式识别问题,需要经过大量的统计学习后才能设计出好的识别算法,包括滤波器参数调节、特征选择、分类器设计等都需要大规模的测试样本。现在各个国家和研究机构都比较重视生物特征数据库的建设,一般作为大型的科研项目进行资助。现在国际生物识别领域已经形成了一批具有广泛影响力的大型数据库,这些数据库大部分都向研究人员免费开放,有的数据库还附有测试协议、标准算法的性能指标等。然而,不同种类的生物特征数据库的被测试人群都是不同的,还没用公开的多模态生物特征数据库,即包含同一个采集用户的指纹、人脸、虹膜和掌纹等多生物特征的综合数据库。
鉴于上述考虑,我们以200名志愿者为样本采集对象建立了一个多模态生物特征数据库,样本采集对象大部分为在校大学生,另外一部分为学校的教员,男女比例大约为10∶1,年龄大部分为20~30岁,采集时间为6月份。样本采集对象像医院体检一样轮流通过指纹、人脸、虹膜、掌纹和掌脉采集设备采集该对象的样本图像,经过采集程序命名并存储到指定位置的PC机数据库中。每个志愿者采集指纹样本图像50幅(10个手指,每个手指5幅),人脸样本图像18幅(9个角度,每个角度采集两幅),虹膜样本图像30幅(每个眼睛采集15幅),掌纹掌脉样本图像各10幅(左右手各采集5幅)。对应于一个用户ID,采集了50+18+30+10+10=118幅生物特征样本图像,该数据库的总体样本图像数量为23600幅。
建立的多模态生物特征数据库的结构分为3个层次。第一层为总的数据库KD,索引项为次级数据库的名称,即总共包含指纹数据库KD_Fingerprint、人脸数据库KD_Face、虹膜数据库KD_Iris、掌纹数据库KD_Palmprint和掌脉数据库KD_ PalmVein,共5个索引值,第二层为次级数据库,即为某种特定类型的生物特征数据库,它的索引项为用户的注册ID,用户ID为采集程序根据用户对话框中输入的用户姓名全拼来生成。对于多名用户重名的情况,采集程序判断出重名情况后在用户ID后面依次加上阿拉伯数字以区分开。第三层则为该ID用户所实际采集得到的特定类型生物特征样本图像序列,样本图像序列的命名规则根据不同类型的生物特征而各不相同,例如指纹数据库中左手拇指、食指、中指、无名指及小指分别命名为11、12、13、14、15,每个指头的5张指纹图像依次命名为11_1,11_2,11_3,11_4,11_5。多模态生物特征数据库的结构图如图7.10所示。(www.xing528.com)
图7.10 多模态生物特征数据库的结构图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。