首页 理论教育 深度合成:高质量图像合成数据集

深度合成:高质量图像合成数据集

时间:2023-11-18 理论教育 版权反馈
【摘要】:图6-5DVMM彩色图像数据集示例CASIA TIDEv1. 0/v2.0数据集。CASIA TIDE数据集由中国科学院自动化研究所建立,共有CASIAITDEv1.0和CASIAITDEv2.0两个版本,分别收集了1721幅和12614幅彩色图像,包含真实集和合成数据集。CASIAITDEv1.0共包含800张真实图像和921张合成图像,分辨率为384×256,CASIAITDEv2.0共包含7491张真实图像和5 123张合成图像,图像分辨率从240×160至900×600不等,图像格式包括JPEG、BMP和TIFF。

深度合成:高质量图像合成数据集

(1)DVMM数据集。Columbia Image Splicing Detection Evaluation Dataset(哥伦比亚大学图像拼接检测数据库)是图像合成检测领域较早公开的权威样本库,该数据集一般简称为DVMM。该库共有灰度图像1845张,分辨率为128×128,其中真实图像933张、拼接图像912张,并且拼接后无美化润饰等后期处理。样本库内容包括动植物风景建筑物,涵盖了水平、垂直以及轮廓的不同拼接情形的训练样本。根据平滑和纹理的组合情况来划分,有均勾平滑、均勾纹理、平滑平滑、纹理纹理和平滑纹理五种类别。图6-4中列出了库中的示例图像。

图6-4 DVMM图像拼接数据库部分灰度图像

在其网站中还包括一个合成的彩色图像数据集,采用佳能G3、尼康D70、佳能350D RebelXT和柯达DCS330四种型号相机拍摄的183张原始图像,以及在此基础上拼接的180图像。原始图像的分辨率由757×568至1152×768不等,为均未压缩并包含EXIF信息的TIFF或BMP格式图像。图6-5为彩色图像数据集中的示例图片。

图6-5 DVMM彩色图像数据集示例

(2)CASIA TIDEv1. 0/v2.0数据集。CASIA TIDE(Tampered Image Detection Evaluation)数据集由中国科学院自动化研究所建立,共有CASIAITDEv1.0和CASIAITDEv2.0两个版本,分别收集了1721幅和12614幅彩色图像,包含真实集和合成数据集。CASIAITDEv1.0共包含800张真实图像和921张合成图像,分辨率为384×256,CASIAITDEv2.0共包含7491张真实图像和5 123张合成图像,图像分辨率从240×160至900×600不等,图像格式包括JPEG、BMP和TIFF。图像内容包括场景、动物、建筑、人物、植物、艺术、自然、室内和纹理九类。这两个数据集均包括拼接和复制粘贴两种合成方式,且使用了各种后处理方式消除了合成痕迹。目前该数据集在其官网的链接已经失效,但读者可以在Kaggle提供的平台以及Github找到包括groundtruth的该数据集。该数据集的示例图像如图6-6所示。

图6-6 CASIA v2.0数据库拼接图像示例(www.xing528.com)

(3)IFS-TCImageForensicsChallenge数据集。IEEE信息取证和安全技术委员会(IFS-TC)在2013年组织了一项国际竞赛——图像取证挑战赛。比赛分为两个阶段,第一个阶段提供的训练数据集共包含442张真实图像和1050张合成图像,测试数据集包含5713张图像。图像均未压缩,分辨率为1024×575至1024×768不等,存储格式为PNG。参加比赛的研究团队可以使用训练集来训练和测试他们设计的分类器。第二阶段提供350张图像,并被要求对每个被修改的图像在像素级别进行检测,即实现区域定位。图6-7列出了部分示例图像,左侧的为测试图像,右侧为groundtruth图像。

图6-7 IFS-TC图像示例

(4)RealisticTampering数据集。该数据集是一个用现代照片编辑软件手工合成的220张照片的数据集。这些图像均未经压缩,分辨率为1920×1080像素,涵盖了各种具有挑战性的合成场景,包括物体的拼接和移除。原始图像由四个不同的相机拍摄:索尼alpha57、佳能60d、尼康d7000和尼康d90。数据集还包含了摄像头的PRNU指纹。图6-8为示例图片,其中左边的为原始图像,右边的为合成图像中间为groundtruth图像。

图6-8 Realistic Tampering数据集图示

需要指出的是,除了上面列出的数据集外,还有一些学者利用真实图像集进行自定义的修改,如使用Wild Web数据集、UCID、BOSSbase图像集中的真实图像进行各种类型的后期处理,能够根据各自的实验内容更加灵活地设计训练集和测试集,但花费的时间成本较高。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈