面向红外视觉或多光谱视觉行人检测研究,一些研究者近年来面向相关应用构建了一些数据集,其中较有代表性的有以下5个。
1)KAIST Multispectral Pedestrian Detection Benchmark
Hwang等[117]搭建了由可见光相机、红外热像仪、分光镜和三轴相机夹具组成并实现精密光学配准图像的采集系统,使用该系统拍摄日间和夜间的校园、街道以及乡村的交通场景,构建面向智能驾驶的可见光与红外图像行人检测数据集KAIST(https://github.com/Soonmin Hwang/rgbt-ped-detection)。KAIST中每张图像都包含RGB彩色图像和热红外图像两个版本,图像分辨率为640×480,共计95 328张。数据集的标签包含person、people和cyclist三个类别,总共包含103 128个行人标注框,其中比较好区分的个体标注为person,不太好分辨的多个个体标注为people,骑行的人则标注为cyclist。在全部标注对象中,未被遮挡、部分遮挡以及严重遮挡的行人目标占比分别为78.6%、12.6%以及8.8%。
2)OTCBVS Benchmark Dataset Collection
OTCBVS Benchmark Dataset Collection(http://vcipl-okstate.org/pbvs/bench/)是面向多任务的图像数据库,由14个子数据库构成。其中,俄亥俄州立大学人体体温数据库(OSU Thermal Pedestrian Database)、Terravic运动红外数据库(Terravic Motion IR Database)、视觉分析热红外视频基准库(Thermal Infrared Video Benchmark for Visual Analysis)等可用于人体目标的检测与分析。以视觉分析热红外视频基准库为例,它包括从512×512到1 024×1 024多种分辨率的热红外序列图像,图像中出现单/多视角下的单/多类目标,面向人体目标的识别、跟踪、计数等应用。
3)FLIR Thermal Dataset(www.xing528.com)
FLIR Thermal Dataset(https://www.flir.in/oem/adas/adas-datasetform/)是FLIR System公司面向ADAS应用环境,为在完全漆黑、烟雾、恶劣天气和眩光等具有挑战性的天气条件下,能更好检测和区分行人、骑行者、动物和机动车辆开发的机器学习算法(特别是DNN算法)的公开热红外图像数据集。数据集共14 000张图像,描述的是日间(60%)和夜间(40%)晴到多云天气行驶在加利福尼亚州圣巴巴拉市街道和公路上的场景,这些场景中的目标包括人、汽车、自行车、狗以及其他车辆,并都相应做了标注。
4)SCUT FIR Pedestrian Dataset
SCUT FIR Pedestrian Datasets[118]是大型的长波红外行人检测数据集(https://github.com/SCUT-CV/SCUT_FIR_Pedestrian_Dataset),由长达11小时的序列图像构成,图像帧率为25 Hz,描述的是在时速80码(即80 km/h)下,在广州的商业区、郊区、高速路以及校园等地点合计11个路段的交通场景。数据集在211 011帧中为7 659个不同行人标注了合计477 907个标定框。在该数据集中,S0-S10为训练集,合计70 517帧,3 703个不同行人,240 297个标注框;S11-S20为测试集,合计73 115帧,3 940个不同行人,237 610个标注框。
5)INO Videos Analytics Dataset
INO Videos Analytics Dataset(ftp://ftp.ino.ca/Video AnalyticsDataset)由加拿大国家光学研究所(National Optics Institute of Canada)构建,包含了不同天气状况下多种户外场景例如停车场、校园、高速公路、大厅入口等的可见光序列图像以及可见光-热红外多光谱序列图像。这些图像包含了单/多人行为、车辆运动等,另外其中的热红外与可见光图像实现了像素级配准。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。