首页 理论教育 数据集及相关工具概述

数据集及相关工具概述

时间:2023-06-24 理论教育 版权反馈
【摘要】:本节算法使用的是用于 ILSVRC 2012 比赛中 ImageNet 数据集的子集。ILSVRC 2012 测试集包括训练集、测试集、验证集。

数据集及相关工具概述

1. MNIST 手写数字数据集

该数据集分为60 000 个样本的训练集和10 000 个样本的测试集,它是数据集NIST 的子集。数据集中的数据都是28 像素×28 像素的手写数字图像,对应的分类标签为0~9。

2. CIFAR − 10

该数据集中的图像共分为10 个类别,每个类别中有6 000 幅彩色图像,图像的大小为32 像素×32 像素。数据集分为5 个训练集和1 个测试集,每个数据集中有10 000 幅图像。其中,测试集包含来自每个类别各有1 000幅的不同图像;训练集以随机的方式包含剩余图像。这 10 个类分别对应airplane、car、bird、cat、deer、dog、frog、horse、boat、truck。

3. ImageNet(www.xing528.com)

该数据集是目前深度学习领域中应用得最多的数据集,除了本节所要介绍的图像分类任务外,它还可以用于目标检测和定位任务。该数据集包含了两万多个分类,有超过1 400 万幅图像,在一般实验中无法完全使用。本节算法使用的是用于 ILSVRC 2012 比赛中 ImageNet 数据集的子集。ILSVRC 2012 测试集包括训练集、测试集、验证集。其中,训练集有超过128 万幅图像,验证集有5 万幅图像,测试集有10 万幅图像。本节算法使用其中的验证集。

4. Foolbox

Foolbox 是一个可以用于制造用于欺骗神经网络的对抗样本的 Python工具箱,它支持许多框架来构建模型,包括本节实验所要用到的 PyTorch框架。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈