VGGFace2数据集由约331万张图像组成,分为9131个类,每个类代表不同的个人身份。数据集分为两个部分,一个用于训练,一个用于测试。后者包含约170000张图像,分为500个身份,而所有其他图像属于剩余的8631个可供培训的课程。在构建数据集的过程中,作者将精力集中在达到极低的标签噪音和较高的姿势和年龄多样性,从而使VGGFace2数据集成为在人脸相关任务中训练最先进的深度学习模型的合适选择。训练集的图像平均分辨率为137x180像素,在分辨率低于32像素时(考虑到最短边),分辨率小于1%。
样例:
数据集内容:
我自己也在百度网盘分享了一份。可关注本人公众号,回复“202206”获取下载链接。
其中,由于vggface2_train.tar.gz太大,超过百度网盘上传限制,我自己通过压缩包工具进行切分,独立放在一个文件夹vggface2_train,到时大家下载回来之后,直接通过压缩工具一起合并解压。
如果不会,可参考以下内容:
用winrar压缩工具切分文件和合并文件
如果下回来的数据,合并有问题,数据集没法使用。我自己本人有这个数据集的种子,如果有需要,可以通过邮箱联系本人获取。