0
点赞
收藏
分享

微信扫一扫

深度学习数据集大全

文章目录

前言

深度学习是以数据为驱动的技术,在使用深度学习进行科研或者工作当中,都离不开数据集。因此本篇博客整理我在工作当中遇到的一些数据集。如人脸数据集,地球信息的数据集。数据集来源有一些比赛的数据集,如kaggle,还有一些团队公开发表的数据集。数据集都尽可能地贴出链接,贴不出链接只能自己寻找,然后你懂得。

人脸数据集

  1. 哥伦比亚大学公众人物脸部数据库
    数据集链接:http://m6z.cn/5DlIR9。该数据集是一个大型的人脸数据集,主要用于人脸识别和身份鉴定,涵盖互联网上200多人的人脸照片,共58797张图像。该数据集由哥伦比亚大学于2009年发布,相关论文有:《Attribute and Simile Classifiers for Face Verification》。

  2. CelebA人脸数据集
    CelebFaces Attributes Dataset (CelebA) 是一个大规模的人脸属性数据集,包含超过 20 万张名人图像,每张都有 40 个属性注释。该数据集中的图像涵盖了较大的姿势变化和杂乱的背景。CelebA 种类多、数量多、注释丰富,包括10,177 个身份,202,599 张人脸图像,以及5 个地标位置,每张图像 40 个二进制属性注释。该数据集可用作以下计算机视觉任务的训练和测试集:人脸属性识别、人脸识别、人脸检测、地标(或人脸部分)定位以及人脸编辑与合成。

  3. 美国国防部人脸照片
    为促进人脸识别算法的研究和实用化,美国国防部的Counterdrug Technology Transfer Program(CTTP)发起了一个人脸识别技术(Face Recognition Technology 简称FERET)工程,它包括了一个通用人脸库以及通用测试标准。到1997年,它已经包含了1000多人的10000多张照片,每个人包括了不同表情,光照,姿态和年龄的照片。数据集链接:http://m6z.cn/5So6DB

  4. Youtube视频人脸数据集
    该数据集包含 1,595 个不同人的 3,425 个视频。所有视频都是从 YouTube 下载的。每个主题平均有 2.15 个视频可用。最短剪辑时长为 48 帧,最长剪辑为 6070 帧,视频剪辑的平均长度为 181.3 帧。在这个数据集下,算法需要判断两段视频里面是不是同一个人。有不少在照片上有效的方法,在视频上未必有效/高效。数据集链接:http://m6z.cn/6u3P2V

  5. BioID人脸数据集
    这个数据集包含了1521幅分辨率为384x286像素的灰度图像。每一幅图像来自于23个不同的测试人员的正面角度的人脸。为了便于做比较,这个数据集也包含了对人脸图像对应的手工标注的人眼位置文件。图像以 "BioID_xxxx.pgm"的格式命名,其中xxxx代表当前图像的索引(从0开始)。类似的,形如"BioID_xxxx.eye"的文件包含了对应图像中眼睛的位置。数据集地址:http://m6z.cn/5ZUjyC

地球信息数据集

本博客持续更新中…

举报

相关推荐

0 条评论