本文转载地址:https://blog.csdn.net/qq_32447301/article/details/79487335
目前系统整理了一些网上开放的免费科研数据集,以下是分类列表以及下载地址,供高校和科研机构免费下载和使用。
金融
- 美国劳工部统计局官方发布数据
 - 上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票
 - 深证A股日线数据,1999.12.09 至 2016.06.08,前复权,1766支股票
 - 深证创业板日线数据,1999.12.09 至 2016.06.08,前复权,510支股票
 - MT4平台外汇交易历史数据
 - Forex平台外汇交易历史数据
 - 几组外汇交易逐笔(Ticks)数据
 - 美国股票新闻数据【Kaggle数据】
 - 美国医疗保险市场数据【Kaggle数据】
 - 美国金融客户投诉数据【Kaggle数据】
 - Lending Club 网贷违约数据【Kaggle数据】
 - 信用卡欺诈数据【Kaggle 数据】
 - 某个金融产品实时交易数据【Kaggle数据】
 - 美国股票数据XBRL【Kaggle数据】
 - 纽约股票交易所数据【Kaggle数据】
 
交通
- 2013年纽约出租车行驶数据
 - Udacity自动驾驶数据
 - 纽约 Uber 接客数据 【Kaggle数据】
 - 英国车祸数据(2005-2015)【Kaagle数据】
 - 芝加哥汽车超速数据【Kaggle数据】
 
商业
- Amazon 食品评论数据【Kaggle数据】
 - Amazon 无锁手机评论数据【Kaggle数据】
 - 美国视频游戏销售和评价数据【Kaggle数据】
 - Kaggle 各项竞赛情况数据【Kaggle数据】
 
推荐系统
- Netflix 电影评价数据
 - MovieLens 20m 电影推荐数据集
 - WikiLens
 - Jester
 - HetRec2011
 - Book Crossing
 - Large Movie Review
 
医疗健康
- 人识别物体时大脑核磁共振影像数据
 - 人理解单词时大脑核磁共振影像数据
 - 心脏病心房图像及标注数据
 - 细胞病理识别
 - FIRE 视网膜眼底病变图像数据
 - 食物营养成分数据 【Kaggle数据】
 - EGG 大脑电波形状数据【Kaggle数据】
 
图像数据
综合图像
- Visual Genome 图像数据
 - Visual7w 图像数据
 - COCO 图像数据
 - SUFR 图像数据
 - ILSVRC 2014 训练数据(ImageNet的一部分)
 - PASCAL Visual Object Classes 2012 图像数据
 - PASCAL Visual Object Classes 2011 图像数据
 - PASCAL Visual Object Classes 2010 图像数据
 - 80 Million Tiny Image 图像数据【数据太大仅有介绍】
 - ImageNet【数据太大仅有介绍】
 
场景图像
- Street Scences 图像数据
 - Places2 场景图像数据
 - UCF Google Street View 图像数据
 - SUN 场景图像数据
 - The Celebrity in Places 图像数据
 
Web标签图像
- HARRISON 社交标签图像
 - NUS-WIDE 标签图像
 - Visual Synset 标签图像
 - Animals With Attributes 标签图像
 
人形轮廓图像
- MPII Human Shape人体轮廓数据
 - Biwi Kinect Head Pose 头部姿势数据
 - 上半身人像数据
 - INRIA Person 数据集
 
视觉文字识别图像
- Street View House Number 门牌号图像数据
 - MNIST 手写数字识别图像数据
 - 3D MNIST 数字识别图像数据【Kaggle数据】
 - MediaTeam Document 文档影印和内容数据
 
特定一类事物图像
- 著名的猫图像标注数据
 - Caltech-UCSD Birds200 鸟类图像数据
 - Stanford Car 汽车图像数据
 - Cars 汽车图像数据
 - MIT Cars 汽车图像数据
 - Stanford Cars 汽车图像数据
 - Food-101 美食图像数据
 - 17_Category_Flower 图像数据
 - 102_Category_Flower 图像数据
 - UCI Folio Leaf 图像数据
 - Labeled Fishes in the Wild 鱼类图像
 - 美国 Yelp 点评网站酒店照片
 - CMU-Oxford Sculpture 塑像雕像图像
 - Oxford-IIIT Pet 宠物图像数据
 
材质纹理图像
- CURET 纹理材质图像数据
 - ETHZ Synthesizability 纹理图像数据
 - KTH-TIPS 纹理材质图像数据
 - Describable Textures 纹理图像数据
 
物体分类图像
- COIL-20 图像数据
 - COIL-100 图像数据
 - Caltech-101 图像数据
 - Caltech-256 图像数据
 - CIFAR-10 图像数据
 - CIFAR-100 图像数据
 - STL-10 图像数据
 - LabelMe_12_50k图像数据
 - NORB v1.0 图像数据
 - NEC Toy Animal 图像数据
 - iCubWorld 图像分类数据
 - Multi-class 图像分类数据
 - GRAZ 图像分类数据
 
人脸图像
- IMDB-WIKI 500k+ 人脸图像、年龄性别数据
 - Labeled Faces in the Wild 人脸数据
 - Extended Yale Face Database B 人脸数据
 - Bao Face 人脸数据
 - DC-IGN 论文人脸数据
 - 300 Face in Wild 图像数据
 - BioID Face 人脸数据
 - CMU Frontal Face Images
 - FDDB_Face Detection Data Set and Benchmark
 - NIST Mugshot Identification Database
 - Faces in the Wild 人脸数据
 - CelebA 名人人脸图像数据
 - VGG Face 人脸图像数据
 
姿势动作图像
- HMDB_a large human motion database
 - Human Actions and Scenes Dataset
 
指纹识别
- NIST FIGS 指纹识别数据
 
其它图像数据
- Visual Question Answering 图像数据
 
视频数据
综合视频
- DAVIS_Densely Annotated Video Segmentation 数据
 - YouTube-8M 视频数据集【数据太大仅有介绍】
 - YouTube 网站视频备份【数据太大仅有介绍】
 
人类动作视频
- Microsoft Research Action 人类动作视频数据
 - UCF50 Action Recognition 动作识别数据
 - UCF101 Action Recognition 动作识别数据
 - UT-Interaction 人类动作视频数据
 - UCF iPhone 运动中传感器数据
 - UCF YouTube 人类动作视频数据
 - UCF Sport 人类动作视频数据
 - UCF-ARG 人类动作视频数据
 - HMDB 人类动作视频
 - HOLLYWOOD2 人类行为动作视频数据
 - Recognition of human actions 动作视频数据
 - Motion Capture 动作捕捉视频数据
 - SBU Kinect Interaction 肢体动作视频数据
 
行人检测视频
- UCSD Pedestrian 行人视频数据
 - Caltech Pedestrian 行人视频数据
 - ETH 行人视频数据
 - INRIA 行人视频数据
 - TudBrussels 行人视频数据
 - Daimler 行人视频数据
 
密集人群视频
- Crowd Counting 高密度人群图像
 - Crowd Segmentation 高密度人群视频数据
 - Tracking in High Density Crowds 高密度人群视频
 
其它视频
- Fire Detection 视频数据
 
音频数据
综合音频
Google Audioset 音频数据【数据太大仅有介绍】
语音识别
- Sinhala TTS 英语语音识别
 - TIMIT 美式英语语音识别数据
 - LibriSpeech ASR corpus 语音数据
 - Room Impulse Response and Noise 语音数据
 - ALFFA 非洲语音数据
 
自然语言处理
- RCV1英语新闻数据
 - 20news 英语新闻数据
 - First Quora Release Question Pairs
 - JRC Names各国语言专有实体名称
 - Multi-Domain Sentiment V2.0
 - LETOR 信息检索数据
 - Yale Youtube Vedio Text
 - 斯坦福问答数据【Kaggle数据】
 - 美国假新闻数据【Kaggle数据】
 - NIPS会议文章信息数据(1987-2016)【Kaggle数据】
 - 2016年美国总统选举辩论数据【Kaggle数据】
 
社会数据
- 希拉里邮件门泄露邮件
 - 波士顿 Airbnb 公开数据【Kaggle数据】
 - 世界各国经济发展数据【Kaagle数据】
 - 世界大学排名芝加哥犯罪数据(2001-2017)【Kaagle数据】
 - 世界范围显著地震数据(1965-2016)【Kaagle数据】
 - 美国婴儿姓名数据【Kaagle数据】
 - 全世界鲨鱼袭击人类数据【Kaagle数据】
 - 1908年以来空难数据【Kaagle数据】
 - 2016年美国总统大选数据【Kaagle数据】
 - 2013年美国社区统计数据【Kaagle数据】
 - 欧洲足球运动员赛事表现数据【Kaagle数据】
 - 美国环境污染数据【Kaagle数据】
 - 美国H1-B签证申请数据【Kaggle数据】
 - IMDB五千部电影数据【Kaggle数据】
 - 2015年航班延误和取消数据【Kaggle数据】
 - 凶杀案报告数据【Kaggle数据】
 - 人力资源分析数据【Kaggle数据】
 - 某人基因序列数据【Kaggle数据】
 - 美国费城犯罪数据【Kaggle数据】
 - 安然公司邮件数据【Kaggle数据】
 - 历史棒球数据【Kaggle数据】
 - 美联航 Twitter 用户评论数据【Kaggle数据】
 - 波士顿 Airbnb 公开数据【Kaggle数据】
 
新增数据集:
http://nltk.org/nltk_data/
https://pan.baidu.com/s/1szmNZQrwh9y994uO8DFL_A 提取码:f2ex 容量为1.8GB
http://sighan.cs.uchicago.edu/bakeoff2005/










