- 一般文章中的ImageNet指的是ISLVRC2012这个比赛数据集,比较经典
- ImageNet login首先先用邮箱注册一个账号,然后才能下载(一般下数据集尽量用教育邮箱申请)
- 进download界面点2012的链接
- 下载训练集
- 传上服务器又传了很久。。Xftp很良心可以继续上传(当服务器端有未完整上传的文件存在时,就可以继续上传的~比如有时候你不小心把xshell xftp给关了。。),不过图里没显示。
- 解压数据集
mkdir imagenet && mv ILSVRC2012_img_train.tar imagenet/ && cd imagenet
tar -xvf ILSVRC2012_img_train.tar
# tar -xvf ILSVRC2012_img_train.tar && rm -f ILSVRC2012_img_train.tar 网上看到了个这个命令 边删除吧? 不过不敢rm数据集,有的时候需要在不同服务器之间传数据集,留一手。。
find . -name "*.tar" | while read NAME ; do mkdir -p "${NAME%.tar}"; tar -xvf "${NAME}" -C "${NAME%.tar}"; rm -f "${NAME}"; done
- 解压ing
- 解压完
一共128w张图片~