前言
一开始学习scrapy框架,总感觉不知所措,从pycharm,阵地转移到了cmd,用命令行的方式去战斗
一、shell 与 startproject
- 与命令,scrapy startproject 一样,scrapy shell [url] 也是一个scrapy的命令。
- 参数 startprofect创建新的项目(类似在pycharm创建新项目:会生成文件夹和文件)
- 参数 scarpy是用于调试 scrape 代码。它本来是用来测试数据提取页面内容的,后演化成调试代码
- 例子
命令行输入:scrapy shell http://doc.scrapy.org/en/latest/_static/selectors-sample1.html
分析网址源代码,测试代码是否是想要的内容
在实践一番后,可观察到,scrapy shell是一个交互式shell,有来有往
二、scrapy的命令
1.scrapy命令形式
对于
scrapy startproject [project_name]
scrapy shell [url]
不难理解scrapy命令的形式:scrapy <command> [options] [args]
2.全局命令
shell | 调试 scrape 代码 |
---|---|
runspider | 运行一个爬虫文件 |
startproject | 创建一个新的Scrapy项目 |
settings | 输出项目设定值 |
version | Print Scrapy version |
fetch | 获取指定的URL,并且能够显示出获取的过程 |
view | 在浏览器中打开指定的URL |
3.项目命令
项目命令是在创建有项目和在项目目录下,运行的命令;;而全局命令,没有创建过项目,也可以使用。。
crawl | 运行一个 spider |
---|---|
genspider | 使用预定义的模板生成新的spider |
edit | 编辑spider |
bench | 对你的硬件做爬虫的压力测试 |
check | 检查spider contracts |
list | 查看你有几个spider |
parse | 使用spider解析网页内容 |
总结
希望通过这篇对 scrapy shell 的介绍,让大家学习 scrapy其他的命令提供一点点方向