0
点赞
收藏
分享

微信扫一扫

scrapy shell和 scrapy常用命令

全栈顾问 2022-04-13 阅读 64
python

前言

一开始学习scrapy框架,总感觉不知所措,从pycharm,阵地转移到了cmd,用命令行的方式去战斗


一、shell 与 startproject

  1. 与命令,scrapy startproject 一样,scrapy shell [url] 也是一个scrapy的命令。
    • 参数 startprofect创建新的项目(类似在pycharm创建新项目:会生成文件夹和文件)
    • 参数 scarpy是用于调试 scrape 代码。它本来是用来测试数据提取页面内容的,后演化成调试代码
  2. 例子
    命令行输入:scrapy shell http://doc.scrapy.org/en/latest/_static/selectors-sample1.html
    在这里插入图片描述
    分析网址源代码,测试代码是否是想要的内容
    在这里插入图片描述
    在实践一番后,可观察到,scrapy shell是一个交互式shell,有来有往

二、scrapy的命令

1.scrapy命令形式

对于
scrapy startproject [project_name]
scrapy shell [url]
不难理解scrapy命令的形式:scrapy <command> [options] [args]

2.全局命令

shell调试 scrape 代码
runspider运行一个爬虫文件
startproject创建一个新的Scrapy项目
settings输出项目设定值
versionPrint Scrapy version
fetch获取指定的URL,并且能够显示出获取的过程
view在浏览器中打开指定的URL

3.项目命令

项目命令是在创建有项目和在项目目录下,运行的命令;;而全局命令,没有创建过项目,也可以使用。。

crawl运行一个 spider
genspider使用预定义的模板生成新的spider
edit编辑spider
bench对你的硬件做爬虫的压力测试
check检查spider contracts
list查看你有几个spider
parse使用spider解析网页内容

总结

希望通过这篇对 scrapy shell 的介绍,让大家学习 scrapy其他的命令提供一点点方向

举报

相关推荐

0 条评论