0
点赞
收藏
分享

微信扫一扫

python爬虫:爬虫的简单介绍及requests模块的简单使用

残北 2022-02-25 阅读 86

Python微信订餐小程序课程视频

https://edu.csdn.net/course/detail/36074

Python实战量化交易理财系统

https://edu.csdn.net/course/detail/35475

python爬虫:爬虫的简单介绍及requests模块的简单使用😜

一点点的建议:😶

————————————————————————————————————————————————————————————————

😬一个问题:

1.一点介绍


2.requests模块学习


headers的包装之一(UA伪装)

方法:

随便打开一个网页,摁F12,也就是java的调试工具,然后点击上面的【网络】这个键。

然后刷新你的网页,在你的调试工具网络那边左下角就会有这些出现,

接下来就是随便点击一个,在他的右边,就会出现一堆内容,先不用管,直接拉到最底下,你就会找到一个叫做【“User-Agent”】的东西。

然后就是复制到你的代码里面用字典进行包装了。

示意如下:

然后就可以用进你的代码里面了。


爬虫的步骤:(怎么写爬虫)

实战1:爬取搜狗搜索的网页代码。

<1>安装包

<2>开始写代码

爬取完了之后,作者是存到了自己的文件夹下面,然后打开 搜狗.html ,我们就可以看到网页的源码了。

如下图:

看起来是不是很抽象,看不懂,我们这时候,只要用编译器打开你爬取回来的网页代码,就可以看见你爬取回来的,是不是正确的网页源码。

比如这个搜狗的搜索网页:

在这里这一句,就可以充分表明,是你自己本地的网页,而不是自己又打开了搜狗搜索的网页。

<3>最后讲两句

爬虫要学习的内容还有很多,这里只是入入门,打个样让大家尝试一下,给大家一个大致印象,接下来需要更多练习跟学习来学爬虫。可以多上上视频网站看看。

(作者的更新周期很长,平常可能记起来要写博客才写的😳)

举报

相关推荐

0 条评论