0

点赞

收藏

分享

python爬虫:爬虫的简单介绍及requests模块的简单使用

残北 2022-02-25 阅读 87

标签: python 爬虫开发语言计算机

Python微信订餐小程序课程视频

https://edu.csdn.net/course/detail/36074

Python实战量化交易理财系统

https://edu.csdn.net/course/detail/35475

python爬虫:爬虫的简单介绍及requests模块的简单使用😜

一点点的建议：😶

————————————————————————————————————————————————————————————————

😬一个问题：

1.一点介绍

2.requests模块学习

headers的包装之一（UA伪装）

方法：

随便打开一个网页，摁F12,也就是java的调试工具，然后点击上面的【网络】这个键。

然后刷新你的网页,在你的调试工具网络那边左下角就会有这些出现，

接下来就是随便点击一个，在他的右边，就会出现一堆内容，先不用管，直接拉到最底下，你就会找到一个叫做【“User-Agent”】的东西。

然后就是复制到你的代码里面用字典进行包装了。

示意如下：

然后就可以用进你的代码里面了。

爬虫的步骤：（怎么写爬虫）

实战1:爬取搜狗搜索的网页代码。

<1>安装包

<2>开始写代码

爬取完了之后，作者是存到了自己的文件夹下面，然后打开搜狗.html ，我们就可以看到网页的源码了。

如下图：

看起来是不是很抽象，看不懂，我们这时候，只要用编译器打开你爬取回来的网页代码，就可以看见你爬取回来的，是不是正确的网页源码。

比如这个搜狗的搜索网页：

在这里这一句，就可以充分表明，是你自己本地的网页，而不是自己又打开了搜狗搜索的网页。

<3>最后讲两句

爬虫要学习的内容还有很多，这里只是入入门，打个样让大家尝试一下，给大家一个大致印象，接下来需要更多练习跟学习来学爬虫。可以多上上视频网站看看。

(作者的更新周期很长，平常可能记起来要写博客才写的😳)

0 条评论

关注