0
点赞
收藏
分享

微信扫一扫

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行


1.为什么将爬虫放到ECS运行

ECS介绍

ECS全名是​​Elastic Cloud Server​​,弹性云服务器,是一种可以随时获取、可弹性伸缩的云服务器,帮助用户打造可靠、安全、灵活、高效的应用环境。

ECS运行爬虫的优势


  • 运行环境的优势​:ECS自带Python爬虫运行环境,不需要复杂配置;
  • 计算资源的优势​:不需要占用本地资源,ECS所有的资源都可以用来运行爬虫;
  • 反爬虫优势​:ECS使用公有IP,IP可更换,防止爬虫被封;

2.实验目的


  • 在华为云上购买弹性云主机ECS
  • 配置Python环境
  • 运行Python爬虫根据输入的关键字爬取图片。

3.实验过程

首先登录​​华为云官网​​,在右上角进入​​控制台​​,地区选择为​​华北-北京一​​:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云主机

3.1. 华为云创建VPC

虚拟私有云可以为弹性云服务器ECS构建隔离的、用户自主配置和管理的虚拟网络环境。

点开​​服务列表​​,选择​​网络​​-> ​​虚拟私有云VPC​​,进入​​网络控制台​​:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云主机_02

点击​​创建虚拟私有云​​:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_python_03

基本信息:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云服务_04

子网配置:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云服务_05

自定义配置:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云主机_06

点击右下角的​​立即创建​​即可创建成功:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云服务_07

在网络控制台左侧菜单栏中点击​​访问控制​​的​​安全组​​进入安全组页面,在​​安全组规则​​ 下选择​​Sys-default​​,然后再点击​​添加规则​​:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云主机_08

3.2. 华为云创建ECS

登录​​华为云控制台​​,在所有服务中选择​​计算>弹性云服务器​​ ,进入云服务器控制台,点击​​购买弹性云服务器​​:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_python_09

基本信息:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_python_10

规格:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云服务_11

镜像:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云服务_12

磁盘:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云服务_13

网络配置:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云主机_14

登录方式配置:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云主机_15

其余配置:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_python_16

确认好配置好,点击​​立即购买​​ :

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_python_17

在控制台即可看到ECS列表:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云主机_18

3.3. 远程登录ECS云主机

登录ECS云主机是基于SSH服务的,登录方式有很多种:


  • 直接在华为云控制台登录:
    【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_python_19
  • 使用Xshell或putty等SSH远程工具登录;
  • 使用Git Bash中的ssh命令登录;
  • 使用VS Code中的SSH扩展登录;
  • ……

因为这里要编辑代码,所以我使用XShell登录:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云服务_20

3.4.配置云主机Python环境

首先检查一下Python环境:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云服务_21

可以看到系统内置Python2,没有Python3,参考我的另一篇文章进行安装。

安装爬虫运行依赖库:

pip3 install requests

3.5. 运行Python爬虫程序

首先创建一个爬虫运行的目录:

mkdir Python_Image_Downloads
mkdir Python_Image_Downloads/images

创建爬虫文件:

touch ./Python_Image_Downloads/spider.py

使用vim打开并编辑代码,保存。

然后运行爬虫:

python3 spider.py

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_python_22

3.6. 检查图片抓取结果

进入保存图片的目录,查看是否抓取成功:

【华为云认证—爬虫实验】(二)将Python爬虫放到ECS上运行_云服务_23



举报

相关推荐

0 条评论