前言
环境使用
- python 3.9
- pycharm
模块使用
- selenium
- 谷歌驱动
from selenium import webdriver
模块介绍
代码实现
今天这个目标要求特别简单,只要几行代码就能实现。话不多说,直接进入正题。
1.确定我们的目标网址
目标网址:https://www.bilibili.com/blackboard/BPU2022-poweruplist.html
2.通过谷歌确定去访问
driver = webdriver.Chrome()
driver.get('https://www.bilibili.com/blackboard/BPU2022-poweruplist.html')
效果如下:
3.定位目标元素
使用浏览器的开发者工具,我们找到了目标所在的位置,我们直接右击复制得到我们的selector。
selector = #app > div > div.main-content > div.list > ul > li > p.name
我们用一行代码得到我们所需要的数据。
names = driver.find_elements(By.CSS_SELECTOR,'#app > div > div.main-content > div.list > ul > li > p.name')
这是一个列表,我们都知道用for循环遍历。
for name in names:
print(name.text)
到这里,我们就用了6行代码就获取到了我们想要的数据,为了看到我们是不是获得了100位up主的数据,我们加一个计数,效果如下:
大家感兴趣的还可以获取up主的个人简介,什么照片的。下面这种效果也可以做,按字母排序。