一、Python re模块的基本用法
二、爬取网页图片
爬取百度贴吧图片
其中指定爬虫的下载图片位置,注意为反斜杠,
def batchDownloadJPGs(imgUrls, path='D:/test/'):
爬取百度搜索图片
三、 第一个Python爬虫——谈心得
(没试用)
(requests模块讲解)
(Python中的BeautifulSoup模块)
(获取标签<a>中的内容)
如果,标签<a>中含有其他标签,比如<em>..</em>,此时要提取<a>中的数据,需要用k.get_text()
四、爬取movie
五、网页登陆
————————————————————————