0
点赞
收藏
分享

微信扫一扫

Python爬虫大作业(仿虎牙直播客户端)

小月亮06 2022-04-08 阅读 73

一、大作业要求

结合所选专业方向(信息处理、嵌入式、人工智能、大数据处理),用所学Python技术设计并实现一个与专业方向技术相关的、功能完整的系统,并撰写总结报告。

实现要求:

(1)实现涵盖以下技术:
  • 图形界面、
  • 多线程、
  • 文件操作、
  • 数据库编程、
  • 网页爬虫、
  • 异常处理。

A可侧重于应用系统,结合爬虫丰富系统功能,提升用户体验。
B可考虑实现物联网。
C可侧重于爬取网站图片,并进行图形或图像识别。
D可侧重于基于爬虫进行数据采集,并进行数据的统计分析。

(2)系统具有一定复杂度。爬取图片不少于500张。采集数据不少于1000条,统计分析的目标不能少于3个。其中每项均可根据需求进行增添或删减。

二、设计方案

1、设计了虎牙主页的爬虫,包括直播间封面、主播名、人气、直播间标题、主播id、主播房间号等信息。

另附虎牙直播分类页面进行对比查阅:虎牙直播分类

2、使用python3实现爬取数据,使用sqlite3模块进行数据存储,本地化存储,不需要额外安装数据库软件,但相应的不能可视化操作数据库内容;使用plt模块进行数据的绘图,使用tkinter模块实现界面。

3、通过tkinter的绑定事件,实现了单击列名可使列表按字符升序(降序)排列;实现了单击某一主播会在软件主页面更新页面图片,双击时会在浏览器打开该主播的直播间;实现了快捷键绑定,如F5刷新列表,Ctrl+F聚焦搜索框;实现了主播列表里的搜索功能,可通过Ctrl+F快捷键快速搜索;实现了单击页面图片可在浏览器跳转到对应主播的直播间


三、软件支持

  • Windows 10 操作系统(理论上对Windows版本无要求)
  • Visual Studio 2022 Community(2017发行版及以上)
  • Python3开发环境(笔者本人版本号为3.9.5)

四、作业实现成果

英雄联盟分类下的运行界面
切换游戏列表为穿越火线分类下的运行界面
人气范围统计图功能展示
人气对比图功能展示
英雄联盟分类下人气Top10榜单功能展示
主播列表按"主播"列字符降序排列
主播列表按"人气"列浮点数降序排列
单击单个主播功能展示

[运行说明]


运行代码前需要更改图中所示的变量,确保路径有效,文件存在,否则运行会报错。

[附件]

代码及文件:代码及附件

举报

相关推荐

0 条评论