Requestium:爬取解析。是 Requests, Selenium 和 Parsel 的结合体。
Caffe2:深度学习的库,优势是它是由 Facebook 团队来维护
FlashText:文本搜索与替换。当关键词数量>500 的时候,FlashText 的搜索速度开始超过正则
Sanic:和 Flask 类似,但是测试中达到每秒 36000 次请求
psutil:是用来获取操作系统监控以及进程管理
BeautifulSoup:解析HTML的,特点就是好用,有人吐槽BeautifulSoup慢
utils:工具库?
awesome-spider:搜集了几乎所有可以爬取的中文网址,从知乎豆瓣到知网,抖音微博到QQ
Nyspider:国内爬虫
python-spider:国内网站爬虫
annie:视频爬虫 https://github.com/iawia002/annie
gym+universe:两个开源强化学习
python-docx – 读取,查询以及修改 Microsoft Word 2007/2008 docx 文件
PDFMiner – 一个用于从PDF文档中抽取信息的工具。
PyPDF2 – 一个可以分割,合并和转换 PDF 页面的库。
ReportLab – 快速创建富文本 PDF 文档。
Mistune – 快速并且功能齐全的纯 Python 实现的 Markdown 解析器。
Python-Markdown – John Gruber’s Markdown 的 Python 版实现。
NLTK – 一个先进的平台,用以构建处理人类语言数据的 Python 程序。
jieba – 中文分词工具。
langid.py – 独立的语言识别系统。
Pattern – Python 网络信息挖掘模块。
SnowNLP – 一个用来处理中文文本的库。
TextBlob – 为进行普通自然语言处理任务提供一致的 API。
TextGrocery – 一简单高效的短文本分类工具,基于 LibLinear 和 Jieba。
MkDocs – 对 Markdown 友好的文档生成器。
you-get – 一个 YouTube/Youku/Niconico 视频下载器,使用 Python3 编写。
youtube-dl – 一个小巧的命令行程序,用来下载 YouTube 视频。
python-qrcode – 一个纯 Python 实现的二维码生成器。
scikit-image – 一个用于(科学)图像处理的 Python 库。
thumbor – 一个小型图像服务,具有剪裁,尺寸重设和翻转功能
pygram – 类似 Instagram 的图像滤镜
pyocr – Tesseract 和 Cuneiform 的一个封装(wrapper)。
pytesseract – Google Tesseract OCR 的另一个封装(wrapper)。
python-tesseract – Google Tesseract OCR 的一个包装类。
moviepy – 一个用来进行基于脚本的视频编辑模块,适用于多种格式,包括动图 GIFs。
TinyDB – 一个微型的,面向文档型数据库。
HappyBase – 一个为 Apache HBase 设计的,对开发者友好的库。
PyMongo – MongoDB 的官方 Python 客户端。
redis-py – Redis 的 Python 客户端。
hot-redis – 为 Redis 提供 Python 丰富的数据类型
redisco – 一个 Python 库,提供可以持续存在在 Redis 中的简单模型和容器。
内容管理系统
django-cms – 一个开源的,企业级 CMS,基于 Django。
djedi-cms – 一个轻量级但却非常强大的 Django CMS ,考虑到了插件,内联编辑以及性能。
FeinCMS – 基于 Django 构建的最先进的内容管理系统之一。
Kotti – 一个高级的,Python 范的 web 应用框架,基于 Pyramid 构建。
Mezzanine – 一个强大的,持续的,灵活的内容管理平台。
Opps – 一个为杂志,报纸网站以及大流量门户网站设计的 CMS 平台,基于 Django。
Plone – 一个构建于开源应用服务器 Zope 之上的 CMS。
Quokka – 灵活,可扩展的小型 CMS,基于 Flask 和 MongoDB。
Wagtail – 一个 Django 内容管理系统。
Widgy – 最新的 CMS 框架,基于 Django。
电子商务
django-oscar – 一个用于 Django 的开源的电子商务框架。
django-shop – 一个基于 Django 的店铺系统。
Cartridge – 一个基于 Mezzanine 构建的购物车应用。
shoop – 一个基于 Django 的开源电子商务平台。
alipay – 非官方的 Python 支付宝 API。
merchant – 一个可以接收来自多种支付平台支付的 Django 应用。
money – 货币类库with optional CLDR-backed locale-aware formatting and an extensible currency exchange solution.
python-currencies – 显示货币格式以及它的数值
django-allauth – Django 的验证应用。
django-oauth-toolkit – 为 Django 用户准备的 OAuth2。
django-oauth2-provider – 为 Django 应用提供 OAuth2 接入。
elasticsearch-py – Elasticsearch 的官方底层 Python 客户端。
elasticsearch-dsl-py -Elasticsearch 的官方高级 Python 客户端。
envelopes – 供人类使用的电子邮件库。
flanker – 一个 email 地址和 Mime 解析库。
imbox – Python IMAP 库
inbox.py – Python SMTP 服务器。
inbox – 一个开源电子邮件工具箱。
lamson – Python 风格的 SMTP 应用服务器。
mailjet – Mailjet API 实现,用来提供批量发送邮件,统计等功能。
marrow.mailer – 高性能可扩展邮件分发框架。
modoboa – 一个邮件托管和管理平台,具有现代的、简约的 Web UI。
pyzmail – 创建,发送和解析电子邮件。
Talon – Mailgun 库,用来抽取信息和签名。










