0
点赞
收藏
分享

微信扫一扫

gunicorn的简单总结

您好,我是码农飞哥,感谢您阅读本文!本文主要将对gunicorn进行一个简单的总结。


文章目录

  • ​​gunicorn是什么​​
  • ​​gunicorn的安装​​
  • ​​安装​​
  • ​​查看gunicorn的版本​​
  • ​​运行gunicorn​​
  • ​​工作模式​​
  • ​​性能实践​​
  • ​​参考​​

gunicorn是什么

Gunicorn 是一个 Python 的 WSGI HTTP 服务器。它所在的位置通常是在反向代理(如 Nginx)或者 负载均衡(如 AWS ELB)和一个 web 应用(比如 Django 或者 Flask)之间。它是一个移植自Ruby的Unicorn项目的pre-fork worker模型,即支持eventlet,也支持greenlet。

gunicorn的安装

目前Gunicorn只能运行在Linux环境中,不支持windows平台

安装

# 安装最新版本的gunicorn
$ pip install gunicorn
#安装指定版本的gunicorn
pip install gunicorn==19.9.0
#异步模式
pip install gevent==1.4.0

查看gunicorn的版本

$ pip show gunicorn

运行gunicorn

$ gunicorn [OPTIONS] $(MODULE_NAME):$(VARIABLE_NAME)

其中MODULE_NAME对应的是python文件,VARIABLE_NAME对应web应用实例。 ​​[OPTIONS]​​的参数类型如下:

  1. ​-c CONFIG, --config=CONFIG​​​ 指定项目路径下的配置文件,如​​gunicorn -c gunicorn.py manage:app​​。gunicorn.py文件中设置了workers等参数。
  2. ​-b BIND, --bind=BIND​​​ 指定一个服务器的地址和端口,格式是gunicorn的简单总结_gunicorn(PORT)。例如:​​​gunicorn -b 0.0.0.0:18005 manage:app​
  3. ​-w WORKERS, --workers=WORKERS​​​ 是指定工作进程的数量,单核机器上这个数量一般在2-4个之间。例如:​​gunicorn -w 4 manage:app​​。
  4. ​-n APP_NAME, --name=APP_NAME​​ 指定APP的名称
  5. ​-k WORKERCLASS, --worker-class=WORKERCLASS​​ 指定工作模式。工作进程运行的模式,一共有 sync, eventlet, gevent, tornado, gthread 五种模式,默认是sys模式
  6. 加入- -reload,则代码变更后,gunicorn会自动重启,这样就可以进行开发调试。

工作模式

  1. 同步工作模式(Sync Workers(sync))
    这是最基本的工作模式,也是默认的工作模式,线程为native类型。即请求先来后到,排队模式。
  2. 异步工作模式(Async Workers(gevent,eventlet))
    gevent和eventlet都是基于Greentlet库,利用python协程实现的。安装方式:
    gevent是​​​pip install gunicorn[gevent]​​​ eventlet是​​pip install gunicorn[eventlet]​​ Gunicorn允许通过设置对应的worker类来使用这些异步Python库。这里的设置适用于我们想要在单核机器上运行的gevent:
gunicorn --worker-class=gevent --worker-connections=1000 --workers=3 main:app

worker-connections 是对于 gevent worker 类的特殊设置。​​(2*CPU)+1​​​ 仍然是建议的workers 数量。因为我们仅有一核,我们将会使用 3 个worker。在这种情况下,最大的并发请求数量是3000。(​​3个worker*1000个连接/worker​​​)
当worker指定为gevent或者evenlet类型时,线程变成基于Greentlet的task(伪线程),这时候线程数量threads参数是无效的。
使用gevent模式会出现一些兼容性问题。
使用gevent时,系统会使用monkey patch。系统的部分函数会被修改,
有些库会兼容gevent的类型,
例如,任务调度的库apscheduler,web socket需要socketio的库等,需要专门选择gevent的函数。
而有些库则直接无法使用,例如多进程multiprocess。
例如,在一个api请求中,如果需要使用多核cpu资源,采用multiprocess进行多进程计算。则会出现卡死的问题。gevent中,不能使用multiprocess库

  1. Tornado Workers (tornado)
    tornado利用python Tornado框架来实现。安装方式是:​​​pip install gunicorn[tornado]​
  2. AsyncIO Workers (tornado)
    gthread采用的是线程工作模式,利用线程池管理连接,安装方式是:​​​pip install gunicorn[gthread]​​​。
    Gunicorn允许每个worker拥有多个线程。在这种场景下,Python应用程序每个worker都会加载一次,同一个worker生成的每个线程共享相同的内存空间。为了在 Gunicorn 中使用多线程。我们使用了 threads 模式。每一次我们使用 threads 模式,worker 的类就会是 gthread:
gunicorn --workers=5 --threads=2 main:app

该命令等同于:

gunicorn --workers=5 --threads=2 --worker-class=gthread main:app

该例中里面的最大并发请求数是 ​​worker*线程​​,也就是10。

性能实践

  1. 如果这个应用是I/O受限,通常可以通过使用**“伪线程”(gevent或asyncio)的工作模式**来得到最佳性能。正如我们了解到的,Gunicorn通过设置合适的worker类并将workers数量调整到​​(2*CPU)+1​​来支持这种编程范式。
  2. 如果这个应用是CPU受限,那么应用程序处理多少并发请求就并不重要,唯一重要的是并行请求的数量。因为Python’s GIL,线程和’伪线程’并不能以并行模式执行,可以将worker的数量改成CPU的核数,理解到最大的并行请求数量其实就是核心数。这时候适合的工作模式是sync工作模式。
  3. 如果不确定应用程序的内存占用,使用多线程以及相应的gthread worker类会产生更好的性能,因为应用程序会在每个worker上都加载一次,并且在同一个worker上运行的每个线程都会共享一些内存,但这需要一些额外的CPU消耗。
  4. 如果你不知道你自己应该选择什么就从最简单的配置开始,就只是 workers 数量设置为 (2*CPU)+1 并且不用考虑 多线程。从这个点开始,就是所有测试和错误的基准环境。如果瓶颈在内存上,就开始引入多线程。如果瓶颈在 I/O 上,就考虑使用不同的 Python 编程范式。如果瓶颈在 CPU 上,就考虑添加更多内核并且调整 workers 数量。

参考

​​Gunicorn介绍​​​​[译] 通过优化 Gunicorn 配置提高性能​​


举报

相关推荐

0 条评论