gunicorn的简单总结-CFANZ编程社区

您好，我是码农飞哥，感谢您阅读本文！本文主要将对gunicorn进行一个简单的总结。

文章目录

gunicorn是什么
gunicorn的安装

安装
查看gunicorn的版本

运行gunicorn
工作模式
性能实践
参考

gunicorn是什么

Gunicorn 是一个 Python 的 WSGI HTTP 服务器。它所在的位置通常是在反向代理（如 Nginx）或者负载均衡（如 AWS ELB）和一个 web 应用（比如 Django 或者 Flask）之间。它是一个移植自Ruby的Unicorn项目的pre-fork worker模型，即支持eventlet，也支持greenlet。

gunicorn的安装

目前Gunicorn只能运行在Linux环境中，不支持windows平台

安装

# 安装最新版本的gunicorn
$ pip install gunicorn
#安装指定版本的gunicorn
pip install gunicorn==19.9.0
#异步模式
pip install gevent==1.4.0

查看gunicorn的版本

$ pip show gunicorn

运行gunicorn

$ gunicorn [OPTIONS] $(MODULE_NAME):$(VARIABLE_NAME)

其中MODULE_NAME对应的是python文件，VARIABLE_NAME对应web应用实例。 [OPTIONS]的参数类型如下：

-c CONFIG, --config=CONFIG 指定项目路径下的配置文件，如gunicorn -c gunicorn.py manage:app。gunicorn.py文件中设置了workers等参数。
-b BIND, --bind=BIND 指定一个服务器的地址和端口，格式是(PORT)。例如：gunicorn -b 0.0.0.0:18005 manage:app
-w WORKERS, --workers=WORKERS 是指定工作进程的数量，单核机器上这个数量一般在2-4个之间。例如：gunicorn -w 4 manage:app。
-n APP_NAME, --name=APP_NAME 指定APP的名称
-k WORKERCLASS, --worker-class=WORKERCLASS 指定工作模式。工作进程运行的模式，一共有 sync, eventlet, gevent, tornado, gthread 五种模式，默认是sys模式
加入- -reload，则代码变更后，gunicorn会自动重启，这样就可以进行开发调试。

工作模式

同步工作模式（Sync Workers(sync)）
这是最基本的工作模式，也是默认的工作模式，线程为native类型。即请求先来后到，排队模式。
异步工作模式（Async Workers(gevent，eventlet)）
gevent和eventlet都是基于Greentlet库，利用python协程实现的。安装方式:
gevent是pip install gunicorn[gevent] eventlet是pip install gunicorn[eventlet] Gunicorn允许通过设置对应的worker类来使用这些异步Python库。这里的设置适用于我们想要在单核机器上运行的gevent：

gunicorn --worker-class=gevent --worker-connections=1000 --workers=3 main:app

worker-connections 是对于 gevent worker 类的特殊设置。(2*CPU)+1 仍然是建议的workers 数量。因为我们仅有一核，我们将会使用 3 个worker。在这种情况下，最大的并发请求数量是3000。（3个worker*1000个连接/worker）
当worker指定为gevent或者evenlet类型时，线程变成基于Greentlet的task(伪线程)，这时候线程数量threads参数是无效的。
使用gevent模式会出现一些兼容性问题。
使用gevent时，系统会使用monkey patch。系统的部分函数会被修改，
有些库会兼容gevent的类型，
例如，任务调度的库apscheduler，web socket需要socketio的库等，需要专门选择gevent的函数。
而有些库则直接无法使用，例如多进程multiprocess。
例如，在一个api请求中，如果需要使用多核cpu资源，采用multiprocess进行多进程计算。则会出现卡死的问题。gevent中，不能使用multiprocess库

Tornado Workers (tornado)
tornado利用python Tornado框架来实现。安装方式是：pip install gunicorn[tornado]
AsyncIO Workers (tornado)
gthread采用的是线程工作模式，利用线程池管理连接，安装方式是：pip install gunicorn[gthread]。
Gunicorn允许每个worker拥有多个线程。在这种场景下，Python应用程序每个worker都会加载一次，同一个worker生成的每个线程共享相同的内存空间。为了在 Gunicorn 中使用多线程。我们使用了 threads 模式。每一次我们使用 threads 模式，worker 的类就会是 gthread：

gunicorn --workers=5 --threads=2 main:app

该命令等同于：

gunicorn --workers=5 --threads=2 --worker-class=gthread main:app

该例中里面的最大并发请求数是 worker*线程，也就是10。

性能实践

如果这个应用是I/O受限，通常可以通过使用**“伪线程”（gevent或asyncio）的工作模式**来得到最佳性能。正如我们了解到的，Gunicorn通过设置合适的worker类并将workers数量调整到（2*CPU）+1来支持这种编程范式。
如果这个应用是CPU受限，那么应用程序处理多少并发请求就并不重要，唯一重要的是并行请求的数量。因为Python’s GIL，线程和’伪线程’并不能以并行模式执行，可以将worker的数量改成CPU的核数，理解到最大的并行请求数量其实就是核心数。这时候适合的工作模式是sync工作模式。
如果不确定应用程序的内存占用，使用多线程以及相应的gthread worker类会产生更好的性能，因为应用程序会在每个worker上都加载一次，并且在同一个worker上运行的每个线程都会共享一些内存，但这需要一些额外的CPU消耗。
如果你不知道你自己应该选择什么就从最简单的配置开始，就只是 workers 数量设置为 (2*CPU)+1 并且不用考虑多线程。从这个点开始，就是所有测试和错误的基准环境。如果瓶颈在内存上，就开始引入多线程。如果瓶颈在 I/O 上，就考虑使用不同的 Python 编程范式。如果瓶颈在 CPU 上，就考虑添加更多内核并且调整 workers 数量。

参考

Gunicorn介绍[译] 通过优化 Gunicorn 配置提高性能