您好,我是码农飞哥,感谢您阅读本文!本文主要将对gunicorn进行一个简单的总结。
文章目录
- gunicorn是什么
- gunicorn的安装
- 安装
- 查看gunicorn的版本
- 运行gunicorn
- 工作模式
- 性能实践
- 参考
gunicorn是什么
Gunicorn 是一个 Python 的 WSGI HTTP 服务器。它所在的位置通常是在反向代理(如 Nginx)或者 负载均衡(如 AWS ELB)和一个 web 应用(比如 Django 或者 Flask)之间。它是一个移植自Ruby的Unicorn项目的pre-fork worker模型,即支持eventlet,也支持greenlet。
gunicorn的安装
目前Gunicorn只能运行在Linux环境中,不支持windows平台
安装
# 安装最新版本的gunicorn
$ pip install gunicorn
#安装指定版本的gunicorn
pip install gunicorn==19.9.0
#异步模式
pip install gevent==1.4.0
查看gunicorn的版本
$ pip show gunicorn
运行gunicorn
$ gunicorn [OPTIONS] $(MODULE_NAME):$(VARIABLE_NAME)
其中MODULE_NAME对应的是python文件,VARIABLE_NAME对应web应用实例。 [OPTIONS]
的参数类型如下:
-
-c CONFIG, --config=CONFIG
指定项目路径下的配置文件,如gunicorn -c gunicorn.py manage:app
。gunicorn.py文件中设置了workers等参数。 -
-b BIND, --bind=BIND
指定一个服务器的地址和端口,格式是(PORT)。例如:
gunicorn -b 0.0.0.0:18005 manage:app
-
-w WORKERS, --workers=WORKERS
是指定工作进程的数量,单核机器上这个数量一般在2-4个之间。例如:gunicorn -w 4 manage:app
。 -
-n APP_NAME, --name=APP_NAME
指定APP的名称 -
-k WORKERCLASS, --worker-class=WORKERCLASS
指定工作模式。工作进程运行的模式,一共有 sync, eventlet, gevent, tornado, gthread 五种模式,默认是sys模式 - 加入- -reload,则代码变更后,gunicorn会自动重启,这样就可以进行开发调试。
工作模式
- 同步工作模式(Sync Workers(sync))
这是最基本的工作模式,也是默认的工作模式,线程为native类型。即请求先来后到,排队模式。 - 异步工作模式(Async Workers(gevent,eventlet))
gevent和eventlet都是基于Greentlet库,利用python协程实现的。安装方式:
gevent是pip install gunicorn[gevent]
eventlet是pip install gunicorn[eventlet]
Gunicorn允许通过设置对应的worker类来使用这些异步Python库。这里的设置适用于我们想要在单核机器上运行的gevent:
gunicorn --worker-class=gevent --worker-connections=1000 --workers=3 main:app
worker-connections 是对于 gevent worker 类的特殊设置。(2*CPU)+1
仍然是建议的workers 数量。因为我们仅有一核,我们将会使用 3 个worker。在这种情况下,最大的并发请求数量是3000。(3个worker*1000个连接/worker
)
当worker指定为gevent或者evenlet类型时,线程变成基于Greentlet的task(伪线程),这时候线程数量threads参数是无效的。
使用gevent模式会出现一些兼容性问题。
使用gevent时,系统会使用monkey patch。系统的部分函数会被修改,
有些库会兼容gevent的类型,
例如,任务调度的库apscheduler,web socket需要socketio的库等,需要专门选择gevent的函数。
而有些库则直接无法使用,例如多进程multiprocess。
例如,在一个api请求中,如果需要使用多核cpu资源,采用multiprocess进行多进程计算。则会出现卡死的问题。gevent中,不能使用multiprocess库
- Tornado Workers (tornado)
tornado利用python Tornado框架来实现。安装方式是:pip install gunicorn[tornado]
- AsyncIO Workers (tornado)
gthread采用的是线程工作模式,利用线程池管理连接,安装方式是:pip install gunicorn[gthread]
。
Gunicorn允许每个worker拥有多个线程。在这种场景下,Python应用程序每个worker都会加载一次,同一个worker生成的每个线程共享相同的内存空间。为了在 Gunicorn 中使用多线程。我们使用了 threads 模式。每一次我们使用 threads 模式,worker 的类就会是 gthread:
gunicorn --workers=5 --threads=2 main:app
该命令等同于:
gunicorn --workers=5 --threads=2 --worker-class=gthread main:app
该例中里面的最大并发请求数是 worker*线程
,也就是10。
性能实践
- 如果这个应用是I/O受限,通常可以通过使用**“伪线程”(gevent或asyncio)的工作模式**来得到最佳性能。正如我们了解到的,Gunicorn通过设置合适的worker类并将workers数量调整到
(2*CPU)+1
来支持这种编程范式。 - 如果这个应用是CPU受限,那么应用程序处理多少并发请求就并不重要,唯一重要的是并行请求的数量。因为Python’s GIL,线程和’伪线程’并不能以并行模式执行,可以将worker的数量改成CPU的核数,理解到最大的并行请求数量其实就是核心数。这时候适合的工作模式是sync工作模式。
- 如果不确定应用程序的内存占用,使用多线程以及相应的gthread worker类会产生更好的性能,因为应用程序会在每个worker上都加载一次,并且在同一个worker上运行的每个线程都会共享一些内存,但这需要一些额外的CPU消耗。
- 如果你不知道你自己应该选择什么就从最简单的配置开始,就只是 workers 数量设置为 (2*CPU)+1 并且不用考虑 多线程。从这个点开始,就是所有测试和错误的基准环境。如果瓶颈在内存上,就开始引入多线程。如果瓶颈在 I/O 上,就考虑使用不同的 Python 编程范式。如果瓶颈在 CPU 上,就考虑添加更多内核并且调整 workers 数量。
参考
Gunicorn介绍[译] 通过优化 Gunicorn 配置提高性能