0%

高性能WSGI Gunicorn

为什么要使用Gunicorn

Flask自带的web服务器可用于开发环境运行调试,不适合部署在生产环境,无法满足线上的性能要求。

当使用,以下命令启动Flask应用时:

1
app.run(host = '0.0.0.0',port=6000)

Flask框架会有一段

WARNING: This is a development server. Do not use it in a production deployment. Use a production WSGI server instead.

image-20240624182739132

Gunicorn是基于unix系统,被广泛应用的高性能的Python WSGI HTTP Server。用来解析HTTP请求的网关服务。它通常是在进行反向代理(如nginx),或者进行负载均衡(如AWS ELB)和一个web 应用(比如Django或者Flask)之间。

目前,gunicorn只能运行在Linux环境中,不支持windows平台。

Gunicorn安装

安装好Python环境后使用一下命令即可完成安装:

1
pip install gunicorn

一般使用它,主要是为使用其异步的worker模型,还需要安装对应的异步模块。

1
2
3
pip install greenlet # 使用异步必须安装
pip install eventlet # 使用eventlet workers
pip install gevent # 使用gevent workers

Gunicorn的使用

快速使用

我们使用以下代码编写一个简单的Flask应用:

main.py文件

1
2
3
4
5
6
7
8
9
10
from flask import Flask

app = Flask(__name__)

@app.route('/',methods=['GET'])
def hello_world():
return 'Hello World!'

if __name__ == '__main__':
app.run(host='0.0.0.0', port=6000)

使用gunicorn 命令启动此应用。

1
gunicorn -w 5 -b 0.0.0.0:6000 -t 120 main:app

windows系统会报错:`ModuleNotFoundError: No module named 'fcntl',原因是 gunicorn不支持windows,在linux上可正常运行。

参数解释:

  • -w:表示工作进程数
  • -b :访问地址和端口
  • -t:设置超时时间120秒,默认30秒
  • mainFlask启动python文件名
  • app :脚本中创建的Flask对象名

如果生产环境,必不可少还需要配置日志信息,如下:

1
gunicorn -w 4 -b 0.0.0.0:8080 --access-logfile access.log --error-logfile error.log app:app

--access-logfile access.log:将正常日志写入access.log

--error-logfile error.log app:app:将应用错误日志写入error.log

使用配置文件启动

example.py配置文件

1
2
3
4
5
6
7
8
9
10
11
12
13
import multiprocessing

bind = '127.0.0.1:8000' # IP地址和端口号
workers = multiprocessing.cpu_count() * 2 + 1 # 工作进程的数量

backlog = 2048 # 最大挂起连接数
worker_class = "gevent" # 工作进程类型,包括sync(默认),eventlet,gevent,tornado,gthread,gaiohttp
worker_connections = 1000 # 最大客户端并发数量
daemon = False # 后台进程方式运行gunicorn进程
debug = True # 是否开启debug模式
proc_name = 'gunicorn_demo' #
pidfile = './log/gunicorn.pid' # 存放日志路径
errorlog = './log/gunicorn.log' # 存放错误请求日志路径

启动Gunicorn

1
gunicorn -c example.py main:app

更多配置项

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
-c CONFIG    : CONFIG,配置文件的路径,通过配置文件启动;生产环境使用;
-b ADDRESS : ADDRESS,ip加端口,绑定运行的主机;
-w INT, --workers INT:用于处理工作进程的数量,为正整数,默认为1;
-k STRTING, --worker-class STRTING:要使用的工作模式,默认为sync异步,可以下载eventlet和gevent并指定
--threads INT:处理请求的工作线程数,使用指定数量的线程运行每个worker。为正整数,默认为1。
--worker-connections INT:最大客户端并发数量,默认情况下这个值为1000。
--backlog int:未决连接的最大数量,即等待服务的客户的数量。默认2048个,一般不修改;
-p FILE, --pid FILE:设置pid文件的文件名,如果不设置将不会创建pid文件
--access-logfile FILE : 要写入的访问日志目录
--access-logformat STRING:要写入的访问日志格式
--error-logfile FILE, --log-file FILE : 要写入错误日志的文件目录。
--log-level LEVEL : 错误日志输出等级。
--limit-request-line INT : HTTP请求头的行数的最大大小,此参数用于限制HTTP请求行的允许大小,默认情况下,这个值为4094。值是0~8190的数字。
--limit-request-fields INT : 限制HTTP请求中请求头字段的数量。此字段用于限制请求头字段的数量以防止DDOS攻击,默认情况下,这个值为100,这个值不能超过32768
--limit-request-field-size INT : 限制HTTP请求中请求头的大小,默认情况下这个值为8190字节。值是一个整数或者0,当该值为0时,表示将对请求头大小不做限制
-t INT, --timeout INT:超过这么多秒后工作将被杀掉,并重新启动。一般设定为30秒;
--daemon: 是否以守护进程启动,默认false
--chdir: 在加载应用程序之前切换目录;
--graceful-timeout INT:默认情况下,这个值为30,在超时(从接收到重启信号开始)之后仍然活着的工作将被强行杀死;一般使用默认;
--keep-alive INT:在keep-alive连接上等待请求的秒数,默认情况下值为2。一般设定在1~5秒之间。
--reload:默认为False。此设置用于开发,每当应用程序发生更改时,都会导致工作重新启动。
--spew:打印服务器执行过的每一条语句,默认False。此选择为原子性的,即要么全部打印,要么全部不打印;
--check-config :显示现在的配置,默认值为False,即显示。
-e ENV, --env ENV: 设置环境变量;
-------------本文结束感谢您的阅读-------------