django 服务部署教程

熊大2022年7月9日大约 18 分钟约 5428 字

docker 部署

# 基于 Debian9
FROM python:3.12
LABEL authors="熊大"
USER root

ENV PYTHONUNBUFFERED 1
# 标记为生产环境
ENV PRODUCTION 1
# 启动端口
ENV PROJECT_PORT 19028


RUN mkdir -p /root/project/
WORKDIR /root/project/

RUN pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/
# RUN pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple
RUN pip install gunicorn gevent

ADD requirements.txt /root/project/
RUN pip install -r requirements.txt
ADD . /root/project/

EXPOSE ${PROJECT_PORT}

#CMD python manage.py runserver 0:${PROJECT_PORT}
CMD gunicorn --worker-connections=1000 --workers=$((`grep processor /proc/cpuinfo | wc -l`*2+1)) --worker-tmp-dir /dev/shm -b 0.0.0.0:${PROJECT_PORT} --access-logfile - conf.wsgi

Gunicorn 部署

本套部署方案采用了：

Gunicorn来运行wsgi应用，采用unix domain socket服务模式
gevent作为worker，采用epoll监听模型
Supervisor作为守护进程管理程序
nginx作为反向代理web服务器

Gunicorn对静态文件的支持不太好，所以生产环境下常用Nginx作为反向代理服务器

Gunicorn概述

Gunicorn是pre-fork worker model架构

worker model：意味着这个模型有一个master进程，来管理一组worker进程
fork：意味着worker进程是由master进程fork（复刻）出来的
pre-：意味着在任何客户端请求到来之前，就已从master进程fork出了多个worker进程，坐等请求到来
master进程：不管理也不处理http请求，只负责管理worker进程，对worker进程的创建、销毁、以及根据负载情况增减
worker进程：所有worker共用一组listener(Gunicorn支持绑定多个socket)，worker启动时为每个监听器创建一个WSGI Server，实例化了django app，监听端口、接受和解析http请求，调用web app处理，得到处理结果后，再整理成HTTP Response，通过TCP返回给客户端

Gunicorn工作模式

默认的work_class是sync(同步阻塞的网络模型)，
- 一个worker进程一次只处理一个请求，后面的请求会堵塞，性能不佳
- 一个请求一个进程，并发时是非常消耗CPU和内存的，只能适合在访问量不大、CPU密集而非I/O的情形
- 优点是即使一个worker的进程瘫痪了也只影响到一个请求，不会影响其他的请求
- 如果是CPU密集型的web app，那么并发请求数量就不重要了，重要的是并行请求数量，可以将worker数改为CPU核数，最大并行请求数量就是核心数，这时候适合sync工作模式
gevent(异步模式，基于Greenlet协程+libev快速事件循环实现的，利用python协程实现)
- gevent最好的地方在于，当你的web app是同步处理请求时，而你又需要赋予它异步的能力，不需要改代码，只需要打个猴子补丁(monkey patch)，Gevent就会帮你改造Python标准库和一些第三方库，使具备异步处理请求的能力
- gevent虽然只有一个线程，同时只能处理一个请求，但每个请求的连接是一个Greenlet协程(函数级线程)，可以在IO等待时主动yield出控制权而不阻塞其他请求
- gevent的线程会变成基于Greentlet的task伪线程，线程数量配置参数threads无效
- gevent在不同请求间不断切换从而实现并发的方式，很适合于外部IO密集型(访问数据库、访问第三方API)的web app
- 使用该工作模式需安装：pip install gevent
eventlet(异步模式，基于Greenlet协程实现的)
- eventlet的线程会变成基于Greentlet的task伪线程，线程数量配置参数threads无效
- 使用该工作模型需安装：pip install eventlet
tornado(利用Tornado框架实现)
- 使用该工作模式需安装：pip install tornado
gthread(采用多线程工作模式)
- gthread是一种全线程worker，worker与线程池保持连接，线程会等待接受请求，一个请求一个线程。可以配置进程数和线程数(threads参数)来控制
- 应用程序会在每个worker上都加载一次，每个worker上的每个线程都会共享一些内存，但回消耗额外的CPU资源，如果不确定app的内容占用，可以使用gthread模式
- 使用该工作模式需安装：pip install gthread
gaiohttp(利用aiohttp库实现异步I/O，支持web socket)

Gunicorn使用

在项目根目录建立配置文件gunicorn.conf.py

gevent模式

import multiprocessing

chdir = '/var/www/demo'  # 运行前切换工作目录，好处是命令行后面可以写app的相对路径

bind = '0.0.0.0:8000'  # 绑定服务的IP和端口
workers = multiprocessing.cpu_count() * 2 + 1  # 进程数量

worker_class = "gevent"  # 进程的工作类型，包括sync（默认）、gevent、eventlet、tornado、gthread、gaiohttp
worker_connections = 1000  # 每个worker的协程最大并发请求数，gevent和eventlet的特殊配置，默认值是1000

daemon = 'false'  # 是否以守护进程启动，交给supervisor管理
proc_name = 'demo_gunicorn'  # 进程名称，默认是gunicorn
errorlog = '/var/log/gunicorn/gunicorn_error.log'  # 错误日志文件存放路径

配置选项说明

import logging
import logging.handlers
from logging.handlers import WatchedFileHandler
import os
import multiprocessing

bind = '127.0.0.1:8000'      #绑定ip和端口号
worker_class = 'gevent' #使用gevent模式，还可以使用sync 模式，默认的是sync模式
workers = multiprocessing.cpu_count() * 2 + 1  # 进程数
threads = 2  # 指定gthread模式下每个worker进程开启的线程数。如果指定该参数，工作模式自动变成gthread

backlog = 2048  # 未结连接的最大数量，即等待服务的客户数量，默认是2048个，一般不修改
max_requests = 5000  # 在重启worker进程前，限制能处理的最大请求数,帮助限制内存泄漏最简单方法。默认为0，代表禁用worker自动重启功能。
timeout = 30      # 在同步模式下，worker处理单个请求超时没有响应将被杀死重启，默认30秒。异步worker则不收此参数影响
keepalive = 2  # 在keep-alive连接上等待请求的秒数，默认2秒超时，一般设置1-5秒。

limit_request_line = 4094  # 限制HTTP请求行的最大大小，默认为4094，最大可设置为8190。此参数可以防止任何DDOS攻击
limit_request_fields = 101  # 限制HTTP请求头字段数量，默认为100，最大可设置为32768，此参数可以防止DDOS攻击
limit_request_field_size = 8190  # 限制HTTP请求头大小，默认为8190，当为0时代表不限制

# debug = True  # 当代码变动时会自动重启
# reload= True  # 当代码变动时会自动重启，用于开发环境

pythonpath='/home/your_path/venv/bin/python3'  # 设置python虚拟环境
raw_env = 'APE_API_ENV=DEV'  # 设置环境变量
chdir = '/var/www/demo'  # 加载应用程序前，切换工作目录

pidfile = '/run/gunicorn.pid'  # pid文件存放路径

loglevel = 'info' # 错误日志级别（访问日志的级别无法设置）
access_log_format = '%(t)s %(p)s %(h)s "%(r)s" %(s)s %(L)s %(b)s %(f)s" "%(a)s"'    # 设置访问日志格式，错误日志无法设置
# access_log_format = '%({X-Real-IP}i)s %(t)s "%(r)s" %(s)s %(b)s "%(f)s" "%(a)s"'
accesslog = "/var/log/gunicorn/gunicorn_access.log"      # 访问日志文件路径
errorlog = "/var/log/gunicorn/log/gunicorn_error.log"        # 错误日志文件路径

官方配置说明：进入官方文档

运行Gunicorn服务

gunicorn -c gunicorn.conf.py  project_name.wsgi:application

提示

上述命令后面的wsgi.py文件路径，请在项目中查找并与之对应

application是wsgi.py文件的一个变量，变量里面装的是web应用
app变量名称如果是application也可以不写到命令，命令选项缺省情况下自动查找该变量

Supervisor 守护进程管理器

概述

Supervisor组成部分：

/etc/supervisord.conf：服务配置文件
supervisord: 服务守护进程
supervisorctl：命令行客户端
Web Server：Web管理客户端界面，默认监听在9091上
XML-RPC Interface：XML-RPC接口

安装：

apt install supervisor
systemctl enable supervisord
systemctl start supervisord

supervisorctl命令

# 启动supervisord
supervisord -c project_name/devops/supervisor_gunicorn.conf
# 关闭supervisord
supervisorctl shutdown
# 关闭supervisord
systemctl stop supervisord

supervisorctl reload  # 重启服务并重新加载配置文件，更新配置后执行可生效（命令好用）
supervisorctl update  # 重新加载配置文件，更新配置后执行可生效

# 应用服务管理
supervisorctl start/stop/restart [program_name]/all  # 注意这里不会重新加载配置文件
supervisorctl status  # 查看所子进程状态

如果没有配置-c选项，则会按照以下指定顺序查找supervisord.conf文件，并将使用它找到的第一个文件。

../etc/supervisord.conf（相对于可执行文件）
../supervisord.conf（相对于可执行文件）
$CWD/supervisord.conf
$CWD/etc/supervisord.conf
/etc/supervisord.conf
/etc/supervisor/supervisord.conf（从 Supervisor 3.3.0 开始）

报错指南

BACKOFF Exited too quickly (process log may have details)

Supervisor只能管理前台应用程序，如果应用程序是通过fork方式实现的daemon服务，像Apache Tomcat Nginx服务默认按daemon方式启动(systemctl start nginx)，则不能被管理。

Permission权限问题

有时候提示往/tmp文件夹写入文件提示PermissionErr，检查supervisor配置文件，可以设置为user=root。

exit status 127; not expected

127表示命令没找到，首先可能是directory写错，用cd命令看一下，然后可能是command命令写错，复制命令在控制台试试是否gunicorn无法使用。

WSGI配置

>>> vim wsgi.py
import os
import sys
from django.core.wsgi import get_wsgi_application

BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))
sys.path.append(BASE_DIR)
#os.environ.setdefault("DJANGO_SETTINGS_MODULE", "project.settings")
os.environ["DJANGO_SETTINGS_MODULE"] = "project.settings"
application = get_wsgi_application()

排坑指南

上传文件时，中文名报错

解决修改http服务器配置，使用UTF-8字节码：vim /etc/sysconfig/httpd，LANG=en_US.UTF-8

gevent模式与multiprocess多进程库兼容问题

使用gevent模式时，系统会使用monkey patch，系统部分函数会被修改，有些库会兼容gevent的类型，例如，任务调度的库apscheduler，web socket需要socketio的库等，需要专门选择gevent的函数。而有些库则直接无法使用，例如多进程multiprocess。例如，在一个api请求中，如果需要使用多核cpu资源，采用multiprocess进行多进程计算。则会出现卡死的问题。gevent中，不能使用multiprocess库。