目标:
1、 将Django项目部署到docker上,相关数据挂载于宿主机上;
2、使用django-crontab定时模块,确保定时模块正常启动;
我的django项目结构(普普通通,没有重点)
mysite/
|-- mysite
| |-- __init__.py
| |-- settings.py
| |-- urls.py
| |-- views.py
| `-- wsgi.py
`-- manage.py
1、生成项目使用的第三方库文件requirements.txt
在django项目的虚拟环境里,通过下面命令导出项目的第三方库依赖包名称
pip freeze > requirements.txt
此外,由于我的爬虫项目需要走socks5代理(window电脑上的V2ray代理),因此还需要在requirements.txt文件中加入库名pysocks
,最终requirements.txt文件内容如下:
asgiref==3.3.1
certifi==2020.11.8
chardet==3.0.4
Django==3.1.3
django-crontab==0.7.1
et-xmlfile==1.0.1
idna==2.10
jdcal==1.4.1
lxml==4.6.2
PyMySQL==0.10.1
pytz==2020.4
requests==2.25.0
sqlparse==0.4.1
urllib3==1.26.2
pysocks
2、 准备Dockerfile 镜像构建文件,创建名字Dockerfile的文件,内容如下(各命令作用已注释)
# 环境python:3.8.6
FROM python:3.8.6
#MAINTAINER 维护者信息
MAINTAINER 孙思锴
# 启动python环境缓存,可以将print等输出到控制台
ENV PYTHONUNBUFFERED 1
# 复制 第三方库依赖名称文件到环境
COPY requirements.txt /
# 设置时区; # 修改apt源为阿里 # 更新apt源 # 安装cron服务(用于定时任务)
# 删除软件包(减少包镜像体积) # 清理apt缓存 # 安装python第三方库
RUN ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime \
&& sed -i s@/deb.debian.org/@/mirrors.aliyun.com/@g /etc/apt/sources.list \
&& apt-get update \
&& apt-get install -y --no-install-recommends cron \
# && apt-get -y install vim \
&& rm -rf /var/lib/apt/lists/* \
&& apt-get clean \
&& pip install -r /requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/
# 暴露8000端口
EXPOSE 8000
# 先启动cron服务(项目用到了django-crontab的定时任务,其需要linux的cron服务来支持);再将定时任务启动(django-crontab语法要求),最后再启动django工程。
CMD sh -c '/etc/init.d/cron start && python /mysite/manage.py crontab add && python /mysite/manage.py runserver 0.0.0.0:8000'
3、 开始构建镜像
Dockerfile文件、requirements.txt 文件放在同一个目录下,在该目录下打开命令行窗口,执行以下命令,生成镜像文件
docker build -t mysite:4.0 .
镜像名称mysite,版本4.0,不要漏掉命令最后面一点
4、创建容器
docker run -d --name mysite4 -p 8001:8000 --restart=on-failure:3 -v E:\DockerHouse\Django\mysite:/mysite -w /mysite mysite:4.0
上面命令解释如下:
-d 后台运行容器,如果需要进入容器,则使用-it命令
--name mysite4 容器命名mysite4
-p 8001:8000 将容器的8000端口映射到主机8001端口
--restart=on-failure:3 非正常关闭容器重启次数为3,防止宿主机意外关闭
-v E:\DockerHouse\Django\mysite:/mysite 文件挂载,/mysite位置是Django项目
-w /mysite 指定工作目录,下次进入容器才不用频繁切换目录
至此,容器创建完毕,容器启动后先启动cron服务,再将django项目的定时任务添加到cron,最后才会启动django项目。
5、补充
1、 步骤4创建容器后,由于我们设置的是容器在后台静默运行,如果需要进入容器内,可使用命令: docker exec -it mysite4 bash
2、 mysite4容器启动后,django-crontab的定时任务不会立即启动,因为其本质是将任务交给了linux的cron服务,所以至少要过 1、2 分钟后任务才会被调用,如果需要立马执行任务,可以重启 cron服务。
django-crontab模块命令如下:
python manage.py crontab add # 将任务添加并生效
python manage.py crontab show # 显示当前的定时任务
python manage.py crontab remove # 删除所有定时任务
补充:django-crontab定时模块,需要使用 add 命令才能将任务添加到cron并生效。
前面构建Dockerfile文件时,已设置了容器启动执行add命令,后面就不再执行add命令。
linux上的cron服务命令:
查看状态: /etc/init.d/cron status
启动: /etc/init.d/cron start
关闭: /etc/init.d/cron stop
重启: /etc/init.d/cron restart
重新载入配置: /etc/init.d/cron reload
列出目前的任务表: crontab -l
删除目前的任务表: crontab -r
2、可使用命令date
查看容器使用的时区(确保定时任务不会跑偏)
3、window 检测被占用的端口
netsh interface ipv4 show excludedportrange protocol=tcp
4、查看容器的代理配置
set | grep -i all_proxy # 查看代理配置
unset all_proxy # 关闭代理配置
curl http://pv.sohu.com/cityjson?ie=utf-8 # 查看当前ip的地理位置(搜狐接口)
5、遇到报错(已解决)
requests.exceptions.InvalidSchema: Missing dependencies for SOCKS support.
requests不支持SOCKS代理 ,安装依赖库即可 pip install pysocks