Bustag老司机车牌自动推荐系统

Bustag 是一个基于 python 异步爬虫框架开发aspider的自动车牌推荐系统, 系统原理为定时爬取最新车牌信息, 然后可以对车牌进行打标(标示是否喜欢), 打标车牌到一定数量可以进行训练并生成模型, 以后就可以基于此模型自动对下载的车牌进行预测是否喜欢, 可以过滤掉大量不喜欢的车牌, 节约时间。

项目说明

1、自动抓取最新车牌信息, 抓取频率可以自定义
2、系统启动后自动开启一次下载, 然后安装设置抓取频率下载
3、车牌打标功能
4、模型训练, 基于当前所有打标数据训练模型
5、有了模型后, 自动预测判断是否喜欢
6、Docker 镜像一键运行, 省去新手配置项目的麻烦
7、项目访问地址: localhost:8000

如何运行项目

windows , mac绿色版如何使用

下载zip包后解压缩到任意目录, 然后在目录下的data目录里, 创建文件config.ini – windows 版: 执行(双击)bustag.exe – mac 版: 执行(双击)bustag – 浏览器访问: localhost:8000, 访问成功说明运行正常, 如果访问不成功, 可以看bustag程序窗口有无报错。

本地源代码安装

懂 python 开发的可以 clone 本项目, 建立一个虚拟环境并按照 requirements.txt 的 python 包后, 在项目根目录下 直接运行 。

python bustag/app/index.py

或者安装了gunicorn
gunicorn bustag.app.index:app --bind='0.0.0.0:8000'

使用 docker 运行(推荐)

1、建立一个目录, 如 bustag, 然后在该目录下建一个子目录 data, data 目录用于保存配置文件以及下载数据的数据库
2、在 data 下需要建立一个文件, config.ini, 该文件用于设置爬取的初始地址, 以及每次下载的最大数量
3、运行命令

linux, mac
  docker run --rm -d -v $(pwd)/data:/app/data -p 8000:8000 gxtrobot/bustag-app

  windows powershell
  docker run --rm -d -v ${PWD}/data:/app/data -p 8000:8000 gxtrobot/bustag-app

如何使用项目

请按照以下顺序

1、到打标页面进行打标, 达到一定数量(喜欢+不喜欢), 比如 300
2 、到其他页面训练模型
3 、坐等系统自动推荐
4、在推荐页面进行确认(确认过的数据转为打标数据)
5、积累更多打标数据, 再次训练模型, 打标数据越多模型效果越好

data 目录文件说明

|____bus.db
|____config.ini
|____crontab.txt
|____model
| |____ label_binarizer.pkl
| |____model.pkl

1、config.ini, (系统配置文件, 必须, 系统启动时候需要此文件 参考文件 )
(1)root_path: 制定bus网站主页地址, 爬虫起始地址, 由于地址可能变化, 确保本机能够访问该地址, 如果需要代理才能访问, 必须开启全局代理, 系统本身无代理设置
(2)count: 每次下载总数, 建议不要太多, 500以下比较好
(3)interval: 每次下载间隔时间, 单位为秒, 建议不要低于1800秒
2、bus.db (数据库文件, 可选, 但是可以放一个现成的库, 有 2000 条数据, 方便直接开始打标, 不需要等下载)
3、crontab.txt (定时下载配置文件, 可选参考例子)
4、model 目录(系统训练生成的模型)

压缩包密码: gxtrobot