WD14-Batch

~~面向 ChatGPT 编程的产物。~~

完全离线且本地的批量打标工具。原始项目：Ketengan-Diffusion/wdv3-batch-vit-tagger

目录结构

├─input
├─model
│  ├─wd-eva02-large-tagger-v3
│  │      model.onnx
│  │      selected_tags.csv
│  │      
│  └─wd-vit-tagger-v3
│          model.onnx
│          selected_tags.csv
│          
└─python
│  ├─ ...
│  caption.py
│  requirements.txt
│  run.bat
│  run2.bat

安装

requirements.txt 使用 pip freeze >> requirements.txt 生成，所有包依赖指定了版本。

安装参考，不用安装 torch 。或者按常规的 venv 虚拟环境或 conda 折腾。

获取模型

打开大佬主页，选一个模型。

在 model 目录使用 git clone 拉取，或者打开对应模型地址，单独下载 model.onnx 和 selected_tags.csv 。

无特殊需求，使用 wd-eva02-large-tagger-v3 就够了。

# model.onnx 和 selected_tags.csv 一共 1.17 GB 。拉取会获取多余的文件，三四G左右。
git clone https://huggingface.co/SmilingWolf/wd-eva02-large-tagger-v3

使用

把图片丢 input 目录中，运行 run2.bat 。

或者运行 run.bat 后执行 python caption.py -h 查看帮助。

以下仅供参考。不同的图片处理时间差异很小。

农企 5700x 占用百分之五十五附近，每一张图耗时两秒左右。使用小模型速度会更快。

牙膏厂 i5-9400F 系统自带壁纸会跑满 CPU ，每张图耗时接近三秒。

牙膏厂 i7-10750H 人物图最高百分之七十五，耗时四五秒。

自定义

如果需要修改使用特定模型，编辑 caption.py 把模型路径改成想要使用的模型所在的位置。

MODEL_DIR = "wd-eva02-large-tagger-v3"
或者
MODEL_DIR = "wd-vit-tagger-v3"
...

addtxt.py：遍历特定目录下的 txt 文件，在文件开头写入指定文本。一般是打标后添加召唤词用。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

WD14-Batch

目录结构

安装

获取模型

使用

自定义

Files

README.md

Latest commit

History

README.md

File metadata and controls

WD14-Batch

目录结构

安装

获取模型

使用

自定义