VALL-E-X 用のツール類
フォークした日本語版もあります https://github.com/kuwacom/VALL-E-X-JP
以下本家リポジトリを参考に進めていきます https://github.com/Plachtaa/VALL-E-X
先に本家リポジトリ内のソースコードの一部をコピーしてきます
必要なファイル・フォルダは
customs
data
images
models
modules
nltk_data
prompts
utils
whisper
の計9フォルダです
次に venv
を利用して環境を構築していきます
それぞれのOSにあったコマンドを実行してください (コマンド等が違う場合はその都度修正してください)
Windows
py -3.10 -m venv venv
Linux
python3 -m venv venv
次にモジュールをインストールします
先ほど準備した仮想環境へアクティベートした状態で行ってください
./venv/Scripts/activate
プリセットでは二つの環境のみ用意してありますのでそれ以外の場合は各自変更してください
CUDA 12.1
pip install -r req-cuda-12.1.txt
torch類は https://pytorch.org/get-started/locally/ より手動で入れます
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
CUDA 12.1
pip install -r req.txt
以上で環境の構築は終了です
以下のファイルを実行して動作のテストをしてください
test.py
WEBGUIは本家様作成の物をベースに改造したものがあります(日本語のみ)
以下のファイルを実行して利用してください
launch-ui.py