English | 简体中文
使用flet
UI框架,基于CosyVoice2-0.5B
模型的多角色语音克隆项目。
模型运行要求:至少 6GB 可用 RAM 或 GPU 内存, 至少10GB存储空间
- 支持本地音频文件或 URL 直接克隆
- 预设角色一键切换音色
- 历史记录参数快速复用
- 支持模型自动加载
-
在 Releases 中下载对应平台版本,运行并解压
-
模型下载二选一
-
手动下载模型文件
- 下载地址
- v1.0.0及之前版本
- 百度网盘 提取码: y67e
- Onedrive
- Onedrive国内下载地址
- v1.0.1版本
- windows系统
- 百度网盘 提取码: 7yh3
- Onedrive
- Onedrive国内下载地址
- linux系统
- 百度网盘 提取码: 7yh3
- Onedrive
- Onedrive国内下载地址
- windows系统
- v1.0.0及之前版本
- 运行程序后点击
设置
-模型目录
,将模型文件解压至此或将下载的文件移动到该路径下,然后点击
运行模型
-自动下载
,程序将自动解压并运行模型
- 下载地址
-
自动下载模型文件(偶尔较慢,但很方便)
启动后,点击设置界面中的“运行模型”按钮,自动下载模型文件
-
-
windows下双击
Parrot.exe
,linux下./parrot
- 文本内容:需要朗读的内容
- 说话人:选择预设的说话人(选择角色),或自定义说话人
- 提示音频:一段干净的人声音频文件,或可访问的文件URL
- 提示词(语言控制):用于控制朗读该段文字的语言、例如:请使用四川话朗读这段话
- 参考音频文本内容(精准模式):
提示音频
的实际文本内容。例如你选择的音频的内容是 “你好,欢迎使用Parrot”。这里就应该填写 “你好,欢迎使用Parrot”
- 快速推理:直接使用音频进行语音生成,效果较为普通
- 语言控制:效果与
1
类似,但支持通过提示词来更改实际生成的语言 - 精准模式:效果很好,但需要提供
提示音频
的实际文本内容
由于接口未做鉴权,请在内网环境下使用
-
Windows系统
- 下载对应版本的windows模型并解压
- 切换到模型路径,在cmd中执行
python.exe fastapi_app.py
-
Linux系统
- 下载对应版本的linux模型并解压
- 切换到模型路径,在终端中执行
./bin/python3 fastapi_app.py
-
克隆项目
git clone --recursive https://github.com/HG-ha/Parrot.git
-
安装依赖
- 安装 Miniconda(或其他环境管理工具)
- 配置环境:
# 创建并激活环境 conda create -n Parrot -y python=3.10 conda activate Parrot # 安装依赖 pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
-
运行
# 在桌面运行 flet run # 在浏览器中运行 flet run -w --host 127.0.0.1 -p 8000
- 建议不要在系统中安装flutter sdk,这会导致flet编译无响应。在编译时flet会自动安装flutter sdk
- 正确安装flutter sdk的依赖工具
- 克隆项目
git clone https://github.com/HG-ha/Parrot.git cd Parrot
- 安装依赖
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
- 进行编译
- windows:
flet build windows
- linux:
flet build linux
- macos:
flet build macos
- android:
flet build apk
- windows: