Skip to content
/ Parrot Public

基于Cosyvoice2-0.5B模型实现的多角色语音克隆项目,使用flet开发,支持多音色管理、历史记录管理、一键克隆,仅需短短几秒的人声音频即可快速生成。

Notifications You must be signed in to change notification settings

HG-ha/Parrot

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Parrot

English | 简体中文

使用fletUI框架,基于CosyVoice2-0.5B模型的多角色语音克隆项目。

模型运行要求:至少 6GB 可用 RAM 或 GPU 内存, 至少10GB存储空间

主要功能

  • 支持本地音频文件或 URL 直接克隆
  • 预设角色一键切换音色
  • 历史记录参数快速复用
  • 支持模型自动加载

使用指南

开箱即用

  1. Releases 中下载对应平台版本,运行并解压

  2. 模型下载二选一

  3. windows下双击 Parrot.exe,linux下 ./parrot

参数说明

  1. 文本内容:需要朗读的内容
  2. 说话人:选择预设的说话人(选择角色),或自定义说话人
  3. 提示音频:一段干净的人声音频文件,或可访问的文件URL
  4. 提示词(语言控制):用于控制朗读该段文字的语言、例如:请使用四川话朗读这段话
  5. 参考音频文本内容(精准模式):提示音频 的实际文本内容。例如你选择的音频的内容是 “你好,欢迎使用Parrot”。这里就应该填写 “你好,欢迎使用Parrot”

模式区别

  1. 快速推理:直接使用音频进行语音生成,效果较为普通
  2. 语言控制:效果与1类似,但支持通过提示词来更改实际生成的语言
  3. 精准模式:效果很好,但需要提供提示音频的实际文本内容

单独在平台上运行模型API(模型分离场景)

由于接口未做鉴权,请在内网环境下使用

  • Windows系统

    1. 下载对应版本的windows模型并解压
    2. 切换到模型路径,在cmd中执行 python.exe fastapi_app.py
  • Linux系统

    1. 下载对应版本的linux模型并解压
    2. 切换到模型路径,在终端中执行 ./bin/python3 fastapi_app.py

部署开发环境

  1. 克隆项目

    git clone --recursive https://github.com/HG-ha/Parrot.git
  2. 安装依赖

    • 安装 Miniconda(或其他环境管理工具)
    • 配置环境:
      # 创建并激活环境
      conda create -n Parrot -y python=3.10
      conda activate Parrot
      
      # 安装依赖
      pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
  3. 运行

    # 在桌面运行
    flet run
    
    # 在浏览器中运行
    flet run -w --host 127.0.0.1 -p 8000

发布到其他平台

  1. 建议不要在系统中安装flutter sdk,这会导致flet编译无响应。在编译时flet会自动安装flutter sdk
  2. 正确安装flutter sdk的依赖工具
  3. 克隆项目
    git clone https://github.com/HG-ha/Parrot.git
    cd Parrot
  4. 安装依赖
    pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/
  5. 进行编译
    • windows:flet build windows
    • linux:flet build linux
    • macos:flet build macos
    • android:flet build apk

在不同环境下

界面展示

主页面

主页界面

主页界面 - 提供语音克隆核心功能和角色切换

历史记录

历史记录

历史记录页面 - 查看和复用以往的语音克隆参数

角色管理

角色管理

角色管理界面 - 添加、编辑和管理预设角色

系统配置

系统设置

设置界面 - 调整系统参数和模型配置

手机

移动设备

手机主页

About

基于Cosyvoice2-0.5B模型实现的多角色语音克隆项目,使用flet开发,支持多音色管理、历史记录管理、一键克隆,仅需短短几秒的人声音频即可快速生成。

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages