-
Notifications
You must be signed in to change notification settings - Fork 1.9k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
周期的にブツッブツッと切れた音声が出力される #154
Comments
@nukora Converter Settingからバッファ(Input Chunk Num)を伸ばせば解決します。ただし、バッファを伸ばすとラグが大きくなるので、ここはトレードオフになってしまいます。Extra Data Lengthを小さくするとラグは多少減ります。 voice-changer/server/voice_changer/VoiceChanger.py Lines 162 to 260 in fb1be8b
|
元はmultiprocessingで動いてたんですけど、Winネイティブ化(pyinstaller)だったか、Colab対応だったかでシングルスレッドにしないとうまく動かなくなってしまったんですよね。どっちだったか忘れたけど、Colab対応が原因だったらColabはそろそろ切ってmultiprocessingに戻してもよいかなと考えています。 |
@w-okada 多分pyinstallerが原因ですね。multiprocessingの機能を利用する前に適当なところで |
Input Chunk Numを増やして試してみたところ、無音が発生する間隔は長くなりましたが、やはり周期的に無音が挟まってしまいます。 (内部処理が理解できていないため的外れな事を言ってるかもしれませんが、とりあえず起こっている現象を貼っておきます) 【Input Chunk Num = 512】 【Input Chunk Num = 1024】 |
@w-okada とりあえず変換処理だけmultiprocessingでぶん回すように直しました。 この問題を解決するには、多分再生側もプロセスを分けるなり変換処理と同じプロセスでやるなりしないといけないような気がします。流石に眠気が限界なので一旦寝てきます。 |
現在のコードでは、バッファごとに変換し、その再生が終わるまで次のバッファの変換処理が走らないようになっています。なので、あるバッファの再生が終わったタイミングから次のバッファの再生の準備が整うまで音が途切れてしまいます。そこで、Input Chunk Numを大きくするとバッファが増えるので、その分バッファあたりの再生時間が伸びます。つまり、おっしゃるように無音時間の発生間隔が伸びるということです。 |
なるほどです |
あ、前提として、バッファリングと再生はブラウザでやって、変換はサーバ側でやる作りです。 |
まさにこちらが原因でした。 私の環境ですと、48kHzより大きくても小さくても正常に動かなくなるようです。 ご教示いただきありがとうございました! |
はじめまして。
RVCを使用しているのですが、周期的にブツッブツッと切れた音声が出力されてしまいます。
マイク→オーディオインターフェイス→VC Client→VoiceMeeter Banana→Audacity
という流れで録音した音声が以下となります。
(VoiceMeeterを使わずスピーカーに直接出力しても同じような出力になります)
【文章を読み上げたサンプル】
https://user-images.githubusercontent.com/15606184/230758825-264a8bcc-46d4-4569-8ed9-f96265501f4a.mp4
【伸ばした音のサンプル】
https://user-images.githubusercontent.com/15606184/230758838-3499e5cc-a8bc-4b11-9f0d-917e0b7e6e0e.mp4
また、これはVC ClientのDevice Setting→output record機能を使用すると発生しません。
【文章を読み上げたサンプル】
https://user-images.githubusercontent.com/15606184/230758850-55b386c6-2591-499f-ba04-95975834084e.mp4
【伸ばした音のサンプル】
https://user-images.githubusercontent.com/15606184/230758856-105353f6-99d3-4176-baf7-0a942cf38587.mp4
こちら解決する方法はありますでしょうか?
よろしくお願いします。
【環境】
使用方法:
事前ビルド済みBinary v.1.5.1.15b win ONNX(cpu,cuda), PyTorch(cpu,cuda)
start_http_RVC.bat
OS: Windows 11 Pro 22H2
CPU: i9-10850K
GPU: GeForce RTX 3080
RAM: 32GB
The text was updated successfully, but these errors were encountered: