【RVC】初心者の方向けにRVCの導入からモデルが出来るまで全部解説してみたよ【AIボイチェン】
Ойындар
RVCの導入→素材の用意→学習までワンセットで解説しています
解らなければコメントへ(わかる範囲でお答えします…)
VC Clientで女の子になろう!(ローカル環境)
• 【AIボイチェン】VC Clientで女の子...
歌わせてみよう
• 【RVC】実際に歌わせてみたを作ってみよう!...
・python
www.python.org/downloads/
・7zip
7-zip.opensource.jp/download....
・RVC Web UI
huggingface.co/lj1995/VoiceCo...
・KZread→MP3
www.y2mate.com/jp/youtube-mp3...
(広告注意)
→Any Video Converterが楽。ダウンロードからWAV変換がこのソフトでできる無料です。
www.any-video-converter.jp/an...
Audacity
www.audacityteam.org/
もものせTwitter
/ yumeno_momonose
イラストレータ
ねいろ様
モデリング
おかだ様
Пікірлер: 396
00:00 開始 00:35 python 7zip 導入 03:38 RVC 導入 08:07 Audacity 導入 09:08 学習素材収集 12:56 学習素材編集 19:00 学習
欲しい時に欲しい情報が上がってる。不思議なチャンネル。
ちょうど導入、確認している際に最新の動画が投稿されていた!解説ありがとうございます…!
@yumeno_momonose
5 ай бұрын
タイミングばっちりでしたね!ぜひ頑張ってみてください☆
もものせさんの最初の動画のおかげでRVCにはまり、気付いたら30人以上の学習データを作成していました。 クオリティに関しても文句のない出来で、本当に参考になりました。 音声データ探しがどうしてもネックですが、やっていて楽しいので本当に感謝してます。
@yumeno_momonose
3 ай бұрын
コメントありがとうございます! めっちゃ楽しまれてますね!解説動画出してみてよかったです 音声素材の入手が一番大変ですもんねー…
毎回わかりやすい解説助かる
@yumeno_momonose
4 ай бұрын
見てくれて助かるです(*'ω'*)
動画のおかげでRVCモデル作成することができました…!感謝です…! 使用素材的に200や600回が良いかと試したところ、3時間や6時間かかって驚きましたね…。 どの学習回数が良いのか知るために試行錯誤するのが大変…!
@yumeno_momonose
5 ай бұрын
ご視聴感謝☆完成おめでとうございます🎉 声質によっても違ったりすますが、何回もやってるとある程度感覚がわかってきますよ…!
めっちゃ詳しい解説お疲れさまでした! 凄い!今までのアップデート集大成、「これさえ見ればRVCはOK!」の決定版みたいな感じですね(^^) 何度も見返して勉強させていただきますね!
@yumeno_momonose
5 ай бұрын
ありがとうございます☆
BGMで解説が入ってこないけどこれがこのチャンネルの特徴
AI学習関連で一番わかりやすくてかなりお世話になってます🙇♀️ 人力ボカロ作る時にアニメから50音抽出するんじゃなくてAIに学習させて50音採取するっていうズルしてます…
@yumeno_momonose
5 ай бұрын
ありがとうございます(*'ω'*) AIはうまく使えばとっても便利なものなのでとってもいい使い方だとおもいますよ☆
やっと更新したね! ももちゃ…しっかり見させてもらうよ^^
@yumeno_momonose
5 ай бұрын
めっちゃさぼってしまった…('ω') 感謝☆
凄いわかりやすかったので、可能であれば過去の学習モデルで推論する方法も動画にぜひまとめてほしいです!
@yumeno_momonose
Ай бұрын
ありがとうございます! 近く動画をつくりますね!
わかりやすい動画ありがとうございます この動画の作業が終わった後の手順って概要欄の動画に続いていくかんじですかね? あと2人以上の素材を組み合わせるのって可能なんですかね?
@yumeno_momonose
5 ай бұрын
ご視聴ありがとうございます! この動画で完成した音声モデルを使って概要欄にあるVC Clientで女の子になろうの動画で解説しているソフトでリアルタイムボイチェンジが可能になります…!学習時にAの声とBの声を混ぜるとあまりよくないと思います…AとBを別々に学習させて混ぜる(mergeといいます)ことは可能ですよー!
いつも有益な情報をありがとうございます。 自分でモデルを作るメリットとしては、好みの声にできること以外に何があるでしょうか?
@yumeno_momonose
5 ай бұрын
ご視聴ありがとうございます☆ 自分で好みのものを作れる、販売や配布物では品質に満足できない場合、いろいろと素材を追加したり変えたりして作れることが大きいと思います…!
もものせさんの動画を見て最後まで作ることが出来ました!無知な私で申し訳ないのですがこの後は何をすればボイスチェンジ出来ますか?動画などがあれば教えて欲しいです!
@yumeno_momonose
4 ай бұрын
VC Clientで女の子になろう!2023.8月版というのが参考になると思います…!
@user-eg1pi4fl9y
4 ай бұрын
@@yumeno_momonose ありがとうございます!
頑張った👍
@yumeno_momonose
5 ай бұрын
疲れ申した('ω')笑
勉強になりました!別言語の声を素材にすると変になるのでしょうか??
@yumeno_momonose
4 ай бұрын
できないことはないですが、若干活舌が甘くなりがちですね…
失礼な日本語だったらごめんなさい。 uvr5を使用することは多くないですか?品質が下がりますか? それと元の素材がどれぐらいの時間あればよいですか? 5分のファイルが何戸で品質が良くなりますか? 動画の説明の中で説明していたらごめんなさい。
@yumeno_momonose
4 ай бұрын
大丈夫ですよ! どうしても品質が落ちやすいので基本的にUVR5は使わないですね。 元々音声にBGMやSEがないものを使った方が品質は圧倒的に高いです! 5分の音声を8~10個くらい用意するのがいいと思います!学習品質は元の音声の品質が良ければ良いほど高くなります。(日本語でのご質問ありがとうございます(*'ω'*))
ワンクリックトレーニングで毎回エラー吐いて出力できません。どうしたらよいでしょうか? 途中に日本語のフォルダやファイルは無いです。 追記「ValueError: 40000 SR doesn't match target 48000 SR」と最後出て進めません 追追記色々試したら成功しました!まだ試行錯誤してみます!
何回か作ってみたのですが、思い通りの声になりません、、 30秒~1分ほどの音声素材を50個ほど学習させていたのですが、もしかしたら音声素材の時間は長い方が良い等ありますか?
@yumeno_momonose
4 ай бұрын
遅くなってすみません💦 まず、元素材の品質がかなり影響いたします。同じ人物の声だとしても配信や動画をまたぐと収録環境が変わっていたりして聞こえ方が違ってくるものがあると思いますがそういったものを混ぜるのは品質の低下につながります。可能であれば同じ配信などから合計1時間分くらいを抜き出すのがよろしいかと思います。また最近は5分程度の音声を12個学習するようにしていますね!
女の子の声かわいいですね😋つい吹き出してしまいました。早速ですが、学習終了したのですが(ちなみに150回学習で12時間かかりました😱)pthファイルはできてたのですがindexファイルが見つかりません。この場合どのように対処したらよろしいでしょうか?😢
@yumeno_momonose
4 ай бұрын
ありがとうございます(*'ω'*) indexが生成されない場合は同じ学習名、パス、設定値でデータ処理→特徴抽出→特徴インデックスのトレーニングを行えば再生成されると思いますよ!
@Chill_Vibes_Playlist
4 ай бұрын
@@yumeno_momonose 早速の対応ありがとうございます。できましたありがとうございました。
コメント失礼します。 声がコンプレックスで使ってみようと思ったのですが、5GBのファイルをダウンロードすると容量オーバーになってしまいました。 使うにはマイクロソフトのサブスクリプションに加入するしかないのでしょうか?
@yumeno_momonose
3 ай бұрын
モデルの作成には最低15GB程度(RVC本体を含め)必要ですね💦 不要なゲームデータなどがあれば削除して容量を空けるなどするかローカルでの学習ではなくGoogleコラボラトリーでの学習を視野に入れるといいと思います…!
スムーズに動くスペックってどのくらいでしょうか? 使ってる環境お聴きしたいです!
@yumeno_momonose
5 ай бұрын
学習させるならVRAM12GBくらいあるグラボだといい感じです! 今はメインパソコンが壊れてしまっているのでサブPCですが ryzen7 1700 RAM16GB RTX4090 といった構成です!
@user-fy4yd1sy5y
5 ай бұрын
ありがとうございます! 調べてみます!
久しぶりに見たら、バージョン2.0になってるんですね 去年の11月頃に使ってた(多分v1.6頃)のですが 2.0になって結構変わってますか?
@yumeno_momonose
4 ай бұрын
声以外の音(環境音やキーボードの打音)、誤変換には強くなりましたよ!
この動画の通りもものせさんのテスト配信で学習してみました。VCを起動するともものせさんの声になったのですが話しているとうっすらBGMが聞こえてしまいます。実際に使う場合はbgmなしの動画で素材を調達した方がよいですか?また、完全オリジナルの音源を作る際にはどのように学習するべきでしょうか?様々な人の音源を混ぜたりしたらよいでしょうか?よろしくお願いします。
@yumeno_momonose
29 күн бұрын
基本的に学習に使う音声データはBGMやSEがないものを使うのがよろしいと思います! オリジナルを作るのであれば学習時に混ぜるのではなく完成したpthファイルをマージする方法で混ぜる方が簡単ですよ!
@user-iw2fz3dc7k
29 күн бұрын
@@yumeno_momonose なるほど! ありがとうございます
みないうちに超自然だこれもうわかんないな
喋ってる途中で切れるかもしれないですが、Audacityのツールから等間隔ラベルで秒数を設定して、エクスポート時にラベルを選択すれば一気に分割保存できますよ!
@yumeno_momonose
5 ай бұрын
その方法のほうが本当は楽なんですよね!なんとなく途中で声がぶつ切りになるのが気になってしまって💦
はじめまして。よろしければご回答いただければ幸いです。 最後のワンクリックトレーニング前までは順調なのですが、そこを押すとしばらくしてエラーが出ます。 CUDA out of memoryというのがコマンドに出ます。これってGPUの容量が足りてないのでしょうか? 私のGPUはGeForceGTX 1660で容量は6GBです。 GPUごとのバッチサイズを最小の1にしてみたりするのですが上手くいきません。解決策をお知りでしたらアドバイス頂ければ幸いです。
@yumeno_momonose
3 ай бұрын
VRAM不足エラー(GPUメモリ)ですね…💦 バッチサイズを最小まで小さくしてもエラーになる場合は素材データが多すぎる可能性があります。 バッチ1でギリギリ回せる量まで減らすしかないと思われます…
@user-ob3xo3ko3r
3 ай бұрын
@@yumeno_momonose ありがとうございます。素材数減らしてみます
5分の素材を50分用意するのと 1文ずつ数秒で分けたものを50分用意するのは どちらの方が品質が良くなるかわかりますか?
@yumeno_momonose
4 ай бұрын
個人的には5分くらいの素材を複数のほうが安定した品質を出しやすい気がします…!
大変わかりやすい解説助かります。 私も興味をもってRVCに手を出してみました。 そこで質問なのですが、勢い余って5分の素材を30個作ってしまったのですが多すぎるでしょうか? また、この素材の数で学習させる場合、エポック数はどれぐらいが良いでしょうか? 回答いただけると幸いです。
@yumeno_momonose
8 күн бұрын
少し多い気もしますが、問題ない程度かと思います。 素材が多いとその分学習に時間がかかりますが、当方であれば200エポック程度でまずは回してみますね…!
これ学習素材なんですけど しゃべってる音声と歌声両方あると歌を歌わせる目的ならいいとかありますか?
@yumeno_momonose
4 ай бұрын
歌わせる場合でもしゃべっている音声があればいいですよ…!
@yumeno_momonose
4 ай бұрын
最低30分くらいはほしいかな?といった感じですね💦
RX6650XTを使用していてwin ONNX(cpu,DirectML)をダウンロードしたのですがGPUの欄にCPUしか表示されません...対処法などありますでしょうか?
@yumeno_momonose
4 ай бұрын
DirectML版の場合は横並びでCPU GPU0 GPU1 GPU2のような表記になってると思うのですが確認できますか?
コメント失礼します!学習に使う際の音源をスマホで作成し、Googleドライブを通じて使うことは可能でしょうか…?
@yumeno_momonose
28 күн бұрын
googleドライブを通してPCにデータを移行してということですかね??
go-webを開いた後にエラー、指定されたモジュールが見つかりませんと出てくるのですがどうすればいいのでしょうか
@yumeno_momonose
3 ай бұрын
グラボのドライバが古い可能性ありです… 更新後、改善するか試してみてください!
質問失礼します。RVC Web UIのステップ2aのデータ処理でエラーが出てしまうのですか、原因は何でしょうか
@yumeno_momonose
3 ай бұрын
まずはcmd上でのエラーを確認したほうがいいですね!
学習用の素材データーの動画時間はどのくらいが理想なのでしょうか?
@yumeno_momonose
2 ай бұрын
無音部分を除いて40~50分程度は欲しいかな?といったところですね…!
コメント失礼します!Audacityにて学習音声を出力する前にノーマライズ処理は必要でしょうか?昔どこかでやった方がいいと聞きまして...
@yumeno_momonose
2 ай бұрын
特に違いは感じないので不要かな?とおもいます…
@user-kt1nt1ye4b
2 ай бұрын
@@yumeno_momonose ありがとうございます!重ねて質問申し訳ないですが、学習音声のサンプリング周波数は目標サンプリングレートに合わせなくても問題はないのでしょうか?(44100Hzの素材をわざわざ40kや48kに出力する必要はないのでしょうか?)
@yumeno_momonose
2 ай бұрын
素材のサンプリングレートはそのままで問題ないですよ! 特に変更して書き出す必要はないと思っています…!
MacBookの場合はMacBookのPythonを選べばいいですか。
@yumeno_momonose
4 ай бұрын
申し訳ありませんMac環境がなく検証ができないのですがpythonのマック版があればそちらをインストールでいけるとおもいます…!
コメント失礼します。 小音でもbgmが入ってしまうと、学習結果に影響を及ぼしますか?
@yumeno_momonose
Ай бұрын
それなりに品質に影響します。人間が聞いてわかるレベルですと品質は大きく低下するイメージです
初歩的なことでつまづいているのですが、デスクトップをDesktop表記にする方法が知りたいです…。 オーディオをエクスポートする際のフォルダー名に必ずカタカナでデスクトップの文字が入ってしまいます…。。
@yumeno_momonose
3 ай бұрын
おそらくOneDriveと同期されているのが原因です。 面倒であればCドライブ直下にフォルダを配置するといいですよ!
PCはnVidiaのグラボ積んでないので(Ryzen7オンボード)intelAMDになりますか?
@yumeno_momonose
3 ай бұрын
オンボードグラフィックで学習は現状不可能です…
質問失礼します。 2ヶ国語をしゃべる人の英語で喋ってる素材と日本語で喋っている素材を学習させた場合どうなるんでしょうか。
@yumeno_momonose
5 ай бұрын
同一人物がしゃべっている場合ですが、日本語のみの時とほぼほぼ遜色ないモデルが出来たはずです…!
@user-vu1hm6xd4i
5 ай бұрын
@@yumeno_momonose ありがとうございます
すき
@yumeno_momonose
5 ай бұрын
ありがと(*'ω'*)
配信とかで大きな声とか叫び声などが混じっている場合は無くした方が品質安定しますか?
@yumeno_momonose
13 күн бұрын
音割れするレベルの大きな声や叫び声は削除したほうがいいですね
毎晩寝る前にやってるんですが、満足のいくモデルが全然できません…。合計約27分無音部分カット済みのデータなら何エポック回せばいいと思いますか?音声データはゲームのデータから抜いてるので品質に問題ないです。
@yumeno_momonose
Ай бұрын
合計27分のデータとのことで少々不足気味な印象を受けます。 個人的な見解ですが45~50分程度は欲しいところです。また、ゲームから抜き出した音声データとのことですがすべて聞いてみて聞こえ方が違うもの(収録スタジオの違いやマイクの違い)は混ざっていませんでしたか?
@afragile7152
Ай бұрын
@@yumeno_momonose 回答ありがとうございます!取れるボイスデータが少なくて激しい演じ方のやつとかも混じってたのでそれかもです…。ちなみに約1時間のデータであれば目安は何エポックほどでしょうか?
@yumeno_momonose
Ай бұрын
なるべく同じように聞こえる音声を学習させる方がよいと思います(こもっているように聞こえるものなどはNG) 1時間程度の素材であれば200~250エポック程度回すとよろしいかと思います
@afragile7152
Ай бұрын
@@yumeno_momonose もうちょっと素材集め頑張ってみます。回答ありがとうございます!
コメント失礼します。 UnicodeDecodeError: 'utf-8' codec can't decode byte 0x83 in position 28: invalid start byte こちらのエラーが出た後何か処理が始まるのですが途中で止まってしまいます。 何かわかりませんか?
@yumeno_momonose
3 ай бұрын
すみませんこちらでは確認できていないエラーです💦 python関連のエラーのようなのですが、一度環境を整えなおしてみることをお勧めいたします。 pythonのアンインストール、RVCの入れ直しを検討してみてください
Audacityのリンクがないので貼ってくださるとありがたいです!
nvidiaとRadeonだったらどっちの方が早いとかありますかね?
@yumeno_momonose
4 ай бұрын
nvidiaのほうが早いです。またトラブルも少ないかと…!
今更ながら質問失礼します。RVC WebUIのステップ2でno-feature-todoと表示されてしまうのですがどうしたら良いですか?ステップ1は問題なく通過しているのですが...
@yumeno_momonose
29 күн бұрын
エラー内容的にパスやファイルに日本語やスペースが含まれている気がするのですがいかがでしょうか?
RVC web UIをを開こうとすると503 Hugging Face is in maintenance と出てきてしまうのですがどうすれば良いでしょうか?
@yumeno_momonose
4 ай бұрын
現在hugfaceのサーバーが落ちているようなので復帰したら起動可能かと思います…
@user-zc3uw6uz4x
4 ай бұрын
ありがとうございます。何度もすみませんが学習させるデータは合計で最低何分くらいあればまともな音声になりますか?
@yumeno_momonose
4 ай бұрын
こもっていたり、音が割れたりしていない音声であれば40~50分くらいあればいい感じです!
GTX 1050 を使用しておりますが、学習速度の遅さに限界を感じ、買い替えを検討しております!もものせさんが使用しているグラボでは、1時間の音源データを5エポックほど回した時どれくらいの時間を要しますか? 私の環境では5時間でした、、ので買い替えで速度向上がどれほど期待出来るのか教えていただけると幸いです!
@yumeno_momonose
7 күн бұрын
1050ではさすがに厳しいですね💦 4090では1時間データ5エポックだと3分くらいです!4070tiで6~7分程度です! VRAM量で大幅に学習速度が変わりますので現行世代だと最低でも12GBクラス(RTX4070~)をおすすめいたします
@abccca12
7 күн бұрын
@@yumeno_momonose ご返信いただきありがとうございます!なんとお速い...さすが最強スペックですね...。目安時間やおすすめグラボについて大変参考になりました!これからも動画楽しみにしております!
コメント失礼します!質問なのですが、声の精度を上げるには5分ほどに切り分けた素材は多ければ多いほどいいですよね?
@yumeno_momonose
5 күн бұрын
あまり多いと学習に失敗したりするので1時間分くらいがちょうどいいと思いますよ!
pthのファイル(最後の二つ)はどこで使えばいいですか?
@yumeno_momonose
3 ай бұрын
ファイル2つが完成=声の学習が終わった状態です 完成したものはVC Clientというもので使用が可能です。『VC Clientで女の子になろう』の動画を参照していただければ幸いです
ディープ学習させて、13時間むりさせて(i7-13650 HX /rtx 4060 laptop)、声がやはり雑音入ったり、ロボットのような声があったりします、地声が低めですが、関係ありますでしょうか? モデルの音声はあみたろからダウンロードのものです
@yumeno_momonose
3 ай бұрын
学習させた素材が細切れすぎてきれいに学習できていないような気がします。 どれくらいのデータ量を何エポックで回しましたか?13時間となるとかなりの量と思いますが、多すぎ、回しすぎもよい結果にはなりづらいです💦
harvestとrmvpeとrmvpe_gpuではどれが一番高品質ですか?
@yumeno_momonose
5 ай бұрын
なんとなく個人的な見解ですがrmvpeが一番好きですね! rmvpe_gpuは若干粗がでる気がします
@Maralog
5 ай бұрын
ありがとうございます。やってみます!
@Maralog
5 ай бұрын
もう一つ質問なんですが、素材のデータは高い声がないほうがいいのでしょうか それとも少し高い声を入れたほうがいいのでしょうか?
@yumeno_momonose
5 ай бұрын
入れておいた方がいいと思いますよ!いろいろな感情が乗ってる素材の方が実使用で破綻しづらいです!
17:42 もものせさんのような綺麗なモデルを作る場合、5分の素材は何個ほどいるでしょうか?教えて欲しいです
@yumeno_momonose
3 ай бұрын
合計60分くらいあれば完璧です!
@kinako10969
3 ай бұрын
@@yumeno_momonose 了解です!ありがとうございます!
いつもわかりやすい解説ありがとうございます! 質問なのですが、学習データ(pth,indexの二つ)を切り取った後、 残りのファイルは削除していいのでしょうか?
@yumeno_momonose
5 ай бұрын
こちらこそご視聴感謝です! その二つを回収できたら他は消してしまって大丈夫ですよー!
学習時に、変換元の入力値(=自分自身の声)をパラメータとして与えるようなことはしないのでしょうか? 音声が同じ学習元のモデルでも、発声者によって出力される声が変わるのではないかと思うのですが より最適なモデルづくりには自分の声も1つのパラメータとして与える必要はないの?と思ってしまいました。
@yumeno_momonose
Ай бұрын
RVCに関しては不要かと思います。 一緒に地声を学習させると変換できるピッチを越えた時に地声がそのまま出力されたとの報告もありました。
全工程が完了って出てアセットを見に行ったんですけどPTHファイル?がなくてindexファイルだけが生成されてるんですけどどういうことでしょうか😢
@yumeno_momonose
3 ай бұрын
ワンクリックトレーニングに失敗しています💦 cmd(黒い画面)でepoc1、epoc2と順番に学習は進んでましたか?
最低でもRTX4070以上あった方がいいですか?
@yumeno_momonose
5 ай бұрын
学習させるのであればVRAMが多ければ多いほど速いので購入を検討するのであればやはり4070クラス~が選択肢としては正解と思います!
色々rvc作ったり買ったりしているんですが自分の声が悪いのかマイクが悪いのか、なかなか納得のいくやつがありません! 心折れかかってます! 作った場合声が素材と全く違ってしまったり、買った場合サンプルボイスと全く違う声になってしまいます! クライアントの設定等もちゃんと調べてやってるんですがうまくいきません… あとなんか活舌すごく悪くなります… 助けてください…
@yumeno_momonose
3 ай бұрын
活舌が甘くなるのはモデルが原因の可能性が高いと思われます… 無音の切りつめで切りすぎていたり、音声データの声が鮮明でなかったり… まずはマイクの入力音量を小さめにしてみると少し改善するかもです
ワンクリックトレーニングまでは上手く出来たんですが、エポックが1回で止まってしまうんですけど原因分かりますかね..
@yumeno_momonose
4 ай бұрын
使用しているGPUによっては1エポック20分近くかかるものもありますが止まってどれくらい時間がかかってますか?
@aopenpen
4 ай бұрын
gpuは1660superで30分ほど止まっております。それとFalse is deprecated. In a future pytorch release, stft will return complex tensors for all inputs, and return_complex=False will raise an error.のようなエラー?が発生して止まっています・・@@yumeno_momonose
@yumeno_momonose
4 ай бұрын
さすがに30分は遅すぎる気がします💦 1epchの後にこのエラーが表示されてますかね??
4つ目youtubeから変換MP3のやつになってしまいますどうすればいいでしょうか
@yumeno_momonose
3 ай бұрын
MP3でも大丈夫ですよ!
AIに学習させる音声ファイルは、声のみでないとダメですか? (声以外というのは、背景BGM等です。)
@yumeno_momonose
4 ай бұрын
できないことはありませんが、品質面ではどうしても音声のみと比べると圧倒的に劣ってしまいます…
@TC-Ruxy
4 ай бұрын
@@yumeno_momonose 声以外のノイズに強くなったりする、みたいなのってあったりしますか?
@yumeno_momonose
4 ай бұрын
ないとおもわれます…!
@TC-Ruxy
4 ай бұрын
ありがとう!学習の参考にしますわ!(?)@@yumeno_momonose
自分のGPUがIntelでそのファイルをダウンロードしてワンクリックトレーニングを押したんですけどなぜかファイルに保存されていません。どうすればいいですか?
@yumeno_momonose
3 ай бұрын
現状Windows環境ではNvidia製GPU以外での学習はできないと考えてもらっていいと思います… すみません説明不足でした
VC clientを立ち上げてゲームのクリップを撮ると音が入らないのですが対処法ありませんか😭
@yumeno_momonose
4 ай бұрын
ボイチェン後の声が入らない感じでしょうか?また、録画しているソフトは何になりますでしょうか?
@Ber4xvlrt
4 ай бұрын
@@yumeno_momonose ゲーム音が入らないです!ソフトはnvidiaのインスタントリプレイになります
@yumeno_momonose
4 ай бұрын
インスタントリプレイですか…💦もしソフトを変更しても構わないならOBSなど別なソフトで録画して試していただきたいです…!
初コメです。RVCのダウンロードのところでダウンロードしたファイルがPDFのような表記でもものせさんのような圧縮ファイルをダウンロードできません。私が何かミスをしているのでしょうか。
@yumeno_momonose
4 ай бұрын
ダウンロードに失敗していませんか?💦 ブラウザを変えて再度ダウンロードしてみるといいかもです…!
@printer3d513
4 ай бұрын
@@yumeno_momonose ご返信ありがとうございます! そのDLしたファイルを解凍すれば大丈夫でした。失礼いたしました。重ねてご質問になりますが、アニメ等のボイスを抜き取る場合、BGMなどほかの音が入ってしまうので、15秒とかの音声データだとさすがに機械学習は難しいでしょうか?
@yumeno_momonose
4 ай бұрын
合計15秒ということであれば厳しいですが、1音声データ15秒を何個もということであればいけると思います!
@printer3d513
4 ай бұрын
ご回答頂き、ありがとうございます! いろいろ準備してやってみようと思います。mp3変換の時の広告?がひどいのが大変ですね(笑)
学習させた際のデータ圧迫が厳しいのですが、モデル作成後節約のために消去できるデータってありますでしょうか。
@yumeno_momonose
17 күн бұрын
logs→学習した名前のフォルダはindexデータを取り出した後であればフォルダごと削除してしまってOKですよ!
ワンクリックトレーニングを押した後にエラーが起きてしまいますが何が原因か分かりません エポック数やバッチサイズを変更してもずっとエラーが起きてしまうのですがどうすればいいか教えてもらえないでしょうか
@yumeno_momonose
4 ай бұрын
エラー内容がわかればアドバイスできるかもです… こちらでは画像を添付できないと思うのでtwitterのDMにcmdのスクショをいただけますか?
@user-ss6ob4df8f
4 ай бұрын
エラー画面を撮ろうともう一度やってみたところ何故かエラーが起きずに進むようになりました... 親切に対応して下さりありがとうございます、動画の説明も分かりやすく知識の無い私でもなんとか出来ました!
@yumeno_momonose
4 ай бұрын
解決したようでよかったです!楽しいRVCライフを…!
ワンクリックトレーニングをしたときに毎回RuntimeErrorと出てしまいます。 何か解決方法はないでしょうか?
@yumeno_momonose
4 ай бұрын
ランタイムエラーですか…💦 いろいろ要因が多すぎるのですが、フォルダやファイル名に日本語が入ってたりはしていないですよね??
@TIS_0ZEN11x
4 ай бұрын
@@yumeno_momonose入ってます…! もしかしたらそれかも! ありがとうございます!
前の解説動画からバージョンが変わっていますが更新したほうがいいのでしょうか?
@yumeno_momonose
5 ай бұрын
ベータ版から正式バージョンになり、学習にrmvpeとrmvpe_gpuが使えるようになったのでその方がいいと思いますよー!
@user-gh9wo2iu3w
5 ай бұрын
ありがとうございます ピッチの種類は何を使えばいいですか? @@yumeno_momonose
@yumeno_momonose
5 ай бұрын
基本はrmvpe_gpuでよろしいかと思いますよ!
質問失礼します! VC Cliantでボイチェンした際に2秒ほど声にラグが起きてしまうのですがこれくらいは仕方ないですか?VC Cliantのバージョンは1.5.3.18aを使っています。
@yumeno_momonose
5 күн бұрын
CHUNK値によってはそれくらい遅延してしまいますね💦 VCC自体にそれなりの遅延があります
@user-uo5ub6rf7x
5 күн бұрын
@@yumeno_momonose 返信ありがとうございます!CHUNK値少しいじってみます。動画めっちゃわかりやすくて助かりました!
amd版をダウンロードしたのですが、解凍したファイルの中にgo-webがありません😢
@yumeno_momonose
4 ай бұрын
すみません当方の検証環境にAMDの機材がないため確認に少しお時間をいただいてもよろしいでしょうか? また使用しているグラボをお教えいただけると助かります…!
@user-nt6lo6bo5k
3 ай бұрын
@@yumeno_momonose 使っているのはrx6600xtです。 よろしくお願いします。
@KAEDE_03
3 ай бұрын
同じく!!!!!
@KAEDE_03
3 ай бұрын
@@yumeno_momonose こんにちは。自分もAMD構成ですがgo-webがありませんでした。個人で調べたところAMD製のグラボではできないとの情報がありました。 AMD製グラボでRVCを使用するならばコードを書き直しするとか書かれていました。 自分の構成は以下の通りです。 GPU→Radeon RX6700XT CPU→AMD Ryzen5 5600X になります。最初のコメ主様がもものせ様に返信されていなかったので変わりに送らせて頂きます。
@user-nt6lo6bo5k
3 ай бұрын
@@yumeno_momonose 返信遅くなりました。 私のグラボはrx6600xtです!
RVC導入の動画にもコメントしたのですが、導入する際にstart_httpをダブルクリックするとすぐに画面が閉じちゃいます。どうしてでしょうか?
@yumeno_momonose
4 ай бұрын
見逃していましたすみません💦 Pythonのインストール(3.10.10)は完了していますか?またインストール時にチェックボックスが2つ表示されますが、どちらも選択していましたか?
@Da_0224
4 ай бұрын
@@yumeno_momonose チェックボックス2つとはなんでしょうか!機械音痴ですみません
@yumeno_momonose
4 ай бұрын
pythonのインストールの途中でadd python to exeのような表示にチェックを入れることができるのですが確認できますか??
@Da_0224
4 ай бұрын
@@yumeno_momonose すみません。最近忙しくみれてなかったです。色々やってみた結果できました!ただもものせさんのような違和感のないボイチェンはどうすればよいのでしょうか?
突然コメントしてしまって申し訳ありません。ワンクリックトレーニングを押した後の処理画面で Converged (lack of improvement in inertia) at step 328/6275 と表記されて止まってしまうのですがこれは何がいけないのでしょうか…
@yumeno_momonose
7 күн бұрын
たまに同じような現象で悩んでいる方をお見受けするのですが原因の特定が難しく💦 使用しているRVCのバージョンとGPUをお教えいただけますか?
@mev1us418
7 күн бұрын
@@yumeno_momonose RVCはRVC1006Nvidia (これで合っているでしょうか) で、GPUはRTX4060Tiです! 同じ方がいらっしゃるんですね😢
@yumeno_momonose
7 күн бұрын
当方も1006Nvidiaですね! ちなみに学習に使用したデータ数と合計の素材の時間(だいたいでかまいません)をお教えいただけますか??
@mev1us418
6 күн бұрын
@@yumeno_momonose データ数は10で、素材の時間は1時間20分くらいです! 返信が遅くなってしまいごめんなさい🙏💦
聞き逃してしまったのだと思いますが、18分17秒の所の、さきほどつくったフォルダってどのことでしょうか、、、!!cドライブに新しくフォルダを作成(C;\とれえにんぐ)という名前で作成→その中にクリップした音声を入れて、サイトでデータ処理を行うとエラーが出てしまいます。
@yumeno_momonose
3 ай бұрын
音声データの書き出しフォルダですね!場所はどこでも構わないのでローマ字表記のフォルダを作ってください。その中に音声ファイルを書き出します。※書き出した音声データもローマ字表記で
@karamerudesu
3 ай бұрын
@@yumeno_momonose OSError: [WinError 123] ファイル名、ディレクトリ名、またはボリューム ラベルの構文が間違っています。:って出てきてしまいます、、、
@yumeno_momonose
3 ай бұрын
状況のスクショをいただきたいのですがこちらでは画像を貼れないのでよろしければDMください
コメント失礼致します。 2点質問させていただきたいのですが、 1つ目が、文字と文字の間の不自然な声の出し方をもものせさんのように、自然にするコツはありますか? 自分の素材は1〜2時間の音声データ(BGMをUVR5で消したもの)を5分毎に分割したものを使って総エポック数150ほどで回しております。 2つ目は出来上がった学習ファイルを再度トレーニングにて追加学習することは可能でしょうか? Google版の方で追加学習されていた方がいらっしゃったのですが、assetのデータを参照して新しいwavファイルを読み込ませて学習したりできるのでしょうか… 長文失礼いたしました。 お返事いただければ幸いです。
@killing0627
8 күн бұрын
2つ目の質問に関しましては ・今まで通りに追加教育したい音声素材を準備 ・logsフォルダの中のGモデルDモデルのパスを一番下の左の欄に入力 ・モデルのトレーニングで実施できそうなので、今度試してみようと思います。
@yumeno_momonose
8 күн бұрын
遅くなり失礼いたしました💦 変換後の音声に違和感が出るのは学習に使用した素材が影響していることが多いです。(今回であればUVR5でBGMを処理していること)元からBGMなどがない素材に比べるとクオリティは数段落ちてしまいます。 追加学習に関してはその認識で間違いないですね!
@killing0627
8 күн бұрын
@@yumeno_momonose ご回答ありがとうございます。 やはり素材の違いでしたか… 今度はBGM無しの素材で作ってみたいと思います。 ありがとうございますj!! 追加学習の件なのですが、GもDもモデルのタイトルの数字が大きいものとそうでないものでは、試行回数が違うということでしょうか? そのため一番大きい数字のモデルを二つ使えばよろしいでしょうか?
@yumeno_momonose
7 күн бұрын
途中学習ファイルらしいので基本は一番大きい数字のものを使えばいいと考えてますね…!
昔使ってたのですが今は機械ぽさってなくなってますか?
@yumeno_momonose
5 ай бұрын
初期のころと比べるとかなりいい感じになってると思います…!モデルによる差異が大きいので品質さえしっかりしていれば機械っぽさは出づらくなってる印象ですね!
初コメ失礼します、動画とあまり関係ない質問ですみません。kzread.info/dash/bejne/doeslLeDobOWnbA.htmlsi=tWV5Ubd8QqBSVUH0 こちらの動画で使用されていた百鬼あやめさんの声は、どこかで購入されたものですか?それともこの動画のように学習されたものでしょうか? またVC clientに最初から入っているデータでボイチェンしてみたのですが、自分の滑舌とかのせいなのか言葉の最後の音にノイズが入ってしまうことが多かったです。何か解決策があれば教えていただきたいです。
@yumeno_momonose
3 ай бұрын
ボイスモデルは当方で作成したものになります…! もとから入っているものはあまり良いイメージがないですね💦NvidiaBroadCastなどのノイズ制御ソフトを試してみるといいかもです
@iiiiii2401
3 ай бұрын
@@yumeno_momonose 返信ありがとうございます!この動画を参考に学習もやってみます。またわからないことがあったら質問するかもです…
すみませんローカルドライブのwindows内で解凍してもチャックついたままなんですがどうすればいいですか?
@yumeno_momonose
4 ай бұрын
RVCのフォルダは7zipという形式で圧縮してあるのでwindows標準の解凍ソフトでは途中でエラー終了してしまうのでそれが原因かと…!7zipというソフトで解凍をしてみていただけますか?
@user-oe8eh9qn9g
4 ай бұрын
@@yumeno_momonose 7zipでここに展開を選択しましたがチャックついたままですね...
@user-oe8eh9qn9g
4 ай бұрын
@@yumeno_momonose 7zipつかってもチャックついたままですね…
@yumeno_momonose
4 ай бұрын
わかりやすいように圧縮フォルダをデスクトップに移動してそこで解凍を行うとどうでしょうか?
RTX3060tiでも速度を気にしなければ可能でしょうか?
@yumeno_momonose
5 ай бұрын
問題なく学習可能です!VRAMが8GBのグラボですのでバッチサイズを上げすぎると生成に失敗したり、尋常じゃなく遅くなるので注意です…!
@avezans
5 ай бұрын
@@yumeno_momonose ありがとうございます!試してみます!
ワンクリックトレーニング中にWebサイト閉じちゃって止まっちゃったんですけどどうすれば再開出来ますか?
@yumeno_momonose
Ай бұрын
同じ名前、設定値で再スタート可能ですよ!
RVC解凍したあと、go webが無いのですがどうすれば良いでしょうか、、ちなみにGPUはAMDでAMDバージョンをダウンロードしています、
@yumeno_momonose
3 ай бұрын
遅くなり失礼いたしました💦 説明不足ですみません、Nvidia製GPU以外をご利用の場合はwindows上での学習は基本的に不可能と思ってもらっていいと思います。Linux環境などでは可能です。
@vqwellx
3 ай бұрын
@@yumeno_momonose とんでもないです!返信ありがとうございます! なるほど、、Linux環境の構築は難しいでしょうかね、、?
@yumeno_momonose
3 ай бұрын
@@vqwellx それなりの知識は必要かと思います…多少お金はかかりますがgoogle colabratoryを使用して学習するという方法もありますね!
@vqwellx
3 ай бұрын
@@yumeno_momonose なるほど!遊びでやってみたいだけなので色々学んでみてLinux環境でやってみようと思います!また何かあったらお聞きしてもいいでしょうか、?
@vqwellx
3 ай бұрын
@@yumeno_momonose なるほど!ありがとうございます!興味の範囲でやってみたいだけなのでLinux環境作ってやってみようと思います!出来るかは分かりませんが!笑 またどうしても分からなかったら質問してもよろしいでしょうか、?
トレーニングを行おうとしたのですが、GPUを認識してくれません。 RVCの画面では「トレーニングに対応したGPUが動作しないのは残念です。」と表示されてしまいます。 僕のPCは、 GPU0にIntel(R) UHD Graphics 630 GPU1にNVIDIA GeForce MX250 となっています。 解決法ご存知であればご教授いただきたいです…😢
@yumeno_momonose
19 күн бұрын
もともとインテル内蔵グラフィックUHDシリーズでは学習ができず、MX250はVRAMが2GBが最大でこちらも容量が足りず学習ができないためそのような表示になっているかと思います。
@user-uw6ns5jj7b
19 күн бұрын
@@yumeno_momonose なるほどです 容量が足りなかったんですね ではcolab等から行う必要がありそうですね… 勉強になりました! ありがとうございます🙇
解凍した後にgo webというやつがないのですが何が間違っていたのでしょうか?webのやつ以外はちゃんとあります
@yumeno_momonose
Ай бұрын
ダウンロードしたバージョンをお教え願えますか?
@user-vc6kc8gv6p
Ай бұрын
@@yumeno_momonoseすいませんできました!
2:01のダウンロードでエラーが出るのですがどうしたらいいですか?
@yumeno_momonose
Ай бұрын
pythonのダウンロードの場面ですかね? 状況を詳しくお伺いしたいのでエラーの状態をスクショしてDMにいただけますか?
質問なのですが、ステップ2aで接続エラーになる要因って 何が考えられますでしょうか?
@yumeno_momonose
2 күн бұрын
なんとなくセキュリティソフトが怪しいかと…!ウイルスバスター、ノートンみたいなの入ってませんか??
@user-jq8cx5wo4u
2 күн бұрын
@@yumeno_momonoseソフト消したら行けました! ありがとうございます!
ずっとstep3で止まるのですが対処法などはありますかね?
@yumeno_momonose
3 ай бұрын
ワンクリックトレーニングの部分でしょうか?cmd(黒い画面)で何かエラーのような表記はありますか?
@Aloy0221
3 ай бұрын
@@yumeno_momonose すみませんstep3までは自力で行けたのですがPTHファイルが作られないのですが 解決策などはありますでしょうか?
@yumeno_momonose
3 ай бұрын
しっかりと学習は進んでましたか? cmd上でepoch1、epoch2と順番に進んでいくはずなのですがその前に何かしらのエラーとなっている可能性が高いと思います。
エミュレータ入れて斉藤さんで釣りやろうかなぁ
質問失礼します。最後のワンクリックトレーニングの段階で、"RuntimeError: The expanded size of the tensor (17280) must match the existing size (2640) at non-singleton dimension 1. Target sizes: [1, 17280]. Tensor sizes: [2640]"と表示され、うまく処理されません。考えられる原因をご教授いただけましたら幸いです。(ファイル名にも日本語は含まれていません。)
@yumeno_momonose
4 сағат бұрын
pythonのバージョンは何がインストールされていますか??
25:26 自分用保存
解説動画をつくる人はどうやって解説できるだけの情報を持っているのか
学習させたデータで通話ってどうやってできますか?
@yumeno_momonose
3 ай бұрын
VC Clientで女の子になろうの動画をご覧いただけると嬉しいです…! 基本的な使い方を解説していますので参考にしていただければ!
@itiya_kk
3 ай бұрын
@@yumeno_momonose ありがとうございます!!!!!
トレーニング用の音声を入れる、step1のデータ処理のところで「ディレクトリ名が無効です」とでてしまいます。MP3で音をダウンロードし、メディアプレーヤー?に入っている音源のパスをコピーして、しっかり名前も日本語表記になっていたので直しました。何が原因でしょうか💦
@yumeno_momonose
6 күн бұрын
日本語以外にもスペースなどが入ってたりしませんか?あとパス自体に日本語が含まれてませんか?特に(デスクトップ)
@user-ub5zj1to6n
6 күн бұрын
@@yumeno_momonose 確認しましたが、スペースもなく、日本語も含まれていませんでした...
@yumeno_momonose
4 күн бұрын
状態を見てみないとなんとも言えないのでどうしても解決しなければDMいただければわかる範囲でアドバイスさせていただきます!
うぷ主の気持ちめっちゃわかるわ(チャンネル概要欄) 私も昔動画作ってた時酷い言葉ぶつけられてトラウマだったからわかる……
@yumeno_momonose
4 ай бұрын
ちょっとした言葉が結構重かったりするんですよね💧
ゲーム配信しながらずっと使ってたら結構重くなっちゃいますか?
@yumeno_momonose
3 ай бұрын
100時間程度連続稼働してますが問題なさそうです!
@user-hq5jb5qi2q
3 ай бұрын
@@yumeno_momonose わかりました!ありがとうございます!
素材に笑い声が入っている場合、カットしたほうがいいですか?
@yumeno_momonose
3 ай бұрын
そのまま入れて学習したほうが自然なモデルができやすいのでそのまま学習してみましょう!
@tubasagaen2315
3 ай бұрын
返信ありがとうございます!
学習させるための声って何分くらいが目安ですか?
@yumeno_momonose
3 ай бұрын
50~60分くらいあればいいかんじです!
@La.Ciel0626
3 ай бұрын
@@yumeno_momonose ありがとうございます。 もう一つ質問なんですが、 Audacity の作業の最後のほうで 五分くらいごと切る作業って なんのためにするものですか?
@yumeno_momonose
3 ай бұрын
素材をある程度の長さで区切ることでイマイチ納得のできるクオリティで出来上がらなかったときに素材を入れ替えて学習させるために行っています。面倒であればそのままでも構いませんが1個で1時間を超えるデータはエラーになりやすいので気を付けてください
@La.Ciel0626
3 ай бұрын
@@yumeno_momonose 丁寧な説明ありがとうございます。 参考にさせていただきます。
20:40のところで ディレクトリ名が無効ですとエラーを吐きやがるのですがどうしたら良いでしょうか
@yumeno_momonose
3 ай бұрын
データ処理の項目でしょうか? フォルダパスやファイルに日本語が含まれてないですか?
@user-owjdh99999
3 ай бұрын
@@yumeno_momonose 含まれてないです。 cドライブ直下で何度も試しました 以前は出来たのですが
@user-owjdh99999
3 ай бұрын
含まれてないです 何度か試しました。ファイル形式も変更してみました。 以前は出来たのに
@yumeno_momonose
3 ай бұрын
以前はできていたというのが引っ掛かります… 現在お使いのバージョンは1006Nvidiaでしょうか?
@user-owjdh99999
3 ай бұрын
今回それを試す前に別バージョンでも試したのですが同様のエラーが出てしまいました 仕方ないのでpcをまっさらにしてやり直す予定です
動画参考にしています トレーニングから終了は確認しているのですが、pthファイルが所定の場所に出力されなく困っていますご教授をお願い致します。
@yumeno_momonose
3 ай бұрын
ご視聴ありがとうございます! ワンクリックトレーニングで失敗していると思われます。cmd(黒い画面)でepoch1、epoch2と学習は進んでいましたか?
@user-ki6hm8rp3s
3 ай бұрын
@@yumeno_momonose ご返信ありがとうございます 恐らく学習は進みました、総エポック数は極端に下げたらpthファイルが出力されました。 スペックの問題かもしれないです。 次なる問題で学習素材にあまり近づいていなかったです。エポック数が低いのが原因でしょうか
@yumeno_momonose
3 ай бұрын
エポック数は学習回数なのでスペックはそこまで関係ないかと思われます… バッチサイズが大きすぎてGPUメモリ不足で学習ができていないことがあるので確認してみるといいと思います。学習は最低100は回さないと元素材に近くならないですね💦
@user-ki6hm8rp3s
3 ай бұрын
@@yumeno_momonose なるほど、返信ありがとうございます。 学習数が少ないのが原因なんですね 学習してる間、CPUが70℃を超してるので 学習時間と負荷の大きさでスペック上、耐えられない為、上手くいかないと考えていました。 エポック数を100回以上に設定して再度やってみます。
@yumeno_momonose
3 ай бұрын
グラボによっては1エポック20分以上かかることもあるので気長に待つといいかもです…!
わかりやすい動画をありがとうございました。 途中で詰まってしまい、お聞きしたいことがあります。わかる範囲でお答えいただけますと幸いです。 ワンクリックトレーニング実行後、cmd上で下記エラーが表示されました。 WebUI上では「全工程が完了」と出ていますが、pthファイルが作られておらず、indexファイルのみ作られています。 epoc1, 2...と学習が進んでいなかったので、失敗していそうです。 これが原因かな?と思うところがあるのですが、現在、「GTX 1650」を使用しており、VRAM4GBと、他の方のコメントを見る限り性能不足かと思います。 今回は、性能不足を承知のうえ、お試しとして全体的に少ない値を設定しながら、最後までいけるかやってみようと思っていたのですが、そもそもグラボの性能を上げないと難しいでしょうか? 近いうちに、RTX4070あたりのグラボが搭載されたpcの購入を検討していますが、グラボの変更によって解決する(現状のグラボでは解決できない)エラーでしょうか? ハードウェアの知識が足りず、基礎的な質問でしたらすみません(-_-;) 【エラー内容】 torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 4.00 GiB total capacity; 3.42 GiB already allocated; 0 bytes free; 3.44 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF
@yumeno_momonose
3 ай бұрын
ご視聴ありがとうございます! VRAM不足(GPUメモリ)によって学習ができませんというエラーですね… 学習をするのであれば8GB程度のVRAMがないと厳しいです。 (もしかすると学習時のバッチサイズを一番小さくするといけるかも…?) VRAM8GB以上かつNvidiaのグラフィックボードを選定していただけると改善するエラーですね
@user-ze4sd9eo6h
3 ай бұрын
@@yumeno_momonose ご回答いただきありがとうございます🙇♂️ バッチサイズ2で試したので、1でもやってみようと思います。 新pcを購入しようと思うので、改めてそちらでやってみます!