www.bianshengruanjian.com Open in urlscan Pro
118.24.16.129  Public Scan

URL: https://www.bianshengruanjian.com/index.php/archives/2476/
Submission: On July 01 via api from US — Scanned from DE

Form analysis 2 forms found in the DOM

GET https://www.bianshengruanjian.com/

<form method="get" id="searchform" class="searchform shadow" action="https://www.bianshengruanjian.com/">
  <div class="input-group">
    <input type="text" name="s" id="s" placeholder="请输入搜索关键词并按回车键…" class="form-control">
    <div class="input-group-append">
      <button class="btn btn-nostyle" type="submit"><i class="text-lg iconfont icon-search-line"></i></button>
    </div>
  </div>
  <!-- /input-group -->
</form>

POST https://www.bianshengruanjian.com/index.php/archives/2476/comment

<form id="new_comment_form" method="post" action="https://www.bianshengruanjian.com/index.php/archives/2476/comment" _lpchecked="1">
  <div class="new_comment"><textarea name="text" rows="3" class="textarea_box" style="height: auto;" placeholder="人生在世,难免会写点错别字,没事儿~"></textarea></div>
  <div class="comment_triggered" style="display: block;">
    <div class="input_body">
      <ul class="ident">
        <li>
          <input type="text" name="author" placeholder="昵称*" value="">
        </li>
        <li>
          <input type="mail" name="mail" placeholder="邮件*" value="">
        </li>
        <li>
          <input type="text" name="url" placeholder="网址" value="">
        </li>
      </ul>
      <input type="submit" value="提交评论" class="comment_submit_button c_button">
    </div>
  </div>
</form>

Text Content

 * 首页
 * 电脑软件
   * 原创软件
   * 网络软件
   * 系统软件
   * 系统镜像
   * 办公软件
   * 音频软件
   * 编程软件
   * 游戏软件
   * VR软件
   * VR游戏
 * 移动软件
   * 安卓软件
   * 安卓游戏
   * 电视软件
   * VR安卓端
 * 影视软件
   * 电视资源
   * 影视资源
   * VR电影
 * 文章资讯
   * 原创文章
   * 转载文章
   * 电脑设备
   * 移动设备
   * VR教程
 * 捐赠本站
 * 淘宝店铺
 * 关于

 * 
 * 
   登录

 * 首页
 * 电脑软件
 * 原创软件
 * 网络软件
 * 系统软件
 * 系统镜像
 * 办公软件
 * 音频软件
 * 编程软件
 * 游戏软件
 * VR软件
 * VR游戏
 * 移动软件
 * 安卓软件
 * 安卓游戏
 * 电视软件
 * VR安卓端
 * 影视软件
 * 电视资源
 * 影视资源
 * VR电影
 * 文章资讯
 * 原创文章
 * 转载文章
 * 电脑设备
 * 移动设备
 * VR教程
 * 
 * 
 * 


首页 › 电脑软件,原创软件,音频软件 › RVC AI变声器620 含模型和虚拟声卡 入梦增强版 (PC)


RVC AI变声器620 含模型和虚拟声卡 入梦增强版 (PC)

2023-06-20 01:17
72929 38


一个基于VITS的简单易用的语音转换(变声器)框架,算法相关经验和成果是b站花儿不哭和Rcell经过半年时间做了上百组实验得出的当前的最优解,注意需要N卡才能玩,A卡目前只能战未来,建议最低N卡750ti以上
安装包为博主入梦自己集成,免费使用,包括多款训练好的音源文件和集成入梦虚拟声卡
如果是旧的CPU(i7-4770),则需要1000msec左右。
(如果需要声音训练和效果定制或者购买模型包音源也可以联系入梦)
Github
RVC AI变声器使用教程

> AI变声器交流群(92406190) 变声器免费使用,分享的音源包禁止倒卖,仅用于交流学习!音源包会逐步更新,请关注本站!
> 如果看了UP主的教程也不会安装和设置,入梦音频淘宝店铺拍懒人服务49.9元
> 训练模型和融合音源,有声卡的可声卡直连AI变声器,无需虚拟声卡,提升音质,降低延迟声卡和精品模型调试
> 如设置不成功,或者配置不支持,可申请退款!

123云盘(推荐)
百度网盘





 * 赞助:
   

更新内容-入梦增强包
优化了GPU和CPU占用,降低了资源占用
删除不需要修改的选项按钮,npy和hubert
每个选项改下中文提示符修改,更简洁易懂
集成了入梦麦克风+Voicemeeter两个虚拟声卡
集成NVIDIA Broadcast AI降噪功能,一键安装(RTX显卡可用)
官方20230618更新
v2增加32k和48k两个新预训练模型
修复非f0模型推理报错
对于超过一小时的训练集的索引建立环节,自动kmeans缩小特征处理以加速索引训练、加入和查询
附送一个人声转吉他玩具仓库
数据处理剔除异常值切片
onnx导出选项卡
删除内容:
特征检索增加时序维度:寄,没啥效果
特征检索增加PCAR降维可选项:寄,数据大用kmeans缩小数据量,数据小降维操作耗时比省下的匹配耗时还多
支持onnx推理(附带仅推理的小压缩包):寄,生成nsf还是需要pytorch
训练时在音高、gender、eq、噪声等方面对输入进行随机增强:寄,没啥效果
基于开源软件集成和修改,永久免费,不收取软件任何费用

配置要求
1 win10或win11系统,老显卡驱动要更新到最新版本
2 显卡750TI以上,如需训练音源,需RTX以上显卡,显存越大越好
3 CPU性能越高越推理延迟越低,建议十代酷睿或三代锐龙以上,不满足声音卡顿延迟高
4 清晰干净的麦克风,声卡麦克风最优,如无麦克风可咨询淘宝入梦音频,勿用手机耳机和笔记本自带的麦效果较差

修复BUG
修复16系显卡GUI实时变声效果有问题的解决办法
gui.py:所有 .half()替换为.float() , is_half=True 改为 is_half=False
如果还有问题,就是通用问题,和显卡型号无关

如果CMD控制台报错打不开软件,可以尝试修复下DirectX Repair(DX)运行库修复

特点
@入梦增强版
1 对AI变声集成了VB-audio虚拟MME麦克风,可以实时输出
2 对RVC增强了模型地址,减少加载工作量

相比于传统变声器优点
1 AI变声不吃个人声线,只需要清晰的说化即可,传统变声器只能根据个人声线进行变化
2 可以训练模型,加载各种声线,语气声线多样化
相比于传统变声器缺点
1 延迟太高,通常都是1-5秒以上,传统变声器最低可以无延迟
2 咬字不清晰,气息非常奇怪,感情波动就会失真,非常吃模型的音源
3 吃配置较高,需要CPU和GPU双重占用,配置低就无法使用,RVC目前只能兼容N卡
4 兼容性还是太差了,AI变声目前还不成熟,闪退稳定性有待优化

博主观点
1 使用的时候建议独立声卡或者麦克风,耳机噪音过大会非常影响到AI变声效果,麦克风音质越好,效果越好
2 对CPU和GPU双重资源的压力,部分配置低的用户可能带不动,建议有独立显卡在使用
3 延迟太高,如果使用MME协议输出,延迟在2秒到6秒,如果麦克风音质太低,设置低延迟声音会卡顿
4 说话的时候不能大喊大叫,必须平稳说话,否则声音就变成气音
5 打游戏还是不行的,因为延迟太高,如果说话过快会覆盖下一句话,不能情绪过于激动不然也会变成气音
6 只是发短语音消息而非实时通话,声音还是非常棒的,颠覆了我对于AI变声的印象,科技使人进步

简介
使用top1检索替换输入源特征为训练集特征来杜绝音色泄漏
即便在相对较差的显卡上也能快速训练
使用少量数据进行训练也能得到较好结果(推荐至少收集10分钟低底噪语音数据)
可以通过模型融合来改变音色(借助ckpt处理选项卡中的ckpt-merge)
简单易用的网页界面
可调用UVR5模型来快速分离人声和伴奏

常见问题解答
Q1:ffmpeg error/utf8 error.
大概率不是ffmpeg问题,而是音频路径问题;
ffmpeg读取路径带空格、()等特殊符号,可能出现ffmpeg error;训练集音频带中文路径,在写入filelist.txt的时候可能出现utf8
error;
Q2:一键训练结束没有索引
显示"Training is done. The program is closed."则模型训练成功,后续紧邻的报错是假的;
一键训练结束完成没有added开头的索引文件,可能是因为训练集太大卡住了添加索引的步骤;已通过批处理add索引解决内存add索引对内存需求过大的问题。临时可尝试再次点击"训练索引"按钮。
Q3:训练结束推理没看到训练集的音色
点刷新音色再看看,如果还没有看看训练有没有报错,控制台和webui的截图,logs/实验名下的log,都可以发给开发者看看。
Q4:如何分享模型
rvc_root/logs/实验名
下面存储的pth不是用来分享模型用来推理的,而是为了存储实验状态供复现,以及继续训练用的。用来分享的模型应该是weights文件夹下大小为60+MB的pth文件;
后续将把weights/exp_name.pth和logs/exp_name/added_xxx.index合并打包成weights/exp_name.zip省去填写index的步骤,那么zip文件用来分享,不要分享pth文件,除非是想换机器继续训练;
如果你把logs文件夹下的几百MB的pth文件复制/分享到weights文件夹下强行用于推理,可能会出现f0,tgt_sr等各种key不存在的报错。你需要用ckpt选项卡最下面,手工或自动(本地logs下如果能找到相关信息则会自动)选择是否携带音高、目标音频采样率的选项后进行ckpt小模型提取,提取完在weights文件夹下会出现60+MB的pth文件,刷新音色后可以选择使用。
Q5:Connection Error.
也许你关闭了控制台(黑色窗口)。
Q6:WebUI弹出Expecting value: line 1 column 1 (char 0).
请关闭系统局域网代理/全局代理。
这个不仅是客户端的代理,也包括服务端的代理(例如你使用autodl设置了http_proxy和https_proxy学术加速,使用时也需要unset关掉)
Q7:不用WebUI如何通过命令训练推理
训练脚本:
可先跑通WebUI,消息窗内会显示数据集处理和训练用命令行;
推理脚本:
https://huggingface.co/lj1995/VoiceConversionWebUI/blob/main/myinfer.py
例子:
runtime\python.exe myinfer.py 0 "E:\codes\py39\RVC-beta\todo-songs\1111.wav"
"E:\codes\py39\logs\mi-test\added_IVF677_Flat_nprobe_7.index" harvest "test.wav"
"weights/mi-test.pth" 0.6 cuda:0 True
f0up_key=sys.argv[1]
input_path=sys.argv[2]
index_path=sys.argv[3]
f0method=sys.argv[4]#harvest or pm
opt_path=sys.argv[5]
model_path=sys.argv[6]
index_rate=float(sys.argv[7])
device=sys.argv[8]
is_half=bool(sys.argv[9])
Q8:Cuda error/Cuda out of memory.
小概率是cuda配置问题、设备不支持;大概率是显存不够(out of memory);
训练的话缩小batch
size(如果缩小到1还不够只能更换显卡训练),推理的话酌情缩小config.py结尾的x_pad,x_query,x_center,x_max。4G以下显存(例如1060(3G)和各种2G显卡)可以直接放弃,4G显存显卡还有救。
Q9:total_epoch调多少比较好
如果训练集音质差底噪大,20~30足够了,调太高,底模音质无法带高你的低音质训练集
如果训练集音质高底噪低时长多,可以调高,200是ok的(训练速度很快,既然你有条件准备高音质训练集,显卡想必条件也不错,肯定不在乎多一些训练时间)
Q10:需要多少训练集时长
推荐10min至50min
保证音质高底噪低的情况下,如果有个人特色的音色统一,则多多益善
高水平的训练集(精简+音色有特色),5min至10min也是ok的,仓库作者本人就经常这么玩
也有人拿1min至2min的数据来训练并且训练成功的,但是成功经验是其他人不可复现的,不太具备参考价值。这要求训练集音色特色非常明显(比如说高频气声较明显的萝莉少女音),且音质高;
1min以下时长数据目前没见有人尝试(成功)过。不建议进行这种鬼畜行为。
Q11:index rate干嘛用的,怎么调(科普)
如果底模和推理源的音质高于训练集的音质,他们可以带高推理结果的音质,但代价可能是音色往底模/推理源的音色靠,这种现象叫做"音色泄露";
index rate用来削减/解决音色泄露问题。调到1,则理论上不存在推理源的音色泄露问题,但音质更倾向于训练集。如果训练集音质比推理源低,则index
rate调高可能降低音质。调到0,则不具备利用检索混合来保护训练集音色的效果;
如果训练集优质时长多,可调高total_epoch,此时模型本身不太会引用推理源和底模的音色,很少存在"音色泄露"问题,此时index_rate不重要,你甚至可以不建立/分享index索引文件。
Q11:推理怎么选gpu
config.py文件里device cuda:后面选择卡号;
卡号和显卡的映射关系,在训练选项卡的显卡信息栏里能看到。
Q12:如何推理训练中间保存的pth
通过ckpt选项卡最下面提取小模型。

RVC往期版本



相关文章

评论 (38)
取消回复


发表评论

 * 
 * 
 * 

 1.  木木
     2023-05-05 20:52
     
     用教程吗,不会用
     
     回复
     1. 入梦
        2023-05-05 23:29
        
        正在做
        
        回复
     2. G
        2023-05-11 17:36
        
        介绍视频就是简易教程
        
        回复
     3. 780822464
        2023-06-26 14:39
        
        不会用?
        
        回复
     4. 杰杰
        2023-06-26 14:44
        
        不会?
        
        回复
 2.  G
     2023-05-11 17:33
     
     捉虫:“只需要清晰的说化即可”→“只需要清晰的说话即可”
     
     回复
 3.  G
     2023-05-11 17:34
     
     介绍视频就是简易教程
     
     回复
 4.  入梦
     2023-05-12 00:52
     
     GTX 16开头的声卡目前是有BUG的
     
     回复
 5.  nn
     2023-05-13 17:45
     
     开始推理以后会弹按任意键继续然后就闪退了
     
     回复
     1. nn
        2023-05-13 17:54
        
        好了原来是模型没选上
        
        回复
        1. 837965925
           2023-05-23 13:50
           
           我也是这样 咋选模型啊
           
           回复
 6.  临时
     2023-05-27 23:24
     
     融合模型的时候显示“Fail to merge the models. The model architectures are not the
     same.“怎么解决?”
     
     回复
 7.  木
     2023-05-29 11:59
     
     打游戏还是勉强了,占用太高。游戏不会卡但声音一下子就卡的没法听了。
     
     回复
     1. 入梦
        2023-05-29 19:13
        
        是的,暂时吃配置太高,不适合打游戏
        
        回复
 8.  elvajiazhen
     2023-06-01 15:59
     
     可以在linux操作系统上训练不
     
     回复
 9.  卡卡
     2023-06-06 05:09
     
     mac能用不
     
     回复
 10. 小晨
     2023-06-07 01:53
     
     没有小N的文件夹
     
     回复
 11. 哇咔咔
     2023-06-09 23:12
     
     乱码哈哈
     
     回复
 12. 陈睿
     2023-06-16 16:24
     
     i312100f打游戏会卡 建议上个好u
     
     回复
     1. 入梦
        2023-06-17 01:30
        
        至少12600KF以上
        
        回复
 13. VARD
     2023-06-18 14:03
     
     请问GT16开头声卡的bug修复了么
     
     回复
     1. 入梦
        2023-06-19 11:03
        
        早就修复可以用了
        
        回复
 14. 112
     2023-06-19 19:53
     
     你好 请问怎么卸载呀 配置不行 运行吃力
     
     回复
     1. 入梦
        2023-06-20 01:27
        
        直接删除就行了,虚拟声卡在小工具上再次点击
        
        回复
 15. WILL
     2023-06-20 23:20
     
     打开.bat文件直接变成CMD指令窗了怎么回事
     
     回复
     1. 入梦
        2023-06-21 01:29
        
        就是CMD啊
        
        回复
 16. lixisake
     2023-06-21 04:29
     
     让我试试a卡能不能使用
     
     回复
 17. 花崎千雪
     2023-06-22 20:31
     
     可以用cpu吗
     
     回复
 18. Richard15
     2023-06-24 19:47
     
     能否像日本RVC那样,让GPU提供计算。
     
     回复
     1. 入梦
        2023-06-25 00:29
        
        这是GPU和CPU同时负载
        
        回复
 19. tttx
     2023-06-26 13:16
     
     回音的事情一直解决不了。。。。输入设备只有麦克风阵列,但还是有回音(哭)
     
     回复
     1. 入梦
        2023-06-26 14:50
        
        您这笔记本自带麦克风,连个耳机都木有,肯定不行啊
        
        回复
 20. 780822464
     2023-06-26 14:37
     
     哈哈
     
     回复
 21. 桑榆不是章鱼
     2023-06-27 19:29
     
     大佬,可以在笔记本上使用输出到手机上吗?
     
     回复
 22. 胥余
     2023-06-27 21:02
     
     有好用的模型吗,养模型是什么意思
     
     回复
 23. maoshu
     2023-06-29 09:33
     
     .bat双击没反应是怎么回事?
     
     回复
 24. 凤凰琴弦
     2023-06-30 01:05
     
     点击.bat文件出现这种情况
     D:\PVC\RVC-AI\RVC-beta>runtime\python.exe Rumeng.py
     2023-06-30 01:01:23 | INFO | faiss.loader | Loading faiss with AVX2
     support.
     2023-06-30 01:01:23 | INFO | faiss.loader | Could not load library with
     AVX2 support due to:
     ModuleNotFoundError("No module named 'faiss.swigfaiss_avx2'")
     2023-06-30 01:01:23 | INFO | faiss.loader | Loading faiss.
     2023-06-30 01:01:23 | INFO | faiss.loader | Successfully loaded faiss.
     然后推理时间一直为0,这是为什么呢?
     
     回复
 25. 哐哐
     2023-06-30 20:37
     
     点开命令程序显示C:\Windows\System32>runtime\python.exe Rumeng.py
     系统找不到指定的路径。
     请问怎么解决?
     
     回复

入梦 bibi: 入梦Rumeng

1116文章 424评论 26栏目

热门文章
RM Voice Changer (入梦音频变声器)v35.3 (原创) (PC)
109 评论
RVC AI变声器620 含模型和虚拟声卡 入梦增强版 (PC)
38 评论
入梦方舟小工具v9.1.1 (原创) (PC)
36 评论
RM Toolbox (入梦工具箱)v8.3 (原创) (PC)
35 评论
《使命召唤》1-14合集 (PC)
35 评论
更多
 * 捐赠本站
 * 淘宝店铺
 * 关于

版权所有 © 2022 入梦资源社区 苏ICP备17023803号-1  


bibi: 入梦Rumeng