详情介绍
CosyVoice是通义实验室依托大规模预训练语言模型,深度融合文本理解和语音生成的新一代生成式语音合成大模型,支持文本至语音的实时流式合成。可以应用于:
智能设备/机器人播报的语音内容,如智能客服机器人、智能音箱、数字人、语音助手等。
音视频创作中需要将文字转为语音播报的场景,如小说阅读、新闻播报、影视解说、剧本配音等。
CosyVoice则专注自然语音生成,支持多语言、音色和情感控制,支持中英日粤韩5种语言的生成,效果显著优于传统语音生成模型。
仅需要3~10s的原始音频,CosyVoice即可生成模拟音色,甚至包括韵律、情感等细节,包括跨语种语音生成。而且CosyVoice支持以富文本或自然语言的形式,对生成语音的情感、韵律进行细粒度的控制,生音频在情感表现力上得到明显提升。
CosyVoice是一款基于语音量化编码的语音生成大模型。它对语音进行离散化编码,并依托大模型技术,实现自然流畅的语音生成体验。与传统语音生成技术相比,CosyVoice具有韵律自然、音色逼真等特点。CosyVoice支持多达5种语言,同时还支持以自然语言或富文本形式对生成语音进行情感等维度的细粒度控制。研究团队提供了基模型CosyVoice-300M、经过SFT微调后的模型CosyVoice-300M-SFT、以及支持细粒度控制的模型CosyVoice-300M-Instruct,可满足不同场景下的使用需求。
通过与原始音频以及最近大火的ChatTTS对比,可以发现CosyVoice的合成音频在内容一致性上更高,并且没有很少存在幻觉额外多字的现象。CosyVoice很好地建模了合成文本中的语义信息,达到了与人类发音人相当的水平。此外,通过对合成音频进行重打分,能够进一步降低识别的错误率,甚至在内容一致性和说话人相似度上超越人类。(文件包有预合成演示音频,可自行听取)
使用说明
1.选择推理模式
2.点击骰子按钮(可选),可以改变说话人的语调和韵律
3.按照提示步骤进行操作
稍微等待一下,程序就处理完毕了,可以在页面底部的输出音频界面播放和下载合成后的语音
注意事项
①项目安装路径不要包含中文
②推荐使用GTX1060以上显卡运行此项目
③使用过程中若不慎关闭软件后台,请重新打开,并刷新网页
更新内容:
1、新增手动选择参考音频列表
将需要克隆的参考音频拷贝到软件根目录下的 “参考音频” 文件夹,并将文件名改名为音频说话内容,如下图
点击“刷新参考音频”即可。
2、自定义音色保存
克隆音色生成后,在下方输入音色名称,保存即可。如上图。
比如我们将克隆后的“大幂幂”的音色保存下来,这里输入 大幂幂
保存后,点这里的“刷新新增音色”
即可在新增音色里找到我们刚才克隆的“大幂幂”的音色
后期需要使用这个音色生成音频,就直接在这里选择“大幂幂”即可。
下载地址
人气软件
最强伴奏与人声一键分离工具Ultimate Vocal Remover GUI(UVR5) v
PreSonus Studio One 6 Professional V6.6.2 中文永久免费版(附
IBM ViaVoice Pro v9.1 简体中文版
Adobe Audition 2024(Au2024) v24.6.0.069 中文安装免费版 64位
Studio One6机架效果包插件 V6.0.2 中文免费版(附使用教程)
iZotope RX6 Audio Editor Advanced(音频修复工具) v6.0 安装特
大饼AI变声 v2.4.15 官方安装版
阿里开源语音模型CosyVoice 0721 整合包 免费版
Adobe Audition CC 2019 12.1 中/英文正式最新版 64位
终极伴奏人声提取工具 Ultimate Vocal Remover(UVR) v5.5.1 中文
相关文章
-
JZAudioMaster 金舟音频大师 v2.1.8 绿色免费版
金舟音频大师有丰富的功能可以使用,可满足您的各种音频处理需求,为用户提供强大的音频处理和编辑功能,助您轻松完成各种音频项目,这款软件中有丰富的专业功能可以让大家...
-
Steinberg Cubase Pro v14.0.5 x64 中文完整免费版(Team V.R/R2R)
Cubase 14 Pro 是一次重大的更新,涵盖了在音序器各个方面的众多改进,Cubase 14 通过开创性的功能、简化的工作流程和直观的设计解锁新的创作可能性,以提升您的音乐制作体...
-
MP3剪切工具(Abelssoft MP3 Cutter Pro) v9.9.0 绿色免费版
Abelssoft MP3 Cutter 绿色版是款简单好用的 MP3 文件剪切工具,能够帮助广大用户以简便的方式,快速地将 MP3 文件剪切为多分片段,使其能够更好进行提取或上传等操作,同...
-
Adobe Audition 2025(Au2025) v25.0 中文绿色免费版 64位
Adobe Audition。 一个专业的音频工作站。 用业界最好的数字音频编辑软件建立、混合和设计音效效果。 Audition是一个综合工具集,内含多轨、波形和频谱显示,用于建立、混...
-
MP3提取转换器 V1.3.1 官方安装版
MP3提取转换器电脑端使用的格式转换工具,支持裁剪、合并、铃声、调速、音量调节等多项功能,本站提供的是这款软件的安装版本...
-
Adobe Audition 2025(Au2025) v25.0.0.047 中文免费安装正式版 64位
Adobe Audition是专业的音频工作站,使用业界最好的数字音频编辑软件创建、混合和设计音效,Audition 是一个全面的工具集,包括多轨、波形和频谱显示,这里提供最新Adobe A...
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的阿里开源语音模型CosyVoice 0721 整合包 免费版资源来源互联网,版权归该下载资源的合法拥有者所有。