详情介绍
Constme-Whisper是一款本地离线语音转文字工具,支持 GPU、支持实时语音转换。Whisper是由 OpenAI 训练并开源的神经网络,在英语语音识别方面的稳健性和准确性接近人类水平whisper.cpp 项目是将 Whisper 移植到 C/C++ 中,而今天介绍的 Const-me/Whisper 项目则是 whisper.cpp 在 Windows 上的实现,并增加了显卡的支持,使得速度大幅提升。欢迎需要此款工具的朋友前来下载使用。
软件介绍
Constme-Whisper是OpenAI的Whisper自动语音识别ASR模型的衍生项目。
Constme-Whisper可以在Windows上使用,支持高性能GPGPU处理,可以利用GPU加速处理。
本体是个启动器,需要结合一个语言识别模型文件(ggml-tiny、ggml-small、ggml-base、ggml-medium、ggml-large)使用,模型越大,效果越好,但相对的速度也更慢。
软件特点
基于DirectCompute的与供应商无关的GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
纯C++实现,除了基本的操作系统组件外,没有运行时依赖关系
比OpenAI的实现快得多。
混合 F16 / F32 精度:Windows 需要自 D3D 版本 10.0 起支持缓冲区R16_FLOAT
内置性能探查器,用于测量单个计算着色器的执行时间
内存使用率低
用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis除外), 以及大多数在Windows上运行的音频捕获设备(除了一些专业设备,它们只实现ASIO API)。
用于音频捕获的语音活动检测。
易于使用的 COM 样式 API,nuget 上提供的惯用 C# 包装器
提供预构建的二进制文件
下载 Whisper 模型
而 Const-me 的这个名为 Whisper 的项目,目前仅提供 Windows 版本,使用简单,需要先下载模型:
开发者推荐 ggml-medium.bin,因为一直在使用这个模型进行测试,1.53 GB 大小。
使用 Whisper
在 Model Path 里面选择你下载的模型,然后选择 GPU 就能进入软件了。
之后,就可以选择通过麦克风实时转换,或者使用音频文件比如 MP3 来转换为文字了:
青小蛙随便测试了一个极客湾的视频(仅下载了音频),效果如下:
准确度很高,基本上比较满意。
由于是在虚拟机中测试,显卡性能有限,所以时间不具有参考性。
不过,开发者的测试是在装有 GeForce 1080Ti GPU 的台式电脑上,中型模型,3 分 24 秒语音使用 PyTorch 和 CUDA 转录需要 45 秒,但使用这个和 DirectCompute 只需要 19 秒。而 @JoeCubber 同学测试的是 11:31 分钟的音频,耗时1分26秒完成。
当然,你需要有显卡。
实在是没想到,挖矿之后,显卡又有了用武之地。
更新日志
更新了文档和 GUI 中的模型源 URL
可靠性增强,麦克风捕获不太可能转换到“停滞”状态并丢弃音频
注意:
需要不低于Win8.1的64位Windows
文件main.exe为命令行调用工具
下载地址
人气软件
最强伴奏与人声一键分离工具Ultimate Vocal Remover GUI(UVR5) v
PreSonus Studio One 6 Professional V6.6.2 中文永久免费版(附
IBM ViaVoice Pro v9.1 简体中文版
Adobe Audition 2024(Au2024) v24.6.0.069 中文安装免费版 64位
Studio One6机架效果包插件 V6.0.2 中文免费版(附使用教程)
iZotope RX6 Audio Editor Advanced(音频修复工具) v6.0 安装特
大饼AI变声 v2.4.15 官方安装版
阿里开源语音模型CosyVoice 0721 整合包 免费版
Adobe Audition CC 2019 12.1 中/英文正式最新版 64位
终极伴奏人声提取工具 Ultimate Vocal Remover(UVR) v5.5.1 中文
相关文章
-
JZAudioMaster 金舟音频大师 v2.1.8 绿色免费版
金舟音频大师有丰富的功能可以使用,可满足您的各种音频处理需求,为用户提供强大的音频处理和编辑功能,助您轻松完成各种音频项目,这款软件中有丰富的专业功能可以让大家...
-
Steinberg Cubase Pro v14.0.5 x64 中文完整免费版(Team V.R/R2R)
Cubase 14 Pro 是一次重大的更新,涵盖了在音序器各个方面的众多改进,Cubase 14 通过开创性的功能、简化的工作流程和直观的设计解锁新的创作可能性,以提升您的音乐制作体...
-
MP3剪切工具(Abelssoft MP3 Cutter Pro) v9.9.0 绿色免费版
Abelssoft MP3 Cutter 绿色版是款简单好用的 MP3 文件剪切工具,能够帮助广大用户以简便的方式,快速地将 MP3 文件剪切为多分片段,使其能够更好进行提取或上传等操作,同...
-
Adobe Audition 2025(Au2025) v25.0 中文绿色免费版 64位
Adobe Audition。 一个专业的音频工作站。 用业界最好的数字音频编辑软件建立、混合和设计音效效果。 Audition是一个综合工具集,内含多轨、波形和频谱显示,用于建立、混...
-
MP3提取转换器 V1.3.1 官方安装版
MP3提取转换器电脑端使用的格式转换工具,支持裁剪、合并、铃声、调速、音量调节等多项功能,本站提供的是这款软件的安装版本...
-
Adobe Audition 2025(Au2025) v25.0.0.047 中文免费安装正式版 64位
Adobe Audition是专业的音频工作站,使用业界最好的数字音频编辑软件创建、混合和设计音效,Audition 是一个全面的工具集,包括多轨、波形和频谱显示,这里提供最新Adobe A...
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的Constme-Whisper(离线语音识别转文字) v1.12 绿色免费版(含完整模型)资源来源互联网,版权归该下载资源的合法拥有者所有。