python语音识别whisper的使用

更新时间：2023年02月27日 10:05:49 作者：风华浪浪

本文主要介绍了python语音识别whisper的使用，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

一、背景

最近想提取一些视频的字幕，语音文案，研究了一波

二、whisper语音识别

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。
stable-ts在 OpenAI 的 Whisper 之上修改并添加了更大的破解代码发布，生成更准确的阶段时间切换，并在无须额外推介的情况下获得申领

安装

pip install openai-whisper 
pip install stable-ts

Size	Parameters	English-only model	Multilingual model	Required VRAM	Relative speed
tiny	39 M	tiny.en	tiny	~1 GB	~32x
base	74 M	base.en	base	~1 GB	~16x
small	244 M	small.en	small	~2 GB	~6x
medium	769 M	medium.en	medium	~5 GB	~2x
large	1550 M	N/A	large	~10 GB	1x

三、示例

模型越大，越精确，相应话费的时间越长
自带语言识别功能，language最好加上，下面歌曲识别为英语，加后为中文
stable_whisper 是 whisper 进化版

import whisper
import stable_whisper as whisper

class WhisperTranscriber(object):

    def __init__(self, model_name):
        self.model = whisper.load_model(model_name)

    def whisper_transcribe(self, audio_path):
        audio = self.model.transcribe(audio_path, fp16=False, language='Chinese')
        return audio['text']

if __name__ == '__main__':

    transcriber = WhisperTranscriber("base")
    text = transcriber.whisper_transcribe("257853511.mp3")
    print(text)

可能是伴奏声音过大，你才出来这是什么歌了吗？stable_whisper 别的用法、生成字幕

import stable_whisper
model = stable_whisper.load_model('base')
results = model.transcribe('257853511.mp3', fp16=False, language='Chinese')
stable_whisper.results_to_sentence_srt(results, 'audio')
stable_whisper.results_to_sentence_word_ass(results, 'audio.ass')

四、封装工具

buzz

如果遇到简繁转换可以石下面

pip install zhconv

zh-cn 大陆简体
zh-hant 繁體

from zhconv import convert     
convert('Python是一种动态的、面向对象的脚本语言', 'zh-hant')
'Python是一種動態的、面向對象的腳本語言'

到此这篇关于python语音识别whisper的使用的文章就介绍到这了,更多相关python语音识别whisper内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python必备技巧之字典(Dictionary)详解
Python中的字典由于是对象的集合属于复合数据类型，类似于列表。本文将通过示例详细讲解Python中字典的使用方法，感兴趣的可以了解一下
2022-03-03
Pyside2中嵌入Matplotlib的绘图的实现
这篇文章主要介绍了Pyside2中嵌入Matplotlib的绘图的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-02-02
关于Python Selenium自动化导出新版WOS(web of science)检索结果的问题
这篇文章主要介绍了Python Selenium自动化导出新版WOS(web of science)检索结果,本代码属于半自动化导出，考虑到开发效率等因素，有两处在首次导出时需要手动操作，具体实现过程跟随小编一起看看吧
2022-01-01
利用pandas进行数据清洗的方法
本文主要介绍了利用pandas进行数据清洗的方法，文中通过示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2021-09-09
python安装自己的代码到site-packages问题
这篇文章主要介绍了python安装自己的代码到site-packages问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2023-11-11
Python3 hashlib密码散列算法原理详解
这篇文章主要介绍了Python3 hashlib密码散列算法原理详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-03-03
Python正则表达式如何进行字符串替换实例
Python正则表达式在使用中会经常应用到字符串替换的代码。这篇文章主要介绍了Python正则表达式如何进行字符串替换,具有一定的参考价值，感兴趣的小伙伴们可以参考一下。
2016-12-12
python操作 hbase 数据的方法
下面小编就为大家带来一篇python操作 hbase 数据的方法。小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2016-12-12
tensorflow1.15与numpy、keras以及Python兼容版本对照方式
这篇文章主要介绍了tensorflow1.15与numpy、keras以及Python兼容版本对照方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2024-03-03
使用python写一个自动浏览文章的脚本实例
今天小编就为大家分享一篇使用python写一个自动浏览文章的脚本实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-12-12

python语音识别whisper的使用

目录

一、背景

二、whisper语音识别

三、示例

四、封装工具

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具