Python的speech_recognition库如何将声音转为文字
前言
本篇给大家分享一下通过Python的speech_recognition库将声音转为文字。
之前已经介绍了将音频文件转为文字,只依赖speech_recognition
库,本篇将声音转为文字,除了speech_recognition
库,还要依赖pyaudio
库,而且mac用户需要安装PortAudio
。
Python-语音转文字相关库介绍 可见文末详细介绍
一、PortAudio
1.PortAudio是什么?
PortAudio是一种跨平台的音频I/O库,用于实现音频输入和输出功能。它提供了一种简单、一致的跨平台API,可以让开发者在不同操作系统上编写音频应用程序,如音频录制和播放器。PortAudio支持多种音频设备,包括音频接口、音频文件、网络流等,并且可以在各种操作系统上使用,如Windows、Mac OS X、Linux、Unix等。同时,PortAudio还提供了一些高级特性,如流控制、同步、缓冲管理、音频格式转换等。
2.安装PortAudio
macOS下:
brew install portaudio
二、使用方法
1.引入库
import speech_recognition as sr
2.创建一个Recognizer对象
r = sr.Recognizer()
3.使用麦克风录音,从麦克风录制音频
# 使用麦克风录音 with sr.Microphone() as source: print("请说话...") # 从麦克风录制音频 audio = r.listen(source) print("录音结束")
4.将音频转换为文字
try: # 将音频转换为文字 text = r.recognize_google(audio, language='zh-CN') print("你说的是:", text) except sr.UnknownValueError: print("Google Speech Recognition could not understand audio") except sr.RequestError as e: print("Could not request results from Google Speech Recognition service; {0}".format(e))
5.转换结果
声音:深度神经网络模型部署
请说话...
录音结束
你说的是: 深度神经网络模型部署Process finished with exit code 0
Python-语音转文字相关库介绍
一、speech_recognition库是什么?
Python的speech_recognition库是一个用于语音识别的Python包,它可以使Python程序能够识别和翻译来自麦克风、音频文件或网络流的语音。它支持多种语音识别引擎,包括Google Speech Recognition、CMU Sphinx、Microsoft Bing Voice Recognition等,可以根据需要选择不同的引擎进行语音识别。
使用speech_recognition库进行语音识别非常简单,只需要导入该库并创建一个Recognizer对象,然后调用该对象的recognize_*()方法即可。例如,调用recognize_google()方法可以使用Google Speech Recognition引擎进行语音识别。
二、安装speech_recognition库
pip install SpeechRecognition
三、查看speech_recognition版本
pip show SpeechRecognition
Name: SpeechRecognition
Version: 3.10.0
Summary: Library for performing speech recognition, with support for several engines and APIs, online and offline.
Home-page: https://github.com/Uberi/speech_recognition#readme
Author: Anthony Zhang (Uberi)
Author-email: azhang9@gmail.com
License: BSD
Requires: requests
Required-by:
四、pyaudio库是什么?
Pyaudio是Python语言的一个音频处理库,可以用来录制音频、播放音频、读取音频文件等。它是一个跨平台的库,可以在Windows、Mac、Linux等多个操作系统上使用。Pyaudio库是基于PortAudio C库开发的,PortAudio是一个跨平台的音频处理库,Pyaudio库可以方便的使用PortAudio库的功能。
五、安装pyaudio库
pip install pyaudio
六、查看pyaudio版本
pip show pyaudio
Name: PyAudio
Version: 0.2.13
Summary: Cross-platform audio I/O with PortAudio
Home-page: https://people.csail.mit.edu/hubert/pyaudio/
Author: Hubert Pham
Author-email:
License: MIT
Requires:
Required-by:
到此这篇关于通过Python的speech_recognition库将声音转为文字的文章就介绍到这了,更多相关Python声音转为文字内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
python3+PyQt5+Qt Designer实现扩展对话框
这篇文章主要为大家详细介绍了python3+PyQt5+Qt Designer实现扩展对话框,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下2018-04-04解决python将xml格式文件转换成txt文件的问题(xml.etree方法)
从数据分析的角度去看xml格式的数据集,具有简单性,结构和内容分离、可扩展性的特征,今天通过本文给大家分享python将xml格式文件转换成txt文件的问题及解决方法(xml.etree方法),感兴趣的朋友一起看看吧2021-09-09
最新评论