Python的speech_recognition库如何将声音转为文字

更新时间：2023年05月19日 10:10:36 作者：空空star

这篇文章主要介绍了通过Python的speech_recognition库将声音转为文字,将声音转为文字，除了speech_recognition库，还要依赖pyaudio库，而且mac用户需要安装PortAudio，本文给大家介绍的非常详细，需要的朋友可以参考下

前言

本篇给大家分享一下通过Python的speech_recognition库将声音转为文字。
之前已经介绍了将音频文件转为文字，只依赖speech_recognition库，本篇将声音转为文字，除了speech_recognition库，还要依赖pyaudio库，而且mac用户需要安装PortAudio。

Python-语音转文字相关库介绍可见文末详细介绍

一、PortAudio

1.PortAudio是什么？

PortAudio是一种跨平台的音频I/O库，用于实现音频输入和输出功能。它提供了一种简单、一致的跨平台API，可以让开发者在不同操作系统上编写音频应用程序，如音频录制和播放器。PortAudio支持多种音频设备，包括音频接口、音频文件、网络流等，并且可以在各种操作系统上使用，如Windows、Mac OS X、Linux、Unix等。同时，PortAudio还提供了一些高级特性，如流控制、同步、缓冲管理、音频格式转换等。

2.安装PortAudio

macOS下：

brew install portaudio

二、使用方法

1.引入库

import speech_recognition as sr

2.创建一个Recognizer对象

r = sr.Recognizer()

3.使用麦克风录音，从麦克风录制音频

# 使用麦克风录音
with sr.Microphone() as source:
    print("请说话...")
    # 从麦克风录制音频
    audio = r.listen(source)
    print("录音结束")

4.将音频转换为文字

try:
    # 将音频转换为文字
    text = r.recognize_google(audio, language='zh-CN')
    print("你说的是：", text)
except sr.UnknownValueError:
    print("Google Speech Recognition could not understand audio")
except sr.RequestError as e:
    print("Could not request results from Google Speech Recognition service; {0}".format(e))

5.转换结果

声音：深度神经网络模型部署

请说话...
录音结束
你说的是：深度神经网络模型部署

Process finished with exit code 0

Python-语音转文字相关库介绍

一、speech_recognition库是什么？

Python的speech_recognition库是一个用于语音识别的Python包，它可以使Python程序能够识别和翻译来自麦克风、音频文件或网络流的语音。它支持多种语音识别引擎，包括Google Speech Recognition、CMU Sphinx、Microsoft Bing Voice Recognition等，可以根据需要选择不同的引擎进行语音识别。
使用speech_recognition库进行语音识别非常简单，只需要导入该库并创建一个Recognizer对象，然后调用该对象的recognize_*()方法即可。例如，调用recognize_google()方法可以使用Google Speech Recognition引擎进行语音识别。

二、安装speech_recognition库

pip install SpeechRecognition

三、查看speech_recognition版本

 pip show SpeechRecognition

Name: SpeechRecognition
Version: 3.10.0
Summary: Library for performing speech recognition, with support for several engines and APIs, online and offline.
Home-page: https://github.com/Uberi/speech_recognition#readme
Author: Anthony Zhang (Uberi)
Author-email: azhang9@gmail.com
License: BSD
Requires: requests
Required-by:

四、pyaudio库是什么？

Pyaudio是Python语言的一个音频处理库，可以用来录制音频、播放音频、读取音频文件等。它是一个跨平台的库，可以在Windows、Mac、Linux等多个操作系统上使用。Pyaudio库是基于PortAudio C库开发的，PortAudio是一个跨平台的音频处理库，Pyaudio库可以方便的使用PortAudio库的功能。

五、安装pyaudio库

pip install pyaudio

六、查看pyaudio版本

pip show pyaudio

Name: PyAudio
Version: 0.2.13
Summary: Cross-platform audio I/O with PortAudio
Home-page: https://people.csail.mit.edu/hubert/pyaudio/
Author: Hubert Pham
Author-email:
License: MIT
Requires:
Required-by:

到此这篇关于通过Python的speech_recognition库将声音转为文字的文章就介绍到这了,更多相关Python声音转为文字内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

python3+PyQt5+Qt Designer实现扩展对话框
这篇文章主要为大家详细介绍了python3+PyQt5+Qt Designer实现扩展对话框，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-04-04
解决DataFrame排序sort的问题
今天小编就为的大家分享一篇解决DataFrame排序sort的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-06-06
Python常用模块函数代码汇总解析
这篇文章主要介绍了Python常用模块函数代码汇总解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-08-08
PyQt+socket实现远程操作服务器的方法示例
这篇文章主要介绍了PyQt+socket实现远程操作服务器的方法示例，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-08-08
python获取天气接口给指定微信好友发天气预报
这篇文章主要介绍了python获取天气接口给指定微信好友发天气预报的步骤，帮助大家更好的理解和学习python，感兴趣的朋友可以了解下
2020-12-12
Python之Pygame的Draw绘图
Pygame 中提供了一个draw模块用来绘制一些简单的图形状，比如矩形、多边形、圆形、直线、弧线等。本文主要介绍Pygame中的Draw绘图，感兴趣的同学可以参考阅读
2023-04-04
django 开发忘记密码通过邮箱找回功能示例
这篇文章主要介绍了django 开发忘记密码通过邮箱找回功能示例，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2018-04-04
学习python可以干什么
在本文里我们给大家分享了关于学习python的前途以及告诉大家可以做什么，正在学习PYTHON的朋友们学习下。
2019-02-02
人工智能学习pyTorch自建数据集及可视化结果实现过程
这篇文章主要为大家介绍了人工智能学习pyTorch自建数据集及可视化结果的实现过程，有需要的朋友可以借鉴参考下，希望能够有所帮助
2021-11-11
解决python将xml格式文件转换成txt文件的问题(xml.etree方法)
从数据分析的角度去看xml格式的数据集，具有简单性，结构和内容分离、可扩展性的特征，今天通过本文给大家分享python将xml格式文件转换成txt文件的问题及解决方法(xml.etree方法)，感兴趣的朋友一起看看吧
2021-09-09