通过Python的speech_recognition库将声音转为文字网站首页 技术杂谈

通过Python的speech_recognition库将声音转为文字

空空star 2024-06-17 10:48:29

简介通过Python的speech_recognition库将声音转为文字

文章目录

前言
一、PortAudio
- 1.PortAudio是什么？
- 2.安装PortAudio
二、使用方法
总结

前言

大家好，我是空空star，本篇给大家分享一下通过Python的speech_recognition库将声音转为文字。
之前已经介绍了将音频文件转为文字，只依赖speech_recognition库，本篇将声音转为文字，除了speech_recognition库，还要依赖pyaudio库，而且mac用户需要安装PortAudio。

Python-语音转文字相关库介绍

一、PortAudio

1.PortAudio是什么？

PortAudio是一种跨平台的音频I/O库，用于实现音频输入和输出功能。它提供了一种简单、一致的跨平台API，可以让开发者在不同操作系统上编写音频应用程序，如音频录制和播放器。PortAudio支持多种音频设备，包括音频接口、音频文件、网络流等，并且可以在各种操作系统上使用，如Windows、Mac OS X、Linux、Unix等。同时，PortAudio还提供了一些高级特性，如流控制、同步、缓冲管理、音频格式转换等。

2.安装PortAudio

macOS下：

brew install portaudio

二、使用方法

1.引入库

import speech_recognition as sr

2.创建一个Recognizer对象

r = sr.Recognizer()

3.使用麦克风录音，从麦克风录制音频

# 使用麦克风录音
with sr.Microphone() as source:
    print("请说话...")
    # 从麦克风录制音频
    audio = r.listen(source)
    print("录音结束")

4.将音频转换为文字

try:
    # 将音频转换为文字
    text = r.recognize_google(audio, language='zh-CN')
    print("你说的是：", text)
except sr.UnknownValueError:
    print("Google Speech Recognition could not understand audio")
except sr.RequestError as e:
    print("Could not request results from Google Speech Recognition service; {0}".format(e))

5.转换结果

声音：深度神经网络模型部署

请说话...
录音结束
你说的是： 深度神经网络模型部署

Process finished with exit code 0

总结

风语者！平时喜欢研究各种技术，目前在从事后端开发工作，热爱生活、热爱工作。

上一篇
opencv二值化详解

下一篇
你真的了解低代码吗？

站长推荐

QT多线程的5种用法，通过使用线程解决UI主界面的耗时操作代码，防止界面卡死。
QT多线程的5种用法，通过使用线程解决UI主界面的耗时操作代码，防止界面卡死。...
U8W/U8W-Mini使用与常见问题解决
U8W/U8W-Mini使用与常见问题解决
stm32使用HAL库配置串口中断收发数据（保姆级教程）
stm32使用HAL库配置串口中断收发数据（保姆级教程）
分享几个国内免费的ChatGPT镜像网址(亲测有效)
分享几个国内免费的ChatGPT镜像网址(亲测有效)
Allegro16.6差分等长设置及走线总结
Allegro16.6差分等长设置及走线总结

您现在的位置是：首页 >技术杂谈 >通过Python的speech_recognition库将声音转为文字网站首页技术杂谈

通过Python的speech_recognition库将声音转为文字

文章目录

前言

一、PortAudio

1.PortAudio是什么？

2.安装PortAudio

二、使用方法

1.引入库

2.创建一个Recognizer对象

3.使用麦克风录音，从麦克风录制音频

4.将音频转换为文字

5.转换结果

总结

上一篇 opencv二值化详解

下一篇 你真的了解低代码吗？

站长推荐

上一篇
opencv二值化详解

下一篇
你真的了解低代码吗？