19得票5回答
如何在Python中进行实时语音活动检测?

我正在对录制的音频文件进行语音活动检测,以检测波形中的语音和非语音部分。 分类器的输出如下(绿色区域表示语音): 我在这里面临的唯一问题是使其适用于音频输入流(例如:来自麦克风),并在规定的时间范围内进行实时分析。 我知道可以使用 PyAudio 动态地从麦克风记录语音,并且有几个实...

17得票2回答
由于未安装软件包“wheel”,无法为pyaudio构建轮子。

我试图安装pyaudio,但是出现了如下错误:Could not build wheels for pyaudio, since package 'wheel' is not installed. 我该如何修复这个问题?

15得票7回答
Pyaudio无法导入_portaudio。

尝试运行使用pyaudio的Python应用程序。已安装virtualenv并且安装工作正常。但是在运行时找不到portaudio。但是 _portaudio.so文件存在。有什么建议吗? 尝试运行使用 pyaudio 的 Python 应用程序。已使用 virtualenv 进行安装并成功安...

15得票1回答
未知的PCM cards.pcm.rear (pyaudio)

该问题涉及到这个pydub问题。他们告诉我错误信息与pyaudio有关。 #!/usr/bin/env python3 import pydub, pydub.playback wav = pydub.AudioSegment.from_wav('/home/user/complete...

13得票3回答
Linux - 没有硬件声卡,如何捕获音频播放并录制到文件中

这种事情可能吗? 是否有可能创建一个虚拟声卡,并使用例如PyAudio来监听其输出并将其保存到文件中?请注意,计算机上没有硬件声卡。 我已经尝试了很多东西,特别是 ALSA模块,但我开始怀疑我是否在寻找正确的工具。如果有人能指点我至少高级解决方案,我将不胜感激。最好是在Ubuntu服务器上...

13得票1回答
将多通道PyAudio转换为NumPy数组

我能找到的所有示例都是单声道的,CHANNELS = 1。 如何使用PyAudio中的回调方法读取立体声或多声道输入,并将其转换为2D NumPy数组或多个1D数组?对于单声道输入,以下内容可以正常工作:def callback(in_data, frame_count, time_info,...

12得票1回答
使用Python 3捕获192 kHz音频

我需要使用Python 3捕获192 kHz的音频来进行生物声学实验。我有所需硬件:一个Sound Devices USBPre 2声卡,一个具有良好频率响应曲线(高达100 kHz)的麦克风,并且我已经在我的操作系统(ubuntu 13.04)上启用了从该声卡采样以达到192 kHz的功能。...

12得票3回答
如何在Python中读取.wav字节流

有没有一种方法可以读取.wav格式二进制数据的帧?我正在将.wav二进制数据流式传输到Python服务器,我希望能够从pyaudio处理中读取和使用它,但是pyaudio会抱怨帧大小。 由于我不能使用wave.open('filename.wav'),因为我已经有了正在流式传输的二进制数据,...

11得票4回答
安装PyAudio时出现错误 "Failed Building Wheel for PyAudio"。

我一直在尝试安装PyAudio,但是一直没有成功。我已经尝试了几种不同的解决方案,并且使用homebrew安装了前置库"portaudio"。我也寻找了解决gcc错误的方法,但是这只导致另一个错误出现,显示“Error: command ‘clang’ failed with exit sta...

11得票9回答
导入错误:找不到pyaudio模块。

我正在树莓派上用Python编写程序,但是遇到了一个错误。ImportError No module named pyaudio 之后我尝试了git clone http://people.csail.mit.edu/hubert/git/pyaudio.git 但再次获得另一个fatal: ...