C#中的语音检测

11

我正在寻找一个简单的C#实时语音检测库。输入应该是音频流,输出应该是“人声”或“非人声”。我对语音识别和信号处理一无所知,因此将感谢任何形式的帮助。


3
您打算如何确定什么是人类的声音,什么不是?这不是一个简单的问题,但如果您能设定一些目标参数,我们或许可以为您提供方向建议。 - Brad
我正在尝试测量演讲者讲话的时间以及他的停顿时间。 - Uri Goren
这里回答了一个相似但不完全相同的问题(https://dev59.com/EHVC5IYBdhLWcg3wpS3f"),这些信息或许会有用。 - Eli
1个回答

5
请看 "使用C#检测WAV文件中的音频静默 "的答案。我假设输入是WAV文件。如果不是,请提供音频流的格式,或者您是否打算直接从麦克风获取输入。如果您可以测量音频流中的沉默时间,并且您知道音频流的持续时间,则可以计算讲话时间。答案中的链接已失效,但是如果您在codeproject.com上搜索“C#波形”,则会找到一些项目,这些项目将向您展示如何解释和操作wav文件。如果存在背景噪音,则检测静默可能有点主观。您需要选择一个最小音量阈值来表示静默,低于该阈值的任何内容都被视为静默。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接