我想开发一个安卓应用。
应用的一个功能是识别两个人的声音。
它会像这样 - 当应用程序打开时,两个人会在它的前面交谈。 应用将检测到2个人在说话,并计算A和B两人分别占总发言量的百分比。
因此,例如,在1分钟后,该应用程序将告诉您A发言了80%,B发言了20%。
所以,我需要知道如何区分两个人的声音。
我已经尝试过SpeechRecognizer和android.speech.tts。 但我无法使其工作。
在安卓中,是否可以区分两个人的声音?
谢谢提前帮助。
我想开发一个安卓应用。
应用的一个功能是识别两个人的声音。
它会像这样 - 当应用程序打开时,两个人会在它的前面交谈。 应用将检测到2个人在说话,并计算A和B两人分别占总发言量的百分比。
因此,例如,在1分钟后,该应用程序将告诉您A发言了80%,B发言了20%。
所以,我需要知道如何区分两个人的声音。
我已经尝试过SpeechRecognizer和android.speech.tts。 但我无法使其工作。
在安卓中,是否可以区分两个人的声音?
谢谢提前帮助。
SpeechRecognizer或TTS都无法帮助您进行说话者识别,因为它们被设计用于语音识别。您需要使用DSP技术才能识别说话者。由于其复杂性,我认为您无法在设备本身内完成此任务。您可以保存您的音频(使用类似于Android中的AudioRecord
的东西),然后将其发送到服务器。在服务器端,您可以运行一个说话者识别程序。ALIZE
是一个非常流行的开源工具。