另外,我还没有找到任何适用的语音识别解决方案,我找到了语音识别,但这不是我需要的。
我不想使用任何在线API。有人可以建议我使用哪些SDK或算法来实现面部、情感和声音识别吗?
只需查看System.Speech.Recognition Namespace(请参阅这个和这个答案)。
我知道这个问题很老,但是我想为它做出贡献,因为我也在开发类似的应用程序。
现在有很多面部、情绪和声音识别的选择,请看以下几个选项:
1)使用OpenCV进行面部检测和识别:http://ahmedopeyemi.com/main/face-detection-and-recognition-in-c-using-emgucv-3-0-opencv-wrapper-part-1/
优点:开源,基本上是免费的。你可以修改代码以适应你的需求。支持多个平台。
缺点:准确性可容忍,但不是很好。这可以通过修改库来解决。
2)具有情感的面部检测和识别:尝试使用Microsoft Cognition Service API
优点:非常准确。它包括许多其他服务,如自然语言处理、语音转文本、文本转语音、计算机视觉、实时语言翻译等。由于这些服务托管在云端并针对每个数据输入进行训练,所以准确性很高。
缺点:付费解决方案。有点昂贵。您必须为每项服务分别付费。
3)语音识别:Google Voice API 优点:与微软认知服务相似。在嘈杂环境中准确度更高。 缺点:需要付费。可能不适合一次性销售的商业产品。
4)语音识别和自然语言处理:wit.ai/api.ai 优点:免费使用。可以使用其他公共应用程序的数据。准确度很高。 缺点:我没有发现任何缺点。
试试以下链接,可能会有所帮助。
基于MS Face API的安全系统 https://www.hackster.io/peejster/facial-recognition-security-system-c6ca6c