是否有一个全面的已知桌面或浏览器环境API列表?
是否有一个全面的已知桌面或浏览器环境API列表?
我将重新阐述和更新在C、Java或PHP中进行语音识别?的答案。这并不全面,但可能是你的一个起点。
从观察这些问题几个月来,我发现大多数开发者的选择如下:
Windows用户-使用.Net或Microsoft.Speech的System.Speech功能并安装Microsoft提供的免费识别器。Windows 7包含完整的语音引擎,其他可免费下载。有一个C++ API到同样的引擎称为SAPI。请参见http://msdn.microsoft.com/en-us/magazine/cc163663.aspx 或 http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx。有关Windows的Microsoft引擎的更多背景信息,请参见What is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?
Linux用户-Sphinx似乎有很好的追随者。请参见http://cmusphinx.sourceforge.net/和http://cmusphinx.sourceforge.net/wiki/
商业产品 - Nuance, Loquendo, AT&T, IBM等。它们都提供各种语言的SDK和库。
在线服务 - Nuance, Yapme, ispeech.org, vlingo等。Nuance已经改善了他们的开发者计划,现在将为您提供免费访问其服务以进行开发。我相信Yap最近被亚马逊收购了,所以我们可能会看到一些变化。
当然,这也可能有所帮助 - http://en.wikipedia.org/wiki/List_of_speech_recognition_software
有一个Java语音API。请参阅Java Speech API中的javax.speech.recognition http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html。我相信您仍然需要找到支持此API的语音引擎。我不认为Sphinx完全支持它-http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi
还有很多其他的SO问题:需要Linux的文本到语音和语音识别工具以及pyspeech(python)-转录mp3文件?,其中提到http://code.google.com/p/pyspeech/。您也可以查看http://code.google.com/p/dragonfly/
文本转语音(语音生成)的主要API供应商是YAKiToMe!和iSpeech。我使用YAKiToMe!,因为我最喜欢他们的声音质量,并且他们是最便宜的(大多数是免费的)。他们支持多种语言中的男性和女性发音人。一些语音供应商,如Acapella、Nuance、Loquendo和iVona,有不错的声音,但往往使用起来比较昂贵。
<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" />
在你的JavaScript文件中定义一个函数,并确定你想要做什么。
就像这样:
function processspeech()
{
var speechtext=$("#speech").val();
var elem = document.getElementById("test");
elem.value = speechtext;
var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+ speechtext + "</span>\" <br />*Is this what you said???";
notify(notification);
}
<textarea> id="test"></textarea>
这段话是在文本区域中编写的