我是一名生活中受听力障碍影响的安卓开发者,目前正在探索使用安卓的语音识别API制作语音转文字应用的选项。在我的国家,闭路电话和Innocaption不可用。潜在的应用可能类似于在电话通话期间进行字幕显示。
https://developer.android.com/reference/android/speech/SpeechRecognizer.html
该API旨在捕获语音命令,而不是进行实时的实时转录。我甚至可以将其实现为服务,但是每次它提供结果或部分结果后,我都需要不断重启它,这在对话设置中是不可行的(服务重新启动时会丢失单词)。请注意,我不需要此应用程序的100%准确性。许多听障人士发现了解一些对话上下文有助于他们理解。因此,我实际上不需要关于这不准确的评论。
有没有办法实现连续模式的语音识别器?我可以创建一个文本视图,当从服务返回新文本时,它会不断更新自己。如果这个API不适合我的需求,是否有任何建议?我测试了CMUSphinx,但发现它过于依赖短语/句子块,不太可能适用于我所考虑的应用程序。