有没有替代Dragon NaturallySpeaking的软件?


你在意是否是自由开源软件吗?需要能够离线工作吗?仅限英语使用吗? - Pablo Bianchi
7个回答

有一整个维基百科文章专门讨论这个问题。

不幸的是,目前似乎没有一个解决方案能够很好地运作,但有大量正在进行中的项目。

你可以浏览解决方案列表,看看是否有符合你需求的内容。

鸭嘴兽

总是有可能使用WINE来运行Dragon Naturally Speaking。鸭嘴兽项目正在开发软件,将Dragon的输出重定向到任何Linux / X应用程序,并且他们已经取得了很大进展。

你绝对应该看一下这个。

为了提供最新的答案,这里有一篇来自2018年3月的文章:最佳免费Linux语音识别工具-开源软件
这篇文章介绍了Linux上最好的开源语音识别软件。需要注意的是,其中一些软件还处于早期开发阶段,因此尚未准备好广泛应用。
在我们介绍推荐软件之前,值得特别提到的是Jasper。它是一个出色的开源平台,用于开发始终保持开启状态、由语音控制的应用程序。你可能会想知道为什么HTK没有出现在下面。确实,HTK是一款流行的语音识别工具包。但HTK不符合推荐解决方案的条件。这并不是因为它的版权归微软所有,而是因为它是专有软件。
让我们来探索这6个免费语音识别工具。对于每个标题,我们都编写了一个专门的门户页面,其中包含完整的描述和对其功能的深入分析。
开源语音识别工具

你可以从ppa ppa:chromium-daily/stable如何添加PPA)安装Chromium 11版本,并在启动器的末尾添加--enable-speech-input。

enter image description here

现在访问这个网站,呼!在Ubuntu上使用HTML5的语音转文字。

我在这里读到,如果你说得慢一点,会更准确。

enter image description here



2FreeSpeech似乎已经不再维护了。自Ubuntu 10以来,它就没有提供过ppa。 - JellicleCat
2现在有一个FreeSpeech的Python 3版本 - dotancohen


尝试使用Mozilla DeepSpeech,这是一个开源的自动转录工具。但你需要对该工具进行训练或下载Mozilla的预训练模型。对于非常清晰的录音,准确率相对较高。但对于我的项目来说,仍然不够满意,因为录音中有很多背景噪音,质量也不好。我选择了Transcribear,它是一个基于网络的编辑器,可以实现自动转录。但你需要在线连接才能将录音上传到Transcribear服务器。

如果你对谷歌有耐心,那么在Chrome浏览器的谷歌文档中有谷歌语音输入。打开一个空白的谷歌文档,点击工具->语音输入,点击麦克风开始说话。在2020年,它似乎比我大约2018年尝试时要好,根据一个快速的一段测试,错误率与基于Dragon的语音识别差不多。不幸的是,定制化程度较低,无法教它自定义发音以识别未知单词。这是文档链接。还有一个"Voice in Voice Typing" Chrome插件,可以使语音转文字功能在所有网页输入框中可用。