我如何将MP3中的语音转换为文本?
我有一些来自会议和会谈的录音笔记(录音中只有一个声音,即我的声音)。 我认为使用语音转文本工具将其转换为文本比手动转录更容易和有趣。 我知道有一些技术,特别是用于Asterisk和播客的VoIP应用程序,但它们是什么以及我该如何使用它们?
我如何将MP3中的语音转换为文本?
我有一些来自会议和会谈的录音笔记(录音中只有一个声音,即我的声音)。 我认为使用语音转文本工具将其转换为文本比手动转录更容易和有趣。 我知道有一些技术,特别是用于Asterisk和播客的VoIP应用程序,但它们是什么以及我该如何使用它们?
自然语言输入法 Dragon NaturallySpeaking 似乎支持 MP3 输入。
如果您想要一个 开源版本(我认为有一些基于此的 Asterisk 集成项目)。
来晚了,为未来的参考而回答。
该领域的进步以及 Mozilla 的心态和议程促成了这两个旨在实现此目标的项目:
后者有一个12GB的数据集可供下载。据我理解,前者可以使用你自己的音频文件训练模型。
from leopard import *
o = create(access_key=${YOUR_ACCESS_KEY})
print(o.process_file(${YOUR_AUDIO_FILE_PATH}))