如何将亚马逊转录的JSON响应转换为字幕格式(srt、webvtt等)?

12

尝试寻找一个能够将来自Amazon AWS Transcribe服务的JSON响应转换的软件包,但没有成功。

您可以在Fiddle的JavaScript部分中查看JSON示例

我不想采用幼稚的方法,将10个单词捆绑在一起,因为这样会使字幕间的间距看起来很奇怪。

我甚至可以接受使用Google语音服务或Speechmatics以编程方式完成。它们都返回按单词拆分的json文件。

有人以前使用过吗?

谢谢!


嘿,丹尼尔,你有这个问题的解决方案吗? - Pranay Kumbhalkar
很遗憾,不行。我必须编写一个脚本来解析JSON并将其转换为SRT / VTT格式。@PranayKumbhalkar - Daniel Angel
谢谢你,@Deniel。我也是这样做的。 - Pranay Kumbhalkar
嗨@DanielAngel,你能分享一下你创建的脚本吗? - Nick
1
@nick,我刚刚发布了一个答案。 - Daniel Angel
10个回答

8
您可能已经找到了一种方法或创建了一个脚本来完成这个任务。我也尝试过寻找一些现成的解决方案,最终编写了一些JavaScript代码,从Amazon Transcribe的JSON输出生成SRT字幕文件。
该页面链接为:https://www.yash.info/aws-srt-creator.htm。在这个HTML文件中,我按照句号(.)来分句,并且它是一个独立的文件。欢迎随意下载和修改。

3
我使用了来自Github的Python脚本,它可以很好地格式化成docx格式。输出甚至包括单词置信度的散点图,并将颜色更改为低置信度单词。这对我非常有效。
如果你想修改Python脚本,我认为你可以很容易地将其转换成HTML文件。 https://github.com/kibaffo33/aws_transcribe_to_docx

1

0
这是一个老问题,5年前这些答案是必要的。我碰巧找到了这个问题,并发现在2022年,他们直接将srt和vtt作为输出选项加入了服务中。服务文档在这里

0

0

我看到了这个答案,也一直在寻找它,通过使用其他链接中显示的一些信息 - 接近了我可以使用的东西,但没有得到确切的答案,所以我决定完成解决方案。

步骤1 - 获取一个HTML模板来处理文本块和发言者名称,并按下按钮处理JavaScript 步骤2 - 将从Aws接收到的json粘贴到文本块中 步骤3 - 单击按钮。

Html页面可以在这里找到:https://js.do/lnortje_gmail-com/amazon-transcribe-to-html-converter

我发现有用的一件事是知道翻译的置信度 - 使用这个可以帮助你知道翻译可能存在的问题,并且显示翻译的确切时间可以让你跳转到录音的那个地方。

好吧,使用它并享受,可能会有一天帮助某人 :)


0

0

0
我为了这个目的构建了一个 Web 应用程序(用于查看和编辑 AWS Transcribe JSON 文件):https://scription.app 它可以分离讲话者,突出显示低置信度的单词,并将文本链接到音频播放(如果您加载了音频文件)。它仍然是一个 beta 版本,但希望对任何遇到此帖子的人有所帮助!

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接