如何将亚马逊转录的JSON响应转换为字幕格式（srt、webvtt等）？

Question

如何将亚马逊转录的JSON响应转换为字幕格式（srt、webvtt等）？

jsonamazon-web-servicesspeech-to-textwebvtt

12

尝试寻找一个能够将来自Amazon AWS Transcribe服务的JSON响应转换的软件包，但没有成功。

您可以在Fiddle的JavaScript部分中查看JSON示例。

我不想采用幼稚的方法，将10个单词捆绑在一起，因为这样会使字幕间的间距看起来很奇怪。

我甚至可以接受使用Google语音服务或Speechmatics以编程方式完成。它们都返回按单词拆分的json文件。

有人以前使用过吗？

谢谢！

- Daniel Angel

嘿，丹尼尔，你有这个问题的解决方案吗？ - Pranay Kumbhalkar

很遗憾，不行。我必须编写一个脚本来解析JSON并将其转换为SRT / VTT格式。@PranayKumbhalkar - Daniel Angel

谢谢你，@Deniel。我也是这样做的。 - Pranay Kumbhalkar

嗨@DanielAngel，你能分享一下你创建的脚本吗？ - Nick

1

@nick，我刚刚发布了一个答案。 - Daniel Angel

10个回答

3

我使用了来自Github的Python脚本，它可以很好地格式化成docx格式。输出甚至包括单词置信度的散点图，并将颜色更改为低置信度单词。这对我非常有效。

如果你想修改Python脚本，我认为你可以很容易地将其转换成HTML文件。 https://github.com/kibaffo33/aws_transcribe_to_docx

- Tim Clauss

1

受yash answer启发，我做了一些小改动。欢迎自由使用。

https://apoorv.blog/aws-transcribe-json-to-srt.html

我个人使用这个工具来满足自己的需求，所以请期待更新。

- Apoorv Mote

0

这是一个老问题，5年前这些答案是必要的。我碰巧找到了这个问题，并发现在2022年，他们直接将srt和vtt作为输出选项加入了服务中。服务文档在这里。

- Paco Hope

0

最终我创建了一个Bash脚本，将AWS Transcribe JSON文件转换为SRT格式。

它使用'jq'解析JSON文件。

https://github.com/nicolasps/aws-transcribe-to-srt

- Jorge P.

0

我看到了这个答案，也一直在寻找它，通过使用其他链接中显示的一些信息 - 接近了我可以使用的东西，但没有得到确切的答案，所以我决定完成解决方案。

步骤1 - 获取一个HTML模板来处理文本块和发言者名称，并按下按钮处理JavaScript 步骤2 - 将从Aws接收到的json粘贴到文本块中步骤3 - 单击按钮。

Html页面可以在这里找到：https://js.do/lnortje_gmail-com/amazon-transcribe-to-html-converter

我发现有用的一件事是知道翻译的置信度 - 使用这个可以帮助你知道翻译可能存在的问题，并且显示翻译的确切时间可以让你跳转到录音的那个地方。

好吧，使用它并享受，可能会有一天帮助某人 :)

- Leon Nortje

0

这是一个你可能能够使用的要点，或者给你一个所需内容的想法。基本上就是我最终做的事情。 https://gist.github.com/mwleinad/67a39d7d723f0a2ed076ed2485e098ae

- Daniel Angel

0

这里有一些内容（aws-transcribe-to-vtt），但我还没有能够测试它...

- Jeankowkow

0

我为了这个目的构建了一个 Web 应用程序（用于查看和编辑 AWS Transcribe JSON 文件）：https://scription.app 它可以分离讲话者，突出显示低置信度的单词，并将文本链接到音频播放（如果您加载了音频文件）。它仍然是一个 beta 版本，但希望对任何遇到此帖子的人有所帮助！

- F. Lumley

0

这是一个简单的实用工具脚本，用于将Amazon Transcribe .json转录文件转换成更易读的转录文件。

https://github.com/purdy/aws-transcribe-transcript

- Raj

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Yash Gadhiya · Accepted Answer

您可能已经找到了一种方法或创建了一个脚本来完成这个任务。我也尝试过寻找一些现成的解决方案，最终编写了一些JavaScript代码，从Amazon Transcribe的JSON输出生成SRT字幕文件。

该页面链接为：https://www.yash.info/aws-srt-creator.htm。在这个HTML文件中，我按照句号（.）来分句，并且它是一个独立的文件。欢迎随意下载和修改。