如何为YouTube转录加上标点符号?

18
在Youtube上,我可以下载视频的CC字幕,但字幕不包含标点符号。如何自动为字幕添加标点符号?

你能说明你是通过YouTube API还是客户端代码来尝试实现它吗? - Nate T
1
任何方法都可以。最好使用软件或服务,例如上传原始的转录/视频/音频并下载标点符号的转录。 - William
3个回答

10

真棒的工具。我刚刚用它来给一个YouTube视频的转录加上了标点符号,效果非常好。一开始我尝试对整个文档进行处理,但在大约35K个字符处停止了自动加标点。于是我手动将其分成了合理的块。这真是省时的好帮手。 - Chris C

4

在2023年,有多种方法可以做到这一点:

1. 使用chatGPT,它效果非常好,但由于输入文本的限制,对于长视频(60分钟以上)而言,这是一个相当繁琐的过程。除了批量处理之外,还必须控制每个批次的输出质量,因为它目前不是100%一致的。 2. 使用Deep Multilingual Punctuation Prediction。它可以精确恢复英文文本的77%的标点符号。但它无法修复大写字母。 3. 使用yt-dlpWhisper。从YouTube下载mp3并运行Whisper。这个OpenAI模型可以非常好地进行语音转文字,并提供带有标点符号的输出。但对于长视频/音频来说速度较慢(处理60分钟音频需要约30分钟)。示例实现 4. 使用yt-dlpwhisper.cpp。它的处理速度更快,处理60分钟音频只需不到10分钟。我的示例实现 5. 使用Shoki.app

我尝试使用chagGPT。确实它运行良好,但是提示必须仔细编写,否则目标文本可能会更改。它也不是免费的。 - Andy

4

无法从YouTube中获取它们,您必须自己生成它们。 谷歌 提供了一项为任意文本生成标点的服务,并且根据我的个人经验,它比某些竞争对手更准确,因此我建议将其通过该服务运行。


2
此服务需要您从视频中提取音频并上传。而且这是一个付费服务。 - William

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接