谷歌会议：WebRTC点对点和语音转文本

Question

6

我参加了Google Meet的会议，发现可以启用实时字幕功能。他们实际上在这里提供了演示（链接），展示了实时语音转文本的实现方式，这一点不会让我感到困惑。

我一直想尝试使用WebRTC（我相信GoogleMeet使用它）来看看它的能力-例如，无需任何其他屏幕即可共享屏幕等。

然而，我一直以为WebRTC视频/音频流是客户端点对点的。那么我有以下几个问题：

他们是如何实现这一点的-如果他们没有使用WebRTC，那么是否可能使用WebRTC实现这一点？

- Luke Madhanga

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Philipp Hancke · Accepted Answer

谷歌 Meet 使用了 WebRTC 技术。在这种情况下，“对等方”是服务器，而不是浏览器。尽管这篇旧文章已经有六年了，并且一些细节发生了变化，但这篇旧文章中的大部分内容仍然是正确的。从服务器上，谷歌可以进行音频处理。

这段视频描述了实现语音转换为文本所需的架构（实际上还包括翻译和再次文本转语音）。