BigQuery API和BigQuery Storage API有什么区别?

6

Mabel的下面的回答涵盖了区别。BigQuery存储API对于高吞吐量的用例来说更快,因为它被明确设计用于处理它们。这允许并行读取和更有效的数据序列化格式(Arrow和Avro而不是JSON),另外它是基于流式RPC的,这减少了由于多个请求分页而产生的开销。 - Micah Kornfield
1个回答

6

是的,你说得对,它之所以快,是因为它使用了rpc。并且正如这文档中所述,

Storage Read API不提供与管理BigQuery资源(例如数据集、作业或表)相关的功能。

基本上,当您的操作需要扫描大量托管数据时,您会想在BigQuery API之上使用BigQuery Storage API,因为它为消费者提供了高吞吐量的数据读取。否则,对于与核心资源(例如数据集、表、作业和例程)的交互,使用BigQuery API就足够了。

欲了解更多,请参阅有关Storage Write APIStorage Read API的一些关键特性的这些文档。


在存储读取 API 中提供 SQL 查询语句是否可行? - 1stenjoydmoment
1
@1stenjoydmoment 不,只有简单的列选择和简单的过滤。(没有计算/子查询/等等。) - Tobi

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接