得票数最多 'google-cloud-dataflow' 问题

我已经运行了以下代码，用于处理522个大小为100GB的gzip文件，解压后大约会有320GB的数据，并且数据是以protobuf格式输出到GCS。我使用了n1标准机器和输入输出所在的区域，整个任务花费了我约17美元，这是半小时数据的成本，因此我非常需要进行一些成本优化。以下是查询得到的成本。...

pythonprotocol-buffersgoogle-cloud-dataflowapache-beamavro

22得票3回答

直接将流式数据导入BigQuery的优缺点与通过Google Pub/Sub + Dataflow导入的优缺点

我们在Google Kubernetes Engine上托管了一个NodeJS API，并希望开始将事件记录到BigQuery中。我可以看到有三种不同的方法来实现这一目标: 使用Node BigQuery SDK中的API将每个事件直接插入BigQuery（如在“Streaming I...

google-bigquerygoogle-cloud-dataflowgoogle-cloud-pubsub

21得票2回答

当移动数据时，使用Dataflow而不是云函数有哪些好处？

我对GCP还比较新，并且刚开始在GCP上设置/评估我们组织的架构。场景: 数据将流入pub/sub主题（高频率，低数据量）。目标是将该数据移动到Big Table。据我所知，可以通过在主题上触发云函数或使用Dataflow来实现此目的。现在我之前有过使用云函数的经验，并且对其感到满意...

google-cloud-platformgoogle-cloud-functionsgoogle-cloud-dataflowgoogle-cloud-pubsub

21得票4回答

使用Dataflow和Cloud Composer的区别

我希望能够澄清一下，是 Cloud Dataflow 还是 Cloud Composer 更适合这项工作，但我在 Google 文档中并没有得到明确的答案。目前，我正在使用 Cloud Dataflow 读取一个非标准的 csv 文件——做一些基本处理——然后将其加载到 BigQuery ...

google-cloud-dataflowairflowapache-beamgoogle-cloud-composer

19得票2回答

如何删除一个gcloud Dataflow作业？

我的仪表板上到处都是 Dataflow 作业，我想从项目中删除失败的作业。但在仪表板上，我没有看到任何删除 Dataflow 作业的选项。我希望至少看到如下的选项：$ gcloud beta dataflow jobs delete JOB_ID 要删除所有作业，$ gcloud beta d...

google-cloud-dataflow

19得票4回答

数据流设置控制器服务账户

我尝试为Dataflow设置控制器服务账户。在我的dataflow选项中，我有：options.setGcpCredential(GoogleCredentials.fromStream( new FileInputStream("k...

google-cloud-platformgoogle-cloud-dataflowdataflowgoogle-cloud-iam