有没有一种方法可以在BigQuery之外合并HyperLogLog草图?

3
我正在尝试弄清楚是否可以从BigQuery导出HyperLogLog草图并在外部合并它们以进行基数估计。是否有可用的开源库可以方便地解析BigQuery的草图?
如果没有,是否有任何关于BigQuery HyperLogLog草图格式的公开信息?具体而言,使用了哪种哈希算法,包含什么类型的元数据,以及草图的结构如何?

任何不熟悉HYPERLOGLOG草图的人都应该阅读此链接:https://cloud.google.com/bigquery/docs/reference/standard-sql/approximate-aggregation#storing-estimated-aggregate-values-as-sketches - Pentium10
2个回答

1

您能否在公共问题跟踪器上提交一个功能请求,并提供更多详细信息(例如,您希望与哪些工具/语言/库进行基数估计的互操作性)?


2
仅供参考。目前有两个关于此问题的未解决工单:https://issuetracker.google.com/issues/117087375 和 https://issuetracker.google.com/issues/123269269。 - Niels Basjes
目前的状况是,在Apache Beam中创建新的“BigQuery-HLL ++”草图正在开发中:https://issues.apache.org/jira/browse/BEAM-7013 - Niels Basjes

0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接