BigQuery GitHub 数据:如何处理仓库名称的更改?

3

我的目标是跟踪我的存储库的总星数。然而,它的repo.name随着时间的推移而改变。如何使用githubarchive数据集实现此目标?

1个回答

2
https://stackoverflow.com/a/42930963/132438相关。
GitHub项目名称会发生变化,因此,不要通过名称查询,而是更安全地通过ID查询。您可以在单独的查询中查找项目ID,或者在像这样的查询中一起执行:
SELECT 
  COUNT(*) naive_count,
  COUNT(DISTINCT actor.id) unique_by_actor_id, 
  COUNT(DISTINCT actor.login) unique_by_actor_login 
FROM `githubarchive.month.*` 
WHERE repo.id = (
  SELECT repo.id 
  FROM `githubarchive.month.201702` 
  WHERE repo.name='bazelbuild/bazel' 
  LIMIT 1)
AND type = "WatchEvent"

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接