41得票4回答
免费大型数据集供Hadoop实验使用

你知道有哪些免费或低成本的大型数据集可以用来在Hadoop上进行实验吗?任何相关的指针/链接都将不胜感激。 偏好: 至少一GB的数据。 Web服务器的生产日志数据。 我已找到的几个: Wikipedia转储 http://wiki.freebase.com/wiki/Data_d...

12得票3回答
API到数据库的连接?

请假设我对我将要提到的任何事情都一无所知,因为实际上我确实一无所知。 大多数开放数据网站都可以将呈现的文件导出为例如 .csv 或 .json 格式 (示例)。它们也总是有一个 API 选项卡 (示例 API)。 我认为使用 API 将意味着如果数据更新了,您将收到更改,而将其导出为 ...

12得票2回答
从公开数据中使用SPARQL下载GeoJSON边界

我有兴趣从statistics.gov.scot下载一些边界文件,该网站是一个官方的统计数据仓库,用于共享利用SPARQL查询的统计数据。 背景 Statistics.gov.scot提供访问各种行政和统计地理位置的GeoJSON边界数据,例如地方政府行政边界或卫生委员会 。在我的特定情况下,...

12得票4回答
如何使用 BigQuery 获取任何城市的历史天气?

BigQuery 将 NOAA 的 gsod 数据加载为公共数据集 - 开始于 1929 年:https://www.reddit.com/r/bigquery/comments/2ts9wo/noaa_gsod_weather_data_loaded_into_bigquery/ 我如何检索...