使用Hadoop可视化大型数据集

5
我正在寻找一个关于使用Hadoop可视化大数据集的框架、框架组合、最佳实践或教程。我不是在寻找一个可视化Hadoop作业运行机制或管理Hadoop磁盘空间的框架。我正在寻找使用图表等方式呈现HDFS中包含的数据的方法或指南。
例如,假设我有一组数据点存储在HDFS的多个文件中,并且我想显示一个直方图。我的唯一选择是编写自定义的map/reduce作业来尝试确定哪些点落入哪个桶中,将总数写入文件,然后使用绘图库来可视化吗?
我需要推出一个定制解决方案,还是其他人也在做这样的事情?我已经尝试在线查找,但没有找到与此直接相关的内容。
谢谢您的帮助。
1个回答

1
我们在Datameer也做类似的事情。这些文件需要经过几个处理步骤才能生成我们的可视化结果,但我们可以原生地在Hadoop上运行,因此这些文件并不会很远。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接