刚开始探索图处理方法和工具。基本上我们需要计算一些标准指标,如页面排名、聚类系数、三角形计数、直径、连通性等。过去我很喜欢Octave,但当我们开始处理节点/边缘数量达到10亿的图时卡住了。 因此,可能的解决方案可以是使用Hadoop/Giraph构建分布式云,使用Spark/GraphX,...
我正在使用亚马逊的EC2集群运行GraphLab。他们需要我的 .pem 文件的位置,这是我的私钥。 经过搜索,我仍然找不到该文件在Ubuntu中的位置。我正在使用PuTTY。
我需要帮助确认我的选择...并了解您是否能提供一些信息。 我的存储数据库是使用Cassandra的TitanDb。 我有一个非常大的图形。我的目标是稍后在该图形上使用Mllib。 我的第一个想法:使用GraphX的Titan,但我没有发现任何正在开发中的东西...TinkerPop还没有...