从文档中可以看到:
我可以看到我可以从“顶点元组”创建一个图表。https://spark.apache.org/docs/0.9.0/api/graphx/index.html#org.apache.spark.graphx.Graph$@fromEdges[VD,ED]%28RDD[Edge[ED]],VD%29%28ClassTag[VD],ClassTag[ED]%29:Graph[VD,ED]
我的简单文本文件看起来像这样,其中每个数字都是一个顶点:
v1 v3
v2 v1
v3 v4
v4
v5 v3
当我从文件中读取数据时,
我的问题是:val myVertices = myData.map(line=>line.split(" ")) I get an RDD[Array[String]].
如果这是解决问题的正确方法,如何将
RDD[Array[String]]
转换为正确的格式,根据文档,正确的格式应该是RDD[(VertexId, VertexId)]
(还要求VertexID
的类型为 long,而我正在使用字符串)。是否有另一种更简单的方法,可以从类似 csv 文件的结构构建图形?