将JSON数据下载到R中

7
我需要做以下事情:
  1. 下载由http://api.crunchbase.com/v/1/companies.js提供的所有公司名称的解析文件。

  2. 使用每个公司名称运行查询,下载每个公司信息的解析文件(例如:创立年份、投资者公司名称),使用语法“http://api.crunchbase.com/v/1/company/permalink.js”

我想将这些数据解析成电子表格或其他格式,然后导入R进行分析。

最好的格式是将这些数据导入R中的哪种格式?如何下载数据并将其组织成类似表格的结构?(例如:行=公司,列=资料信息,如融资年份)(最终目标是在R中进行分析)


可能是从JSON文件导入数据到R的重复问题。 - mnel
1个回答

11
library(RJSONIO)
library(RCurl)

# grab the data
raw_data <- getURL("http://api.crunchbase.com/v/1/companies.js")
# Then covert from JSON into a list in R
data <- fromJSON(raw_data)
length(data)
[1] 101782
# We can coerce this to a data.frame
 final_data <- do.call(rbind, data)
 # Then write it to a flat csv file
 write.csv(final_data, "final_data.csv")


> head(final_data)
     name                permalink     category_code
[1,] "Wetpaint"          "wetpaint"    "web"        
[2,] "AdventNet"         "adventnet"   "enterprise" 
[3,] "Zoho"              "zoho"        "software"   
[4,] "Digg"              "digg"        "web"        
[5,] "Facebook"          "facebook"    "web"        
[6,] "Photobucket, Inc." "photobucket" "web"        

1
谢谢!这解决了我在R中将公司名称放入CSV文件的问题。现在我需要在R中将每个公司的详细信息组织到数据库中。最好的方法是通过循环遍历API调用('http://api.crunchbase.com/v/1/company/permalink.js')中的每个永久链接,并将每个公司的配置文件数据添加到单个CSV中?我该如何做到这一点? - user1764260

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接