使用R中的XBRL包将财务报表组织成数据框架

4

我一直在尝试使用R语言中的XBRL程序包从SEC网站上分离收入报表、资产负债表和现金流量数据。理想情况下,我希望将这三个数据输入到不同的数据框中,并希望导出数据到Excel表格中。

以下命令可以在R控制台中打印出报表:

inst <- "http://www.sec.gov/Archives/edgar/data/1223389/000122338914000023/conn-20141031.xml"
options(stringsAsFactors = FALSE)
xbrl.vars <- xbrlDoAll(inst)
xbrl.sec <- xbrlSECdev01(xbrl.vars)
xbrl.sec$showStatements()

但我无法创建一个数据框来保存所有这些信息。
到目前为止,我尝试过:
conn.data <- xbrl.sec$showStatements()

很遗憾,这只是再次打印数据并将conn.data保持为空。

有什么办法可以存储这些数据吗?

如何在R中使用XBRL软件包创建的列表,并将它们组织成可在Excel中读取的数据框架?”于去年三月提出,并未得到回答。

1个回答

5
XBRL包是用于解析复杂的XBRL文件(XML,模式,XLinks等)的解析器。其结果很简单:一个数据框列表。但是仍需要一些对XBRL理念的了解。
您将在fact表中找到所有数字。通过加入context,您可以获得期间和特定维度。要知道它们代表哪些会计概念(现金、存货、流动资产等),您还需要加入element表。
元素通常按照3个链接库层次排列:计算呈现定义。链接库使用从元素和到元素字段来定义层次结构和rule以分隔不同的视图。财务报表通常在呈现链接库中描述。
最后 - 使用label表查找概念名称和描述(它们直接链接自元素,但可能具有更多标签类型和语言)。
整个过程或多或少是按正确顺序连接表格的练习,因此dplyr非常方便。您可以在github上查看我在样本SEC文件中的努力。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接