有没有人有建议,最好的方法打开下面网站上的xml数据,将其放入python中的dataframe中(我更喜欢使用pandas)?该文件位于此网站上的“Data-XML(sdmx / zip)”链接上:http://www.federalreserve.gov/pubs/feds/2006/200628/200628abs.html。我已经尝试过从http://timhomelab.blogspot.com/2014/01/how-to-read-xml-file-into-dataframe.html复制以下内容,看起来我接近成功了:
from lxml import objectify
import pandas as pd
path = 'feds200628.xml'
xml = objectify.parse(open(path))
root = xml.getroot()
root.getchildren()[0].getchildren()
df = pd.DataFrame(columns=('id', 'name'))
for i in range(0,4):
obj = root.getchildren()[i].getchildren()
row = dict(zip(['id', 'name'], [obj[0].text, obj[1].text]))
row_s = pd.Series(row)
row_s.name = i
df = df.append(row_s)
然而,我对XML的了解还不够,无法完成剩余的部分。
任何帮助都将是极好的 - 我甚至不需要它在数据框中,我只需要找出如何以某种方式在Python中解析此内容。