将XML转换成pandas数据框。

Question

将XML转换成pandas数据框。

5

我有一个包含成千上万行类似以下内容的XML文件：

<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word>

我希望将它（包括所有属性）转换为 pandas dataframe。为此，我可以使用beautiful soup遍历文件并逐行插入值，或创建要插入列的列表。但是，我想知道是否有更pythonic的方法来完成我所描述的操作。提前致谢。

代码示例：

x1list=[]
x2list=[]

for word in soup.page.findAll('word'):
    x1list.append(int(word['x1']))
    x2list.append(int(word['x2']))
df=DataFrame({'x1':x1list,'x2':x2list})

- root

@eumiro：添加了一个代码示例... - root

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- eumiro · Accepted Answer

试试这个：

DataFrame.from_records([(int(word['x1']), int(word['x2']))
                        for word in soup.page.findAll('word')],
                       columns=('x1', 'x2'))