我有一个包含成千上万行类似以下内容的XML文件:
<Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word>
我希望将它(包括所有属性)转换为
pandas
dataframe
。为此,我可以使用beautiful soup遍历文件并逐行插入值,或创建要插入列的列表。但是,我想知道是否有更pythonic的方法来完成我所描述的操作。提前致谢。代码示例:
x1list=[]
x2list=[]
for word in soup.page.findAll('word'):
x1list.append(int(word['x1']))
x2list.append(int(word['x2']))
df=DataFrame({'x1':x1list,'x2':x2list})