将MS Excel XML文件读取为pandas数据框?

6

我有一个包含以下元数据的MS Excel XML(2003)文件:

<?xml version="1.0" encoding="UTF-8"?>
<?mso-application progid="Excel.Sheet"?><Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet" 
xmlns:c="urn:schemas-microsoft-com:office:component:spreadsheet" xmlns:html="http://www.w3.org/TR/REC-html40" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet" 
xmlns:x2="http://schemas.microsoft.com/office/excel/2003/xml" 
xmlns:x="urn:schemas-microsoft-com:office:excel" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"><OfficeDocumentSettings xmlns="urn:schemas-microsoft-com:office:office">

我想将其读入pandas dataframe中。有什么好的方法吗?谢谢。


2
它必须是XML格式吗?如果不是,那么您可以使用read_excel来读取它。 - Phillip Cloud
1个回答

1

你尝试过 Canopy Python 的 pyxll 吗?它被宣传为“Excel 的 Python 解决方案”。

请查看一下,看看它是否能解决你的问题。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接