我正在尝试从以下URL读取excel文件到Pandas中:
url1 = 'https://cib.societegenerale.com/fileadmin/indices_feeds/CTA_Historical.xls'
url2 = 'https://cib.societegenerale.com/fileadmin/indices_feeds/STTI_Historical.xls'
使用代码:
pd.read_excel(url1)
然而它不起作用,我收到了错误提示:
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found '2000/01/'
在谷歌上搜索后,似乎有时通过URL提供的.xls文件实际上是以不同的文件格式隐藏在幕后,如html或xml。
当我手动下载Excel文件并使用Excel打开它时,会出现错误消息:“文件格式和扩展名不匹配。该文件可能已损坏或不安全。除非您信任它的来源,否则请勿打开它。”
当我打开它时,它看起来就像一个普通的Excel文件。
我在网上看到一篇帖子建议我在文本编辑器中打开文件,以查看是否有任何其他信息作为正确的文件格式,但是当使用notepad++打开时,我没有看到任何其他信息。
请问有人能帮助我将这个“xls”文件正确地读入pandas DataFrame中吗?
Notepad ++
检查文件,它看起来像是csv
格式。因此,我使用了read_csv
而不是其他方法进行读取,效果非常好。祝你好运! - jezrael