将Excel电子表格导入Pandas DataFrame后,单元格中的换行符丢失了。

3

我使用Python Pandas将一个Excel电子表格(xlsx)导入数据框架中。该Excel电子表格中的一些列包含文本。以下是一个包含多行文本的示例单元格:

document belongs to family 13: 
claims are important. 
description discloses a bycicle with 3 wheels.
assigne is well known Trudi Bikes Inc.

这些单元格包含换行符。示例有4行。问题在于导入电子表格到数据框时会丢失换行符。所有行都合并为一行。

据我所知,Excel使用特殊字符CHR(10)或类似字符添加换行符。

因此,我的问题是:在将电子表格(或换行符)导入Pandas数据框时,是否有办法保留这些特殊字符? 我不介意在数据框单元格的字符串中使用转义序列之类的东西。

谢谢,

Vinz

1个回答

2

通过这种方式,我将\n保留在数据框中:

 df = pd.read_excel(yourfile, 'Sheet1')

在此输入图片描述

                 col1     col2      col3
0  hello\ncome in\ngo    hello        hi
1                 bye  bye bye  bye\nbye

嗨Joe,感谢您的反馈。我能够重现您的结果。这有助于我们继续进行。在我的测试中,我通过df.iloc打印了单个单元格,导致\n没有被打印出来。在进一步处理数据时,我完全丢失了换行符。谢谢!Vinz - Vinz Frauchiger
@VinzFrauchiger 没问题。如果这个答案对你有帮助,请考虑点赞并接受它 :) - Joe

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接