禁用Python中\r\n自动转换为\n的功能

Question

禁用Python中\r\n自动转换为\n的功能

pythonwindowspython-3.xunixline-endings

5

我正在ubuntu上使用Python3.4脚本工作，其中我接收一个在Windows下生成并编码为UTF-8的文件作为参数。我必须逐行（由\r\n分隔）浏览该文件，知道这些“行”包含一些我想保留的'\n'。

我的问题是，Python在打开文件时将文件的"\r\n"转换为"\n"。我尝试了使用不同模式（"r"，"rt"，"rU"）打开文件。

我找到的唯一解决方案是以二进制模式而不是文本模式工作，使用"rb"模式打开文件。

有没有一种不使用二进制模式或正确的方法来解决这个问题？

- lu1her

2个回答

0

从Martijn Pieters的解决方案是：

with open(filename, "r", newline='\r\n') as f:

_{这个答案是由OP lu1her 在CC BY-SA 3.0下发布的，作为对问题disable the automatic change from \r\n to \n in python的编辑。}

- vvvvv

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Martijn Pieters · Accepted Answer

将open()的关键字参数newline设置为'\r\n'，或者设置为空字符串：

with open(filename, 'r', encoding='utf-8', newline='\r\n') as f:

这告诉Python仅在\r\n行终止符上拆分行；输出中保留\n。如果您将其设置为''，则\n也被视为行终止符，但\r\n不会转换为\n。

来自open()函数文档：

newline控制通用换行符模式的工作方式（仅适用于文本模式）。它可以是None、''、'\n'、'\r'和'\r\n'。[...]如果它是''，则启用通用换行符模式，但行结尾以原样返回给调用者。如果它具有任何其他合法值，则只有输入行以给定字符串结尾，并且行结尾以原样返回给调用者。

加粗强调是我的。