我需要使用
有没有办法告诉pandas正确地处理这些文件?
顺便说一下,如果我使用Python,我就没有这个问题。我使用的是:
read_csv
方法从文件中读取数据来创建一个数据框。然而,分隔符不是很规则:有些列是用制表符(\t
)分隔的,其他列是用空格分隔的。此外,有些列可能被2或3或更多个空格分隔,甚至是由空格和制表符组合而成的(例如3个空格、两个制表符,然后1个空格)。有没有办法告诉pandas正确地处理这些文件?
顺便说一下,如果我使用Python,我就没有这个问题。我使用的是:
for line in file(file_name):
fld = line.split()
它完美地工作。 它不在乎字段之间是否有2或3个空格。 即使是空格和制表符的组合也不会引起任何问题。 pandas能做到同样的吗?
skipinitialspace
来跳过开头的空格。 - jarondltxt.file
,并且格式是数字后跟至少两个空格时,它是如何工作的?公式delimiter=r"\d\d\s\s+
不起作用。 - PV8\s+
或\s{2,}
。不要在分隔符中包含字段\d\d
的表达式!分隔符只是分隔符!字段是分隔符(或引号)之间的所有内容。 - smci