使用pandas读取CSV文件并忽略逗号。

3
我有一个只有一列的csv文件,其中包含很多引号。我想将其读入pandas Series,使得csv中每一行都是一个条目。然而,使用pd.read_csv时,读取器会在遇到逗号时截断该行。
如何忽略逗号并将整个单元格读取到Series对象中?
数据如下:一列和很多行。一行中的一个条目如下:"Hector去洗手间了。他很紧张,因为他以前从未去过那里",所以我的程序会因为后面跟着的逗号而截断句子。

1
使用sep参数来定义一个不是默认,的分隔符。 - A.Kot
使用sep关键字。设置sep = '|'或其他内容。 - flyingmeatball
4
你的数据长什么样子?如果你正在读取一个csv文件,用逗号分隔恰好是它应该做的。毕竟,“CSV”中的“CS”代表逗号分隔。 - Bryan Oakley
听起来你实际上没有一个CSV文件,只是一个由许多行组成的纯文本文件。不要尝试将其处理为CSV文件。 - Bryan Oakley
没有需要转换的内容。听起来它已经是一个纯文本文件了。或者,可以像其他人建议的那样选择一个你知道不是数据一部分的分隔符。 - Bryan Oakley
显示剩余2条评论
1个回答

4
您有一个每行一个条目的文本文件。因此,您可以通过设置delimiter='\n'来加载文件,并为单个列命名:
import pandas as pd

data = pd.read_csv('input.txt', delimiter='\n', names=['text'])
print(data['text'][0])

将会给予:

Hector went to the bathroom. He was nervous, as he'd never been there before

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接