我正在尝试使用numpy.genfromtxt
读取一个csv文件,但其中一些字段是包含逗号的字符串。这些字符串被放在引号中,但是numpy没有将引号识别为单个字符串。例如,在数据文件“t.csv”中:
2012, "Louisville KY", 3.5
2011, "Lexington, KY", 4.0
代码
np.genfromtxt('t.csv', delimiter=',')
输出以下错误:
ValueError:检测到一些错误!第2行(实际得到4列,而不是3列)
我正在寻找的数据结构为:
array([['2012', 'Louisville KY', '3.5'],
['2011', 'Lexington, KY', '4.0']],
dtype='|S13')
在查阅文档后,我没有看到任何处理这个问题的选项。是否有一种使用numpy的方法来处理它,或者我只需要使用csv
模块读入数据然后将其转换为numpy数组?
,
更改为;
,例如... - Saullo G. P. Castro;
和/或任何其他字符的字符串 - 这只是一个玩具示例。我正在寻找一种更通用的解决方案。 - CraigO