我有一个CSV文件,准备加载到我的Python代码中,但是,我希望以以下格式进行加载:
data = [[A,B,C,D],
[A,B,C,D],
[A,B,C,D],
]
我该如何加载可读作为Numpy数组的csv文件?例如,以前的教程可能会对以下内容造成混乱:
data = np.array(data)
如果不行,我只想上传我的csv文件(例如,将数据命名为'dual-Cored.csv'并将其作为数据上传)。
我有一个CSV文件,准备加载到我的Python代码中,但是,我希望以以下格式进行加载:
data = [[A,B,C,D],
[A,B,C,D],
[A,B,C,D],
]
data = np.array(data)
最简单的解决方案就是:
import numpy as np
data = np.loadtxt("myfile.csv")
只要数据可以转换为float
并且每行具有相同数量的列,这个函数就能够工作。float
,则您可以编写自己的转换器。请参阅numpy.loadtxt
文档。它非常灵活。A,B,C,D
A,B,C,D
A,B,C,D
A,B,C,D
import csv
with open(filename, 'rb') as f:
data = list(csv.reader(f))
将data
赋值为
[['A', 'B', 'C', 'D'],
['A', 'B', 'C', 'D'],
['A', 'B', 'C', 'D'],
['A', 'B', 'C', 'D']]
data.csv
的文件,其内容如下。
A,B,C,D
1,2,3,4
W,X,Y,Z
5,6,7,8
with open('data.csv', 'r') as f:
data = [i.split(",") for i in f.read().split()]
print data
输出
[['A', 'B', 'C', 'D'],
['1', '2', '3', '4'],
['W', 'X', 'Y', 'Z'],
['5', '6', '7', '8']]
with open('dual-Cored.csv', 'w') as f:
f.write('1,2,3,4\n5,6,7,8\n9,10,11,12')
with open('dual-Cored.csv', 'rU') as f:
c = csv.reader(f)
for l in c:
print list(map(int, l))
这段代码会输出什么:
[1, 2, 3, 4]
[5, 6, 7, 8]
[9, 10, 11, 12]
我建议您在Python教程中了解一下Python数据类型,其中讲述了字符串和数值类型之间的区别。
使用csv模块将数据读取到numpy数组中:
import numpy
with open('dual-Cored.csv', 'rU') as f:
c = csv.reader(f)
ar = numpy.array(list(c), dtype=int)
and ar
现在返回:
array([[ 1, 2, 3, 4],
[ 5, 6, 7, 8],
[ 9, 10, 11, 12]])
或者直接使用numpy.genfromtxt
函数(需要指定分隔符):
numpy.genfromtxt('dual-Cored.csv', delimiter=',')
array([[ 1., 2., 3., 4.],
[ 5., 6., 7., 8.],
[ 9., 10., 11., 12.]])