我有一个以以下格式的csv文件:
userId movieId rating timestamp
1 31 2.5 1260759144
2 10 4 835355493
3 1197 5 1298932770
4 10 4 949810645
我希望构建一个稀疏矩阵,其中行为userId,列为movieID。我已经将所有数据存储为一个名为“column”的字典,其中column ['user']包含用户ID,column ['movie']具有电影ID,column ['ratings']具有以下评级:
f = open('ratings.csv','rb')
reader = csv.reader(f)
headers = ['user','movie','rating','timestamp']
column = {}
for h in headers:
column[h] = []
for row in reader:
for h, v in zip(headers, row):
column[h].append(float(v))
当我调用稀疏矩阵函数时,如下所示:
mat = scipy.sparse.csr_matrix((column['rating'],(column['user'],column['movie'])))
我遇到了"TypeError: invalid shape"的错误。
请帮忙解决。