我有两个变量X和Y。
X的结构(即一个np.array):
[[26777 24918 26821 ... -1 -1 -1]
[26777 26831 26832 ... -1 -1 -1]
[26777 24918 26821 ... -1 -1 -1]
...
[26811 26832 26813 ... -1 -1 -1]
[26830 26831 26832 ... -1 -1 -1]
[26830 26831 26832 ... -1 -1 -1]]
Y的结构:
[[1252, 26777, 26831], [1252, 26777, 26831], [1252, 26777, 26831], [1252, 26777, 26831], [1252, 26777, 26831], [1252, 26777, 26831], [25197, 26777, 26781], [25197, 26777, 26781], [25197, 26777, 26781], [26764, 25803, 26781], [26764, 25803, 26781], [25197, 26777, 26781], [25197, 26777, 26781], [1252, 26777, 16172], [1252, 26777, 16172]]
Y中的数组,例如[1252,26777,26831]是三个独立的特征。
我正在使用scikit learn模块中的Knn分类器。
classifier = KNeighborsClassifier(n_neighbors=3)
classifier.fit(X,Y)
predictions = classifier.predict(X)
print(accuracy_score(Y,predictions))
但我遇到了一个错误:
ValueError: multiclass-multioutput 不支持
我猜 'Y' 的结构是不被支持的,我应该做哪些改变才能让程序运行呢?
输入:
Deluxe Single room with sea view
预期输出:
c_class = Deluxe
c_occ = single
c_view = sea