Python中标签二值化的反向过程

Question

Python中标签二值化的反向过程

5

我已经对多类分类进行了标签二值化，并且它工作得很好：

y_test
1
3
4
2
0

from sklearn.preprocessing import label_binarize

y_test_binarize = label_binarize(y_test, classes=[0, 1, 2, 3, 4])
y_test_binarize

0   1   0   0   0
0   0   0   1   0
0   0   0   0   1
0   0   1   0   0
1   0   0   0   0

接下来，我想做一个反向过程，从y_test_binarize变量中获取y_test。

是否有任何预定义的方法？

- user3193177

3个回答

2

一种简单的方法是计算二值化数据和类别的矩阵乘积：

>>> classes = [0,1,2,3,4]
>>> y_test_binarize.dot(classes)
array([1, 3, 4, 2, 0])

- chthonicdaemon

1

使用numpy的argmax函数：

np.argmax(y_test_binarized, axis=1)

- Teodoro Calonge Cano

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Vivek Kumar · Accepted Answer

您还可以使用LabelBinarizer，它将label_binarize函数封装在一个类中，并提供了转换为二进制数据以及将其反转回原始类的方法。

y_test = [1, 3, 4, 2, 0]

from sklearn import preprocessing
lb = preprocessing.LabelBinarizer()

y_test_binarize = lb.fit_transform(y_test)
#Output: y_test_binarize
array([[0   1   0   0   0],
       [0   0   0   1   0],
       [0   0   0   0   1],
       [0   0   1   0   0],
       [1   0   0   0   0]])

y_test_original = lb.inverse_transform(y_test_binarize)
#Output: y_test_original
array([1, 3, 4, 2, 0])

希望这可以帮到你。如果有任何问题，请随时问。