如何使用LSTM进行多类别多输出分类

Question

如何使用LSTM进行多类别多输出分类

pythonkerasscikit-learnclassificationlstm

4

我有一个多类别多输出的分类问题（详见https://scikit-learn.org/stable/modules/multiclass.html）。换句话说，我的数据集如下。

node_name, timeseries_1, timeseries_2, label_1, label_2
node1, [1.2, ...], [1.8, ...], 0, 2
node2, [1.0, ...], [1.1, ...], 1, 1
node3, [1.9, ...], [1.2, ...], 0, 3 
...
...
...

因此，我的 label_1 可以是 0 或者 1，而我的 label_2 可以是 0、1 或者 2。

我的当前代码如下。

def create_network():
    model = Sequential()
    model.add(LSTM(200, input_shape=(16,2)))
    model.add(Dense(100))
    model.add(Dropout(0.2))
    model.add(Dense(3, activation='softmax'))
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

    return model

neural_network = KerasClassifier(build_fn=create_network, epochs=100, batch_size=100, verbose=0)

k_fold = StratifiedKFold(n_splits=10, shuffle=True, random_state=0)

scores = cross_validate(neural_network, my_features, label_data_encoded, cv=k_fold, scoring = ('accuracy', 'precision_weighted', 'recall_weighted', 'f1_weighted', 'roc_auc'))

我的问题如下。

由于我有两个标签（即label_1和label_2），如何将这些标签适配到lstm模型中？我是否需要做类似于keras.utils.to_categorical(label_1, 2)和keras.utils.to_categorical(label_2, 3)的操作？
如何更改模型，使其适用于多分类多输出分类？

如果需要更多细节，我很乐意提供。

- EmJ

2个回答

1

这是一个比较复杂的问题，因为Scikit-Learn API和Keras API在多类多输出方面不直接兼容。此外，TensorFlow v1和v2处理事情的方式甚至也有所不同。现有的Keras包装器对于更复杂的情况并不真正有效。

我创建了一个KerasClassifier扩展，能够处理这些情况，该软件包和文档在这里（GitHub）。完全透明：我是该软件包的创建者，但我没有任何经济利益，它是开源的。

使用这些扩展版本，您可以轻松处理多类多输出问题。我认为对于您的情况，它应该可以直接使用，但如果不行，您可以从KerasClassifier继承并重写target_encoder以将数据从Scikit-Learn格式转换为您的Keras模型所需的格式。更多细节请参见这里（docs）。

希望这能帮助到您！

- LoveToCode

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Aditya Arora · Accepted Answer

如果我理解正确，label_1是二进制的，而label_2是多类别问题，因此我们需要让模型具有两个分别使用不同损失函数的输出；分别是二进制和分类交叉熵。

然而，Sequential API不允许多个输入/输出。

顺序API允许您逐层创建大多数问题的模型。但它的局限性在于它不允许您创建共享层或具有多个输入或输出的模型。

您可以使用Functional API创建两个输出层，并使用所需的损失函数编译模型。

X=Input(input_shape)
X=Layer(X)
'
'
'
'
out1=Dense(1, activation='sigmoid')(X)
out2=Dense(3, activation='softmax')(X)
model = Model(inputs = input, outputs = [out1,out2])
model.compile(loss = ['binary_crossentropy','categorical_crossentropy'], loss_weights = [l1,l2], ...)

model.fit(input,[label_1, label_2_toCategotical]

网络将会最小化的损失函数是两种损失函数的加权和，由l1和l2进行加权。

希望这可以帮到你 :)