然而,我希望能够同时对输入掩码ID使用SMOTE,以便让模型确定填充值的位置。
我的问题是如何在输入ID和掩码ID上同时使用SMOTE?到目前为止,我已经做了以下工作,模型没有抱怨,但我不确定重新采样的掩码是否与重新采样的输入ID一一对应。 SMOTE需要两个输入:输入和标签,因此我使用相同的随机状态复制了过程,并返回所需的元素。
def smote(input_ids, input_masks, labels):
smote = SMOTE("not majority", random_state=27)
input_ids_resampled, labels_resampled = smote.fit_sample(input_ids, labels)
input_masks_resampled, _ = smote.fit_sample(input_masks, labels)
return input_ids_resampled, input_masks_resampled, labels_resampled
这样做可以接受吗?有更好的方法吗?