我正在使用Keras Sequential在Google Colab上运行CNN。
我遇到了以下错误: ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()
当我从model.fit函数中移除class_weight参数时,错误消失并且网络成功训练。但是,我真的想考虑不平衡的数据。
我检查了我的class_weights向量的形状,它很好(是nd.array,就像从sklearn计算类权重函数生成class_Weights时一样)。
不确定哪些详细信息是相关的,但我很乐意提供更多关于版本和所有混乱的细节。
附注: 可能很重要的一个事实- 我的数据是FER2013数据,并且我正在使用FERplus标签。 也就是说,我的样本与一个唯一的类别没有关联,而每个样本对于每个类别都有自己的概率分布。 总之,我的标签是具有class_names大小的向量,其中所有元素加起来为1。
为了非常清楚,这是一个例子: img1 label = [0,0,0,0,0.2,0,0.3,0,0,0.5]
无论如何,我计算出的class_weights是一个大小为10的nd.array,其元素介于0和1之间,旨在降低表示更多的类别的权重。
我不确定这是否与错误有关,但我提出这个问题以防万一。
我的代码:
我遇到了以下错误: ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()
当我从model.fit函数中移除class_weight参数时,错误消失并且网络成功训练。但是,我真的想考虑不平衡的数据。
我检查了我的class_weights向量的形状,它很好(是nd.array,就像从sklearn计算类权重函数生成class_Weights时一样)。
不确定哪些详细信息是相关的,但我很乐意提供更多关于版本和所有混乱的细节。
附注: 可能很重要的一个事实- 我的数据是FER2013数据,并且我正在使用FERplus标签。 也就是说,我的样本与一个唯一的类别没有关联,而每个样本对于每个类别都有自己的概率分布。 总之,我的标签是具有class_names大小的向量,其中所有元素加起来为1。
为了非常清楚,这是一个例子: img1 label = [0,0,0,0,0.2,0,0.3,0,0,0.5]
无论如何,我计算出的class_weights是一个大小为10的nd.array,其元素介于0和1之间,旨在降低表示更多的类别的权重。
我不确定这是否与错误有关,但我提出这个问题以防万一。
我的代码:
def create_model_plus():
return tf.keras.models.Sequential([
tf.keras.layers.Conv2D(filters=32,kernel_size=5,strides=1,input_shape=(48, 48, 1),padding='same',use_bias=True,kernel_initializer='normal',bias_initializer=tf.keras.initializers.Constant(0.1),activation=tf.nn.relu),
tf.keras.layers.BatchNormalization(),
tf.keras.layers.MaxPooling2D((2, 2), strides=2),
tf.keras.layers.Conv2D(filters=64,kernel_size=5,strides=1,padding='same',use_bias=True,kernel_initializer='normal',bias_initializer=tf.keras.initializers.Constant(0.1),activation=tf.nn.relu),
tf.keras.layers.BatchNormalization(),
tf.keras.layers.MaxPooling2D((2, 2), strides=1),
tf.keras.layers.Conv2D(filters=128,kernel_size=5,strides=1,padding='same',use_bias=True,kernel_initializer='normal',bias_initializer=tf.keras.initializers.Constant(0.1),activation=tf.nn.relu),
tf.keras.layers.BatchNormalization(),
tf.keras.layers.MaxPooling2D((2, 2), strides=1),
tf.keras.layers.Flatten(),
tf.keras.layers.Dense(1008, activation='relu'),
tf.keras.layers.Dropout(0.2),
tf.keras.layers.Dense(512, activation='relu'),
tf.keras.layers.Dense(10, activation='softmax')
])
history_df=[]
history_object=tf.keras.callbacks.History()
#save_best_object=tf.keras.callbacks.ModelCheckpoint('/Users/nimrodros', monitor='val_loss', verbose=1, save_best_only=True, save_weights_only=False, mode='auto', period=1)
early_stop_object=tf.keras.callbacks.EarlyStopping(monitor='val_loss',min_delta=0.001, patience=4)
gony_adam=tf.keras.optimizers.Adam(
lr=0.001
)
reduce_lr = tf.keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.3,patience=3, min_lr=0.0001, verbose=1)
#log_dir = "logs/fit/" + datetime.datetime.now().strftime("%Y%m%d-%H%M%S")
#tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir=log_dir, histogram_freq=1)
datagen = tf.keras.preprocessing.image.ImageDataGenerator(rotation_range=8, width_shift_range=0.2,
height_shift_range=0.2,
horizontal_flip=True,
validation_split=0.3
)
datagen.fit(images.reshape(28709,48,48,1))
model = create_model_plus()
model.compile(optimizer=gony_adam,
loss='categorical_crossentropy',
metrics=['accuracy'])
history = model.fit(x=datagen.flow(images.reshape(28709,48,48,1), FER_train_labels, batch_size=32,subset='training'),validation_data=datagen.flow(images.reshape(28709,48,48,1), FER_train_labels, batch_size=32,subset='validation'),steps_per_epoch=600,validation_steps=250,epochs=60,callbacks=[history_object,early_stop_object,reduce_lr],class_weight=cl_weigh)
history_df=pd.DataFrame(history.history)
希望有人知道该怎么做!谢谢!!!
weights_dict = {i:w for i,w in enumerate(weight)}
- Nir