我正在尝试使用Keras,并思考线性激活层和没有激活层之间有什么区别?它们的行为不是一样的吗?如果是,那么线性激活的意义是什么呢?
我的意思是这两段代码之间的区别:
model.add(Dense(1500))
model.add(Activation('linear'))
model.add(Dense(1500))
和
model.add(Dense(1500))
model.add(Dense(1500))
我正在尝试使用Keras,并思考线性激活层和没有激活层之间有什么区别?它们的行为不是一样的吗?如果是,那么线性激活的意义是什么呢?
我的意思是这两段代码之间的区别:
model.add(Dense(1500))
model.add(Activation('linear'))
model.add(Dense(1500))
和
model.add(Dense(1500))
model.add(Dense(1500))
Activation
。model.add(Dense(1500))
model.add(Activation('relu'))
model.add(Dense(1500))
你说得对,你的代码片段之间没有区别:两者都使用线性激活函数。
激活函数确定它是否为非线性(例如,Sigmoid是一种非线性激活函数):
model.add(Dense(1500))
model.add(Dense(1500, activation='sigmoid'))