通过Keras模型可视化绘制决策边界图

3
我正在尝试使用Keras绘制模型预测的决策边界。然而,生成的边界似乎不正确。
这是我的模型:
def base():
    model = Sequential()
    model.add(Dense(5,activation = 'relu', input_dim = 2))
    model.add(Dense(2,activation = 'relu'))
    model.add(Dense(1,activation = 'sigmoid'))
    model.compile(optimizer = optimizers.SGD(lr=0.0007, momentum=0.0, decay=0.0), loss = 'binary_crossentropy', metrics= ['accuracy'])      
    return model 

model = base()
history = model.fit(train_X,train_Y, epochs = 10000, batch_size =64, verbose = 2)

这是我的绘图函数(取自这里)。
def plot_decision_boundary(X, y, model, steps=1000, cmap='Paired'):
    """
    Function to plot the decision boundary and data points of a model.
    Data points are colored based on their actual label.
    """
    cmap = get_cmap(cmap)

    # Define region of interest by data limits
    xmin, xmax = X[:,0].min() - 1, X[:,0].max() + 1
    ymin, ymax = X[:,1].min() - 1, X[:,1].max() + 1
    steps = 1000
    x_span = linspace(xmin, xmax, steps)
    y_span = linspace(ymin, ymax, steps)
    xx, yy = meshgrid(x_span, y_span)

    # Make predictions across region of interest
    labels = model.predict(c_[xx.ravel(), yy.ravel()])

    # Plot decision boundary in region of interest
    z = labels.reshape(xx.shape)

    fig, ax = subplots()
    ax.contourf(xx, yy, z, cmap=cmap, alpha=0.5)

    # Get predicted labels on training data and plot
    train_labels = model.predict(X)
    ax.scatter(X[:,0], X[:,1], c=y.ravel(), cmap=cmap, lw=0)

    return fig, ax
plot_decision_boundary(train_X,train_Y, model, cmap = 'RdBu')

“我得到了一个像这样的图:

Image

显然,这是一个非常有缺陷的决策边界描绘(由于存在这么多边界,它并不具有信息性)。 有人能指出我的错误吗?”


你说的“那么多限制”是什么意思? - jtlz2
1个回答

4

由于概率是从0到1的连续值,所以我们得到了许多等高线。

如果您的可视化仅限于2个类(输出为2D softmax向量),则可以使用此简单代码。

def plot_model_out(x,y,model):
  """
  x,y: 2D MeshGrid input
  model: Keras Model API Object
  """
  grid = np.stack((x,y))
  grid = grid.T.reshape(-1,2)
  outs = model.predict(grid)
  y1 = outs.T[0].reshape(x.shape[0],x.shape[0])
  plt.contourf(x,y,y1)
  plt.show()

这将产生轮廓线(不止一个),如果你想要单个轮廓线,可以执行以下操作:
你可以对model.predict的概率输出进行阈值处理,并显示单个轮廓线。
例如,
import numpy as np 
from matplotlib import pyplot as plt 

a = np.linspace(-5, 5, 100)
xx, yy = np.meshgrid(a,a)
z = xx**2 + yy**2
# z = z > 5 (Threshold value)
plt.contourf(xx, yy, z,)
plt.show()

当阈值被注释或未注释时,我们得到两张图片。

multiple conoturs

由于连续值而产生的多个轮廓

single contour

将单个轮廓作为z值的阈值(z = z > 5)。

类似的方法也可以用于输出softmax向量,如下所示:

label = label > 0.5

有关可视化代码的更多信息,请参考IITM CVI博客


很好的清晰优雅的答案。 - jtlz2

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接