Caffe中的标签作为图像

Question

Caffe中的标签作为图像

neural-networkconvolutiondeep-learningcaffeconv-neural-network

4

我是Caffe的新手。我正在尝试实现一个全卷积神经网络(FCN-8s)，用于语义分割。我有图像数据和标签数据，它们都是图像。这是为了像素级别的预测。

我尝试使用ImageData作为数据类型，但它要求一个整数标签，这在这种情况下不适用。请指导我如何给Caffe一个2D标签。我应该选择LMDB而不是ImageData吗？如果是这样，我该怎么做？我找不到任何关于这种情况的好的教程/文档。

- Abhilash Panigrahi

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Flavio Ferrara · Accepted Answer

由于需要实现像素级的预测，您不能使用单个标签作为真值。相反，您应该使用一个带有标签的真值矩阵。

Caffe的其中一位开发者写了一个代码片段来创建包含图像数据的LMDB，请参见这里：

import caffe
import lmdb
from PIL import Image

in_db = lmdb.open('image-lmdb', map_size=int(1e12))
with in_db.begin(write=True) as in_txn:
    for in_idx, in_ in enumerate(inputs):
        # load image:
        # - as np.uint8 {0, ..., 255}
        # - in BGR (switch from RGB)
        # - in Channel x Height x Width order (switch from H x W x C)
        im = np.array(Image.open(in_)) # or load whatever ndarray you need
        im = im[:,:,::-1]
        im = im.transpose((2,0,1))
        im_dat = caffe.io.array_to_datum(im)
        in_txn.put('{:0>10d}'.format(in_idx), im_dat.SerializeToString())
in_db.close()