如何在scikit-learn中使用自己的数据集（计算机视觉）？

Question

如何在scikit-learn中使用自己的数据集（计算机视觉）？

imagedatasetmachine-learningscikit-learnfeature-extraction

9

如何在scikit-learn中使用自己的数据集？Scikit教程通常以加载他的数据集（数字数据集、花卉数据集等）作为示例。

http://scikit-learn.org/stable/datasets/index.html 例如：从sklearn.datasets导入load_iris。

我有我的图片，但不知道如何创建新的数据集。

特别是，在开始时，我使用了我找到的这个例子（我使用opencv库）：

img =cv2.imread('telamone.jpg')

# Convert them to grayscale
imgg =cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# SURF extraction
surf = cv2.SURF()
kp, descritors = surf.detect(imgg,None,useProvidedKeypoints = False)

# Setting up samples and responses for kNN
samples = np.array(descritors)
responses = np.arange(len(kp),dtype = np.float32)

我希望能提取一组图片的特征，以便实施机器学习算法！

- postgres

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- ogrisel · Accepted Answer

您首先需要明确您想要实现什么目标：“以一种有用于实现机器学习算法的方式，提取一组图像的特征！”这个描述过于模糊，无法给您任何指导。

您是在尝试做以下哪些事情：

- 整张图片的图像分类（例如室内场景与室外场景）？ - 对一组图片的子部分进行对象识别（例如使用不同大小的窗口扫描程序来识别同一对象的几个实例）？ - 对象检测和基于类别的分类（例如在图片中找到所有汽车或行人的出现，并在每个出现的实例周围绘制边界框）？ - 完整的图片语义分割，即像素的分割+每个部分的类别分类（建筑物、道路、人、树）...

每个任务都需要不同的管道（特征提取+机器学习模型组合）。

您可能应该从阅读这方面的书开始，例如：http://szeliski.org/Book/。

另外顺带一提，stackoverflow可能不是询问此类开放性问题的最佳场所。