7得票4回答
地面真实值与训练数据集

我想了解训练数据集、测试数据集和真实值之间的关系。我知道它们各自的含义,但是特别是真实值和训练数据之间的关系我不太明白。

7得票3回答
使用sklearn.train_test_split处理不平衡数据

我有一个非常不平衡的数据集。我使用了sklearn.train_test_split函数提取训练集。现在我想对训练集进行过采样,所以我计算了类型1的数量(我的数据集有两个类别和类型(type1和type2),但几乎所有的训练数据都是type1)。因此,我无法进行过采样。 之前,我使用自己编写...

7得票1回答
如何从图像目录创建适用于孪生网络的CaffeDB训练数据

我需要帮助从一组图片和标签文本文件的普通目录中创建一个用于Siamese CNN的CaffeDB。最好使用Python的方式来完成它。 问题不在于遍历目录并制作图像对,而是如何将这些图像对制作成CaffeDB。 到目前为止,我只使用了 convert_imageset 来从图像目录创建Caff...

7得票2回答
Tesseract - 无法识别希腊字母

我正在尝试从图像中自动提取比例尺(比例尺条+数字+单位)。这是一个例子: 它用于将像素映射到现实世界的测量。 我正在使用通过Anaconda3安装的PyTesseract。 这是我的代码: import cv2 import pytesseract import numpy as ...

7得票1回答
如何使用 accuracy_score(或其他建议的函数)来评估 xgboost 回归器的准确性

我正在编写一段代码,用于解决一个简单问题:预测库存中某个物品缺失的概率。 我使用XGBoost预测模型完成此任务。 数据被分为两个.csv文件,一个是训练数据,另一个是测试数据。 以下是代码: import pandas as pd import numpy as np...