我刚接触TensorFlow目标检测API,但了解需要将CSV文件转换为TFRecord。 CSV格式应该包括8个列,如下所示:
文件名、宽度、高度、类别、min值、xmax值、ymin值、ymax值
我困惑的是图像的哪个角落被认为是原点?
谢谢任何帮助!
我刚接触TensorFlow目标检测API,但了解需要将CSV文件转换为TFRecord。 CSV格式应该包括8个列,如下所示:
文件名、宽度、高度、类别、min值、xmax值、ymin值、ymax值
我困惑的是图像的哪个角落被认为是原点?
谢谢任何帮助!
(0,0)
,宽度(x坐标)随向右移动而增加,高度(y坐标)随向下移动而增加。因此,图像的右下角将被索引为(width-1,height-1)
。Pascal VOC
注释格式,其中对于特定的边界框:
xmin
表示左上角的x坐标ymin
表示左上角的y坐标xmax
表示右下角的x坐标ymax
表示右下角的y坐标