TensorFlow目标检测API CSV文件格式

3

我刚接触TensorFlow目标检测API,但了解需要将CSV文件转换为TFRecord。 CSV格式应该包括8个列,如下所示:

文件名、宽度、高度、类别、min值、xmax值、ymin值、ymax值

我困惑的是图像的哪个角落被认为是原点?

谢谢任何帮助!

1个回答

2
图像的左上角被认为是原点(0,0),宽度(x坐标)随向右移动而增加,高度(y坐标)随向下移动而增加。因此,图像的右下角将被索引为(width-1,height-1)
你上面描述的格式基本上是Pascal VOC注释格式,其中对于特定的边界框: xmin表示左上角的x坐标
ymin表示左上角的y坐标
xmax表示右下角的x坐标
ymax表示右下角的y坐标

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接