TensorFlow目标检测API CSV文件格式

Question

3

我刚接触TensorFlow目标检测API，但了解需要将CSV文件转换为TFRecord。 CSV格式应该包括8个列，如下所示：

文件名、宽度、高度、类别、min值、xmax值、ymin值、ymax值

我困惑的是图像的哪个角落被认为是原点？

谢谢任何帮助！

- Callum Brown

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Jitesh Malipeddi · Accepted Answer

图像的左上角被认为是原点(0,0)，宽度（x坐标）随向右移动而增加，高度（y坐标）随向下移动而增加。因此，图像的右下角将被索引为(width-1,height-1)。

你上面描述的格式基本上是Pascal VOC注释格式，其中对于特定的边界框： xmin表示左上角的x坐标
ymin表示左上角的y坐标
xmax表示右下角的x坐标
ymax表示右下角的y坐标