在OpenCV的reprojectImageTo3D()函数中，深度图的值是什么？

Question

在OpenCV的reprojectImageTo3D()函数中，深度图的值是什么？

3

OpenCV的reprojectImageTo3D()函数输出一个“表示3D表面的三通道图像”。

您可以通过以下方式访问此数据：

Vec3f coordinates = _3dImage.at<Vec3f>(y,x);
float depth = _3dImage.at<Vec3f>(y,x)[2];

该函数返回一个向量[X,Y,Z]。

在Gary Bradski和Adrian Kaehler的《Learning OpenCV》中，解释了深度是通过以下公式计算的：

Z = f T / (x_left - x_right)

其中f为焦距，T为相机之间的基础/平移距离，(x_left - x_right)为视差

这个精确的公式已经在OpenCV中实现了（我查看了源代码——但出于某种原因，还有一个额外的负号）。问题是：X、Y、Z值以哪种单位指定？

T以您的单位（例如毫米）为单位，x_l - x_r以像素为单位，[ f ] = ?

当您校准相机时，您会指定棋盘在真实世界中的尺寸（例如毫米）。因此，内部矩阵是否具有真实世界单位？或者是以px为单位指定的？不幸的是，我在文档中找不到答案。

- Jack

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Kornel · Accepted Answer

进行深度重建的基本方程式为：

Z = fB/d，其中

f 是焦距（以像素为单位），您称之为相机之间的眼睛基线/平移
B 是立体基线（以米为单位）
d 是视差（以像素为单位），用于测量对应点之间视网膜位置的差异
Z 是沿相机 Z 轴的距离

图像点（例如以像素表示的 (u,v)）的 3D 位置 (X,Y,Z) 可以用米、厘米、毫米或任何您选择的单位来表示，因为 3D 坐标 (X,Y,Z) 与棋盘格方格大小的单位相同。例如，如果您定义方格大小为 1 厘米，则 3D 坐标也将以厘米为单位。

即：

Size boardSize(4, 5); // 4x5 chessboard
float squareSize = 0.025F; // 0.025 meters
for( int i = 0; i < boardSize.height; i++ )
    for( int j = 0; j < boardSize.width; j++ )
        corners.push_back(Point3f(float(j*squareSize), float(i*squareSize), 0.0F));

p.s.:
确定 Z 后，可以使用通常的投影相机方程计算 X 和 Y：

X = uZ/f
Y = vZ/f