Skip to content

八点法计算F矩阵与三角测量

1402字约5分钟

3DVision

2024-03-15

1 八点法计算F矩阵(基础矩阵)

基础矩阵用于描述两个视图之间的几何关系

  1. 基础矩阵:基础矩阵 FF 是描述两个视图之间相机投影关系的矩阵。对于两个对应的图像坐标点 (x,y,1)(x, y, 1)(u,v,1)(u, v, 1)​ 在两个视图上,基础矩阵满足以下方程:

    这个方程即对极约束,描述了图像中对应点的投影关系

[uv1]TF[xy1]=0 \begin{bmatrix} u \\ v \\ 1 \end{bmatrix}^T \cdot F \cdot \begin{bmatrix} x \\ y \\ 1 \end{bmatrix} = 0

  1. 线性系统:对于多对对应点,可以构建一个线性方程系统 Af=0Af = 0 ,其中 AA 是由对应点生成的矩阵, ff​ 是基础矩阵的扁平形式

    上述方程即:

[uv1][f11f12f13f21f22f23f31f32f33][xy1]=0 \begin{bmatrix} u & v & 1 \end{bmatrix} \cdot \begin{bmatrix} f_{11} & f_{12} & f_{13} \\ f_{21} & f_{22} & f_{23} \\ f_{31} & f_{32} & f_{33} \end{bmatrix} \cdot \begin{bmatrix} x \\ y \\ 1 \end{bmatrix} = 0

​ 展开得到:

[uxvxxuyvyyuv1][f11f12f13f21f22f23f31f32f33]=0 \begin{bmatrix} ux&vx&x&uy&vy&y&u&v&1 \end{bmatrix}\cdot \begin{bmatrix}f_{11} \\ f_{12} \\ f_{13} \\ f_{21} \\ f_{22} \\ f_{23} \\ f_{31} \\ f_{32} \\ f_{33} \\ \end{bmatrix} = 0

​ 这个矩阵方程可以表示为 Aif=0A_if = 0

​ 为了解出这个9个未知数的 ff ,我们至少需要8对点,所以叠加 AiA_i 得到 AA 矩阵

A=[x1u1x1v1x1y1u1y1v1y1u1v11x2u2x2v2x2y2u2y2v2y2u2v21x8u8x8v8x8y8u8y8v8y8u8v81] A = \begin{bmatrix} x_1u_1 & x_1v_1 & x_1 & y_1u_1 & y_1v_1 & y_1 & u_1 & v_1 & 1 \\ x_2u_2 & x_2v_2 & x_2 & y_2u_2 & y_2v_2 & y_2 & u_2 & v_2 & 1 \\ \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots & \vdots \\ x_8u_8 & x_8v_8 & x_8 & y_8u_8 & y_8v_8 & y_8 & u_8 & v_8 & 1 \end{bmatrix}

  1. 最小二乘法:通过奇异值分解(SVD),取 VTV^T 的最后一列作为估计矩阵 AA 的最小二乘解,即 ff

    方程的最小二乘解有一个既定的结论,即对 AA 进行SVD分解得到的 VTV^T 的最后一行 即是 ff 的解

  2. 基础矩阵还原:将 ff reshape 为 3×33 \times 3​ 的矩阵,然后通过奇异值分解(SVD)对矩阵进行调整,以确保基础矩阵的秩为2

    • SVD分解: 对矩阵 FF 进行奇异值分解:F=UΣVTF = U \Sigma V^T ,其中 UUVV 是正交矩阵,Σ\Sigma 是对角矩阵

    • 秩-2约束: 将奇异值矩阵 Σ\Sigma 调整为仅保留前两个奇异值(将第三个奇异值设为0),以确保基础矩阵的秩为2

    • 重构基础矩阵: F=UΣVTF = U \Sigma' V^T

    F = f.reshape((3, 3))
    
    # 对F进行SVD分解
    U, S, Vt = np.linalg.svd(F)
    
    # 将奇异值矩阵Sigma调整为仅保留前两个奇异值(第三个设为0)
    S[2] = 0
    
    # 重构基础矩阵F
    F = np.dot(U, np.dot(np.diag(S), Vt))
  3. 归一化:对基础矩阵进行归一化,以确保尺度的一致性

2 标准化八点算法

对普通的八点算法进行了改进,通过标准化输入数据,提高了算法的稳健性和准确性

  1. 我们首先将对应点标准化为零均值和单位方差,以消除尺度的影响

    mean1 = np.mean(keypoints1, axis=0)
    mean2 = np.mean(keypoints2, axis=0)
    std1 = np.std(keypoints1, axis=0)
    std2 = np.std(keypoints2, axis=0)
    # 防止除0,由于齐次坐标,标准差std算得最后一项为0
    std1[2] = 1
    std2[2] = 1
    nomalized_points1 = (keypoints1 - mean1) / std1
    nomalized_points2 = (keypoints2 - mean2) / std2

xˉ=xμxˉσx \bar{x} = \frac{x - \bar{\mu_x}}{\sigma_x}

也等于左乘一个转换矩阵 TT

T=[1σx0μxσx01σyμyσy001] T = \begin{bmatrix} \frac{1}{\sigma_x} & 0 & -\frac{\mu_x}{\sigma_x} \\ 0 & \frac{1}{\sigma_y} & -\frac{\mu_y}{\sigma_y} \\ 0 & 0 & 1 \end{bmatrix}

  1. 在这些标准化点上运行八点算法

  2. 最后对得到的基本矩阵进行反变换,在计算基础矩阵后,需要将其进行撤销标准化处理,以获得最终的基础矩阵

F=T21FnormalizedT1 F = T_2^{-1} \cdot F_{normalized} \cdot T_1

3 三角测量

我们有两个相机,它们的c分别为 P1P_1P2P_23×43 \times 4​ 矩阵)。

P=K[Rt] P = K\begin{bmatrix}R|t\end{bmatrix}

对于一个在相机1和相机2中分别观察到的同一物体的对应点 x~1\tilde x_1x~2\tilde x_2 (齐次坐标 3×13 \times 1 向量) ,我们可以得到以下方程:其中,X~\tilde X (齐次坐标 4×14 \times 1 向量)是物体在三维空间中的坐标

P1X~=x~1P2X~=x~2 P_1 \tilde X =\tilde x_1\\ P_2 \tilde X =\tilde x_2

PP 分解为三个向量:

Pi=[Pi1Pi2Pi3]Pi1=[p11,p12,p13,p14]Pi2=[p21,p22,p23,p24]Pi3=[p31,p32,p33,p34] \begin{align} P_i &= \begin{bmatrix} P_{i1} \\ P_{i2} \\ P_{i3} \end{bmatrix} \\ P_{i1} &= [p_{11}, p_{12}, p_{13}, p_{14}] \\ P_{i2} &= [p_{21}, p_{22}, p_{23}, p_{24}] \\ P_{i3} &= [p_{31}, p_{32}, p_{33}, p_{34}] \end{align}

这样,原等式就变为:

[Pi1X~Pi2X~Pi3X~]=[xiyi1] \begin{bmatrix}P_{i1}\tilde X \\ P_{i2}\tilde X \\ P_{i3}\tilde X\end{bmatrix} =\begin{bmatrix}x_i \\ y_i \\ 1\end{bmatrix}

将左边向量齐次化除以第三个元素,与右边向量元素一一对应:

PiX~=[Pi1X~Pi3X~Pi2X~Pi3X~1]=[xiyi1]=x~ixi=Pi1X~Pi3X~xiPi3X~Pi1X~=0yi=Pi2X~Pi3X~yiPi3X~Pi2X~=0 \begin{align} P_i \tilde X &= \begin{bmatrix} \frac{P_{i1} \tilde X}{P_{i3}\tilde X} \\ \frac{P_{i2} \tilde X}{P_{i3} \tilde X} \\ 1 \end{bmatrix}= \begin{bmatrix}x_i \\ y_i \\ 1 \end{bmatrix} = \tilde x_i \\ x_i &= \frac{P_{i1} \tilde X}{P_{i3} \tilde X} \Rightarrow x_iP_{i3} \tilde X-P_{i1} \tilde X = 0 \\ y_i &= \frac{P_{i2} \tilde X}{P_{i3} \tilde X} \Rightarrow y_iP_{i3} \tilde X-P_{i2} \tilde X = 0 \end{align}

由于我们知道 x1x_1x2x_2P1P_1P2P_2​​ ,我们可以将其转化为一个齐次线性方程组

A1=[x1P13P11y1P13P12]A2=[x2P23P21y2P23P22]A=[A1A2]AX~=0 \begin{align} A_1 &= \begin{bmatrix} x_1 P_{13} - P_{11} \\ y_1 P_{13} - P_{12} \end{bmatrix} \\ A_2 &= \begin{bmatrix} x_2 P_{23} - P_{21} \\ y_2 P_{23} - P_{22} \end{bmatrix} \\ A &= \begin{bmatrix}A_1 \\ A_2 \end{bmatrix} \\ A\tilde X &= 0 \end{align}

A = np.array(
    [keypoint1[0] * P1[2] - P1[0],
     keypoint1[1] * P1[2] - P1[1],
     keypoint2[0] * P2[2] - P2[0],
     keypoint2[1] * P2[2] - P2[1]]
)

这样我们就可以使用最小二乘法或其他方法来解决这个线性方程组,从而找到物体的三维位置 XX

# DLT算法解决最小二乘法
_, _, Vt = np.linalg.svd(A)
x_w = Vt[-1]
x_w = x_w / x_w[3] # 齐次坐标