Maximum likelihood pose estimation using machine vision
-
摘要: 针对现有位姿估计算法对采样数据不做任何的统计假设,缺少评判标准等问题,从信号的概率密度函数出发,推导了基于机器视觉的最大似然位姿估计的一般形式,并证明利用单幅图像时,在各向同性高斯噪声情况下传统迭代算法与最大似然估计等效。推导了位姿估计的克拉美-罗界,给出了位姿估计的方差下限。根据仿真结果可以看出,利用10张图像时,最大似然算法在噪声功率大于5dB的情况下,性能明显优于传统迭代算法,证明适当增加图像数可有效提高估计性能。Abstract: The existing pose estimation algorithms do not make any statistical assumptions on the sampled data, and lack the evaluation criteria. Aiming at this problem, based on the probability density function of the signal, we derived the general form of maximum likelihood pose estimation based on machine vision was and proved that the traditional iterative algorithm is equivalent to the maximum likelihood estimation using single imag ein the case of isotropic Gaussian noise.What's more, we derived the Cramér-Rao bound of pose estimation, which could be regarded as the variance low bound of any unbiased estimations. By the analysis of the simulation, the maximum likelihood method is much better than the traditional iterative method by using 10 pictures when noise power is greater than 5 dB, it proves that the performance of pose estimation can be improved by increasing the number of images.
-
Keywords:
- machine vision /
- pose estimation /
- maximum likelihood estimation /
- Cramér-Rao bound
-
引言
利用相机对位置已知的控制点进行拍摄,通过拍摄得到的二维图像解算相机在世界坐标系下的位置和姿态,称为位姿估计问题,是机器人导航、计算机视觉等领域[1-3]的核心问题之一。位姿估计根据计算方法分为2种方式[4]:第一种一般通过解算一组与旋转参数和平移参数相关的多项式,进而获得位姿估计结果[5],这类方法对于噪声敏感[3],估计性能有限;另一种通常称为迭代类算法,这种算法通过建立代价函数[6],将位姿估计问题转换为非线性最小二乘优化问题,然后利用Gauss-Newton[7]、Levenberg-Marquardt等方法进行位姿参数的估计,这类算法能够综合利用多点的冗余信息[8],增加了估计的鲁棒性,迭代算法中还有一种称为正交迭代(orthogonal iteration, OI)算法,该算法将物空间共线性误差的最小化视为求解绝对定向问题,然后利用迭代方式进行参数估计[9],这种方法计算量较小,速度较快[10],并保证了全局收敛性,但是性能略逊于传统迭代算法。
传统迭代算法是从信号的测量误差出发[11],利用误差最小化的原则建立代价函数,从而得到估计值。这一类算法是一种最小二乘估计,试图使采样得到的信号和无噪声情况下的数据之差的平方达到最小,这一类方法对采样数据不做任何的统计假设,性能取决于噪声的特性,并且往往不是最佳估计,而由于没有对信号做任何统计假设,估计的统计性能是无法评价的[12]。由于相机拍摄的不确定性,图片采样所得的像素信号应视为随机信号,本文从随机信号的统计特性出发,根据采样信号的概率密度推导了最大似然位姿估计的一般形式。从理论上证明了利用单幅图像,在各向同性高斯噪声情况下传统迭代算法等效于最大似然估计,因此在理论上传统迭代算法只能应用于各向同性高斯噪声,对于复杂噪声,将会产生模型误差,导致算法失效。本文的最大似然算法将是推导复杂噪声下的位姿估计的基础;另外,根据信号的Fisher信息阵推导了位姿估计的克拉美-罗界(Cramér-Rao bound, CRB),作为任何无偏估计的方差下界,克拉美-罗界可以作为位姿估计方法有效性的评价标准,并且根据所得结果可知,通过适当增加采样个数可以有效提高估计的性能。这是由于通过采样信号个数的增加,可以更好地估计随机噪声的统计特性,从而减小随机噪声对于估计的影响。
1 信号模型
假设有n个控制点,其在世界坐标系中的坐标为piw,i=1, 2, …, n,它们在相机坐标系下的坐标为pic,i=1, 2, …, n,相机对控制点进行拍摄,可以得到像平面上的n个像点,像点在图像坐标系下的物理坐标为pip,i=1, 2, …, n,在图像坐标系下的像素坐标为(ui, vi)T,如图 1所示。在k时刻对控制点进行拍摄,考虑采样过程的随机噪声影响,则观测量为如下随机向量:
$$ \begin{array}{l} s\left( k \right) = \left[ {{{\hat u}_1}\left( k \right),{{\hat v}_1}\left( k \right),{{\hat u}_2}\left( k \right),{{\hat v}_2}\left( k \right), \cdots ,} \right.\\ \;\;\;\;\;\;\;\;\;\;\;\;{\left. {{{\hat u}_n}\left( k \right),{{\hat v}_n}\left( k \right)} \right]^{\rm{T}}} = \mathit{\boldsymbol{m}}\left( k \right) + \mathit{\boldsymbol{n}}\left( k \right) \end{array} $$ (1) 式中:k=1, 2, ..., K, 其中:
$$ \begin{array}{l} \mathit{\boldsymbol{m}}\left( k \right) = \left[ {{u_1}\left( k \right),{v_1}\left( k \right),{u_2}\left( k \right),{v_2}\left( k \right), \cdots } \right.\\ \;\;\;\;\;\;\;\;\;\;\;\;\;{\left. {{u_n}\left( k \right),{v_n}\left( k \right)} \right]^{\rm{T}}} \end{array} $$ (2) 世界坐标与相机坐标存在以下关系:
$$ \mathit{\boldsymbol{p}}_i^c\left( k \right) = \mathit{\boldsymbol{R}}\left( k \right)\mathit{\boldsymbol{p}}_i^w\left( k \right) + \mathit{\boldsymbol{t}}\left( k \right) $$ (3) 由共线方程可以得到:
$$ \left\{ \begin{array}{l} \frac{{x_i^p\left( k \right) - x_o^p}}{f} = \frac{{x_i^c\left( k \right)}}{{z_i^c\left( k \right)}}\\ \frac{{y_i^p\left( k \right) - y_o^p}}{f} = \frac{{y_i^c\left( k \right)}}{{z_i^c\left( k \right)}} \end{array} \right. $$ (4) 式中(xop, yop)T为图像主点I在图像坐标系下的物理坐标,则像素坐标系与世界坐标系的转换关系可以表示为
$$ \left\{ \begin{array}{l} {u_i}\left( k \right) = \frac{f}{{{d_x}}}\;\frac{{{\mathit{\boldsymbol{r}}_1}\left( k \right)\mathit{\boldsymbol{p}}_i^w\left( k \right) + {t_x}\left( k \right)}}{{{\mathit{\boldsymbol{r}}_3}\left( k \right)\mathit{\boldsymbol{p}}_i^w\left( k \right) + {t_z}\left( k \right)}} + \frac{{x_o^p}}{{{d_x}}}\\ {v_i}\left( k \right) = \frac{f}{{{d_y}}}\;\frac{{{\mathit{\boldsymbol{r}}_2}\left( k \right)\mathit{\boldsymbol{p}}_i^w\left( k \right) + {t_y}\left( k \right)}}{{{\mathit{\boldsymbol{r}}_3}\left( k \right)\mathit{\boldsymbol{p}}_i^w\left( k \right) + {t_z}\left( k \right)}} + \frac{{y_o^p}}{{{d_y}}} \end{array} \right. $$ (5) 式中:tx(k)、ty(k)、tz(k)分别为t (k)从上到下的3个元素;r1(k)、r2(k)、r3(k)分别为R (k)的从上到下的3个横向量;R可以用3个欧拉角表示。假设在K次拍摄过程中,相机的姿态、控制点的世界坐标保持不变,即m不随时间变化,则采样信号可以表示为
$$ \mathit{\boldsymbol{s}}\left( k \right) = \mathit{\boldsymbol{m}} + \mathit{\boldsymbol{n}}\left( k \right) $$ (6) 2 最大似然估计
最大似然估计是一种使用了信号概率模型的方法,其基本思想是参数的估计值应是使观测信号概率最大的值。假设信号为高斯随机变量,噪声的均值为零,则m即为观测量s(k)的均值,根据概率论可知,k时刻观测量的概率密度为[13]
$$ \begin{array}{l} {p_{s\left( k \right)}} = \frac{1}{{\det \left( {{\rm{ \mathit{ π} }}{\mathit{\boldsymbol{Q}}_s}} \right)}}\exp \left\{ { - \left[ {{\mathit{\boldsymbol{s}}^H}\left( k \right) - } \right.} \right.\\ \;\;\;\;\;\;\;\;\left. {\left. {{\mathit{\boldsymbol{m}}^H}} \right]\mathit{\boldsymbol{Q}}_s^{ - 1}\left[ {\mathit{\boldsymbol{s}}\left( k \right) - \mathit{\boldsymbol{m}}} \right]} \right\} \end{array} $$ (7) 式中:det(·)表示矩阵的行列式;Qs为随机信号s的方差。与待估计参数无关,待估计参数表示为
$$ \mathit{\boldsymbol{\theta }} = {\left[ {\alpha ,\beta ,\gamma ,{t_x},{t_y},{t_z}} \right]^{\rm{T}}} $$ (8) 则m(θ)表示为θ的函数,假设K次拍摄是统计独立的,则K次拍摄观测值的联合密度函数为
$$ \begin{array}{l} {p_{s\left( 1 \right),s\left( 2 \right), \cdots ,s\left( k \right)}} = \mathop \Pi \limits_{k = 1}^k \frac{1}{{\det \left( {{\rm{ \mathit{ π} }}{\mathit{\boldsymbol{Q}}_s}} \right)}}\exp \left\{ { - \left[ {{s^H}\left( k \right) - } \right.} \right.\\ \;\;\;\;\;\;\;\;\left. {\left. {{\mathit{\boldsymbol{m}}^{\rm{H}}}\left( \mathit{\boldsymbol{\theta }} \right)} \right]\mathit{\boldsymbol{Q}}_s^{ - 1}\left[ {\mathit{\boldsymbol{s}}\left( k \right) - \mathit{\boldsymbol{m}}\left( \mathit{\boldsymbol{\theta }} \right)} \right]} \right\} \end{array} $$ (9) 对等号两边求自然对数,去掉常数项并除以K,得到似然函数为
$$ \begin{array}{l} L\left( \mathit{\boldsymbol{\theta }} \right) = - \ln \left[ {\det \left( {{\mathit{\boldsymbol{Q}}_s}} \right)} \right] - \frac{1}{K}\sum\limits_{k = 1}^K {\left[ {{\mathit{\boldsymbol{s}}^{\rm{H}}}\left( k \right) - } \right.} \\ \;\;\;\;\;\;\;\;\;\;\;\left. {{\mathit{\boldsymbol{m}}^{\rm{H}}}\left( \mathit{\boldsymbol{\theta }} \right)} \right]\left. {\mathit{\boldsymbol{Q}}_s^{ - 1}\left[ {\mathit{\boldsymbol{s}}\left( k \right) - \mathit{\boldsymbol{m}}\left( \mathit{\boldsymbol{\theta }} \right)} \right]} \right\} \end{array} $$ (10) (10) 式的第二项可以表示为
$$ \begin{array}{l} \frac{1}{K}\sum\limits_{k = 1}^K {\left[ {{\mathit{\boldsymbol{s}}^{\rm{H}}}\left( k \right) - {\mathit{\boldsymbol{m}}^{\rm{H}}}\left( \theta \right)} \right]} \mathit{\boldsymbol{Q}}_s^{ - 1}\left[ {\mathit{\boldsymbol{s}}\left( k \right) - \mathit{\boldsymbol{m}}\left( \mathit{\boldsymbol{\theta }} \right)} \right] = \\ \rm{tr}\left\{ {\frac{1}{K}\sum\limits_{k = 1}^K {\left[ {{\mathit{\boldsymbol{s}}^{\rm{H}}}\left( k \right) - {\mathit{\boldsymbol{m}}^{\rm{H}}}\left( \theta \right)} \right]} \mathit{\boldsymbol{Q}}_s^{ - 1}\left[ {s\left( k \right) - \mathit{\boldsymbol{m}}\left( \mathit{\boldsymbol{\theta }} \right)} \right]} \right\} = \\ \rm{tr}\left\{ {\mathit{\boldsymbol{Q}}_s^{ - 1}\frac{1}{K}\sum\limits_{k = 1}^K {\left[ {\mathit{\boldsymbol{s}}\left( k \right) - \mathit{\boldsymbol{m}}\left( \mathit{\boldsymbol{\theta }} \right)} \right]\left[ {{\mathit{\boldsymbol{s}}^{\rm{H}}}\left( k \right) - {\mathit{\boldsymbol{m}}^{\rm{H}}}\left( \mathit{\boldsymbol{\theta }} \right)} \right]} } \right\} = \\ \rm{tr}\left\{ {\mathit{\boldsymbol{Q}}_s^{ - 1}{\mathit{\boldsymbol{C}}_s}\left( \mathit{\boldsymbol{\theta }} \right)} \right\} \end{array} $$ (11) 式中:tr{·}表示取矩阵的迹;Cs(θ)定义为信号相关矩阵:
$$ {\mathit{\boldsymbol{C}}_s}\left( \theta \right) \buildrel \Delta \over = \frac{1}{K}\sum\limits_{k = 1}^K {\left[ {\mathit{\boldsymbol{s}}\left( k \right) - \mathit{\boldsymbol{m}}\left( \mathit{\boldsymbol{\theta }} \right)} \right]\left[ {{\mathit{\boldsymbol{s}}^{\rm{H}}}\left( k \right) - {\mathit{\boldsymbol{m}}^{\rm{H}}}\left( \mathit{\boldsymbol{\theta }} \right)} \right]} $$ (12) 于是得到似然函数:
$$ L\left( \theta \right) = - \ln \left[ {\det \left( {{\mathit{\boldsymbol{Q}}_s}} \right)} \right] - \rm{tr}\left\{ {\mathit{\boldsymbol{Q}}_s^{ - 1}{\mathit{\boldsymbol{C}}_s}\left( \mathit{\boldsymbol{\theta }} \right)} \right\} $$ (13) (13) 式为最大似然估计的一般形式,使似然函数最大的参数θ即为位姿估计的最大似然估计,可以通过搜索或者更高效的迭代算法计算。
当噪声为各向同性的高斯噪声时,Qs=δw2I,δw2为噪声功率,似然函数可以表示为
$$ L\left( \theta \right) = - 2n\ln \delta _w^2 - \frac{1}{{\delta _w^2}}{\rm{tr}}\left\{ {{C_s}\left( \mathit{\boldsymbol{\theta }} \right)} \right\} $$ (14) 由于似然函数取最大值的必要非充分条件为
$$ \frac{\partial }{{\partial \delta _w^2}}L\left( \mathit{\boldsymbol{\theta }} \right) = 0 $$ (15) $$ \delta _w^2 - \frac{{\rm{tr}\left\{ {{\mathit{\boldsymbol{C}}_s}\left( \mathit{\boldsymbol{\theta }} \right)} \right\}}}{{2n}} $$ (16) 将上式代入似然函数,去除常数项并除以2n,似然函数化简为
$$ L\left( \mathit{\boldsymbol{\theta }} \right) = - {\rm{lntr}}\left\{ {{\mathit{\boldsymbol{C}}_s}\left( \mathit{\boldsymbol{\theta }} \right)} \right\} $$ (17) 根据Cs(θ)的定义,求似然函数的最大值等效于求下式的最小值:
$$ \begin{array}{l} \rm{tr}\left\{ {{\mathit{\boldsymbol{C}}_s}\left( \mathit{\boldsymbol{\theta }} \right)} \right\} = \frac{1}{K}\sum\limits_{k = 1}^K {\left[ {{s^{\rm{H}}}\left( k \right) - {\mathit{\boldsymbol{m}}^{\rm{H}}}\left( \mathit{\boldsymbol{\theta }} \right)} \right]\left[ {s\left( k \right) - \mathit{\boldsymbol{m}}\left( \mathit{\boldsymbol{\theta }} \right)} \right]} = \\ \frac{1}{K}{\sum\limits_{k = 1}^K {\sum\limits_{i = 1}^n {\left[ {\left( {{{\hat u}_i}\left( k \right) - \frac{f}{{{d_x}}}\;\frac{{{\mathit{\boldsymbol{r}}_1}\left( k \right)\mathit{\boldsymbol{p}}_i^w\left( k \right) + {t_x}\left( k \right)}}{{{\mathit{\boldsymbol{r}}_3}\left( k \right)\mathit{\boldsymbol{p}}_i^w\left( k \right) + {t_z}\left( k \right)}} + \frac{{x_o^p}}{{{d_x}}}} \right)} \right.} } ^2} + \\ \left. {{{\left( {{{\hat v}_i}\left( k \right) - \frac{f}{{{d_y}}}\;\frac{{{\mathit{\boldsymbol{r}}_2}\left( k \right)\mathit{\boldsymbol{p}}_i^w\left( k \right) + {t_y}\left( k \right)}}{{{\mathit{\boldsymbol{r}}_3}\left( k \right)\mathit{\boldsymbol{p}}_i^w\left( k \right) + {t_z}\left( k \right)}} + \frac{{y_o^p}}{{{d_y}}}} \right)}^2}} \right] \end{array} $$ (18) 利用单幅图像时,上式与传统的迭代算法等效,因此,利用单幅图像时,在各向同性高斯噪声情况下传统迭代算法与最大似然算法等效。值得注意的是,上述结果是在(16)式的情况下得到的,即位姿估计是在噪声功率估计的基础上实现的,所以增加信号的采样,提高对噪声统计特性的估计,有利于提高参数估计的性能。
3 克拉美-罗界分析
为了了解参数估计的潜在性能,可以利用克拉美-罗界作为评价标准。克拉美-罗界给出了参数所有无偏估计的方差极限[14],将估计误差的方差表示为C(θ),对于所有无偏估计,有关系式:
$$ \mathit{\boldsymbol{C}}\left( \mathit{\boldsymbol{\theta }} \right) \ge {\mathit{\boldsymbol{C}}_{{\rm{CR}}}}\left( \mathit{\boldsymbol{\theta }} \right) $$ (19) 式中CCR(θ)表示克拉美-罗界,克拉美-罗界可以通过求解Fisher信息阵J的逆矩阵求得:
$$ {\mathit{\boldsymbol{C}}_{CR}}\left( \mathit{\boldsymbol{\theta }} \right) = {\mathit{\boldsymbol{J}}^{ - 1}} $$ (20) Fisher信息阵J中的元素为
$$ {\left[ \mathit{\boldsymbol{J}} \right]_{i,j}} = E\left[ {\frac{{\partial L\left( \mathit{\boldsymbol{\theta }} \right)}}{{\partial {\theta _i}}}\;\frac{{\partial L\left( \mathit{\boldsymbol{\theta }} \right)}}{{\partial {\theta _j}}}} \right] $$ (21) 通过对(13)式求偏导并取期望可以得到[J]i, j通用的形式(推导可参见文献[15]):
$$ \begin{array}{l} {\left[ \mathit{\boldsymbol{J}} \right]_{i,j}} = K\rm{tr}\left[ {\mathit{\boldsymbol{Q}}_s^{ - 1}\frac{{\partial {\mathit{\boldsymbol{Q}}_s}}}{{\partial {\theta _i}}}\mathit{\boldsymbol{Q}}_s^{ - 1}\;\frac{{\partial {\mathit{\boldsymbol{Q}}_s}}}{{\partial {\theta _j}}}} \right] + \\ \;\;\;\;\;\;\;\;\;\;\;\;2K{\mathop{\rm Re}\nolimits} \left[ {\frac{{\partial {\mathit{\boldsymbol{m}}^H}\left( \theta \right)}}{{\partial {\theta _i}}}\mathit{\boldsymbol{Q}}_s^{ - 1}\;\frac{{\partial \mathit{\boldsymbol{m}}\left( \theta \right)}}{{\partial {\theta _j}}}} \right] \end{array} $$ (22) (22) 式为Fisher信息阵的一般化形式,是许多克拉美-罗界推导的起点,需要注意的是,通常方差Qs是一个未知矩阵,因此上式应该包含方差的未知参数。
在位姿估计问题中,由于(22)式的第1项只与方差所含未知参数有关,第2项只与待估计参数有关,可以将Fisher信息阵分块:
$$ \mathit{\boldsymbol{J = }}\left[ \begin{array}{l} {\mathit{\boldsymbol{J}}_{{Q_s}{Q_s}}}\;\;\;\;0\\ 0\;\;\;\;\;\;\;\;{\mathit{\boldsymbol{J}}_{00}} \end{array} \right] $$ (23) $$ {\left[ {{\mathit{\boldsymbol{J}}_{{Q_s}{Q_s}}}} \right]_{i,j = }}K{\rm{tr}}\left[ {\mathit{\boldsymbol{Q}}_s^{ - 1}\frac{{\partial {\mathit{\boldsymbol{Q}}_s}}}{{\partial {q_i}}}\mathit{\boldsymbol{Q}}_s^{ - 1}\;\frac{{\partial {Q_s}}}{{\partial {q_j}}}} \right] $$ (24) $$ {\left[ {{\mathit{\boldsymbol{J}}_{00}}} \right]_{i,j}} = 2K{\mathop{\rm Re}\nolimits} \left[ {\frac{{\partial {\mathit{\boldsymbol{m}}^{\rm{H}}}\left( \mathit{\boldsymbol{\theta }} \right)}}{{\partial {\theta _i}}}Q_s^{ - 1}\;\frac{{\partial \mathit{\boldsymbol{m}}\left( \mathit{\boldsymbol{\theta }} \right)}}{{\partial {\theta _j}}}} \right] $$ (25) 式中qi为方差所含的未知参数,当噪声为各点无关的各向同性高斯噪声时,Qs=δw2I,方差所含未知参数为δw2,则有:
$$ {\mathit{\boldsymbol{J}}_{{Q_s}{Q_s}}} = {\mathit{\boldsymbol{J}}_{\delta _w^2\delta _w^2}} = \frac{{2nK}}{{{{\left( {\delta _w^2} \right)}^2}}} $$ (26) 根据矩阵分块求逆原理,噪声功率估计的克拉美-罗界为
$$ {\mathit{\boldsymbol{C}}_{CR}}\left( {\delta _w^2} \right) = \frac{{{{\left( {\delta _w^2} \right)}^2}}}{{2nK}} $$ (27) 可以看出噪声功率估计的克拉美-罗界随着采样数的增加而减小,说明增加信号的采样,可以提高对噪声统计特性的估计。将Qs=δw2I代入(25)式,得到:
$$ {\left[ {{\mathit{\boldsymbol{J}}_{\theta \theta }}} \right]_{i,j}} = 2K{\mathop{\rm Re}\nolimits} \left[ {\frac{{\partial {\mathit{\boldsymbol{m}}^{\rm{H}}}\left( \mathit{\boldsymbol{\theta }} \right)}}{{\partial {\theta _i}}}Q_s^{ - 1}\;\frac{{\partial \mathit{\boldsymbol{m}}\left( \mathit{\boldsymbol{\theta }} \right)}}{{\partial {\theta _j}}}} \right] $$ (28) 定义
$$ D \buildrel \Delta \over = \frac{{\partial {\mathit{\boldsymbol{m}}^{\rm{H}}}\left( \mathit{\boldsymbol{\theta }} \right)}}{{\partial \theta }} $$ (29) 由于θ=[α, β, γ, tx, ty, tz]T,待估计参数的克拉美-罗界为
$$ {\mathit{\boldsymbol{C}}_{CR}}\left( \theta \right) = \frac{{\delta _w^2}}{{2K}}{\left\{ {{\mathop{\rm Re}\nolimits} \left[ {\mathit{\boldsymbol{D}}{\mathit{\boldsymbol{D}}^{\rm{H}}}} \right]} \right\}^{ - 1}} $$ (30) 从(30)式中可以看出,参数估计的克拉美-罗界随拍摄数量的增加线性下降,随噪声功率的增加线性增加。
4 仿真
利用计算机仿真对最大似然估计和克拉美-罗界进行分析,并与传统迭代算法以及OI算法进行比较。
仿真参数:相机焦距f=35mm,单个像素尺寸dx=dy=62.5 μm,主点在图像中心,控制点从相机坐标系的[-2 2]×[-2 2]×[4 9] m3的长方形区域内随机选取,相机坐标系相对于世界坐标系的欧拉角为[20 10 30]°,平移矩阵为[2 3 10]m。图 2(a)是随机选取的控制点在相机坐标系下的坐标,图 2(b)中圆圈表示相机拍摄控制点时实际成像位置(像素坐标系),圆圈旁边的10个点为噪声功率为1dB时,由拍摄的10张图片提取的坐标点。
图 3是传统迭代算法、OI算法、最大似然方法在不同的噪声功率下的参数估计均方根误差(root-mean-square error, RMSE),在各噪声级下完成500次独立实验,其中最大似然方法利用了10张图片。从仿真结果中可以看出,3种方法在噪声功率较小的情况下都趋向于克拉美-罗界,传统迭代算法性能略优于OI算法,而最大似然方法的性能明显优于其他两种方法。
图 4是最大似然估计在不同的图片数下的参数估计均方根误差,噪声功率为2 dB,每个图片数完成500次独立实验,可以看出参数估计的RMSE随着图片数的增加而减小,说明适当地增加拍摄数量可有效提高估计的性能。
5 结论
给出机器视觉位姿估计的信号模型,并从随机信号的角度出发,推导了基于机器视觉的最大似然位姿估计以及相应的克拉美-罗界,从理论上证明了利用单幅图像时,在各向同性高斯噪声情况下传统迭代算法与最大似然算法等效,通过仿真分析,可知在图像数量适当增加的情况下,估计性能得到了明显改进,适用于更高精度的位姿估计。并且推导的位姿估计克拉美-罗界作为任何无偏估计的方差下界,是位姿估计的性能极限,可以作为位姿估计方法有效性的评价标准;下一步,针对复杂的噪声情况,应在此基础上讨论各向异性噪声以及相关噪声情况下的位姿估计方法及其克拉美-罗界。
-
-
[1] LI S Q, XU C. Efficient lookup table based camera pose estimation for augmented reality[J]. Computer Animation and Virtual Worlds, 2011, 22(1): 47-58. doi: 10.1002/cav.385
[2] CAMPA G, MAMMARELLA M, NAPOLITANO M R, et al.A comparison of pose estimation algorithms for machine vision based aerial refueling for UAV[D]. US: IEEE, 2006.
[3] 汪启跃, 王中宇.基于单目视觉的航天器位姿测量[J].应用光学, 2017, 38(2): 250-255. doi: 10.5768/JAO201738.0203001 WANG Qiyue, WANG Zhongyu. Position and pose measurement of spacecraft based on monocular vision[J]. Journal of Applied Optics, 2017, 38(2): 250-255. doi: 10.5768/JAO201738.0203001
[4] LI S Q, XU C, XIE M. A robust O(n) solution to the perspective-n-point problem[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(7): 1444-1450. doi: 10.1109/TPAMI.2012.41
[5] LEPETIT V, MORENO-NOGUER F, FUA P. EPnP: an accurate O(n) solution to the PnP problem[J]. International Journal of Computer Vision, 2009, 81(2): 155-166. doi: 10.1007/s11263-008-0152-6
[6] HMAM H, KIM J. Optimal non-iterative pose estimation via convex relaxation[J]. Image and Vision Computing, 2010, 28(11): 1515-1523. doi: 10.1016/j.imavis.2010.03.005
[7] LOWE D G. Three-dimensional object recognition from single two-dimensional images[J]. Artificial Intelligence, 1987, 31(3): 355-395. doi: 10.1016/0004-3702(87)90070-1
[8] 陈鹏.基于单目视觉的像机位姿估计技术[D].北京: 北京科技大学, 2015. http://cdmd.cnki.com.cn/Article/CDMD-10008-1015565213.htm CHEN Peng. Monocular based camera pose estimation[D]. Beijing: University of Science and Technology Beijing, 2015. http://cdmd.cnki.com.cn/Article/CDMD-10008-1015565213.htm
[9] LU C P, HAGER G D, MJOLSNESS E. Fast and globally convergent pose estimation from video images[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22(6): 610-622. doi: 10.1109/34.862199
[10] 李鑫, 龙古灿, 刘进博, 等.相机位姿估计的加速正交迭代算法[J].光学学报, 2015, 35(1):258-265. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=gxxb201501030 LI Xin, LONG Gucan, LIU Jinbo, et al. Accelerative orthogonal iteration algorithm for camera pose estimation[J]. Acta Optica Sinica, 2015, 35(1): 258-265. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=gxxb201501030
[11] SCHWEIGHOFER G, PINZ A.Robust pose estimation from a planar target[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(12):2024-2030. doi: 10.1109/TPAMI.2006.252
[12] 罗鹏飞, 张文明, 刘忠, 等.统计信号处理基础[M].北京:电子工业出版社, 2014:155-202. LUO Pengfei, ZHANG Wenming, LIU Zhong, et al.Fundamentals of statistical signal processing[M].Beijing:Publishing House of Electronics Industry, 2014:155-202.
[13] STOICA P, NEHORIA A.Mode, maximum likelihood, and Cramér-Rao bound: conditional and unconditional results[D]. New Haven: Center for Systems Science Yale University, 1989.
[14] FRIEDLANDER B, PORAT B. The exact Cramer-Rao bound for Gaussian autoregressive processes[J]. IEEE Transactions on Aerospace and Electronic Systems, 1989, 25(1): 3-7. doi: 10.1109/7.18656
[15] VAN TREES H L.Detection, estimation, and modulation theory, Part VI[M]. New York:Wiley Interscience, 2001:689-785
-
期刊类型引用(0)
其他类型引用(3)