摘要
加权整体最小二乘法(WTLS)是估计errors-in-variables (EIV)模型参数严密的方法,当面临大数据集时,其计算效率有限。针对EIV模型中设计矩阵呈现出的结构性特征,在最小二乘准则的约束条件下,通过仅给设计矩阵的随机列赋予权重,推证了适用于EIV模型参数估计的部分加权整体最小二乘法(PWTLS)。PWTLS无需借助拉格朗日辅助法,能够精确估计EIV模型参数;另外,该算法缩减了矩阵的维数,同时在迭代过程中避免了估计设计矩阵的随机误差,从而减小了矩阵运算量,提升了计算效率。最后以真实数据和模拟数据为例与其他7种同类算法进行对比,结果表明, PWTLS取得了与同类算法相同的精度,但计算效率显著提高,验证了算法的可行性。
高斯‒马尔可夫模型在许多工程实践中得到成功应用,通常认为模型中的设计矩阵是无误差的。然而,在许多情景下,设计矩阵中的元素并不能保证是常数,其本身也是含有随机误差的观测值,设计矩阵和观测向量中含有随机误差的模型通常被定义为变量误差模型(errors-in-variables, EIV
最初,因为求解EIV模型参数的方法不成熟,通常忽略设计矩阵中的随机误差,而采用加权最小二乘法(weighted least-squares,WLS)近似估计EIV参数,这种方法是不严密的。1980年,Golub
一般来说,主要有两类方法实现TLS和WTLS的求解,一类方法是基于奇异值分解(singular value decomposition,SVD)的直接解算方
从现有的研究成果来看,虽然国内外学者就EIV模型提出了许多卓有成效的解算方法,但是与传统的WLS相比,算法比较复杂,不具有操作上的优
为了提高WTLS的效率,一些学者从不同侧面改进了WTLS算法。Shen
WTLS在大地测量等众多科学研究和工程领域中得到应
本文针对EIV模型设计矩阵呈现出的结构性特征,将设计矩阵分成随机和固定部分,仅给随机部分赋予权重,并且不涉及拉格朗日辅助法对参量求偏导,在WLS平差约束准则下,推证了一种估计EIV模型参数的迭代算法,该算法能够显著降低矩阵的运算量,极大提升计算效率。
EIV模型的函数模型和随机模型通常表示
(1) |
(2) |
式(
对于EIV模型,可直接应用最小二乘准则,其参数估值
(3)
式中:和分别表示 E和θ的估计值。
仅对随机误差e加以约束,难以估计E,一般的WTLS的平差准则
(4) |
在
(6) |
式(
式(
理论上EIV模型中的设计矩阵的元素均可包含随机误差,但在实际应用中,绝大多数EIV模型的设计矩阵都会存在部分固定列并且不含有随机误
设A中有t1列固定列和t2列随机列,将A中的固定列和随机列进行矩阵分块,对应的参数θ也分成两部分,即
(7) |
(8) |
式(
根据
(9) |
(10) |
式(
将
(11) |
式中:。
顾及
(12) |
将
(13) |
式中:;;。
在的约束下,应用WLS原理,
(14) |
式中:。
为进一步化简
(15) |
令且,
(16) |
式中:。
由
(17) |
由
(18) |
由
(19) |
将
(20) |
则
(21) |
式中:,λ为n×1的向量。
由
(22) |
根据A的矩阵分块(
(23) |
(24) |
式中:,O 为(t1×n)零矩阵。
(25) |
(26) |
(27) |
则
(28) |
将
(29) |
式中:,G为(t2×n)的矩阵。
组合
(30) |
(31) |
式中:。
(32) |
由
(33) |
上述推导是基于WLS最小二乘准则,并且
(3)重复步骤(2)直到,迭代结束(下标i表示迭代次数,ε为设定的收敛阈值)。
由上述算法可知,在迭代过程中,并不涉及对设计矩阵A拆分成A1和A2,仅需把随机列A2对应的参数θ2分解出来参与迭代。只要EIV模型的设计矩阵存在固定列,根据列与参数的对应关系,很容易将A组合成固定和随机部分。通常情况下,习惯上总是将EIV模型的固定列排列在一起,而且绝大多数EIV模型至少有一列是固定列,因而PWTLS估计EIV参数具有普适性。另外,在实际应用中,设计矩阵的随机列可能会含有少量固定元素,例如三维七参数坐标转换模型中,有3列固定列组成A1,在随机列中有一个固定零元素,对于随机列中的个别固定元素赋予值为零的协因数后,仍可组成随机列A2。
从算法流程可以看出,PWTLS算法不同于一般的WTLS算法,在每次迭代的过程中并不需要估计随机误差E;通过给设计矩阵的随机列赋予权重,使得相关矩阵运算的时间复杂度由O(nt)降低到 O(nt2),占用的内存空间由O(n
为了验证PWTLS的性能,本文选择了7种具有代表性的WTLS算
直线拟合简单而有效,经常用于证明WTLS算法的有效性。设有直线方程为,其中x 和y是直线的坐标分量,a和b是直线的斜率和截距。实验数据来自于文献[
根据直线方程和坐标点数量,设计矩阵A,参数向量θ及观测向量L具体形式为
(34) |
协因数矩阵Qe 和QE 分别为
(35) |
在
(36) |
A2的协因数矩阵的结构取自QE的一部分,即
(37) |
设迭代收敛阈值 ε=1
平面相似四参数转换模型是常用的坐标基准转换模型之一,通常由
(38) |
式中:ξ 和η 为平移参数;k为尺度参数;a为旋转角;下标S和T分别表示原坐标系和目标坐标系。
假设有d个重合点用于求解转换参数,
(39) |
式中:;为辅助参数。
参数ξ 和η对应的系数是1和0的常量,设计矩阵A的第1列和第2列是固定列,组成A1;其他两列组成A2形成随机列,A1和A2表示为
(40) |
对应于A1和A2,相应的参数可分成两部分,即
(41) |
原坐标系中的坐标由随机函数产生d个坐标点,目标坐标由给定的参数真值ξ= -27.366, η= -71.185, u=1.000 001 092 和w=6.400 15×1
(42) |
(43) |
式中:ΔS和ΔT分别表示原始坐标和目标坐标中的真误差,mvnrnd (0, σ, 2d) 生成期望为0、标准差为 σ = 0.05 m、维数为2d×1的随机向量。
由随机误差和标准差定义观测量向量L的协因数阵Qe
(44) |
根据设计矩阵A2的结构,vec(A2)的协因数阵定义为
(45) |
式中:;上标表示元素在矩阵中的位置,其中和来自于向量ΔS。
基于上述的模型和数据,随机模拟1 000次实验,固定重合点数d=200,应用均方根误差(RMSE)来衡量参数估计的精度,参数ξ、η、u 和w的RMSE由式(
, | (46) |
, | (47) |
式(
在相同数据和计算平台的实验条件下(收敛阈值ε =1
从计算的总耗时可以看出,PWTLS是所有严密算法中计算效率最高的,与其他算法计算效率相比,最少提高了161%,最多提高了近416%。其主要是因为PWTLS使用代替了QE,维数由800×800降到400×400;另外,在每次迭代过程中,PWTLS算法并不需要估计随机误差矩阵E。
为了突出PWTLS计算效率的优越性,从另一个角度执行了10次模拟实验,要求重合点数据以间隔为100个点,逐渐从d=100增加到1 000。计算耗时统计结果如

图1 7种算法的计算效率比较
Fig. 1 Computational efficiency of seven algorithms
WTLS已经在众多科学和工程技术中得到应用,当面临处理大数据集时,其计算效率有限,降低算法的复杂度和提高计算效率对WTLS算法将显得越来越重要。
本文针对EIV模型的设计矩阵呈现出的结构性特征,提出了基于WLS准则约束条件下的PWTLS算法,无需引入辅助量,迭代方程与经典的间接平差法方程类似,便于理解,易于实现,估计的参数是严密的。PWTLS通过给设计矩阵中的随机列赋予权重,使得设计矩阵的协因数阵维数降低,从而在迭代过程中缩减了所有参与运算矩阵的维数,极大地减少了计算量,促进了效率的提升;另外,PWTLS算法避免了重复估计设计矩阵随机列的误差,这两方面的因素使矩阵的运算量降低,从而显著提升了计算效率。最后,通过算例验证了所提出的PWTLS算法与同类算法参数估计精度相当,但计算效率显著提高。
作者贡献声明
王建民:提出了论文中PWTLS算法原理,完成了论文的整体写作。
倪福泽:编写了计算程序,完成了论文中的实验计算和分析,绘制了图表。
赵建军:提供研究经费的资助,修改了中英文摘要。
参考文献
刘经南, 曾文宪, 徐培亮. 整体最小二乘估计的研究进展[J]. 武汉大学学报(信息科学版), 2013, 38(5): 505. [百度学术]
LIU Jingnan, ZENG Wenxian, XU Peiliang. Overview of total least squares methods[J]. Geomatics and Information Science of Whuhan University, 2013, 38(5): 505. [百度学术]
FANG X. Weighted total least squares solutions for applications in geodesy[D]. Hannover:Gottfried Wilhelm Leibniz Universität Hannover, 2011. [百度学术]
GOLUB G H, VAN LOAN C F . An analysis of the total least-squares problem[J]. SIAM Journal on Numerical Analysis, 1980, 17(6): 883. [百度学术]
MARKOVSKY I, VAN HUFFEL S . Overview of total least-squares methods[J]. Signal Processing, 2007, 87(10): 2283. [百度学术]
TONG X, JIN Y, LI L. An improved weighted total least squares method with applications in linear fitting and coordinate transformation[J]. Journal of Surveying Engineering, 2011, 137(4): 120. [百度学术]
AKYILMAZ O. Total least squares solution of coordinate transformation[J]. Survey Review, 2007, 39(303): 68. [百度学术]
FELUS Y A. Application of total least squares for spatial point process analysis[J]. Journal of Surveying Engineering, 2004, 130(3): 126. [百度学术]
SCHAFFRIN B, WIESER A. On weighted total least-squares adjustment for linear regression[J]. Journal of Geodesy, 2008, 82(7): 415. [百度学术]
XU P, LIU J, SHI C. Total least squares adjustment in partial errors-in-variables models: algorithm and statistical analysis[J]. Journal of Geodesy, 2012, 86(8): 661. [百度学术]
SHEN Y, LI B, CHEN Y. An iterative solution of weighted total least-squares adjustment[J]. Journal of Geodesy, 2011, 85(4): 229. [百度学术]
MAHBOUB V. On weighted total least-squares for geodetic transformations[J]. Journal of Geodesy, 2012, 86(5): 59. [百度学术]
MAHBOUB V, SHARIFI M A. On weighted total least-squares with linear and quadratic constraints[J]. Journal of Geodesy, 2013, 87(3): 279. [百度学术]
XU P, LIU J, ZENG W, et al. Effects of errors-in-variables on weighted least squares estimation[J]. Journal of Geodesy, 2014, 88(7): 705. [百度学术]
姚宜斌, 孔建. 顾及设计矩阵随机误差的最小二乘组合新解法[J]. 武汉大学学报(信息科学版), 2014, 39(9): 1028. [百度学术]
YAO Yibin, KONG Jian. A new combined LS method considering random errors of design matrix[J]. Geomatics and Information Science of Whuhan University, 2014, 39(9): 1028. [百度学术]
JAZAERI S, AMIRI-SIMKOOEI A R, SHARIFI M A. Iterative algorithm for weighted total least squares adjustment[J]. Survey Review, 2014, 46(334): 19. [百度学术]
王乐洋,余航,陈晓勇.Partial EIV模型的解法[J].测绘学报,2016 ,45(1):22. [百度学术]
WANG Leyang, YU Hang, CHEN Xiaoyong. An algorithm for partial EIV model[J]. Acta Geodaetica et Cartographica Sinica, 2016, 45(1): 22. [百度学术]
ZHAO J. Efficient weighted total least-squares solution for partial errors-in-variables model[J]. Survey Review, 2017, 49(356): 346. [百度学术]
王乐洋.地壳应变参数反演的总体最小二乘方法[J].大地测量与地球动力学, 2013, 33(3): 106. [百度学术]
WANG Leyang. Inversion of crustal strain parameters based on total least squares[J]. Journal of Geodesy and Geodynamics,2013,33(3):106. [百度学术]
方兴, 曾文宪, 刘经南,等.三维坐标转换的通用整体最小二乘算法[J]. 测绘学报, 2014, 43(11): 1139. [百度学术]
FANG Xing , ZENG Wenxian , LIU Jingnan , et al.A general total least squares algorithm for three- dimensional coordinate transformations[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(11): 1139. [百度学术]
ZHOU Y, KOU X, LI J, et al. Comparison of structured and weighted total least-squares adjustment methods for linearly structured errors-in-variables models[J]. Journal of Surveying Engineering, 2017, 143(1): 04016019. [百度学术]
HENDERSON H V, SEARLE S R. On deriving the inverse of a sum of matrices[J]. SIAM Review, 1981, 23(1): 53. [百度学术]
SHI Y, XU P, LIU J, et al. Alternative formulae for parameter estimation in partial errors-in-variables models[J]. Journal of Geodesy, 2015, 89(1): 13. [百度学术]
NERI F, SAITTA G, CHIOFALO S. An accurate and straightforward approach to line regression analysis of error-affected experimental data[J]. Journal of Physics E: Scientific Instruments, 1989, 22(4): 215. [百度学术]
WANG J. Locating and estimating multiple gross errors during coordinate transformation[J]. Survey Review, 2015, 47(345): 458. [百度学术]