摘要
基于一种有效的从系数矩阵中选取两个工作行的贪婪概率准则, 提出一类求解大型稀疏线性系统的贪婪双子空间随机Kaczmarz方法。理论证明该方法收敛到相容线性系统的最小范数解, 而且该方法的理论收敛因子小于原始双子空间随机Kaczmarz方法的收敛因子。数值实验表明,该方法在求解性能方面较原始双子空间随机Kaczmarz方法更具优势。
考虑求解具有如下形式的相容线性系统:
(1) |
其中,系数矩阵可为满秩或秩亏矩阵, 且。通常考虑求
当系数矩阵为列满秩时,为
为求解线性系统(1), 许多迭代方
若以随机顺序而不是以给定顺序选用系数矩阵的行可以极大地提高Kaczmarz方法的收敛速
尽管随机Kaczmarz方法适用于任何相容线性系统的求解,但当系数矩阵有许多相关行时(常出现于地球物理学中),收敛可能停滞。为克服这一缺点,Needell和Ward采用等可能地随机选择两个不同工作行的选择准则,提出了随机Kaczmarz方法的双子空间拓展‒双子空间随机Kaczmarz方
Nutini
在经典的随机Kaczmarz方法(RK)中,Strohmer和Vershynin将各行所对向量的欧式范数与比值的平方作为概率, 然后根据此概率分布随机选取工作行。具体地说, 如果定义代表系数矩阵的第行, 代表向量的第个分量, 初始向量为, 则随机Kaczmarz方法的具体过程见算法1。
算法1 [
③计算。 ④置, 转步骤②。
算法1中, 代表选取矩阵的第行作为本次迭代工作行的概率为。
关于随机Kaczmarz方法, 有如下收敛性定理。
定理
其中表示矩阵的最小非零奇异值。
Needell和Ward发现当线性系统是超定且高度相干时,随机Kaczmarz方法的求解效率低下甚至无效,因此提出同时启用两个工作行的双子空间随机Kaczmarz方法(2S‒RK)去求解这类特殊系统。
为了简便,Needell和Ward假设系数矩阵是标准化的,这意味着其每行都具有单位欧几里得范数,在接下来的部分,仍沿用该假设。在原始双子空间随机Kaczmarz方法中, 等可能地随机选取两个不同工作行, 再将当前解投影到由两个工作行所确定的超平面上获得下一个估计值, 具体过程见算法2。
算法2 [
关于双子空间随机Kaczmarz方法, 有如下收敛性定理。
定理2 [
(2) |
这里,,。
通过算法2,可知双子空间随机Kaczmarz方法的相应误差向量的2‒范数的平方满足
(3) |
若
(4) |
若双子空间随机Kaczmarz方法采用
首先,构造与有关的指标集
(5) |
并以概率选取指标,其中向量的定义见算法3的步3。将当前解投影到解空间得到中间解向量
由此可得,对于成立
即是。
其次,构造与有关的指标集
并以概率选取指标,其中向量的定义见算法3的步8。将当前解投影到解空间得到满足的解向量
由指标集的定义,对于,可得
(6) |
对于,同样可得和,即是。同理, 由指标集的定义,对于,可得
(7) |
算法3 贪婪双子空间随机Kaczmarz方法。
步1 置。计算定义正整数指标集 计算 的第个分量
步2 根据概率选取指标。
步3 计算,
步4 定义正整数指标集计算 的第个分量
步5 根据概率选取指标。
步6 计算 ;
步7 计算
步8 置, 转步1。
此外,由和的递推式可以推得相对应的残量的递推公式如下:
其中且、表示矩阵的第、列。若迭代前已知, 则可进一步提高贪婪双子空间随机Kaczmarz方法的求解性能, 参见文献[
若每次迭代仅选择一个工作行,则算法3成为一类广义贪婪随机Kaczmarz(GRK(θ))方法。通过改变参数,可得到一系列常用算法作为特殊情况。取,,, 时,GRK(θ)方法分别简化为贪婪Kaczmarz方
相容线性系统(1)的最小范数解形如
其中 表示的列空间。若初始向量, 由算法3的步5和步13可知, 算法3生成的迭代序列一定在中, 故若算法3收敛, 则一定收敛到相容线性系统(1)的最小范数解。
关于算法3特殊情况(每次迭代仅选一个工作行)——广义贪婪随机Kaczmarz方法, 有如下收敛性定理。
定理 3 若线性系统(1)相容, 其中系数矩阵且右端项。初始向量, 令为通过广义贪婪随机Kaczmarz方法生成的第个迭代值,则有
(8) |
和
证明: 由广义贪婪随机Kaczmarz方法(算法3的前5步)可得
根据概率选指标。由,即与正交,可得
(9) |
对等
(10) |
由,则。类似不等
(11) |
其中
(12) |
联立等
通过归纳法,可得
关于贪婪双子空间随机Kaczmarz方法, 有如下的收敛性定理。
定理4 若线性系统(1)相容, 其中系数矩阵且右端项。初始向量, 令为通过贪婪双子空间随机Kaczmarz方法生成的第个迭代值,则
(13) |
这里,,,,。进一步放缩可得一个松弛但更简单的收敛界
其中,。
证明: 由算法3的步5和步13可得
记。为了便利,在后续的证明中,、、、、分别简记为、、、、。由于,即向量正交于向量,展开可得
(14) |
在算法3中,一次迭代需执行两次投影。因此,将
(15) |
由的递推式可得
(16) |
由、、的定义可得
(17) |
联立式(
利用向量与向量的正交性,展开可得
(18) |
联立
(19) |
对
(20) |
由定理3可得
(21) |
再由
因此,可得
(22) |
再由期望的定义可得
(23) |
把
把
(24) |
其中。把
收敛因子越小, 方法收敛得越快。通过定理4收敛界可知,参数越小,收敛因子越小,即贪婪双子空间随机Kaczmarz方法收敛速度越快。为便于比较,用取值特殊的贪婪双子空间随机Kaczmarz方法与原双子空间随机Kaczmarz方法作比较, 但对实际问题, 因贪婪双子空间随机Kaczmarz方法选行概率更具优势性, 对于,贪婪双子空间随机Kaczmarz方法都比原双子空间随机Kaczmarz方法收敛更快。
事实 ①令是在概率分别为的某个概率空间上定义的一组随机变量。若越大的所对应的概率越大,则值越大;②对于任意数组,,表示数组的平均值。令,有。
当时,显然成立
同时,当时,对于任意,显然成立
基于事实①和②可得
因此,贪婪双子空间随机Kaczmarz方法收敛因子小于原双子空间随机Kaczmarz方法的收敛因子。
浮点运算量方面, 原双子空间随机Kaczmarz方法每次迭代需要个浮点运算量。若残差由递推公式计算, 则贪婪双子空间随机Kaczmarz方法每次迭代需要个浮点运算量。因此, 当时, 贪婪双子空间随机Kaczmarz方法计算量小于原双子空间随机Kaczmarz方法。
在本节中, 分别通过数值实验比较随机Kaczmarz方法(RK)、双子空间随机Kaczmarz方法(2S‒RK)和贪婪双子空间随机Kaczmarz方法(2S‒GRK(θ)), 并显示后者无论在迭代步数(IT)还是计算时间(CPU)上均优于前两者。这里,迭代步数(IT)和计算时间(CPU)取30次计算结果的平均值。
在实验中, 通过Matlab函数随机生成解, 右端项由给出。此外,需要指出2S‒GRK(θ)方法按照算法3中定义的过程精确执行, 并没有显式地计算矩阵来计算残量。本节的所有数值实验, 均取初始向量为, 停机准则为近似解的相对误差满足
或者迭代步数超过30万。在实验表格中, 若在30万步内未达到指定精度, 即用“”表示。
为了测试这些方法,选取了两类矩阵进行实验。一类是通过Matlab函数生成的500×100的相干矩阵。矩阵元素是在区间上独立且均匀分布的随机变量。通过改变的值,可以得到具有不同相干系数对的矩阵,相干系数对定义如下
对于测试的矩阵,
由

图1 以A2和A4为系数矩阵的线性系统的近似解的相对误差随着迭代步数变化的曲线
Fig.1 versus IT for linear systems with coefficient matrices:A2 and A4
对于测试的稀疏矩阵,
由

图2 以Ash219和Ash958为系数矩阵的线性系统的近似解的相对误差随着迭代步数变化的曲线
Fig.2 versus IT for linear systems with coefficient matrices:Ash219 and Ash958
对于4个测试矩阵A2、A4、Ash219和Ash958,

图3 2S‒GRK(θ)方法的计算时间和迭代步数随控制参数θ变化的曲线
Fig.3 CPU and IT versus θ of 2S‒GRK(θ)
提出一类贪婪双子空间随机Kaczmarz方法, 理论分析证明新方法的收敛性, 还表明收敛因子小于传统的双子空间随机Kaczmarz方法的收敛因子。数值实验结果也表明所提出的新方法在迭代步数和计算时间上均优于传统的双子空间随机Kaczmarz方法。贪婪双子空间随机Kaczmarz方法能够快速求解大规模稀疏相容线性方程组, 主要原因在于新方法定义的随机选取工作行的概率更具优势。如何随机选取工作行以加速Kaczmarz方法及其应
作者贡献声明
荆燕飞:核心思想提炼、论文修改。
李彩霞:论文撰写。
胡少亮:论文修改。
参考文献
BREZINSKI C. Projection methods for systems of equations [M]. Amsterdam:North-Holland Publishing Co,1997. [百度学术]
SAAD Y. Iterative methods for sparse linear systems [M]. Philadelphia: SIAM Publisher, 2003. [百度学术]
GALÁNTAI A. Projectors and projection methods [M]. Boston: Kluwer Academic Publishers, 2003. [百度学术]
GOLUB G H. Matrix computations[M]. 3rd ed. Baltimore: Johns Hopkins UP, 2008. [百度学术]
KACZMARZ S. Angenäherte auflösung von systemen linearer gleichungen [J]. Bulletin International de l'Academie Polonaise des Sciences et des Lettres, 1937, 35: 355. [百度学术]
ANSORGE R. Connections between the Cimmino-method and the Kaczmarz-method for the solution of singular and regular systems of equations [J]. Computing, 1984, 33: 367. [百度学术]
CENSOR Y. Row-action methods for huge and sparse systems and their applications [J]. SIAM Review, 1981, 23: 444. [百度学术]
KNIGHT P A. Error analysis of stationary iteration and associated problems [D]. Manchester: Manchester University, 1993. [百度学术]
BAI Z Z, LIU X G. On the meany inequality with applications to convergence analysis of several row-action iteration methods [J]. Numerische Mathematik, 2013, 124: 215. [百度学术]
CENSOR Y. Parallel application of block-iterative methods in medical imaging and radiation therapy [J]. Mathematical Programming, 1988, 42: 307. [百度学术]
HERMAN G T. Fundamentals of computerized tomography: image reconstruction from projection [M]. 2nd ed. London: Springer, 2009. [百度学术]
KAK A C, SLANEY M. Principles of computerized tomographic imaging [M]. Philadelphia: SIAM Publisher, 2003. [百度学术]
NATTERER F. The mathematics of computerized tomography [M]. Philadelphia: SIAM Publisher, 2001. [百度学术]
GORDON R, BENDER R, HERMAN G T. Algebraic reconstruction techniques (ART) for three-dimensional electron microscopy and X-ray photography [J]. Journal of Theoretical Biology, 1970, 29(3): 471. [百度学术]
HERMAN G T, DAVIDI R. Image reconstruction from a small number of projections [J]. Inverse Problems, 2008, 24(4): 45011. [百度学术]
HERMEN G T, MEYER L B. Algebraic reconstruction techniques can be made computationally efficient [J]. IEEE Trans Medical Imaging, 1993, 12(3): 600. [百度学术]
ELBLE J M, SAHINIDIS N V, VOUZIS P. GPU computing with Kaczmarz’s and other iterative algorithms for linear systems [J]. Parallel Computing, 2010, 36(5): 215. [百度学术]
PASQUALETTI F, CARLI R,BULLO F. Distributed estimation via iterative projections with application to power network monitoring [J]. Automatica, 2012, 48(5): 747. [百度学术]
BYRNE C. A unified treatment of some iterative algorithms in signal processing and image reconstruction [J]. Inverse Problems, 2004, 20(1): 103. [百度学术]
LORENZ D, MAGNOR M, WENGER S, et al. A sparse Kaczmarz solver and a linearized Bregman method for online compressed sensing [C]// IEEE International Conference on Image Processing (ICIP).[S.l.]:ICIP, 2014: 1347-1351. [百度学术]
CENKER C, FEICHTINGER H G, MAYER M, et al. New variants of the POCS method using affine subspaces of finite codimension, with applications to irregular sampling [J]. Proceedings of SPIE - The International Society for Optical Engineering, 1992, 1818: 299. [百度学术]
STROHMER T, VERSHYNIN R. A randomized Kaczmarz algorithm with exponential convergence [J]. Journal of Fourier Analysis and Applications, 2009, 15(2): 262. [百度学术]
DAI L, SOLTANALIAN M, PELCKMANS K. On the randomized Kaczmarz algorithm[J]. IEEE Signal Processing Letters, 2014, 21(3): 330. [百度学术]
BAI Z Z, WU W T. On greedy randomized Kaczmarz method for solving large sparse linear systems [J]. SIAM Journal on Scientific Computing, 2018, 40(1): 592. [百度学术]
BAI Z Z, WU W T. On relaxed greedy randomized Kaczmarz methods for solving large sparse linear systems [J]. Applied Mathematics Letters, 2018, 83: 21. [百度学术]
杜亦疏,殷俊锋,张科. 求解大型稀疏线性方程组的贪婪距离随机Kaczmarz方法[J]. 同济大学学报(自然科学版), 2020, 48(8): 1224. [百度学术]
DU Yishu, YIN Junfeng, ZHANG Ke. Greedy randomized-distance Kaczmarz method for solving large sparse linear systems [J]. Journal of Tongji University (Natural Science), 2020, 48(8): 1224. [百度学术]
NEEDELL D, WARD R. Two-subspace projection method for coherent over-determined systems [J]. Journal of Fourier Analysis and Applications, 2013, 19(2): 256. [百度学术]
ZOUZIAS A, FRERIS N. M. Randomized extended Kaczmarz for solving least squares [J]. SIAM Journal on Matrix Analysis and Applications, 2013, 34(2): 773. [百度学术]
BAI Z Z,WU W T. On partially randomized extended Kaczmarz method for solving large sparse overdetermined inconsistent linear systems [J]. Linear Algebra and Its Applications, 2019, 578: 225. [百度学术]
DAI L, SCHON T. On the exponential convergence of the kaczmarz algorithm[J]. IEEE Signal Processing Letters, 2015, 22(10): 1571. [百度学术]
OSWALD P, ZHOU W Q. Convergence analysis for Kaczmarz-type methods in a Hilbert space framework [J]. Linear Algebra and Its Applications, 2015, 478: 131. [百度学术]
BAI Z Z, WU W T. On convergence rate of the randomized Kaczmarz method [J]. Linear Algebra and Its Applications, 2018, 553: 252. [百度学术]
POPA C. Convergence rates for Kaczmarz-type algorithms [J]. Numerical Algorithms, 2018, 79(1): 1. [百度学术]
ELDAR Y C, NEEDELL D. Acceleration of randomized Kaczmarz method via the Johnson-Lindenstrauss lemma [J]. Numerical Algorithms, 2011, 58(2): 163. [百度学术]
XIANG X, CHENG L Z. An accelerated randomized Kaczmarz method via low-rank approximation [J]. International Journal of Computer Mathematics, 2015, 92(7): 1413. [百度学术]
LEVENTHAL D, LEWIS A S. Randomized methods for linear constraints: convergence rates and conditioning [J]. Mathematics of Operations Research, 2010, 35(3): 641. [百度学术]
MA A, NEEDELL D, RAMDAS A. Convergence properties of the randomized extended Gauss–Seidel and Kaczmarz methods [J]. SIAM Journal on Matrix Analysis and Applications, 2015, 36(4): 1590. [百度学术]
DU K. Tight upper bounds for the convergence of the randomized extended Kaczmarz and Gauss-Seidel algorithms [J]. Numerical Linear Algebra with Applications, 2019, 26(3): e2233. [百度学术]
NEEDELL D, TROPP J A. Paved with good intentions: analysis of a randomized block Kaczmarz method [J]. Linear Algebra and Its Applications, 2014, 441: 199. [百度学术]
NEEDELL D, ZHAO R, ZOUZIAS A. Randomized block Kaczmarz method with projection for solving least squares [J]. Linear Algebra and Its Applications, 2015, 484: 322. [百度学术]
NUTINI J, SEPEHRY B, LARADJI I, et al. Convergence rates for greedy Kaczmarz algorithms, and faster randomized Kaczmarz rules using the orthogonality graph [J]. arXiv, 2016, 1612.07838. [百度学术]
HOLODNAK J T,IPSEN I C F. Randomized approximation of the Gram matrix: Exact computation and probabilistic bounds [J]. SIAM Journal on Matrix Analysis and Applications, 2015, 36(1): 110. [百度学术]
DU Y S, HAYAMI K, ZHENG N, et al. Kaczmarz-type inner-iteration preconditioned flexible GMRES methods for consistent linear systems [J]. arXiv,2020,2006.10818. [百度学术]