摘要
当相容的线性代数方程组的右端向量发生扰动时,给出了由贪婪随机Kaczmarz方法所产生的迭代解与原线性代数方程组的最小范数解之间的期望误差的上界,并说明了随着迭代步数的增长,该期望解误差以线性速率下降至一个给定阈值。数值实验表明,该阈值能够很好地估计贪婪随机Kaczmarz方法的迭代解误差所能达到的最小值。
关键词
对于系数矩阵为且右端向量为的大规模相容线性代数方程组
(1) |
的求解,Kaczmarz方
影响随机Kaczmarz方法收敛速率的关键在于其中所蕴含的用于选取每步迭代所需调用的系数矩阵行的概率准则。为了提高随机Kaczmarz方法的收敛速率,Bai
其中,且、和分别表示矩阵第行的欧氏范数平方、矩阵的Frobenius范数平方和矩阵的最小非零特征值。
当线性代数方程组(1)的右端向量被加上一个不为零的扰动向量时,实际求解的线性代数方程组问题将变为
(2) |
其中,。若对任意矩阵和任意向量,用和分别表示矩阵的第行和向量的第个分量,由于贪婪随机Kaczmarz方法的第步迭代将当前迭代向量投影至超平面上,而线性代数方程组(1)的最小范数解满足,故其并不能收敛到。在这种情况下,本文对贪婪随机Kaczmarz方法的期望解误差进行分析,得到了其上界,证明了随着迭代步数的增长,由贪婪随机Kaczmarz方法所产生的迭代解与原线性代数方程组(1)的最小范数解之间的误差以线性速率下降至一个给定阈值。数值实验表明本文所给出的阈值能够很好地估计贪婪随机Kaczmarz方法的迭代解误差所能达到的最小值。
不失一般性,在本文的讨论中,总是假设系数矩阵不存在零行,即,。当线性代数方程组(1)的右端向量发生扰动时,求解线性代数方程组(2)的贪婪随机Kaczmarz方
输入:,,与
输出:
1: for do
2: 计算
3: 确定正整数指标集
4: 计算向量的第个分量
5: 按照概率选取
6: 令
7: endfor
令和分别为系数矩阵的像空间和其像空间的正交补子空间,则有,其中和分别表示向量在和上的正交投影。若线性代数方程组(1)右端向量的扰动在系数矩阵的像空间中,则线性代数方程组(2)等价于线性代数方程组
(3) |
易知线性代数方程组(3)是相容的且其最小范数解为。此时,若初始迭代向量在的列空间中,则求解线性代数方程组(2)的贪婪随机Kaczmarz方法所产生的迭代序列期望线性收敛到。
与求解原线性代数方程组(1)的贪婪随机Kaczmarz方法的分
有
而对于,有
因此,可得引理1。
引理 1 求解系数矩阵为且右端向量为的线性代数方程组(2)的贪婪随机Kaczmarz方法的概率准则中的量,,满足
和
, |
其中。
当线性代数方程组(1)右端向量的扰动在中时,若初始迭代向量在的列空间中,则求解线性代数方程组(2)的贪婪随机Kaczmarz方法所产生的迭代向量期望线性收敛到线性代数方程组(3)的最小范数解。对于一般的扰动情形,求解线性代数方程组(2)的贪婪随机Kaczmarz方法所产生的迭代向量与之间的期望误差的上界可以由引理2给出。
引理 2 如果初始迭代向量在的列空间中,则贪婪随机Kaczmarz方法求解扰动后的线性代数方程组(2)所产生的迭代序列与线性代数方程组(3)的最小范数解之间的期望误差满足
其中
(4) |
证明: 由求解线性代数方程组(2)的贪婪随机Kaczmarz方法的定义和可知
其中表示具有合适阶数的单位矩阵,则有
(5) |
用表示固定前步迭代的条件期望,即,其中为第步迭代所选取的行指标,则对等
由于
可知
则根据正整数指标集的定义可得
对于在矩阵的像空间中的任意向量,有不等式
(6) |
成立。利用该不等式,通过引理1、向量和向量的正交性、以及可知,对于,有
而对于,有
对不等式两边取期望可得对于,有
而对于,有
因此,由于,,对于,有
由Jensen不等式可知
基于引理2,关于求解扰动后的线性代数方程组(2)的贪婪随机Kaczmarz方法所产生的迭代近似解与原线性代数方程组(1)的最小范数解之间的期望误差的上界,可以给出如下定理。
定理 1 如果初始迭代向量在的列空间中且为线性代数方程组(3)的最小范数解,则贪婪随机Kaczmarz方法求解扰动后的线性代数方程组(2)所产生的迭代序列与原线性代数方程组(1)的最小范数解之间的期望误差满足
其中,、和如(4)式中定义。
证明: 因为,则通过不等
又因为有
成立,则由引理2可得
定理1说明了当迭代步数趋于无穷时,贪婪随机Kaczmarz方法求解扰动后的线性代数方程组(2)所产生的迭代序列的期望相对解误差以的线性速率下降至某个阈值,并给出了该阈值的估计
若为零,则扰动后的线性代数方程组(2)即为相容的线性代数方程组(3)。因此,求解线性代数方程组(2)的贪婪随机Kaczmarz方法的迭代序列收敛到线性代数方程组(3)的最小范数解,且其与原线性代数方程组(1)的最小范数解的差趋于。此时,如果初始迭代向量在的列空间中,则求解线性代数方程组(2)的贪婪随机Kaczmarz方法所产生的迭代序列满足
若为零,则线性代数方程组(3)即为线性代数方程组(1),且线性代数方程组(3)的最小范数解即为。此时,如果初始迭代向量在的列空间中,则求解线性代数方程组(2)的贪婪随机Kaczmarz方法所产生的迭代序列满足
通过数值实验测试贪婪随机Kaczmarz方法求解带右端项扰动的线性代数方程组(2)时的数值表现,并将所估计的阈值与贪婪随机Kaczmarz方法所产生的真实迭代解误差进行比较。
所测试的系数矩阵分为两类:一类为利用MATLAB函数randn随机产生的元素服从标准正态分布的矩阵,矩阵维数分别为和;另一类为取自稀疏矩阵
线性代数方程组(1)的右端向量取为,其中是利用MATLAB函数randn随机产生的。线性代数方程组(1)的右端项的扰动向量分为三类:一类为随机扰动,一类为在系数矩阵的像空间中的扰动,另一类为在系数矩阵的像空间的正交补空间中的扰动。这三类扰动均由MATLAB函数randn生成,并且其欧氏范数为原始右端向量的欧氏范数的0.0005倍。由于的随机矩阵和稀疏矩阵bibd_16_8为行满秩矩阵,故其所对应的右端项扰动一定在其像空间中。所有计算均从初始向量开始。

图1 当和时,lg ERS和lg τ相对于迭代步数的曲线
Fig.1 Pictures of lg ERS and lg τ versus the iteration step when and
从

图2 当且和时,lg ERS和lg τ相对于迭代步数的曲线
Fig.2 Pictures of lg ERS and lg τ versus the iteration step when,and and
当线性代数方程组(1)的系数矩阵为稀疏矩阵bibd_16_8和ash958时,

图3 当矩阵为bibd_16_8 和ash958 时,lg ERS和lg τ相对于迭代步数的曲线
Fig.3 Pictures of lg ERS and lg τ versus the iteration step when the matrices are bibd_16_8 and ash958

图4 当矩阵为ash958且和时,lg ERS与lg τ相对于迭代步数的曲线
Fig.4 Pictures of lg ERS and lg τ versus the iteration step when the matrix is ash958, and and
当线性代数方程组的右端向量发生扰动时,证明了贪婪随机Kaczmarz方法的期望解误差以线性速率下降至一个给定阈值。数值实验表明该阈值能够很好地估计贪婪随机Kaczmarz方法的迭代解误差所能达到的最小值。可以发现当扰动不是很大且对解的精度要求不是很高时,贪婪随机Kaczmarz方法仍然能够很好地给出原线性代数方程组最小范数解的近似。
参考文献
KACZMARZ S. Angenäherte Auflösung von Systemen linearer Gleichungen [J]. Bulletin International de l'Academie Polonaise des Sciences et des Lettres, 1937, 35: 355. [百度学术]
STROHMER T, VERSHYNIN R. A randomized Kaczmarz algorithm with exponential convergence [J]. Journal of Fourier Analysis and Applications, 2009, 15: 262. [百度学术]
MA A, NEEDELL D, RAMDAS A. Convergence properties of the randomized extended Gauss‑Seidel and Kaczmarz methods [J]. SIAM Journal on Matrix Analysis and Applications, 2015, 36: 1590. [百度学术]
GOWER R M, RICHTÁRIK P. Stochastic dual ascent for solving linear systems [J]. arXiv,2015,1512.06890. [百度学术]
BAI Z Z, WU W T. On convergence rate of the randomized Kaczmarz method [J]. Linear Algebra and its Applications, 2018, 553: 252. [百度学术]
NEEDELL D. Randomized Kaczmarz solver for noisy linear systems [J]. BIT Numerical Mathematics, 2010, 50: 395. [百度学术]
ZOUZIAS A, FRERIS N M. Randomized extended Kaczmarz for solving least squares [J]. SIAM Journal on Matrix Analysis and Applications, 2013, 34: 773. [百度学术]
BAI Z Z, WU W T. On greedy randomized Kaczmarz method for solving large sparse linear systems [J]. SIAM Journal on Scientific Computing, 2018, 40: A592. [百度学术]
BAI Z Z, WU W T. On relaxed greedy randomized Kaczmarz methods for solving large sparse linear systems [J]. Applied Mathematics Letters, 2018, 83: 21. [百度学术]
DAVIS T A, HU Y. The University of Florida sparse matrix collection [J]. ACM Transactions on Mathematical Software, 2011, 38: 1. [百度学术]