求解线性方程组稀疏解的稀疏贪婪随机Kaczmarz算法

王泽，殷俊锋; WANG Ze; YIN Junfeng

网刊加载中。。。

使用Chrome浏览器效果最佳，继续浏览，你可能不会看到最佳的展示效果，

确定继续浏览么?

复制成功，请在其他浏览器进行阅读

求解线性方程组稀疏解的稀疏贪婪随机Kaczmarz算法 PDF

- ORCID：
王泽
✉
- ORCID：
殷俊锋
✉

同济大学数学科学学院，上海 200092

中图分类号： O241.6

最近更新：2021-11-25

DOI：10.11908/j.issn.0253-374x.21212

摘要

求解线性方程组的稀疏解在图像重构、信号处理和机器学习等领域中具有广泛的应用，通过引入 $l_{1}$ -范数正则化，可以转化为求解一个约束优化问题。基于一种选择系数矩阵工作行的概率准则，提出了稀疏贪婪随机Kaczmarz算法，并给出了有噪声干扰和无噪声干扰情况下该算法的收敛性分析。理论表明本文算法的收缩因子小于随机稀疏Kaczmarz算法的收缩因子。数值实验验证了本文算法的有效性。

关键词

Kaczmarz算法; 稀疏解; 收敛性; 随机迭代

求解线性方程组 $A x = b$ 的稀疏解在图像重构、信号处理和机器学习中具有广泛应用^［

1-4］。通过引入

l_{1}

-范数，求解线性方程组的稀疏解可以转化为求解式（1）正则化最小二乘问题：

\underset{x \in R^{n}}{m i n} f (x) = λ {‖x‖}_{1} + \frac{1}{2} {‖x‖}_{2}^{2} s . t . A x = b

（1）

求解该问题常见的算法包括基追踪方法、Bregman方法、共轭梯度方法等^［

5-7］。

自Strohmer和Vershynin^［

8］证明了随机Kaczmarz算法具有线性收敛率以来，许多专家学者对随机Kaczmarz算法进行了深入的研究^{［参考文献 9-11}9-11］。Kaczmarz算法求解的是最小二乘解，通常是稠密的，为了求解线性方程组的稀疏解，文献［12］提出稀疏Kaczmarz算法，该算法在原有的Kaczmarz算法基础之上引入了软阈值函数，解决了最小二乘解稠密性的问题。

在线性方程组相容的情况下，文献［

13］证明了稀疏Kaczmarz算法迭代收敛到问题（1）的唯一解。令右端噪声项

b^{δ}

满足

‖ b - b^{δ} ‖_{2} \leq δ

时，线性方程组可能不相容，文献［14-15］证明了随机Kaczmarz算法的迭代值依期望收敛，并且与无噪声情况下有相同的收缩因子。文献［16］在稀疏Kaczmarz算法基础之上，提出了随机稀疏Kaczmarz算法，并在有噪声干扰和无噪声干扰的情况下给出了随机稀疏Kaczmarz算法的收敛性分析。当系数矩阵的行范数相差较小时，随机Kaczmarz算法将等概率选取

A

的行，此时随机Kaczmarz算法的收敛速率较慢，因此Bai和Wu^{［参考文献 17

百度学术}17］结合贪婪和随机思想，提出一种新的概率准则来选取工作行，形成贪婪随机Kaczmarz算法。更多贪婪随机Kaczmarz算法的研究参见文献［18-21］。

在稀疏随机Kaczmarz算法的基础之上^［

21］，受贪婪算法的启发，本文提出稀疏贪婪随机Kaczmarz算法，给出稀疏贪婪随机Kaczmarz算法在有噪声干扰和无噪声干扰情况下的收敛性分析，并以大量的数值实验验证本文算法的计算效率。

符号标记如下，定义 $\hat{x}$ 为线性方程组 $A x = b$ 的解，其中 $A \in R^{m \times n}$ ， $b \in R^{m}$ ， $a_{i}$ 表示系数矩阵A的第 $i$ 行。支持集S= $s u p p (\hat{x}) = \{j \in {1, \dots, n} ∣ {\hat{x}}_{j} \neq 0\}$ 是列向量 $\hat{x}$ 中非零元的下标所构成的集合， $A_{S}$ 是 $A$ 的子矩阵，由支持集 $S$ 中的指标选取系数矩阵 $A$ 的列构成， $a_{i_{S}}$ 表示的是 $A_{S}$ 的第 $i$ 行， $x_{S}$ 是在支持集 $S$ 限制下的列向量；定义 $\hat{σ}$ $_{m i n} (A) = m i n \{σ_{m i n} (A_{J}) ∣ J \subset {1, \dots, n}, A_{J} \neq 0\}$ 为子矩阵 $A_{J}$ 的最小奇异值，其中 $A_{J}$ 为指标集 $J$ 中A的列构成的子矩阵，令 $\tilde{κ} = \frac{‖ A ‖_{F}}{{\hat{σ}}_{m i n} (A)}$ ； $⊙$ 为哈达玛积（Hadamard product）； $\hat{k}$ 为对支持集大小的估计值； $w_{j}$ 为稀疏随机Kaczmarz算法第 $j$ 次迭代的权重值， $w_{j} \in R^{m \times 1}$ 。

1 稀疏贪婪随机Kaczmarz算法

当 $A x = b$ 的解 $x$ 稀疏时，文献［

21］提出了稀疏随机Kaczmarz算法，加快了算法的收敛速率（算法1）。

算法1 　稀疏随机Kaczmarz算法^［

21］。①输入

A \in R^{m \times n}

，

b \in R^{m}

，最大迭代数M和估计的支持集的大小

\hat{k}

。②输出

x_{j} 。

③初始化

S = \{1, \dots, n\}

，

x_{0} = 0

，

j = 0 。

④当

j \leq M

时，置

j = j + 1

。⑤选择行向量

a_{i}, i \in {1, \dots, n}

，每一行对应的概率为

\frac{‖ a_{i} ‖_{2}^{2}}{‖ A ‖_{F}^{2}}

。⑥确定估计的支持集

S

，

S = s u p p ({x_{j - 1}|}_{m a x {\hat{k}, n - j + 1}}) 。

⑦生成权重值

w_{j}

，

w_{j} (l) = \{\begin{array}{l} 1 & l \in S \\ \frac{1}{\sqrt[]{j}} & l \in S^{c} \end{array}

。⑧

x_{j} = x_{j - 1} + \frac{b_{i} - <w_{j} ⊙ a_{i}, x_{j - 1}>}{{(w_{j} ⊙ a_{i})}_{2}^{2}} {(w_{j} ⊙ a_{i})}^{T}

。⑨转步骤④。

稀疏随机Kaczmarz算法可以用比随机Kaczmarz算法更少的迭代步数找到最小二乘解。由于支持集和稀疏度都是未知的，因此稀疏随机Kaczmarz算法从支持集中所有元素的稀疏度的初始估计开始，然后在每一次迭代中，稀疏随机Kaczmarz算法通过去掉向量 $x$ 中数量级最小的元素下标来更新估计的支持集。该算法第 $j$ 次迭代的加权准则为

w_{j} (l) = \{\begin{array}{l} 1 & l \in S \\ \frac{1}{\sqrt[]{j}} & l \in S^{c} \end{array}

其中， $j$ 为迭代步数。当 $j \to \infty$ 时， $w_{j} ⊙ a_{i} \to a_{i_{S}}$ ，因此原线性方程组退化成

b = A x = A_{S} x_{S}

由于 $κ (A_{S}) \leq κ (A)$ ，因此稀疏随机Kaczmarz算法的收敛因子小于随机Kaczmarz算法。但是由于最小二乘解总是稠密的，该算法在求解超定线性方程组时，虽然在稀疏解零元对应位置上的元素很小，但仍然不等于零，因此在文献中提出稀疏Kaczmarz算法，文献［

16］在稀疏Kaczmarz算法的基础上，提出了随机稀疏Kaczmarz算法（算法2）。

算法2 　随机稀疏Kaczmarz算法^［

16］。①输入

A \in R^{m \times n}

，

b \in R^{m}

，最大迭代数

M

。②输出

x_{k}

。③初始化：

x_{0} = x_{0}^{*} = 0

。④置

k = 0

，当k

\leq M - 1

时。⑤选择行向量

a_{i_{k}}, i_{k} \in {1, \dots, n}

，每一行对应的概率为

\frac{‖ a_{i_{k}} ‖_{2}^{2}}{‖ A ‖_{F}^{2}}

。⑥

x_{k + 1}^{*} = x_{k}^{*} - \frac{<a_{i_{k}}, x_{k}> - b_{i_{k}}}{‖ a_{i_{k}} ‖_{2}^{2}} \cdot a_{i_{k}}

。⑦

x_{k + 1} = S_{λ} (x_{k + 1}^{*})

。⑧转步骤④。

算法2中 $λ > 0$ ， $S_{λ} (x) = m a x {| x | - λ, 0} \cdot s i g n (x)$ 。结合稀疏随机Kaczmarz算法和随机稀疏Kaczmarz算法的思想，受贪婪算法的启发，本文提出稀疏贪婪随机Kaczmarz算法，在保证算法能够计算出稀疏解的同时，通过贪婪的概率准则来选择工作行从而达到加快算法收敛速度的目的。算法3给出稀疏贪婪随机Kaczmarz算法。

算法3 　稀疏贪婪随机Kaczmarz算法。①输入 $A \in R^{m \times n}$ ， $b \in R^{m}$ ，最大迭代数 $M$ 和估计的支持集的大小 $\hat{k}$ 。②输出 $x_{k}$ 。③初始化 $S = \{1, \dots, n\}$ ， $x_{0} = x_{0}^{*} = 0 。 ④$ 置 $k = 0$ 时，当k $\leq M - 1$ 时。⑤计算

ϵ_{k} = \frac{1}{2} (\frac{1}{‖ b - A x_{k} ‖_{2}^{2}} \underset{1 \leq i_{k} \leq m}{m a x} \{\frac{{|b_{i_{k}} - a_{i_{k}} x_{k}|}^{2}}{‖ a_{i_{k}} ‖_{2}^{2}}\} + \frac{1}{‖ A ‖_{F}^{2}})

（2）

⑥决定正整数指标集

𝒰_{k} = \{i_{k} | {|b_{i_{k}} - a_{i_{k}} x_{k}|}^{2} \geq ϵ_{k} ‖ b - A x_{k} ‖_{2}^{2} ‖ a_{i_{k}} ‖_{2}^{2}\}

（3）

⑦计算向量 ${\tilde{r}}_{k}$ 的第 $i$ 行 ${\tilde{r}}_{k}^{(i)}$

{\tilde{r}}_{k}^{(i)} = \{\begin{array}{l} b^{(i)} - A^{(i)} x_{k} & 若 i \in 𝒰_{k} \\ 0 & 其 他 \end{array}

⑧以概率准则 $p (r_{r o w} = i_{k}) \frac{{|r_{k}^{(i)}|}^{2}}{‖ r_{k} ‖_{2}^{2}}$ 选择 $i_{k} \in 𝒰_{k}$ 。⑨确定估计的支持集 $S$ ，如下： $S = s u p p ({x_{k}|}_{m a x {\hat{k}, n - k}})$ 。⑩生成权重值 $w_{k + 1}$

w_{k + 1} (l) = \{\begin{array}{l} 1 & l \in S \\ \frac{1}{\sqrt[]{k + 1}} & l \in S^{c} \end{array}

⑪计算

x_{k + 1}^{*} = x_{k}^{*} + \frac{b_{i_{k}} - <w_{k + 1} ⊙ a_{i_{k}}, x_{k}>}{‖ w_{k + 1} ⊙ a_{i_{k}} ‖_{2}^{2}} {(w_{k + 1} ⊙ a_{i_{k}})}^{T}

⑫计算 $x_{k + 1} = S_{λ} (x_{k + 1}^{*})$ 。⑬转步骤④。

2 稀疏贪婪随机Kaczmarz算法的收敛性分析

为了证明求解正则基追踪问题（1）稀疏贪婪随机Kaczmarz算法依期望线性收敛，先回顾一些基本的概念和性质^［

22］。

令 $f : R^{n} \to R$ 是凸函数，用 $\partial f (x)$ 表示 $f$ 在 $x \in R^{n}$ 的次微分

\partial f (x) = \{x^{*} \in R^{n} ∣ f (y) \geq f (x) + <x^{*}, y - x> \forall y \in R^{n}\}

其中， $\partial f (x)$ 是一个非空紧凸集。

定义1 　凸函数 $f : R^{n} \to R$ ，如果存在 $α > 0$ ，使得对任意的 $x, y \in R^{n}$ 且 $x^{*} \in \partial f (x)$ ，有

f (y) \geq f (x) + <x^{*}, y - x> + \frac{α}{2} \cdot ‖ y - x ‖_{2}^{2}

那么 $f$ 是强凸的，当和 $α$ 的具体值相关时，则称 $f$ 是 $α$ -强凸的。

定义2 ^［

22］如果

f : R^{n} \to R

是

α

-强凸，那么它的共轭函数

f^{*} (x^{*}) : = s u p_{x \in R^{n}} <x^{*}, x> - f (x)

可微且有

1 / α - L i p s c h i t z

连续梯度，例如

{(\nabla f^{*} (x^{*}) - \nabla f^{*} (y^{*}))}_{2} \leq \frac{1}{α} \cdot {(x^{*} - y^{*})}_{2}, \forall x^{*}, y^{*} \in R^{n}

有式（4）不等式成立：

\begin{array}{l} f^{*} (y^{*}) \leq f^{*} (x^{*}) + <\nabla f^{*} (x^{*}), y^{*} - x^{*}> + \\ \frac{1}{2 α} ‖ y^{*} - x^{*} ‖_{2}^{2} \forall x^{*}, y^{*} \in R^{n} \end{array}

（4）

定义3 　令 $f : R^{n} \to R$ 是强凸函数，那么 $x, y \in R^{n}$ 之间的Bregman距离 $D_{f}^{x^{*}} (x, y)$ 由 $f$ 和一个次梯度 $x^{*} \in \partial f (x)$ 定义

\begin{array}{l} D_{f}^{x^{*}} (x, y) : = f (y) - f (x) - \\ <x^{*}, y - x> = f^{*} (x^{*}) - <x^{*}, y> + f (y) \end{array}

如果 $f$ 是可微的，那么有 $\partial f (x) = {\nabla f (x)}$ ，因为 $D_{f}^{} (x, y) = f (y) - f (x) - <\nabla f (y), y - x>$ ，所以可以简化来写 $D_{f} (x, y) = D_{f}^{x^{*}} (x, y)$ 。

下面的引理都遵循强凸性的假设^［

13］，给出了随机方法收敛性分析所需的Bregman距离的关键性质。

引理1 ^［

13］令

f : R^{n} \to R

是

α

强凸函数，对任意的

x, y \in R^{n}

和

x^{*} \in \partial f (x) 、 y^{*} \in \partial f (y)

有

\frac{α}{2} ‖ x - y ‖_{2}^{2} \leq D_{f}^{x^{*}} (x, y) \leq <x^{*} - y^{*}, x - y> \leq {(x^{*} - y^{*})}_{2} \cdot ‖ x - y ‖_{2}

因此

D_{f}^{x^{*}} (x, y) = 0 \Leftrightarrow x = y

对于序列 $x_{k}$ 和 $x_{k}^{*} \in \partial f (x_{k})$ ， $D_{f}^{x_{k}^{*}} (x_{k}, y)$ 的有界性意味着 $x_{k}$ 和 $x_{k}^{*}$ 有界。如果 $f$ 有一个 $L - L i p s c h i t z$ 连续梯度，那么也有 $D_{f} (x, y) \leq \frac{L}{2} \cdot ‖ x - y ‖_{2}^{2}$ 。

定义4 　令 $f : R^{n} \to R$ 是强凸函数，且 $C \subset R^{n}$ 是一个非空闭凸集，则 $x$ 到 $C$ 上的Bregman投影是关于 $f$ 和 $x^{*} \in \partial f (x)$ 满足下式的唯一点 $Π_{C}^{x^{*}} (x) \in C$ ：

D_{f}^{x^{*}} (x, Π_{C}^{x^{*}} (x)) = \underset{y \in C}{m i n} D_{f}^{x^{*}} (x, y) = : d i s t_{f}^{x^{*}} {(x, C)}^{2}

对于可微的 $f$ ，可以简化为 $Π_{C} (x)$ 和 $d i s t_{f} (x, C)$ 。

引理2 ^［

13］令

f : R^{n} \to R

是强凸函数，x到C上的Bregman投影点

\hat{x} \in C

是与

f

和

x^{*} \in \partial f (x)

3 数值实验

通过随机生成的高斯矩阵和矩阵市场中的矩阵2个数值实验算例来比较稀疏贪婪随机Kaczmarz（SGRK）算法、随机稀疏Kaczmarz（RaSK）算法和稀疏随机Kaczmarz（SRK）算法的收敛速度。为了能够使三者收敛到相同解上进行比较，在本次数值实验中，在稀疏随机Kaczmarz算法最后一步加上了软阈值函数 $S_{λ} (x)$ 参与迭代以保证求得稀疏解。对相同参数的同一个线性方程组 $A x = b$ 做了20次试验，得到迭代步数（ $I T$ ）和 $C P U$ 计算时间的平均值。解的相对误差（RSE）定义为

r_{R S E} = \frac{‖ x_{k} - \hat{x} ‖_{2}^{2}}{‖ \hat{x} ‖_{2}^{2}} .

例1 利用Matlab软件中的randn函数随机生成系数矩阵 $A$ 和 $x_{n \times 1}$ ，其中有 $k \times n$ 个非零元，之后利用 $b = A \times x$ 得到相容线性方程组，初始向量 $x_{0} = 0$ 。取 $\tilde{k} = 2 \times k$ ，通过 $k$ 来设置解的稀疏度，其中 $\tilde{k}$ 是对稀疏度的初始估计值。

当解稀疏度为0.2、0.4、0.6以及0.8时，表1和表2分别给出了系数矩阵 $A$ 的维数为 $1 000 \times 150$ 和 $4 000 \times 300$ 时的SGRK算法、RaSK算法和SRK算法的迭代步数和计算时间。

表1 m = 1 000、n = 150时SGRK、RaSK 和 SRK 的迭代步数和计算时间

Tab. 1 Iteration steps and computation time of SGRK, RaSK and SRK（m = 1 000、n = 150）

稀疏度	SGRK		RaSK		SRK
稀疏度	迭代步数	计算时间	迭代步数	计算时间	迭代步数	计算时间
0.2 n	158.80	0.014 6	2 496.50	0.053 0	1 082.10	0.038 1
0.4 n	273.35	0.023 5	2 491.20	0.053 3	1 972.00	0.064 9
0.6 n	360.65	0.026 3	2 552.00	0.055 2	2 559.40	0.082 7
0.8 n	363.05	0.025 9	2 597.50	0.054 7	2 557.30	0.080 4

表 2 m = 4 000、n = 300时SGRK、RaSK 和 SRK 的迭代步数和计算时间

Tab. 2 Iteration steps and computation time of SGRK, RaSK and SRK（m = 4 000、n = 300）

稀疏度	SGRK		RaSK		SRK
稀疏度	迭代步数	计算时间	迭代步数	计算时间	迭代步数	计算时间
0.2 n	259.95	0.094 0	4 224.40	0.226 4	2 057.00	0.152 6
0.4 n	418.45	0.146 8	4 302.50	0.229 9	3 736.00	0.306 7
0.6 n	522.90	0.188 2	4 344.60	0.245 1	4 372.70	0.330 1
0.8 n	523.30	0.190 9	4 435.90	0.237 3	4 442.40	0.321 0

当稀疏度为 0.2 和 0.8 时，图1和图2分别给出系数矩阵A的维数为1 000 × 150和4 000 × 300时3种算法近似解的相对误差随迭代步数变化的曲线。

图1 当矩阵A的维数为1 000 × 150时SGRK、RaSK和SRK算法的收敛曲线

Fig. 1 Convergence curves of SGRK, RaSK and SRK methods for Example 1 at a matrix A of 1 000 × 150

图2 当矩阵A的维数为4 000 × 300时SGRK、RaSK和SRK算法的收敛曲线

Fig. 2 Convergence curves of SGRK, RaSK and SRK methods for Example 1 at a matrix A of 4 000 × 300

通过表1和表2中的实验数据以及图1和图2中的变化曲线可以看出，随着稀疏解非零元个数的不断增加，SRK算法的收敛曲线不断向RaSK算法的收敛曲线靠拢，这是因为SRK算法在对应零元位置上乘以权重，加速减小零元位置上的元素，因此在零元较多的情况下，SRK算法的收敛速度更快。但是，由于SRK算法的计算过程较为复杂，因此在计算时间上一开始低于RaSK算法，后来在迭代步数不明显占优的情况下，计算时间要多于RaSK算法。SGRK算法在2种算法的基础之上，每次以贪婪的概率准则随机选取行指标进行迭代，因此SGRK算法的计算时间和迭代步数都要优于其他2种算法。

例2 选取了矩阵市场中的一些矩阵进行数值实验。为了得到超定的系数矩阵，将所有的欠定矩阵取转置之后再做数值实验，取稀疏度估计为 $\hat{k}$ = 2k，稀疏度k=0.2 n。表3列出的是测试矩阵的相关信息。

表3 矩阵信息

Tab. 3 Matrix information for Example 2

矩阵名称

阶数

稠密度/%

秩

条件数

WorldCities

315 \times 100

23.87

100

66.00

bibd_13_6

78×1 716

19.23

6.27

Crew1

Trec8

135 × 6 469

$23 \times 84$

5.38

28.42

135

18.2

26.89

对于测试的矩阵，表4给出了SGRK算法、RaSK算法和SRK算法的迭代步数和运行时间。

表4 SGRK、RaSK 和 SRK 的迭代步数和计算时间

Tab. 4 Iteration steps and computation time of SGRK, RaSK and SRK

矩阵名称	SGRK		RaSK		SRK
矩阵名称	迭代步数	计算时间	迭代步数	计算时间	迭代步数	计算时间
bibd_13_6	134.40	0.015 0	1 681.80	0.078 9	753.15	0.039 4
Trec8	53.85	0.002 4	10 697.00	0.217 8	580.80	0.015 1
crew1	433.35	0.118 0	13 222.00	1.468 4	6 050.30	0.747 1
WorldCities	482.30	0.032 1	19 706.00	0.654 5	2 909.10	0.116 6

图3对应于表4，给出了3种算法近似解的相对误差随着迭代步数的变化曲线。通过对比可以发现，在无噪声干扰的情况下，SGRK算法的迭代步数和CPU运行时间都优于原来的RaSK算法和SRK 算法。

图3 SGRK、RaSK 和 SRK 算法在稀疏度 k = 0.2 n时的收敛曲线

Fig. 3 Convergence curves of SGRK, RaSK and SRK methods convergence curve for Examples 2 at a sparsity k = 0.2 n

图4和图5描述SGRK算法、SRK算法和RaSK算法在有噪声干扰的系统中的一些数值实验结果。用Matlab软件中的randn随机生成高斯矩阵和范数为0.02的独立高斯噪声进行数值实验。

图4 SGRK、RaSK 和 SRK 算法在稀疏度k = 0.2 n时误差阈值和实际误差比较

Fig. 4 Comparison of error threshold and actual error of SGRK, RaSK and SRK methods at a sparsity k = 0.2 n

图5 SGRK、RaSK 和 SRK 算法在稀疏度k = 0.6 n时误差阈值和实际误差比较

Fig. 5 Comparison of error threshold and actual error of SGRK, RaSK and SRK methods at a sparsity k = 0.6 n

图4和图5中水平的实线是SGRK算法的相对误差阈值，水平的虚线是RaSK算法的相对误差阈值，图4是在有噪声干扰的情况下，解的稀疏度为0.2时3种算法的近似解的相对误差随迭代步数的变化曲线。其中图4a描述系数矩阵A的维数为1 000 × 150时的收敛情况，图4b描述的是系数矩阵A的维数为4 000×300时的收敛情况。

图5是在有噪声干扰的情况下，解的稀疏度为0.6时3种算法的近似解的相对误差随迭代步数的变化曲线。其中图5a和图5b分别画出的是系数矩阵A的维数为1 000 × 150和4 000×300时3种算法的收敛曲线。

由图4和图5可以看出，在有噪声干扰的情况下，SGRK算法优于其他2种算法最先达到稳定阈值。另外，在图4和图5中分别用水平的实线和虚线画出了SGRK算法的相对误差阈值和RaSK算法的相对误差阈值，通过数值实验表明，由定理2中 SGRK算法推导出来的阈值更接近实际情况。

4 结论

在随机稀疏Kaczmarz算法和稀疏随机Kaczmarz算法的基础上，受贪婪算法的启发，提出稀疏贪婪随机Kaczmarz算法，给出了新算法的收敛性分析，且在有噪声干扰和无噪声干扰的情况下，通过理论证明了新算法的收缩因子小于随机稀疏Kaczmarz算法的收缩因子。数值实验表明所提出的新算法在迭代步数和计算时间上均优于传统的随机稀疏Kaczmarz算法。

作者贡献声明

王泽：算法设计者和算法研究的执行人，构造新的算法，给出收敛性证明，完成数值实验和数据分析、论文初稿的写作。

殷俊锋：研究的构思者及负责人，指导实验设计，数据分析，论文写作与修改。

参考文献

TSAIG Y， DONOHO D L. Extensions of compressed sensing ［J］. Signal Processing， 2005， 86（3）：549. [百度学术]

CANDES E， ROMBERG J， TAO T. Stable signal recovery from incomplete and inaccurate measurements ［J］. Communications on Pure and Applied Mathematics， 2006， 59（8）：1207. [百度学术]

ELAD M. Sparse and redundant representations： From theory to applications in signal and image processing ［M］. Berlin： Springer， 2010. [百度学术]

BYRD R H， CHIN G M， WU Y， et al. Sample size selection in optimization models for machine learning ［J］. Mathmatical Programming， 2012， 134（1）：127. [百度学术]

CHEN S S， DONOHO D L， SAUNDERS M A. Atomic decomposition by basis pursuit ［J］. SIAM Review， 2001， 43（1）： 129. [百度学术]

YIN W， OSHER S， GOLDFARB D， et al. Bregman iterative algorithms for $l_{1}$ -minimization with applications to compressed sensing ［J］. SIAM Journal on Imaging Sciences， 2008， 1（1）： 143. [百度学术]

SCHÖPFER F. Linear convergence of descent methods for the unconstrained minimization of restricted strongly convex functions ［J］. SIAM Journal on Optimization， 2016， 26（3）： 1883. [百度学术]

STROHMER T， VERSHYNIN R. A randomized Kaczmarz algorithm with exponential convergence ［J］. Journal of Fourier Analysis and Applications， 2009， 15（2）： 262. [百度学术]

NEEDELL D， TROPP J A. Paved with good intensions： Analysis of a randomized block Kaczmarz method ［J］. Linear Algebra and its Applications， 2014， 441（1）： 199. [百度学术]

AGASKAR A， WANG C， LU Y M. Randomized Kaczmarz algorithms： Exact MSE analysis and optimal sampling probabilities ［C］// 2014 IEEE Global Conference on Signal and Information Processing （Global SIP）. ［s.l.］： IEEE， 2015： 389-393. [百度学术]

LIU J， WRIGHT S. An accelerated randomized Kaczmarz algorithm ［J］. Mathematics of Computation， 2016， 85（297）： 153. [百度学术]

LORENZ D A， SCHÖPFER F， WENGER S. A sparse Kaczmarz solver and a linearized Bregman method for online compressed sensing ［C］//2014 IEEE International Conference on Image Processing （ICIP）. ［s.l.］：IEEE，2015：1347-1351. [百度学术]

LORENZ D A， SCHÖPFER F， WENGER S. The linearized Bregman method via split feasibility problems： Analysis and generalizations ［J］. SIAM Journal on Imaging Sciences， 2014， 7（2）：1237. [百度学术]

ZOUZIAS A， FRERIS N M. Randomized extended Kaczmarz for solving least squares［J］. SIAM Journal on Matrix Analysis and Applications， 2013， 34（2）： 773. [百度学术]

NEEDELL D. Randomized Kaczmarz solver for noisy linear system ［J］. BIT Numerical Mathematics， 2010， 50（2）： 395. [百度学术]

SCHÖPFER F， LORENZ D A. Linear convergence of the randomized sparse Kaczmarz method ［J］. Mathematical Programming， 2019， 173（1/2）： 509. [百度学术]

BAI Z Z， WU W T. On greedy randomized Kaczmarz method for solving large sparse linear systems ［J］. SIAM Journal on Scientific Computing， 2018， 40： A592. [百度学术]

BAI Z Z， WU W T. On relaxed greedy randomized Kaczmarz methods for solving large sparse linear systems ［J］. Applied Mathematics Letters， 2018， 83： 21. [百度学术]

杜亦疏，殷俊锋，张科. 求解大型稀疏线性方程组的贪婪距离随机Kaczmarz算法［J］. 同济大学学报（自然科学版），2020，48（8）： 1224. DOI： 10.11908/j. issn. 0253-374x. 20041. [百度学术]

DU Yishu， YIN Junfeng， ZHANG Ke. Greedy randomized-distance Kaczmarz method for solving large sparse linear systems ［J］. Journal of Tongji University （Natural Science）， 2020，48（8）： 1224. DOI： 10.11908/j. issn. 0253-374x. 20041. [百度学术]

荆燕飞，李彩霞，胡少亮. 求解大型稀疏线性系统的贪婪双子空间随机Kaczmarz方法［J］. 同济大学学报（自然科学版），2021， 49（10）： 1473. DOI： 10.11908/j. issn. 0253-374x. 21054. [百度学术]

JING Yanfei， LI Caixia， HU Shaoliang. A greedy two-subspace randomized Kaczmarz method for solving large sparse linear systems ［J］. Journal of Tongji University （Natural Science）， 2021， 49（10）： 1473. DOI： 10.11908/j. issn. 0253-374x. 21054. [百度学术]

MANSOUR H， YILMAZ O. A fast randomized Kaczmarz algorithm for sparse solutions of consistent linear system ［J］. arXiv， 2013， 1305.3803v1. [百度学术]

ROCKAFELLAR R T， WETS R， et al. Variational analysis ［M］. Berlin： Springer，2009. [百度学术]