来源:https://www.cnblogs.com/zhoukui/p/7746371.html
预备知识
平面旋转与 Householder 矩阵是特殊的酉矩阵,它们在建立某些基本的矩阵分解过程中起着重要的作用。
平面旋转
设 1⩽i<j⩽n1⩽i
为平面旋转或者 Givens 旋转.
容易验证对任何一对指数 i,j,(1⩽i<j⩽n)i,j,(1⩽i
Householder 矩阵
它有几个很好的性质:
由于 U∗ω=I−2(ω∗ω)−1(ωω∗)∗=I−2(ω∗ω)−1ωω∗=UωUω∗=I−2(ω∗ω)−1(ωω∗)∗=I−2(ω∗ω)−1ωω∗=Uω, 所以 UωUω 是 Hermite 矩阵. 又由于 Uω⋅Uω=IUω⋅Uω=I ,所以 UωUω 是酉矩阵且 U−1ω=UωUω−1=Uω.
Householder 矩阵 UωUω 在子空间 ω⊥ω⊥ 上的作用是恒等元,即如果 x∈ω⊥x∈ω⊥, 就有 Uωx=xUωx=x.
Householder 矩阵 UωUω 在子空间 span(ω)span(ω) 上的作用是反射,即 Uω⋅ω=−ωUω⋅ω=−ω.
detUω=−1detUω=−1. 由秩一扰动的行列式公式知 detUω=1−2(ω∗ω)−1ω∗I⋅ω=−1detUω=1−2(ω∗ω)−1ω∗I⋅ω=−1. 由 Brauer 定理知,它的特征值是 −1,1,1⋯−1,1,1⋯. 于是,对所有 nn 以及每个非零的 ω∈Rnω∈Rn, Householder 矩阵 Uω∈Mn(R)Uω∈Mn(R) 是实正交矩阵,但不是真旋转矩阵(真旋转矩阵是行列式为 +1+1 的实正交矩阵)
设 n⩾2n⩾2, 并设 x,y∈Rnx,y∈Rn 是单位向量. 如果 x=yx=y, 令 ωω 是任意一个与 xx 正交的实单位向量. 如果 x≠yx≠y, 令 ω=x−yω=x−y. 此时有 ω∗ω=2(1−x∗y),ω∗x=1−x∗yω∗ω=2(1−x∗y),ω∗x=1−x∗y, 所以 Uωx=yUωx=y. 事实上,任意的 x∈Rnx∈Rn 可以由实的 Householder 矩阵变换成任何一个满足 ∥x∥2=∥y∥2‖x‖2=‖y‖2 的向量 y∈Rny∈Rn. 但是在 CnCn 中不一样,不存在 ω∈Cnω∈Cn 使得 Uωe1=ie1Uωe1=ie1.
Householder 矩阵以及纯量酉矩阵可以用来构造一个酉矩阵,它将 CnCn 中任意给定的向量变换成 CnCn 中有同样 Euclid 范数的另外任意一个向量。
证明: (A 是本性 Hermite 的是指存在 θ∈Rθ∈R 使 eiθAeiθA 是 Hermite 的).
如果 xx 与 yy 线性相关的(也就是说,如果对某个实的 θθ 有 y=eiθxy=eiθx), 这些结论容易验证. 如果 xx 与 yy 线性无关,由 Cauchy-Schwartz 不等式确保有 x∗x≠|x∗y|x∗x≠|x∗y|. 计算
ω∗ω=(eiϕx−y)∗(eiϕx−y)=x∗x−e−iϕx∗y−eiϕy∗x+y∗y=2(x∗x−Re(e−iϕx∗y))=2(x∗x−|x∗y|)ω∗ω=(eiϕx−y)∗(eiϕx−y)=x∗x−e−iϕx∗y−eiϕy∗x+y∗y=2(x∗x−Re(e−iϕx∗y))=2(x∗x−|x∗y|)
和
ω∗x=e−iϕx∗x−y∗x=e−iϕx∗x−e−iϕ|y∗x|=e−iϕ(x∗x−|x∗y|))ω∗x=e−iϕx∗x−y∗x=e−iϕx∗x−e−iϕ|y∗x|=e−iϕ(x∗x−|x∗y|))
最后计算
eiϕUωx=eiϕ(x−2(ω∗ω)−1ωω∗x)=eiϕ(x−(eiϕx−y)e−iϕ)=yeiϕUωx=eiϕ(x−2(ω∗ω)−1ωω∗x)=eiϕ(x−(eiϕx−y)e−iϕ)=y
如果 zz 与 xx 正交,那么 ω∗z=−y∗zω∗z=−y∗z, 且
y∗U(y,x)z=eiϕ(y∗z−1∥x∥22−|x∗y|)(eiϕy∗x−∥y∥22)(−y∗x))=eiϕ(y∗z+(−y∗x))=0y∗U(y,x)z=eiϕ(y∗z−1‖x‖22−|x∗y|)(eiϕy∗x−‖y‖22)(−y∗x))=eiϕ(y∗z+(−y∗x))=0
说明了变换不仅保证了范数不变,还保持了正交不变性. 由于 UωUω 是酉矩阵,且是 Hermite 矩阵,故而 U(y,x)=(eiϕI)UωU(y,x)=(eiϕI)Uω 是酉矩阵(它是两个酉矩阵的乘积),且是 Hermite 的.
如果 y∈Cny∈Cn 是已知的单位向量,按上述方法构造的 U(y,e1)U(y,e1) 的第一列肯定是 yy, 由于 U(y,e1)⋅e1=yU(y,e1)⋅e1=y.
QR 分解
复矩阵或者实矩阵的 QR 分解在理论上与计算上都有相当的重要性.
证明: 设 a1∈Cna1∈Cn 是 AA 的第一列,r1=∥a1∥2r1=‖a1‖2, 又设 U1U1 是一个酉矩阵,它使得 U1a1=r1e1U1a1=r1e1, 上个定理 (1.1) 对这样的矩阵给出了一个明显的构造,它或者是一个纯量的酉矩阵,或者是一个纯量的酉矩阵与一个 Householder 矩阵的乘积. 分划
U1A=[r10★A2]U1A=[r1★0A2]
其中 A2∈Mn−1,m−1A2∈Mn−1,m−1. 设 a2∈Cn−1a2∈Cn−1 是 A2A2 的第一列,并令 r2=∥a2∥2r2=‖a2‖2. 再次利用定理 (1.1) 来构造一个酉矩阵 V2∈Mn−1V2∈Mn−1, 使得 V2a2=r2e1V2a2=r2e1, 再令 U2=I1⊕V2U2=I1⊕V2. 那么
U2U1A=⎡⎣⎢r100r20★A3⎤⎦⎥U2U1A=[r1★0r200A3]
重复这一结构 mm 次就得到
UmUm−1⋯U2U1A=[R0]UmUm−1⋯U2U1A=[R0]
其中 R∈MmR∈Mm 是上三角的,其主对角元素是 r1,⋯,rmr1,⋯,rm, 它们全都是非负的. 设 U=UmUm−1⋯U2U1U=UmUm−1⋯U2U1. 分划 U∗=U∗1U∗2⋯U∗m−1U∗m=[QQ2]U∗=U1∗U2∗⋯Um−1∗Um∗=[QQ2], 其中 Q∈Mn,mQ∈Mn,m 的列是标准正交的(它包含了一个酉矩阵的前 mm 个列). 这样就有 A=QRA=QR. 如所希望的那样. 如果 AA 是列满秩的,则 RR 是非奇异的,所以它的主对角线元素全是正的.
假设 rankA=mrankA=m, 且 A=QR=Q~R~A=QR=Q~R~, 其中 RR 与 R~R~ 是上三角的且有正的主对角元素,而 QQ 与 Q~Q~ 都标准正交的列向量. 那么 A∗A=R∗(Q∗Q)R)=R∗IR=R∗RA∗A=R∗(Q∗Q)R)=R∗IR=R∗R, 且还有 A∗A=R~∗R~A∗A=R~∗R~, 所以 R∗R=R~∗R~R∗R=R~∗R~ 且 R~−∗R∗=R~R−1R~−∗R∗=R~R−1. 也就是说下三角阵等于一个上三角矩阵,所以它们两者必定都是对角矩阵:R~R−1=DR~R−1=D 是对角的,且它必定有正的主对角元素,这是因为 R~R~ 与 R−1R−1 这两者的主对角元素都是正的. 但是 R~=DRR~=DR 蕴含 D=R~R−1=R~−∗R∗=(DR)−∗R∗=D−1R−∗R∗=D−1D=R~R−1=R~−∗R∗=(DR)−∗R∗=D−1R−∗R∗=D−1, 所以 D2=ID2=I, 从而 D=ID=I. 所以有 R~=RR~=R 以及 Q~=QQ~=Q.
(c) 中的结论由列向量标准正交的方阵是酉矩阵这一事实推出.
如果 (d) 中有 n⩾mn⩾m, 我们可以从 (a) 中的分解开始,设 Q~=[QQ2]∈MnQ~=[QQ2]∈Mn 是酉矩阵,令 R~=[R0]∈Mn,mR~=[R0]∈Mn,m, 并注意到 A=QR=Q~R~A=QR=Q~R~. 如果 n<mn
最后的结论 (e) 从定理 (1.1) 中的如下结论推出:(a) 与 (d) 的结构中所包含的酉矩阵 UiUi 可以全部取为实矩阵.
任何形如 B=A∗AB=A∗A 的 B∈Mn(A∈Mn)B∈Mn(A∈Mn) 可以写成 B=LL∗B=LL∗, 其中 L∈MnL∈Mn 是下三角矩阵,且有非负的对角元素. 如果 AA 是非奇异的,这个分解是唯一的. 其实这是 BB 的 Cholesky 分解,每一个正定的或半正定的矩阵都可以用这种方式进行分解.
A∈Mn,mA∈Mn,m 的 QR 分解得到的变量有时很有用. 假设 n⩽mn⩽m, 并令 A∗=QRA∗=QR, 其中 Q∈Mn,mQ∈Mn,m 有标准正交的列,而 R∈MmR∈Mm 是上三角的. 这样,A=R∗Q∗A=R∗Q∗ 就是形如
A=LQ(1)(1)A=LQ
的一个分解,其中 Q∈Mn,mQ∈Mn,m 有标准正交的行,且 L∈MnL∈Mn 是下三角的. 如果 Q~=[QQ~2]Q~=[QQ~2] 是酉矩阵,我们就有形如
A=[L0]Q~(2)(2)A=[L0]Q~
的分解.
我们举个例子,对矩阵 A=⎡⎣⎢1221−1−41−15⎤⎦⎥A=[1112−1−12−45] 进行 QR 分解. 按照上述证明过程,先拿出矩阵 AA 的第一列 a1=[1,2,3]Ta1=[1,2,3]T,求出 ∥a1∥2=3‖a1‖2=3,现在要求一个酉矩阵 U1U1 使得 U1a1=3e1U1a1=3e1. 按照定理 1 计算 a∗1⋅3e1=3a1∗⋅3e1=3 是正号,所以 w=a1−3e1=[−2,2,2]Tw=a1−3e1=[−2,2,2]T. 归一化得 w=[−1/3–√,1/3–√,1/3–√]Tw=[−1/3,1/3,1/3]T, 计算酉矩阵 U1=I−2ww∗=13⎡⎣⎢12221−22−21⎤⎦⎥U1=I−2ww∗=13[12221−22−21], 计算 U1A=⎡⎣⎢300−330−3−33⎤⎦⎥=RU1A=[3−3−303−3003]=R. 我们运气比较好,直接变成上三角了,否则重复上述步骤,此时就完成了 QR 分解,由于是实数域,故 U−11=UT1U1−1=U1T, 所以 A=UT1RA=U1TR.
一个重要的几何事实是:任何两个有相同个数的标准正交向量组都通过酉变换联系在一起.
证明: 将标准正交向量 [x1⋯xk][x1⋯xk] 与 Y=[y1⋯yk]Y=[y1⋯yk] 中的每一个都通过 Gram-Schmidt 扩充为 CnCn 的一组标准正交基,也就是构造酉矩阵 V=[XX2]V=[XX2] 以及 W=[YY2]∈MnW=[YY2]∈Mn. 那么 U=WV∗U=WV∗ 是酉矩阵,且 [YY2]=W=UV=[UXUX2][YY2]=W=UV=[UXUX2], 所以 Y=UXY=UX. 如果 XX 与 YY 是实的,则矩阵 [XX2][XX2] 与 [YY2][YY2] 可以选为实的正交矩阵(它们的列是 RnRn 的标准正交基).
读完应该知道什么
平面旋转与 Householder 矩阵是特殊的酉矩阵
Householder 矩阵的特征值是 −1,1,1⋯−1,1,1⋯, 所以其行列式为 -1
Householder 矩阵以及纯量酉矩阵可以用来构造一个酉矩阵,它将 CnCn 中任意给定的向量变换成 CnCn 中有同样 Euclid 范数的另外任意一个向量。
QR 分解
分类: 矩阵分析