过度矩阵
$(a_1,a_2,…,a_n)A=(b_1,b_2,…,b_n)$
则称矩阵$A$为$(a_1,a_2,…,a_n)$到$(b_1,b_2,…,b_n)$的过度矩阵。
$A = (a_1,a_2,…,a_n)^{-1}(b_1,b_2,…,b_n)$
向量在基变换下的坐标变化
$\alpha_1,\alpha_2,…,\alpha_n$ 以及 $\beta_1,\beta_2,…,\beta_n$是$V$中的两个基,$\alpha$在上述两个基下的表示分别为:
$\alpha = (\alpha_1,\alpha_2,…,\alpha_n) \begin{bmatrix}
k_1\\k_2\\ … \\k_n
\end{bmatrix} \quad \alpha = (\beta_1,\beta_2,…,\beta_n) \begin{bmatrix}
l_1\\l_2\\ … \\l_n
\end{bmatrix}$
则有:
$\begin{bmatrix}
l_1\\l_2\\ … \\l_n
\end{bmatrix} = A^{-1}\begin{bmatrix}
k_1\\k_2\\ … \\k_n
\end{bmatrix}$
$A$表示$(a_1,a_2,…,a_n)$到$(b_1,b_2,…,b_n)$的过度矩阵。
线性变换在不同基下的表示
$V$是数域$P$上的一个$n$维线性空间,$\alpha_1,\alpha_2,…,\alpha_n$ 以及 $\beta_1,\beta_2,…,\beta_n$是$V$中的两个基,从前一个基到后一个基的过度矩阵为$C$.又设$T$是$V$的一个线性变换,它在前后两个基下的矩阵表示分别是$A,B$,则有$B=C^{-1}AC$
*线性空间和维数
设$V_1,V_2$是线性空间$V$的两个子空间。
$V_1 \cap V_2 = \{ a|a\in V_1 \quad and \quad a\in V_2\}$ 交空间
$V_1+V_2 = \{a=a_1+a_2| a_1\in V_1 \quad and \quad a_2\in V_2\}$ 和子空间
和空间的基和维度:
$V_1 = span\{\alpha_1,\alpha_2,…,\alpha_s\}$
$V_2 = span\{\beta_1,\beta_2,…,\beta_k\}$
$V_1 + V_2 = span\{\alpha_1,\alpha_2,…,\alpha_s,\beta_1,\beta_2,…,\beta_k\}$
求$V_1+V_2$的线性无关组就行了。
交空间的基和维数:
$\xi = k_1\alpha_1+k_1\alpha_2+…+k_s\alpha_x = l_1\beta_1+l_2\beta_2+…+l_k\beta_k$
$k_1\alpha_1+k_1\alpha_2+…+k_s\alpha_x - l_1\beta_1-l_2\beta_2-…-l_k\beta_k = 0$
求出$k_i,l_i$
$dim(V_1+V_2) = dim(V_1)+dim(V_2)-dim(V_1 \cap V_2)$
*最小二乘法
待求解方程组
$AX=B$
左乘$A^T$
$A^TAX=A^TB$
$X = (A^TA)^{-1}A^TB$
$X$不唯一,$AX$唯一。
*正规矩阵
设$A \in R^{n\times n}$ 若$A^HA=AA^H$,则称$A$为正规矩阵。
*向量范数
$||\overset{\rightarrow}{v}||_p = (|v_1|^p+|v_2|^p+…+|v_n|^p)^{\frac{1}{p}}$
零范数:
$||\overset{\rightarrow}{v}||_0$=非零元素个数
1范数:
$||\overset{\rightarrow}{v}||_1 = |v_1|+|v_2|+…+|v_n|$
2范数:
$||\overset{\rightarrow}{v}||_2 = (v_1^2+v_2^2+…+v_n^2)^{\frac{1}{2}}$
无穷范数:
$||\overset{\rightarrow}{v}||_{\infty} = max|v_i|$
*矩阵范数
$||A||_1$:最大列和范数,所有矩阵列向量计算模长和,取最大值。
$||A||_{\infty}$:最大行和范数,所有矩阵行向量计算模长和,取最大值。
$||A||_2 = \sqrt{max \lambda(A^HA)}$: $A^HA$的最大特征值开平方。
$||A||_F$: 元素模长的平方和再开平方。
*奇异值
$A$的最小奇异值。
$B=A^HA \quad or \quad AA^H$
$B$的特征值为$d_1^2,d_2^2,…,d_r^2$
其中$d_1 \geq d_2 \geq … \geq d_r >0$ 为$A$的奇异值。
$d_r$为$A$的最小奇异值。
*最小多项式
写出初级因子后,比如$(\lambda-a_i)^{b_i}$,将每个$a_i$对于$b_i$最大的项乘起来,就是最小多项式。
$A = \begin{bmatrix}
2\\
1&2\\
&&2\\
&&&2\\
&&&&3\\
&&&&1&3\\
&&&&&1&3\\
&&&&&&&3\\
&&&&&&&1&3\\
\end{bmatrix}$
初级因子有$(\lambda-2)^2,(\lambda-2),(\lambda-2),(\lambda-3)^3,(\lambda-3)^2$
所以$m(\lambda) = d_n(\lambda) = (\lambda-2)^2(\lambda-3)^3$
$d_{n-1}(\lambda) = (\lambda-2)(\lambda-3)^2$
$d_{n-2}(\lambda) = (\lambda-2)$
*矩阵函数$f(A),f(At)$
- 先求的矩阵的最小多项式。 例如:$(\lambda-1)(\lambda-2)^2$
- 根据最小多项式中$\lambda$的阶数$r$,假设$e^A = a_0E+a_1A+a_2A^2+…+a_{r-1}A^{r-1}$。 例如$e^A = a_0E+a_1A+a_2A^2$
- 将最小多项式中的$\lambda$带入式子中,对于阶数大于1的 对式子求导后在代入。
例如:
$e^A = a_0E+a_1A+a_2A^2|_{A=2} \rightarrow e^2 = a_0+a_12+a_24$
$e^A = a_0E+a_1A+a_2A^2|_{A=1} \rightarrow e^1 = a_0+a_11+a_21$
$(e^A = a_0E+a_1A+a_2A^2)’|_{A=1} \rightarrow e=a_1+2a_2A|_{A=1} \rightarrow e=a_1+a_22$
- 解出$a_i$。
- 带入$e^A = a_0E+a_1A+a_2A^2+…+a_{r-1}A^{r-1}$求出e^A。
*QR分解
$A \in C^{n \times n}$都能写成$A=QR$, $QQ^H=E_n$ $R$是上三角矩阵。
$A \in R^{n \times n}$都能写成$A=QR$, $QQ^T=E_n$ $R$是上三角矩阵。
求$Q$
- 对$A$进行斯密特正交化,
- 将正交化后的$\beta_i$中的零向量补齐为正交向量。
- 进行单位化
- $Q=(\beta_1,\beta_2,…,\beta_n)$
求$R$
$A=QR \qquad R=Q^{-1}A=Q^TA$
斯密特正交化
$\beta_1 = \alpha_1$
$\beta_2 = \alpha_2 - \frac{(\beta_1,\alpha_2)}{(\beta_1,\beta_1)} \beta_1$
$\beta_3 = \alpha_3 - \frac{(\beta_1,\alpha_3)}{(\beta_1,\beta_1)}\beta_1 - \frac{(\beta_2,\alpha_3)}{(\beta_2,\beta_2)}\beta_2$
约当标准型
$k$级行列式因子:
$A(\lambda)$中所有非零的$k$级子式的首项(最高次项)系数为1的最大公因式$D_k(\lambda)$称为$A(\lambda)$的一个$k$级行列式因子。
不变因子
$d_1(\lambda) = D_1(\lambda) \quad d_2(\lambda)=\frac{D_2(\lambda)}{D_1(\lambda)} \quad d_2(\lambda)=\frac{D_3(\lambda)}{D_3(\lambda)} \quad… \quad d_n(\lambda)=\frac{D_n(\lambda)}{D_{n-1}(\lambda)}$
称为$A(\lambda)$的不变因子。
初级因子
把每个次数大于零的不变因子分解为互不相同的一次因式的方幂的乘积,所有这些一次方幂(相同的必须安出现次数计算)称为$A(\lambda)$的初级因子。
约当块
设$A=(a_{ij})_{n \times n}$的全部初级因子为:
$(\lambda - \lambda_1)^{k_1} \quad (\lambda - \lambda_2)^{k_2} \quad … \quad (\lambda - \lambda_s)^{k_s}$
每个初级因子$(\lambda - \lambda_i)^{k_i}$构成一个$k_i$阶矩阵(约当块)
$J_i = \begin{bmatrix}
\lambda_i& & & \\1&\lambda_i \\ & … & … \\ & & 1& \lambda_i
\end{bmatrix} (i=1,2,…,s)$
约当标准型
将这些约当块构成分块对角矩阵
$J = \begin{bmatrix}
J_1\\
&J_2\\
&&…\\
&&& J_3
\end{bmatrix}$
称为$A$的约当标准型。
求约当标准型的简便方法
- 求出所有特征值$\lambda_i$
- $\lambda_i$的约当块的个数$=n-rank(\lambda_iE - A)$
题型1:求不变因子
- 使用初等变换将矩阵变为对角矩阵:适用于低阶数字矩阵。
- 更具定义求出行列式因子,进而求出不变因子:适用于n阶带有未知量的明显特征的矩阵。
斯密特标准型
将上面约当标准型中的不变因子$d_i(\lambda)$排列成对角矩阵就是smith标准型。
*圆盘定理
$z \in C$
$|z -a -bi| \leq 2$的圆盘为以$(a,b)$为圆心2为半径的圆。
$A\in C^{n \times n}$,$A$的特征值在下面圆盘内:
$|z-a_{ii}| \leq R_i = \sum\limits_{j=1,j\neq i}^{n}|a_{ij}|$
上面的$||$表示模长,不是绝对值。
*普半径
最大特征值的模厂
*广义逆矩阵$A^+$
$A\in C^{m \times n}$
$A^+ = \begin{cases}
A^H(AA^H)^{-1}& &当rank(A)=m\\\\
(A^HA)^{-1}A^H& &当rank(A)=n
\end{cases}$
当$A \neq 0$时,$A$可逆,则$A^H = A^{-1}$
当行列都不满秩的时候将$A$分解成为$LR$然后分别对矩阵$L,R$求$L^+,R^+$ 最终$A^+=L^+R^+$