笔记 - 对称双线性度量空间与线性方程组

发表于 2020-06-20 更新于 2024-07-02 分类于笔记，数学，高等代数本文字数： 9k 阅读时长 ≈ 33 分钟

线性函数，双线性函数，Euclidean 空间等

线性空间上的线性和双线性函数

顾名思义，线性函数就是具有线性的函数，双线性函数就是具有双重线性的函数

因为这两个概念有许多相通之处，故选用如下方式展示

基本定义

线性函数
双线性函数

定义线性函数

对映射 \(f:V\to\mathbb{P}\), 满足 \((\forall\alpha,\beta\in V,k,l\in\mathbb{P}),~f(k\alpha+l\beta)=kf(\alpha)+lf(\beta)\)

例如矩阵的迹 \(\operatorname{tr}A\)

定义双线性函数

对映射 \(f:V\times V\to\mathbb{P}\), 满足

\((\forall\alpha,\beta,\gamma\in V,k,l\in\mathbb{P}),~f(k\alpha+l\beta,\gamma)=kf(\alpha,\gamma)+lf(\beta,\gamma)\)

\((\forall\alpha,\beta,\gamma\in V,k,l\in\mathbb{P}),~f(\gamma,k\alpha+l\beta)=kf(\gamma,\alpha)+lf(\gamma,\beta)\)

定义表示向量

令 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 为 \(V\) 的一组基，称

\[ (f(\epsilon_1),f(\epsilon_2),...,f(\epsilon_n)) \]

为 \(f\) 在 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 下的表示向量

我们有如下定理

定理 - 1-1-1

\(\eta:L(V,\mathbb{P})\to\mathbb{P}^n;~f\mapsto(f(\epsilon_1),f(\epsilon_2),...,f(\epsilon_n))\) 为双射

即所有线性函数的集合 \(L(V,\mathbb{P})\) 与 \(\mathbb{P}^n\) 同构

\(\Box\)

定义表示矩阵 / 度量矩阵

令 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 为 \(V\) 的一组基，称

\[ (f(\epsilon_i,\epsilon_j))_{n\times n} \]

为 \(f\) 在 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 下的表示矩阵

我们有如下定理

定理 - 1-1-2

\(\zeta:BL(V,\mathbb{P})\to\mathbb{P}^{n\times n};~f\mapsto(f(\epsilon_i,\epsilon_j))_{n\times n}\) 为双射

即所有双线性函数的集合 \(BL(V,\mathbb{P})\) 与 \(\mathbb{P}^{n\times n}\) 同构

\(\Box\)

证明很简单，读者可尝试自行补充

我们发现
\(\forall\alpha=\displaystyle\sum_{i=1}^nx_i\epsilon_i=(\epsilon_0,\epsilon_1,\dots,\epsilon_n)X,\beta=\sum_{i=1}^ny_i\epsilon_i=(\epsilon_0,\epsilon_1,\dots,\epsilon_n)Y\in V\)
都有

\[ f(\alpha,\beta)=X^TAY \]

这样就将双线性函数的计算转换成了矩阵乘法，这个形式很重要

零元

类比线性空间中的零元，我们可定义零线性函数 / 零双线性函数

线性函数
双线性函数

定义零线性函数

对于线性函数 \(f\), 若 \((\forall\alpha\in V),~f(\alpha)=0\), 则称 \(f\) 为零线性函数 , 记作 \(\bold{0}\)

定义零双线性函数

对于双线性函数 \(f\), 若 \((\forall\alpha,\beta\in V),~f(\alpha,\beta)=0\), 则称 \(f\) 为零双线性函数 , 记作 \(\bold{0}\)

基底间的过渡

设 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 和 \((\eta_0,\eta_1,\dots,\eta_n)\) 是 \(V\) 的两组基底，过渡矩阵 \(T\) 使得

\[ (\eta_0,\eta_1,\dots,\eta_n)=(\epsilon_0,\epsilon_1,\dots,\epsilon_n)T \]

线性函数
双线性函数

若线性函数 \(f\) 在 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 和 \((\eta_0,\eta_1,\dots,\eta_n)\) 下的表示向量分别为 \((a_1,a_2,\dots,a_n)\) 和 \((b_1,b_2,\dots,b_n)\), 则

\[ (b_1,b_2,\dots,b_n)=(a_1,a_2,\dots,a_n)T \]

因此 \(T\) 非奇异

若双线性函数 \(f\) 在 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 和 \((\eta_0,\eta_1,\dots,\eta_n)\) 下的表示矩阵分别为 \(A\) 和 \(B\), 则

\[ B=T^TAT \]

因此 \(T\) 非奇异，称 \(\operatorname{rk}A\) 为 \(f\) 的秩

接下来我们定义一些特殊的双线性函数，我们可以从这些函数具有的性质中感受到其与矩阵的密切关系

非奇异双线性函数

定义非奇异双线性函数

称 \(f\) 是非奇异的 , 若

\[ (\forall\alpha\in V/\{\theta\},~\exists\beta\in V),~f(\alpha,\beta)\ne0 \]

定理 - 1-2

下列命题等价

\(f\) 是非奇异的
\(f\) 在 \(V\) 任意基底下的度量矩阵是非奇异的
\(f\) 在 \(V\) 某一基底下的度量矩阵是非奇异的
\((\forall\alpha\in V/\{\theta\},~\exists\beta\in V),~f(\beta,\alpha)\ne0\) (对称性)

\[ \begin{aligned} (\forall\alpha\in V,~\forall\beta\in V,~f(\alpha,\beta)=0\implies\alpha=0)&\iff(\forall X\in\mathbb{P}^n,~\forall Y\in\mathbb{P}^n,~X^TAY=0\implies X=0)\\ &\iff(\forall X\in\mathbb{P}^n,~X^TA=0\implies X=0) \end{aligned} \]

\(2\iff3:\) 显然

\(2\iff4:\) 参照 \(1\iff2\)

\(\Box\)

对称双线性函数

定义对称双线性函数

称 \(f\) 是对称的 , 若

\[ (\forall\alpha,\beta\in V),~f(\alpha,\beta)=f(\beta,\alpha) \]

定理 - 1-3

下列命题等价

\(f\) 是对称的
\(f\) 在 \(V\) 任意基底下的度量矩阵是对称的
\(f\) 在 \(V\) 某一基底下的度量矩阵是对称的

证明参照定理 - 1-2

\(\Box\)

斜对称双线性函数

定义斜对称双线性函数

称 \(f\) 是斜对称的 , 若

\[ (\forall\alpha,\beta\in V),~f(\alpha,\beta)=-f(\beta,\alpha) \]

正定双线性函数

定义正定双线性函数

称 \(f\) 是正定的 , 若

\[ (\forall\alpha\in V/\{\theta\}),~f(\alpha,\alpha)>0 \]

我们将在 Euclidean 空间见到它

它有类似定理 - 1-2, 定理 - 1-3 的定理 (定理 - 3-4)

正交与正交基

定义正交

对双线性函数 \(f\), 称 \(\alpha,\beta\in V\) 正交 , 若 \(f(\alpha,\beta)=0\)

定义正交基底

一组基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 称作正交基底 , 若 \((\forall 1\leqslant i,j\leqslant n,i\ne j), f(\epsilon_i,\epsilon_j)=0\)

定理 - 1-4

对任意线性空间 \(V\) 和其上的对称双线性函数 \(f\), 正交基底总是存在
进而 \(f\) 在该基底下的度量矩阵为对角矩阵，对角线上的非零元素个数为 \(f\) 的秩

证明

若 \(f\) 是零函数，则 \(V\) 上任意基底均为所求
若 \(f\) 是非零函数，即

\[ (\exists\alpha,\beta\in V),~f(\alpha,\beta)\ne0 \]

由
\(f(\alpha,\beta)=\displaystyle\frac{1}{2}\left(f(\alpha+\beta,\alpha+\beta)-f(\alpha,\alpha)-f(\beta,\beta)\right)\) (这里利用了 \(f\) 的对称性)
可知

\[ (\exists\epsilon\in V),~f(\epsilon,\epsilon)\ne0\tag{1.4.1} \]

接下来对 \(\dim V\) 应用第二数学归纳法
- 当 \(\dim V=1\) 时，任意基底均为所求
- 若对 \(1\leqslant\dim V\leqslant n-1\) 的情况命题都成立，考察 \(\dim V=n\) 的情形
  
  对 \((1.4.1)\) 中的 \(\epsilon\), 将其扩充为 \(V\) 的一组基底 \((\epsilon,\eta_{2},...,\eta_{n})\)
  
  令 \(\epsilon_i'=\displaystyle \eta_i-\frac{f(\eta_i,\epsilon)}{f(\epsilon,\epsilon)}\epsilon,\qquad i=2,3,...,n\)
  
  则 \((\epsilon,\epsilon'_{2},...,\epsilon'_{n})\) 为 \(V\) 的基底，且
  \(f(\epsilon,\epsilon_i')=0,\qquad i=2,3,...,n\)
  
  因此
  
  \[ (\forall\alpha\in G[\epsilon'_{2},...,\epsilon'_{n}]),~f(\epsilon,\alpha)=0\tag{1.4.2} \]
  
  又显然 \(V=G[\epsilon]\oplus G[\epsilon'_{2},...,\epsilon'_{n}]\)
  
  考虑 \(f|_{G[\epsilon'_{2},...,\epsilon'_{n}]}\), 由归纳假设，\(G[\epsilon'_{2},...,\epsilon'_{n}]\) 中有正交基底 \((\epsilon_{2},...,\epsilon_{n})\)
  
  故由 \((1.4.2)\) 式可得 \((\epsilon,\epsilon_{2},...,\epsilon_{n})\) 为 \(V\) 的一组正交基底

\(\Box\)

推论 - 1-4-1

令 \(V\) 为 \(\mathbb{C}\) 上一 \(n\) 维线性空间，\(f\) 为 \(V\) 上一对称双线性函数，则存在正交基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 使得对 \(V\) 上的任意向量 \(\alpha=\sum_{i=1}^nx_i\epsilon_i,\beta=\sum_{i=1}^ny_i\epsilon_i\) 均有

\[ f(\alpha,\beta)=\sum_{i=1}^rx_iy_i \]

其中 \(r=\operatorname{rk}f\)
若 \(V\) 为 \(\mathbb{R}\) 上一 \(n\) 维线性空间，其余同上，则

\[ f(\alpha,\beta)=\sum_{i=1}^px_iy_i-\sum_{i=p+1}^rx_iy_i \]

另一种写法:

对于前者，\(f\) 的度量矩阵为 \(\operatorname{diag}\{\underbrace{1,...,1}_{\operatorname{rk}f},0,...,0\}\)
对于后者，\(f\) 的度量矩阵为 \(\operatorname{diag}\{\underbrace{1,...,1}_{p},\underbrace{-1,...,-1}_{\operatorname{rk}f-p},0,...,0\}\)

证明

若 \(V\) 为 \(\mathbb{R}\) 上一 \(n\) 维线性空间，则由定理 - 1-4 可知，
存在正交基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\), 使得 \(f\) 的度量矩阵为 \(\operatorname{diag}\{d_1,d_2,\dots,d_p,-d_{p+1},-d_{p+2},...,-d_{r},0,...,0\}\), 其中 \(d_1,d_2,\dots,d_r>0,~0\leqslant p\leqslant r\leqslant n\)

考虑 \(f(\epsilon_i,\epsilon_i)=(-1)^{[i>p]}d_i,~1\leqslant i\leqslant r\)

令 \(\displaystyle\epsilon'_i={\epsilon_i\over\sqrt{d_i}}\), 则 \(f(\epsilon'_i,\epsilon'_i)=(-1)^{[i>p]}\)

容易验证 \((\epsilon'_0,\epsilon'_1,\dots,\epsilon'_r,\epsilon_{r+1},\epsilon_{r+2},...,\epsilon_{n})\) 为正交基底

故在正交基底 \((\epsilon'_0,\epsilon'_1,\dots,\epsilon'_r,\epsilon_{r+1},\epsilon_{r+2},...,\epsilon_{n})\) 下，\(f\) 的度量矩阵为 \(\operatorname{diag}\{\underbrace{1,...,1}_{p},\underbrace{-1,...,-1}_{\operatorname{rk}f-p},0,...,0\}\)

我们可以注意到负号产生的原因是 \(\sqrt{\phantom{-}}\) 要求被开方数非负，而在 \(\mathbb{C}\) 上没有这个限制，故在 \(\mathbb{C}\) 上即为 \(\operatorname{diag}\{\underbrace{1,...,1}_{\operatorname{rk}f},0,...,0\}\)

\(\Box\)

在后面还有进一步的讨论

习题

习题 - 1-1

令 \(V\) 为 \(\mathbb{P}\) 上一 \(n\) 维线性空间，\(f_1,f_2,\dots,f_k\) 为 \(V\) 上 \(k\) 个线性函数，证明:

\[ W=\{\alpha\in V|f_i(\alpha)=0\}\leqslant V \]

称 \(W\) 为 \(f_1,f_2,\dots,f_k\) 的零化子空间
若 \(W\leqslant V\), 则存在 \(V\) 上 \(k\) 个线性函数 \(f_1,f_2,\dots,f_k\) 使得 \(W\) 为 \(f_1,f_2,\dots,f_k\) 的零化子空间

解

首先，\(\theta\in W\)

又，若 \(\alpha,\beta\in W\), 即 \(f_i(\alpha)=f_i(\beta)=0,~i=1,2,...,k\)

则 \((\forall s,t\in\mathbb{P}),~f_i(s\alpha+t\beta)=sf_i(\alpha)+tf_i(\beta)=0,~i=1,2,...,k\)

因此 \(W\leqslant V\) 1
- 若 \(W=V\), 则令 \(f(\alpha)=0,~\forall\alpha\in V\), \(W\) 为 \(f\) 的零化子空间
- 若 \(W=\{\theta\}\), 则 \(W\) 为 \(L(V,\mathbb{P})\) 的零化子空间
- 若 \(\dim W=r\in[1,n)\), 取 \(W\) 的一组基 \(\epsilon_0,\epsilon_1,\dots,\epsilon_r\), \(V\) 的一组基 \(\epsilon_0,\epsilon_1,\dots,\epsilon_n\)
  
  令 \(f_i(\epsilon_j)=\delta_{ij},~i,j=1,2,...,n\)
  
  取 \(f_{r+1},f_{r+2},...,f_{n}\) 构成的零化子空间 \(M\)
  
  则 \((\forall\alpha\in W),~\alpha\in M\), 即 \(W\subseteq M\)
  
  又取 \(\alpha=\sum_{i=1}^nk_i\epsilon_i\in M\), 由 \(f_i(\alpha)=k_i,~i=1,2,...,n\) 可知 \(k_i=0,i=r+1,r+2,...,n\)
  
  故 \(\alpha\in W\), 即 \(M\subseteq W\)
  
  因此 \(W\) 是 \(f_{r+1},f_{r+2},...,f_{n}\) 的零化子空间

\(\Box\)

习题 - 1-2

令 \(V\) 是复线性空间，\(\dim V\geqslant 2\), \(f\) 为 \(V\) 上一对称双线性函数，证明:

\[ (\exists\theta\ne\zeta\in V),~f(\zeta,\zeta)=0 \]
若 \(f\) 非奇异，则存在线性无关向量 \(\zeta,\eta\) 使得

\[ f(\zeta,\eta)=1,f(\zeta,\zeta)=f(\eta,\eta)=0 \]

解

由 \(\dim V\geqslant2\) 可知，存在 \(\alpha,\beta\in V\) 使得 \(\alpha,\beta\) 线性无关

设 \(f(\alpha,\alpha)=a,f(\beta,\beta)=b\)
- 若 \(a=0\) 或 \(b=0\), 则命题得证
- 若 \(a,b\) 均不为 \(0\), 考虑 \[ f(\alpha+t\beta,\alpha+t\beta)=f(\alpha,\alpha)+2tf(\alpha,\beta)+t^2f(\beta,\beta) \] 此时 \(t\) 有根 \(t_1\), 故令 \(\zeta=\alpha+t_1\beta\), 则 \(f(\zeta,\zeta)=0\)
由 1 知，\((\exists\theta\ne\zeta\in V),~f(\zeta,\zeta)=0\)

取 \(\zeta\ne\xi'\in V/\{\theta\}\), 由 \(f\) 非奇异知 \(f(\zeta,\xi')=b\ne0\)

令 \(\xi=\displaystyle\frac{\xi'}{b}\)
- 若 \(f(\xi,\xi)=0\), 则命题得证
- 若 \(f(\xi,\xi)\ne0\), 考虑 \(f(\xi+t\zeta,\xi+t\zeta)\)
  
  \(f(\zeta,\xi+t\zeta)=1\)
  
  由 1 知，\(t\) 有根 \(t_1\) 使得 \(f(\xi+t_1\zeta,\xi+t_1\zeta)=0\)
  
  令 \(\eta=\xi+t_1\zeta\) 即可

\(\Box\)

对称双线性度量空间与线性方程组可解的几何解释

说实话，我挺讨厌这种万物都往方程组上靠的做法

对称双线性度量空间

就是有非奇异对称双线性函数的线性空间

特别的，当 \(\mathbb{P}=\mathbb{R}\) 时即称其为伪 Euclidean 空间

显然，这个非奇异对称双线性函数是满秩的，即

命题 - 2-1

\(n\) 维对称双线性度量空间 \(V\) 存在正交基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\), 使得 \(V\) 上的非奇异对称双线性函数 \(f\) 有

\(f(\epsilon_i,\epsilon_i)\ne0,~i=1,2,...,n\)
\(f(\epsilon_i,\epsilon_j)=0,~1\leqslant i,j\leqslant n,i\ne j\)

\(\Box\)

正交补空间

在继续讨论线性方程组之前，我们先引入正交补的概念

定义正交补 (空间)

对 \(n\) 维对称双线性度量空间 \(V=(V,+,\cdot,\mathbb{P},f)\) 和 \(V_1\leqslant V\), 称

\[ \{\alpha\in V|(\forall\beta\in V_1),~f(\alpha,\beta)=0\} \]

为 \(V_1\) 的正交补 (空间), 记作 \(V_1^\perp\)

显然 \(V_1^\perp\leqslant V\)

由定义立得

命题 - 2-2

若 \(\dim V_1=0\), 则 \(V_1^\perp=V\)
若 \(\dim V_1=r\geqslant1\), 且 \((\beta_0,\beta_1,\dots,\beta_r)\) 为 \(V_1\) 的一组基，则

\[ V_1^\perp=\{\alpha\in V|f(\alpha,\beta_i)=0,~i=1,2,...,r\} \]

即 \(V_1^\perp\) 为 \(\begin{cases} f(\alpha,\beta_i)=0\\i=1,2,...,r \end{cases}\) 的解集

若令 \(f\) 在基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 下的表示矩阵为 \(A\), \(\beta_0,\beta_1,\dots,\beta_r\) 的坐标分别为 \(B_1,B_2,\dots,B_r,~\alpha\) 的坐标为 \(X\), 则上述方程组可表示为

\[ X^TA(B_1,B_2,\dots,B_r)=\theta \]

另外，\(V_1^\perp\) 与上式的解空间 \(S\) 同构

\(\Box\)

定理 - 2-1

若 \(V\) 为 \(n\) 维对称双线性度量空间，\(V_1\leqslant V\), 则

\(\dim V_1+\dim V_1^\perp=\dim V\)
\((V_1^\perp)^\perp=V_1\)

证明

当 \(\dim V_1=0\) 时，易知命题成立

当 \(\dim V_1=r\geqslant1\) 时，

只需证 \(\dim S=n-r\)

\(S\) 即为 \((B_1,B_2,\dots,B_r)^TAX=\theta\) 的解空间 (等式两边取转置)

令 \(B=(B_1,B_2,\dots,B_r)^T\), 则 \(\dim S=n-r\iff\operatorname{rk} BA=r\)

而 \(\operatorname{rk}B=r\), 由 \(A\) 可逆知 \(\operatorname{rk}BA=\operatorname{rk}B=r\)

因此 \(\dim S=n-r\)
由 1 知，\(\dim V_1^\perp=n-r,~\dim~(V_1^\perp)^\perp=r=\dim V_1\)

又 \(V_1\subseteq(V_1^\perp)^\perp\)

故 \((V_1^\perp)^\perp=V_1\)

\(\Box\)

注意 - 2-1-1

未必有 \(V_1\cap V_1^\perp=\{\theta\}\), 即未必有 \(V=V_1\oplus V_1^\perp\)

如在 \(\mathbb{C}^2\) 上引入 \(f((x_1,y_1),(x_2,y_2))=x_1x_2+y_1y_2\), 显然可构成对称双线性度量空间，而取 \(V_1=G[(1,i)]\), 显然 \(V_1=V_1^\perp\)

\(\Box\)

线性方程组可解的几何解释

进入正题

本节将在 \(n\) 维对称双线性度量空间 \(\mathbb{P}^n(E)\) 中讨论

\[ AX=\theta\tag{2.3.1} \]

和

\[ AX=B\tag{2.3.2} \]

其中 \(\mathbb{P}^n(E)\) 表示 \(\mathbb{P}^n\) 连同在自然基底下度量矩阵为 \(E\) 的双线性函数 \(f_E\) 所构成的对称双线性度量空间，显然有

\[ f_E([a_1,a_2,\dots,a_n]^T,[b_1,b_2,\dots,b_n]^T)=\sum_{i=1}^na_ib_i \]

齐次线性方程组 \((2.3.1)\) 可记作

\[ \begin{cases} f_E(A_i^T,X)=0\\ i=1,2,...,m \end{cases} \]

其中 \(A_i=(a_{i1},a_{i2},...,a_{in}),~i=1,2,...,m\)

令 \(V_1=G[A_1^T,A_2^T,...,A_m^T]\), 则上述齐次线性方程组的解空间恰为 \(V_1^\perp\)
非齐次线性方程组 \((2.3.2)\) 有解 \(\iff\operatorname{rk}(A^1,A^2,...,A^n)=\operatorname{rk}(A^1,A^2,...,A^n,B)\iff B\in G[A^1,A^2,...,A^n]\)

其中 \(A^i=(a_{1i},a_{2i},...,a_{mi})^T,~i=1,2,...,n\)

考虑 \((2.3.2)\) 的转置齐次线性方程组

\[ A^TY=\theta\tag{2.3.3} \]

由上一部分的讨论可知，\((2.3.3)\) 的解空间为 \(G[A^1,A^2,...,A^n]^\perp\)

故 \(B\in G[A^1,A^2,...,A^n]\iff B\) 与 \((2.3.3)\) 的解空间正交

这可以作为一个定理

定理 - 2-2

非齐次线性方程组 \((2.3.2)\) 有解当且仅当 \(B\) 与 \((2.3.3)\) 的解空间正交

\(\Box\)

习题

习题 - 2-1

令 \(V\) 为 \(\mathbb{P}\) 上一 \(n\) 维线性空间，\(V_1<V,\zeta\notin V_1\), \(f\) 为 \(V\) 上一对称双线性函数，证明:

\[ (\exists0\ne\eta\in V_1+G[\zeta]),(\forall\alpha\in V_1),~f(\eta,\alpha)=0 \]

解

即证 \(\theta\ne\eta\in(V_1+G[\zeta])\cap V_1^\perp\)

设 \(\dim V_1=r\), 则 \(\dim(V_1+G[\zeta])=r+1,~\dim V_1^\perp=n-r\)

故 \(\dim((V_1+G[\zeta])\cap V_1^\perp)\ne0\)

\(\Box\)

euclidean 空间

定义 Euclidean 空间

令 \(V\) 为实线性空间，若其上一对称双线性函数 \(f\) 满足正定性 , 则称 \(V\) 连同 \(f\) 构成 Euclidean 空间

称 \(f\) 为内积 , 记作 \((~,~)\), \(f(\alpha,\beta)\) 可简记为 \((\alpha,\beta)\)

显然 Euclidean 空间是伪 Euclidean 空间

例 - 1

定义 \(f\) 如下:

\[ f(g(x),h(x))=\int_a^bf(x)g(x)\mathrm{d}x \]

易证 \(f\) 是内积，\(C[a,b]\) 连同 \(f\) 构成 Euclidean 空间

向量的长度与夹角 (度量)

Euclidean 空间有一个很好的性质，就是我们可以在其上定义向量的长度，夹角等在直观几何中的概念
这一点即使是在一般的伪 Euclidean 空间都是做不到的

定义长度

令 \(V\) 为一 Euclidean 空间，\(\alpha\in V\), 称 \(\sqrt{(\alpha,\alpha)}\) 为 \(\alpha\) 的长度 , 记作 \(|\alpha|\)

定义单位向量

假设同上，称 \(\alpha\) 为单位向量 , 若 \(|\alpha|=1\)

如果 \(\alpha\ne\theta\), 则 \(\displaystyle\frac{\alpha}{|\alpha|}:=\frac{1}{|\alpha|}\alpha\) 为单位向量

在定义夹角之前，我们需要证明 \(\displaystyle\frac{|(\alpha,\beta)|}{|\alpha||\beta|}\leqslant1\)

在高中数学中，这个形式等价于 \(\displaystyle\left|\sum_{i=1}^na_ib_i\right|\leqslant\sqrt{\sum_{i=1}^na_i^2}\sqrt{\sum_{i=1}^nb_i^2}\), 这就是大名鼎鼎的 Cauchy 不等式

到了 Euclidean 空间，我们自然也会考虑是否能将 Cauchy 不等式推广过来

很幸运，这是可行的

定理 - 3-1 (Cauchy-Bunjakovski-Schwarz 不等式)

令 \(V\) 为一 Euclidean 空间，则对其上任意非零向量 \(\alpha,\beta\), 均有

\[ \frac{|(\alpha,\beta)|}{|\alpha||\beta|}\leqslant1 \]

等号成立当且仅当 \(\alpha,\beta\) 线性相关

若写成 \(|(\alpha,\beta)|\leqslant|\alpha||\beta|\), 则不需限制 \(\alpha,\beta\) 非零

证明

考察 \(\alpha-k\beta,~k\in\mathbb{R}\), 由内积的正定性可得

\[ k^2(\beta,\beta)-2k(\alpha,\beta)+(\alpha,\alpha)\leqslant0 \]

此式表明判别式非正，即 \((\alpha,\beta)^2-(\alpha,\alpha)(\beta,\beta)\leqslant0\)

亦即

\[ \frac{|(\alpha,\beta)|}{|\alpha||\beta|}\leqslant1 \]

当 \(\alpha,\beta\) 线性相关时，上式等号显然成立
反之，若上式等号成立，则 \((\exists t_0\in\mathbb{R}),~(\alpha-t_0\beta,\alpha-t_0\beta)=0\), 可得 \(\alpha-t_0\beta=0\), 即 \(\alpha,\beta\) 线性相关

\(\Box\)

Cauchy-Bunjakovski-Schwarz 不等式有两个著名的实例

\[ \left|\sum_{i=1}^na_ib_i\right|\leqslant\sqrt{\sum_{i=1}^na_i^2}\sqrt{\sum_{i=1}^nb_i^2} \]
\[ \left|\int_a^bf(x)g(x)\mathrm{d}x\right|\leqslant\sqrt{\int_a^bf^2(x)\mathrm{d}x}\sqrt{\int_a^bg^2(x)\mathrm{d}x} \]

接下来给出夹角的定义

定义夹角

令 \(V\) 为一 Euclidean 空间，\(\alpha,\beta\in V/\{\theta\}\), 称 \(\displaystyle\arccos\frac{(\alpha,\beta)}{|\alpha||\beta|}\in[0,\pi]\) 为 \(\alpha\) 和 \(\beta\) 的夹角 , 记作 \(\langle\alpha,\beta\rangle\)

接下来我们可以尝试把我们熟知的，与长度和角度相关的几何定理都推广到 Euclidean 空间了 (其实，在推论 - 3-2 的保障下，我们可以更大胆些)

定理 - 3-2

令 \(V\) 为一 Euclidean 空间，\(\alpha,\beta\in V\), 则

\(|\alpha+\beta|\leqslant|\alpha|+|\beta|\) (三角不等式)
\((\alpha,\beta)=0\implies|\alpha+\beta|^2=|\alpha|^2+|\beta|^2\) (勾股定理) > 可推广为 > > \[ > ((\forall1\leqslant i,j\leqslant m,i\ne j),~(\alpha_i,\alpha_j)\ne0),~\left|\sum_{i=1}^ma_i\right|^2=\sum_{i=1}^m|\alpha_i|^2 > \]

证明

由定理 - 3-1, \[ |\alpha+\beta|^2=(\alpha,\alpha)+2(\alpha,\beta)+(\beta,\beta)\leqslant|\alpha|^2+2|\alpha||\beta|+|\beta|^2=(|\alpha|+|\beta|)^2 \]
\[ |\alpha+\beta|^2=(\alpha,\alpha)+(\beta,\beta)=|\alpha|^2+|\beta|^2 \]

\(\Box\)

标准正交基底

简单来说，就是满足其所有基向量都是单位向量的一组正交基底

定义标准正交基底

称 \(n\) 维 Euclidean 空间上的一组基 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 是标准正交的，若

\(|\epsilon_i|=1,~i=1,2,...,n\)

\((\epsilon_i,\epsilon_j)=0,~i,j=1,2,...,n,i\ne j\)

容易验证，\(n\) 维 Euclidean 空间存在标准正交基，而且我们还可以将其上任意基底标准正交化

定理 - 3-3 (标准正交化)

若 \((\alpha_0,\alpha_1,\dots,\alpha_n)\) 为 \(n\) 维 Euclidean 空间上的一组基，则其上存在标准正交基 \((\beta_0,\beta_1,\dots,\beta_n)\) 使得

\[ G[\alpha_0,\alpha_1,\dots,\alpha_i]=G[\beta_0,\beta_1,\dots,\beta_i],~i=1,2,...,n \]

证明

观察定理形式可知是用归纳法证的

该证法也是构造性的

令 \(\beta'_1=\alpha_1\), 则 \(G[\beta'_1]=G[\alpha_1]\)
令 \(\beta'_2=\alpha_2+k\beta'_1\) 使得 \((\beta'_2,\beta'_1)=0\), 可推知当且仅当

\[ k=-\frac{(\alpha_2,\beta'_1)}{(\beta'_1,\beta'_1)} \]

时此式成立

由 \(\beta'_2=\alpha_2+k\beta'_1=\alpha_2+k\alpha_1\) 可知 \(\beta'_1,\beta'_2\) 线性无关，故 \(G[\beta'_1,\beta'_2]=G[\alpha_1,\alpha_2]\)
假设已找到 \(m<n\) 个两两正交的向量 \(\beta'_0,\beta'_1,\dots,\beta'_m\) 满足条件

令

\[ \beta'_{m+1}=\alpha_{m+1}+\sum_{i=1}^mk_i\beta'_i \]

使得

\[ (\beta'_{m+1},\beta'_i)=0,~i=1,2,...,m \]

即

\[ (\alpha_{m+1},\beta'_i)+k_i(\beta'_i,\beta'_i)=0,~i=1,2,...,m \]

上式成立当且仅当

\[ k_i=-{(\alpha_{m+1},\beta'_i)\over(\beta'_i,\beta'_i)},~i=1,2,...,m \]

又可知 \(\beta'_{m+1}\) 是 \(\alpha_0,\alpha_1,\dots,\alpha_{m+1}\) 的线性组合，\(\beta'_{m+1}\ne\theta\)

因此 \(G[\alpha_0,\alpha_1,\dots,\alpha_{m+1}]=G[\beta'_0,\beta'_1,\dots,\beta'_{m+1}]\)

因此我们可以找到一组正交基 \((\beta'_0,\beta'_1,\dots,\beta'_n)\) 满足

\[ G[\alpha_0,\alpha_1,\dots,\alpha_i]=G[\beta'_0,\beta'_1,\dots,\beta'_i],~i=1,2,...,n \]

上述过程即 Schmidt 正交化

又令 \(\beta_i=\displaystyle\frac{1}{|\beta'_i|}\beta'_i,~i=1,2,...,n\), 命题即得证

\(\Box\)

应用定理 - 3-3 的方法即可将任意基底标准正交化

此方法本质上还是矩阵乘法

推论 - 3-1

令 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 为 \(n\) 维 Euclidean 空间 \(V\) 的一组标准正交基，则

\(V\) 的内积的度量矩阵为 \(E\)
若 \(\alpha,~\beta\in V\) 在其上的坐标分别为 \(A=(a_1,a_2,\dots,a_n)^T,~B=(b_1,b_2,\dots,b_n)^T\), 则 \[ (\alpha,\beta)=\sum_{i=1}^na_ib_i=A^TB \]

\(\Box\)

接下来是一个与内积证明和性质有关的定理

定理 - 3-4

令 \(V\) 为 \(n\) 维实线性空间，\(f\) 是 \(V\) 上一双线性函数，则下列命题等价:

\(f\) 为 \(V\) 上的内积
\(f\) 在 \(V\) 的任意基底下的度量矩阵 \(A\) 正定，即存在可逆矩阵 \(P\) 使得 \(A=P^TP\)
\(f\) 在 \(V\) 的某一基底下的度量矩阵 \(A\) 正定

证明

\(1\implies2:\)

可知 \(V\) 连同 \(f\) 构成 Euclidean 空间

故由推论 - 3-1 可知，存在标准正交基 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 使得 \(f\) 的度量矩阵为 \(E\)

任取 \(V\) 上一组基底 \((\eta_0,\eta_1,\dots,\eta_n)=(\epsilon_0,\epsilon_1,\dots,\epsilon_n)Q\), 易知 \(Q\) 可逆，则 \(f\) 在该基底下的度量矩阵 \(A=Q^TEQ=Q^TQ\)

\(2\implies3:\) 显然

\(3\implies1:\)

不妨设该基底为 \((\eta_0,\eta_1,\dots,\eta_n)\)

假设 \(f\) 在该基底下的度量矩阵为 \(A=Q^TQ=Q^TEQ\), 则 \(E=(Q^{-1})^TAQ^{-1}\)

故存在基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)=(\eta_0,\eta_1,\dots,\eta_n)Q^{-1}\) 使得 \(f\) 的度量矩阵为 \(E\)

显然 \(f\) 是对称正定双线性函数，即 \(f\) 为 \(V\) 上的内积

\(\Box\)

Euclidean 空间的同构

定义 Euclidean 空间同构映射

令 \(V,V'\) 为两个 Euclidean 空间，称 \(V\) 到 \(V'\) 的同构映射 \(f\) 是 \(V\) 到 \(V'\) 的 Euclidean 空间同构映射 , 若

\[ (\forall\alpha,\beta\in V),~(f(\alpha),f(\beta))=(\alpha,\beta) \]

此时，称 \(V\) 与 \(V'\) 是同构的

显然这个同构也是等价关系

定理 - 3-5

两有限维 Euclidean 空间 \(V,V'\) 同构当且仅当 \(\dim V=\dim V'\)

证明

\(\implies\): 显然

\(\impliedby\):

只需证 \(n\) 维 Euclidean 空间 \(V\) 同构于 \(\mathbb{R}^n\)

令 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 为 \(V\) 的一组标准正交基，建立映射

\[ f_{\{\epsilon_i\}_{i=1}^n}:\alpha\mapsto(x_1,x_2,\dots,x_n)^T\in\mathbb{R}^n,~\alpha=\sum_{i=1}^nx_i\epsilon_i\in V \]

易知 \(f_{\{\epsilon_i\}_{i=1}^n}\) 是 \(V\) 到 \(\mathbb{R}^n\) 的线性同构映射

任取 \(\alpha=\sum_{i=1}^nx_i\epsilon_i,\beta=\sum_{i=1}^ny_i\epsilon_i\), 均有

\[ \begin{aligned} (\alpha,\beta)&=\sum_{i=1}^nx_iy_i\\ &=((x_1,x_2,\dots,x_n)^T,(y_1,y_2,\dots,y_n)^T)\\ &=(f_{\{\epsilon_i\}_{i=1}^n}(\alpha),f_{\{\epsilon_i\}_{i=1}^n}(\beta)) \end{aligned} \]

\(\Box\)

基于这个定理，我们有一个重要且有用的推论

推论 - 3-2

在 Euclidean 空间中，所有关于两个或三个向量的命题均可在三维直观几何空间验证

证明

在 Euclidean 空间中，两个或三个向量可生成维数不超过 3 的 Euclidean 空间，由定理 - 3-5 可知其与三维直观几何空间或其子空间同构

而 Euclidean 空间中的命题均可只用空间说的加法，实数乘和内积描述，因此只需在三维直观几何空间中验证就行

\(\Box\)

在本章的最后，我们另给出一组定理

定理 - 3-6

令 \(V\) 为一 \(n\) 维 Euclidean 空间，\(\alpha_0,\alpha_1,\dots,\alpha_m\in V\), 则有如下平行的事实

若 \(\alpha_i\ne\theta,~(\alpha_i,\alpha_j)=0,~i,j=1,2,...,m,~i\ne j\), 则 \(m\leqslant n\)
若 \((\alpha_i,\alpha_j)<0,~i,j=1,2,...,m,~i\ne j\), 则 \(m\leqslant n+1\)
若 \((\alpha_i,\alpha_j)>0,~i,j=1,2,...,m,~i\ne j\), 则不存在映射 \(f:\mathbb{Z}^+\to\mathbb{Z}^+\) 满足 \(m\leqslant f(n)\)

又在线性相关的角度，我们可以注意到更深刻的事实

条件蕴含 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关
条件蕴含 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 的任意真子组线性无关

证明

设 \(\exists k_i\in\mathbb{R},~i=1,2,...,m,~s.t.~\displaystyle\sum_{i=1}^mk_i\alpha_i=\theta\)

则

\[ k_j(\alpha_j,\alpha_j)=-(\alpha_j,\sum_{i=1,~i\ne j}^mk_i\alpha_i)=0,~j=1,2,...,m \]

而 \((\alpha_j,\alpha_j)>0\), 故 \(k_j=0,~j=1,2,...,m\)

因此 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关

因此 \(m\leqslant n\)
不妨设 \(m=n+2\)

则

\[ \exists k_i\in\mathbb{R},~i=1,2,...,n+1,\sum_{i=1}^{n+1}k_i^2\ne0,~s.t.~\sum_{i=1}^{n+1}k_i\alpha_i=\theta \]

此时 \((\alpha_{n+2},\sum_{i=1}^{n+1}k_i\alpha_i)=0\)

此式说明 \(k_0,k_1,\dots,k_{n+1}\) 中有正有负，不妨设

\[ k_i>0,k_j<0,~i=1,2,...,s,~j=s+1,s+2,...,t,~1\leqslant s<t\leqslant n+1 \]

则 \(\sum_{i=1}^sk_i\alpha_i=-\sum_{i=s+1}^tk_i\alpha_i\)

而

\[ (\sum_{i=1}^sk_i\alpha_i,-\sum_{i=s+1}^tk_i\alpha_i)=-\sum_{i=1}^s\sum_{j=s+1}^t(k_i\alpha_i,k_j\alpha_j)<0 \]

这与点积的正定性矛盾，故 \(m\leqslant n+1\)

类似地，我们可证明 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 的任意真子组线性无关

只需证 \(\alpha_0,\alpha_1,\dots,\alpha_{m-1}\) 线性无关

设 \(\exists k_i\in\mathbb{R},~i=1,2,...,m-1,~s.t.~\displaystyle\sum_{i=1}^{m-1}k_i\alpha_i=\theta\)

此时 \((\alpha_m,\sum_{i=1}^{m-1}k_i\alpha_i)=0\)

此式说明要么 \(k_0,k_1,\dots,k_{m-1}\) 中有正有负，要么 \(k_0,k_1,\dots,k_{m-1}\) 均为 \(0\)
- 若情况为后者，则命题得证
- 若情况为前者，不妨设
  
  \[ k_i>0,k_j<0,~i=1,2,...,s,~j=s+1,s+2,...,t,~1\leqslant s<t\leqslant m-1 \]
  
  则 \(\sum_{i=1}^sk_i\alpha_i=-\sum_{i=s+1}^tk_i\alpha_i\)
  
  而
  
  \[ (\sum_{i=1}^sk_i\alpha_i,-\sum_{i=s+1}^tk_i\alpha_i)=-\sum_{i=1}^s\sum_{j=s+1}^t(k_i\alpha_i,k_j\alpha_j)<0 \]
  
  这与点积的正定性矛盾，故情况只能为后者
由条件知 \(\alpha_i\ne\theta,i=1,2,...,m\)

假设 \(f\) 存在
- 当 \(n=1\) 时，\(\alpha_0,\alpha_1,\dots,\alpha_m\) 中任意两个向量均线性相关，不妨设
  \(\alpha_i=k_i\alpha_1,~i=1,2,3,...m\), 显然 \(k_1=1\)
  
  假设 \(f(1)\in\mathbb{Z}^+\), 令 \(m=f(1)\), \(k\in\mathbb{Z}^+/\{k_1,k_2,\dots,k_m\}\), \(\beta=k\alpha_1\)
  
  则 \((\beta,\alpha_i)=kk_i(\alpha_1,\alpha_1)>0,~i=1,2,...,m\)
  
  即满足条件的向量组长度至少为 \(f(1)+1\), 与 \(m\leqslant f(n)\) 矛盾！
  
  因此 \(1\notin D(f)\)
- 当 \(n\geqslant2\) 时，\(\alpha_0,\alpha_1,\dots,\alpha_m\) 中存在两向量线性无关，设其为 \(\alpha'_1,\alpha'_2\)
  
  假设 \(f(n)\in\mathbb{Z}^+\), 令 \(m=f(n)\)
  
  令 \(\beta_k=\alpha'_1+k\alpha'_2,~k=1,2,...,m\), 则其中必有一向量 \(\beta_{k'}\) 满足 \(\beta_{k'}\ne\alpha_i,~i=1,2,...,m\)
  
  此时有 \((\beta_{k'},\alpha_i)=(\alpha'_1,\alpha_i)+k'(\alpha'_2,\alpha_i)>0,~i=1,2,...,m\)
  
  即满足条件的向量组长度至少为 \(f(n)+1\), 与 \(m\leqslant f(n)\) 矛盾！
  
  因此 \(n\notin D(f)\)
因此 \(D(f)=\varnothing\), \(f\) 不存在

\(\Box\)

习题

习题 - 3-1

令 \(V\) 为一 \(n\) 维 Euclidean 空间，\(\alpha\) 为 \(V\) 中一向量，证明:

\(f(\beta)=(\beta,\alpha)\) 定义 \(V\) 上一线性函数
若 \(g(\eta):=(\eta,\beta),~\beta\ne\alpha\), 则 \(f\ne g\)
对于 \(V\) 上任一线性函数 \(f\), 都存在向量 \(\alpha\), 使得 \(f\) 可由 \(f(\eta)=(\eta,\alpha)\) 定义

解

显然
若 \(f=g\), 则 \((f-g)(\alpha-\beta)=(\alpha-\beta,\alpha-\beta)=0\), 矛盾
任取 \(V\) 上一组基 \(\epsilon_0,\epsilon_1,\dots,\epsilon_n\), 设 \(f(\epsilon_i)=t_i,~i=1,2,...,n\)

考虑方程组

\[ \begin{bmatrix} (\epsilon_1,\epsilon_1)&(\epsilon_1,\epsilon_2)&...&(\epsilon_1,\epsilon_n)\\ (\epsilon_2,\epsilon_1)&(\epsilon_2,\epsilon_2)&...&(\epsilon_2,\epsilon_n)\\ \vdots&\vdots&\ddots&\vdots\\ (\epsilon_n,\epsilon_1)&(\epsilon_n,\epsilon_2)&...&(\epsilon_n,\epsilon_n)\\ \end{bmatrix}\begin{bmatrix} k_1\\k_2\\\vdots\\k_n \end{bmatrix}=\begin{bmatrix} t_1\\t_2\\\vdots\\t_n \end{bmatrix} \]

由 \(((\epsilon_i,\epsilon_j))_{n\times n}\) 的正定性可知方程组有唯一解，令 \(\alpha=\displaystyle\sum_{i=1}^nk_i\epsilon_i\)

则 \((\epsilon_i,\alpha)=t_i=f(\epsilon_i)\)

从而 \((\forall\eta\in V),~f(\eta)=(\eta,\alpha)\)

\(\Box\)

向量到子空间的距离与线性方程组的最小二乘法

若无明确说明，本章内容均在有限维 Euclidean 空间内进行讨论

向量在子空间的正射影

我们在定理 - 2-1 得知 \(\dim V_1+\dim V_1^\perp=\dim V\), 而如果 \(V\) 是 \(n\) 维 Euclidean 空间，我们有更进一步的结论

定理 - 4-1

令 \(V\) 为一 \(n\) 维 Euclidean 空间，则 \(\forall V_1\leqslant V\), 均有

\[ V=V_1\oplus V_1^\perp \]

证明

设 \(\alpha\in V_1\cap V_1^\perp\), 则 \((\alpha,\alpha)=0\), 由内积的正定性可得 \(\alpha=\theta\), 因此 \(V_1\cap V_1^\perp=\{\theta\}\)

又 \(V_1+V_1^\perp\subseteq V\), \(\dim V_1+\dim V_1^\perp=\dim V\)

因此 \(V=V_1\oplus V_1^\perp\)

\(\Box\)

有了这个定理，我们就可在 Euclidean 空间定义正射影了

定义正射影

令 \(V\) 为一 \(n\) 维 Euclidean 空间，\(V_1\leqslant V\), 则 \(\forall\alpha\in V_1,~\alpha\) 均有唯一分解

\[ \alpha=\alpha_1+\alpha_2,~\alpha_1\in V_1,\alpha_2\in V_1^\perp \]

称 \(\alpha_1\) 为 \(\alpha\) 在 \(V_1\) 上的正射影

向量到子空间的距离

定义向量间距离

令 \(V\) 为一 \(n\) 维 Euclidean 空间，\(\alpha,\beta\in V\), 称 \(d(\alpha,\beta):=|\alpha-\beta|\) 为 \(\alpha\) 与 \(\beta\) 的距离

类似在直观几何空间中的距离，Euclidean 空间中的距离也有如下性质

\((\forall\alpha,\beta\in V),~d(\alpha,\beta)=d(\beta,\alpha)\)
\((\forall\alpha,\beta\in V),~d(\alpha,\beta)\geqslant0\), 等号成立当且仅当 \(\alpha=\beta\)
\((\forall\alpha,\beta,\gamma\in V),~d(\alpha,\beta)\leqslant d(\alpha,\gamma)+d(\beta,\gamma)\) (三角不等式)

在三维直观几何空间中，一点到一平面的最短距离即是该点到垂足的连线，在 Euclidean 空间中表现为

定理 - 4-2

令 \(V\) 为一 \(n\) 维 Euclidean 空间，\(V_1\leqslant V,\alpha\in V\), \(\alpha_1\in V_1\) 为 \(\alpha\) 在 \(V_1\) 上的正射影，则

\[ (\forall\beta\in V_1,\beta\ne\alpha_1),~d(\alpha,\alpha_1)<d(\alpha,\beta) \]

证明

\(\alpha-\beta=(\alpha-\alpha_1)+(\alpha_1-\beta),~\alpha_1-\beta\in V_1,\alpha-\alpha_1\in V_1^\perp\)
故 \(|\alpha-\beta|^2=|\alpha-\alpha_1|^2+|\alpha_1-\beta|^2\)

由 \(|\alpha_1-\beta|^2>0\) 可知 \(|\alpha-\beta|^2>|\alpha-\alpha_1|^2\)

因此 \(d(\alpha,\alpha_1)<d(\alpha,\beta)\)

\(\Box\)

因此，我们可在 Euclidean 空间下定义向量到子空间的距离

定义向量到子空间的距离

假设如定理 - 4-2, 称 \(d(\alpha,\alpha_1)\) 为 \(\alpha\) 到 \(V_1\) 的距离

我们要求向量到子空间的距离，只需要求向量到正射影的距离即可

接下来将会给出正射影的求法

首先我们需要定义一个特殊矩阵

定义 Gram 矩阵

令 \(V\) 为一 \(n\) 维 Euclidean 空间，\(\alpha_0,\alpha_1,\dots,\alpha_m\in V\), 称

\[ ((\alpha_i,\alpha_j))_{m\times m} \]

为 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 的 Gram 矩阵 , 记作 \(G(\alpha_0,\alpha_1,\dots,\alpha_m)\)

接下来我们就可以给出做法了

定理 - 4-3

令 \(V\) 为一 \(n\) 维 Euclidean 空间，\(V_1=G[\alpha_0,\alpha_1,\dots,\alpha_m]\leqslant V\), \(\alpha\in V\), \(X=(x_1,x_2,\dots,x_m)^T\in\mathbb{R}^m\)

则

\[ \gamma=(\alpha_0,\alpha_1,\dots,\alpha_m)X=\sum_{i=1}^mx_i\alpha_i\tag{4-3.1} \]

为 \(\alpha\) 在 \(V_1\) 上的正射影当且仅当

\[ G(\alpha_0,\alpha_1,\dots,\alpha_m)X=((\alpha,\alpha_0),(\alpha,\alpha_1),\dots,(\alpha,\alpha_m))^T\tag{4-3.2} \]

证明

显然 \(\alpha\) 的正射影 \(\gamma\) 一定存在，则

\[ \begin{aligned} (\text{4-3.1})&\iff \left(\alpha-\sum_{i=1}^mx_i\alpha_i\right)\in V_1^\perp\\ &\iff 0=(\alpha_j,\alpha-\sum_{i=1}^mx_i\alpha_i)=(\alpha,\alpha_j)-\sum_{i=1}^mx_i(\alpha_j,\alpha_i),~j=1,2,...,m\\ &\iff G(\alpha_0,\alpha_1,\dots,\alpha_m)X=((\alpha,\alpha_0),(\alpha,\alpha_1),\dots,(\alpha,\alpha_m))^T \end{aligned} \]

\(\Box\)

这里补充一点，定理 - 4-3 条件里并未限制 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关

若 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关，则 \(G(\alpha_0,\alpha_1,\dots,\alpha_m)\) 即为内积在 \(V_1\) 的度量矩阵，则 \(G(\alpha_0,\alpha_1,\dots,\alpha_m)\) 是正交矩阵，\(|G(\alpha_0,\alpha_1,\dots,\alpha_m)|\ne0\), 因此方程 \((\text{4-3.2})\) 的解唯一
- 若 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 是一组标准正交基，则 \(G(\alpha_0,\alpha_1,\dots,\alpha_m)=E\), 此时 \[ X=((\alpha,\alpha_0),(\alpha,\alpha_1),\dots,(\alpha,\alpha_m))^T \]
若 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性相关，则 \(X\) 的解显然不唯一

最小二乘法

这是个很有用的理论，不过放到这有点突兀，姑且当作前面内容的应用吧

在实际应用中，线性方程组 \(AX=B,~A\in\mathbb{R}^{m\times n}\) 由于测量精度等原因往往无解，即

\[ \sum_{i=1}^n(b_1-\sum_{j=1}^na_{ij}x_j)^2\ne0\tag{4.1} \]

此时，我们则需要寻找一组实数 \(x_1,x_2,\dots,x_n\) 使得式 \((4.1)\) 左端的值最小
这样的 \(x_1,x_2,\dots,x_n\) 即为 \(AX=B\) 的最小二乘解

下面我们将在 \(m\) 维 Euclidean 空间讨论该问题

将 \(A\) 按列分块，\(A=(\alpha_0,\alpha_1,\dots,\alpha_n),~\alpha_i\in\mathbb{R}^m,i=1,2,...,n\)

有

\[ AX=\sum_{i=1}^nx_i\alpha_i\in G[\alpha_0,\alpha_1,\dots,\alpha_n]\leqslant\mathbb{R}^m \]

而式 \((4.1)\) 左端用内积的语言描述即为

\[ (B-\sum_{i=1}^nx_i\alpha_i,B-\sum_{i=1}^nx_i\alpha_i)=|B-\sum_{i=1}^nx_i\alpha_i|^2\tag{4.2} \]

要使式 \((4.2)\) 的值最小，只需 \(d(B,\sum_{i=1}^nx_i\alpha_i)\) 最小

此时取的 \(x_1,x_2,\dots,x_n\) 即要使 \(\sum_{i=1}^nx_i\alpha_i\) 为 \(B\) 在 \(G[\alpha_0,\alpha_1,\dots,\alpha_n]\) 的正射影

这样的 \(x_1,x_2,\dots,x_n\) 是且仅是

\[ G(\alpha_0,\alpha_1,\dots,\alpha_n)X=((B,\alpha_0),(B,\alpha_1),\dots,(B,\alpha_n))^T\tag{4.3} \]

的解

又

\[ G(\alpha_0,\alpha_1,\dots,\alpha_n)=A^TA \]

\[ ((B,\alpha_0),(B,\alpha_1),\dots,(B,\alpha_n))^T=A^TB \]

因此式 \((4.3)\) 即为

\[ A^TAX=A^TB\tag{4.4} \]

由正射影的存在性可知该方程一定可解，其解为 \(X=(A^TA)^{-1}A^TB\)

\((4.4)\) 的可解性也可通过 \(\operatorname{rk}(A^TA)=\operatorname{rk}((A^TA,A^TB))\) 推得
(注意到 \(\forall A\in\mathbb{R}^{m\times n},AX=0\) 与 \(A^TAX=0\) 同解)

习题

习题 - 4-1

令 \(V\) 为一 \(n\) 维 Euclidean 空间，\(\alpha_0,\alpha_1,\dots,\alpha_m\in V\), 证明:
\(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关当且仅当 \(|G(\alpha_0,\alpha_1,\dots,\alpha_m)|\ne0\)

解

\(\impliedby\):

设 \(\displaystyle\sum_{i=1}^nk_i\alpha_i=\theta\)

则 \(\displaystyle\sum_{i=1}^nk_i(\alpha_j,\alpha_i)=0,~j=1,2,...,n\)

即

\[ G(\alpha_0,\alpha_1,\dots,\alpha_n)(k_1,k_2,\dots,k_n)^T=O\tag{4-1.1} \]

由 \(|G(\alpha_0,\alpha_1,\dots,\alpha_m)|\ne0\) 知该方程只有零解

故 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关
\(\implies\):

假设 \(|G(\alpha_0,\alpha_1,\dots,\alpha_m)|=0\), 则方程 \((\text{4-1.1})\) 有非零解

即 \((\sum_{i=1}^nk_i\alpha_i,\alpha_j)=0,~j=1,2,...,n\)

可得 \((\sum_{i=1}^nk_i\alpha_i,\sum_{i=1}^nk_i\alpha_i)=0\)

因此 \(\sum_{i=1}^nk_i\alpha_i=0\), 与条件矛盾

\(\Box\)

参考资料

高等代数教程 / 郭聿琦，岑嘉评，王正攀编著. —— 北京：科学出版社，2014. 7