笔记 - 对称双线性度量空间与线性方程组

线性函数,双线性函数,Euclidean 空间等

线性空间上的线性和双线性函数

顾名思义,线性函数就是具有线性的函数,双线性函数就是具有双重线性的函数

因为这两个概念有许多相通之处,故选用如下方式展示

基本定义

定义 线性函数

对映射 \(f:V\to\mathbb{P}\), 满足 \((\forall\alpha,\beta\in V,k,l\in\mathbb{P}),~f(k\alpha+l\beta)=kf(\alpha)+lf(\beta)\)

例如矩阵的迹 \(\operatorname{tr}A\)

定义 双线性函数

对映射 \(f:V\times V\to\mathbb{P}\), 满足

  • \((\forall\alpha,\beta,\gamma\in V,k,l\in\mathbb{P}),~f(k\alpha+l\beta,\gamma)=kf(\alpha,\gamma)+lf(\beta,\gamma)\)
  • \((\forall\alpha,\beta,\gamma\in V,k,l\in\mathbb{P}),~f(\gamma,k\alpha+l\beta)=kf(\gamma,\alpha)+lf(\gamma,\beta)\)

表示向量 / 表示矩阵

定义 表示向量

\((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\)\(V\) 的一组基,称

\[ (f(\epsilon_1),f(\epsilon_2),...,f(\epsilon_n)) \]

\(f\)\((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 下的表示向量

我们有如下定理

定理 - 1-1-1

\(\eta:L(V,\mathbb{P})\to\mathbb{P}^n;~f\mapsto(f(\epsilon_1),f(\epsilon_2),...,f(\epsilon_n))\) 为双射

即所有线性函数的集合 \(L(V,\mathbb{P})\)\(\mathbb{P}^n\) 同构

\(\Box\)

定义 表示矩阵 / 度量矩阵

\((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\)\(V\) 的一组基,称

\[ (f(\epsilon_i,\epsilon_j))_{n\times n} \]

\(f\)\((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 下的表示矩阵

我们有如下定理

定理 - 1-1-2

\(\zeta:BL(V,\mathbb{P})\to\mathbb{P}^{n\times n};~f\mapsto(f(\epsilon_i,\epsilon_j))_{n\times n}\) 为双射

即所有双线性函数的集合 \(BL(V,\mathbb{P})\)\(\mathbb{P}^{n\times n}\) 同构

\(\Box\)

证明很简单,读者可尝试自行补充

我们发现
\(\forall\alpha=\displaystyle\sum_{i=1}^nx_i\epsilon_i=(\epsilon_0,\epsilon_1,\dots,\epsilon_n)X,\beta=\sum_{i=1}^ny_i\epsilon_i=(\epsilon_0,\epsilon_1,\dots,\epsilon_n)Y\in V\)
都有

\[ f(\alpha,\beta)=X^TAY \]

这样就将双线性函数的计算转换成了矩阵乘法,这个形式很重要

零元

类比线性空间中的零元,我们可定义零线性函数 / 零双线性函数

定义 零线性函数

对于线性函数 \(f\), 若 \((\forall\alpha\in V),~f(\alpha)=0\), 则称 \(f\)零线性函数 , 记作 \(\bold{0}\)

定义 零双线性函数

对于双线性函数 \(f\), 若 \((\forall\alpha,\beta\in V),~f(\alpha,\beta)=0\), 则称 \(f\)零双线性函数 , 记作 \(\bold{0}\)

基底间的过渡

\((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\)\((\eta_0,\eta_1,\dots,\eta_n)\)\(V\) 的两组基底,过渡矩阵 \(T\) 使得

\[ (\eta_0,\eta_1,\dots,\eta_n)=(\epsilon_0,\epsilon_1,\dots,\epsilon_n)T \]

若线性函数 \(f\)\((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\)\((\eta_0,\eta_1,\dots,\eta_n)\) 下的表示向量分别为 \((a_1,a_2,\dots,a_n)\)\((b_1,b_2,\dots,b_n)\), 则

\[ (b_1,b_2,\dots,b_n)=(a_1,a_2,\dots,a_n)T \]

因此 \(T\) 非奇异

若双线性函数 \(f\)\((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\)\((\eta_0,\eta_1,\dots,\eta_n)\) 下的表示矩阵分别为 \(A\)\(B\), 则

\[ B=T^TAT \]

因此 \(T\) 非奇异,\(\operatorname{rk}A\)\(f\) 的秩


接下来我们定义一些特殊的双线性函数,我们可以从这些函数具有的性质中感受到其与矩阵的密切关系

非奇异双线性函数

定义 非奇异双线性函数

\(f\)非奇异的 , 若

\[ (\forall\alpha\in V/\{\theta\},~\exists\beta\in V),~f(\alpha,\beta)\ne0 \]

定理 - 1-2

下列命题等价

  1. \(f\) 是非奇异的
  2. \(f\)\(V\) 任意基底下的度量矩阵是非奇异的
  3. \(f\)\(V\) 某一基底下的度量矩阵是非奇异的
  4. \((\forall\alpha\in V/\{\theta\},~\exists\beta\in V),~f(\beta,\alpha)\ne0\) (对称性)
证明

\(1\iff2:\)

\[ \begin{aligned} (\forall\alpha\in V,~\forall\beta\in V,~f(\alpha,\beta)=0\implies\alpha=0)&\iff(\forall X\in\mathbb{P}^n,~\forall Y\in\mathbb{P}^n,~X^TAY=0\implies X=0)\\ &\iff(\forall X\in\mathbb{P}^n,~X^TA=0\implies X=0) \end{aligned} \]

\(2\iff3:\) 显然

\(2\iff4:\) 参照 \(1\iff2\)

\(\Box\)

对称双线性函数

定义 对称双线性函数

\(f\)对称的 , 若

\[ (\forall\alpha,\beta\in V),~f(\alpha,\beta)=f(\beta,\alpha) \]

定理 - 1-3

下列命题等价

  1. \(f\) 是对称的
  2. \(f\)\(V\) 任意基底下的度量矩阵是对称的
  3. \(f\)\(V\) 某一基底下的度量矩阵是对称的

证明参照 定理 - 1-2

\(\Box\)

斜对称双线性函数

定义 斜对称双线性函数

\(f\)斜对称的 , 若

\[ (\forall\alpha,\beta\in V),~f(\alpha,\beta)=-f(\beta,\alpha) \]

正定双线性函数

定义 正定双线性函数

\(f\)正定的 , 若

\[ (\forall\alpha\in V/\{\theta\}),~f(\alpha,\alpha)>0 \]

我们将在 Euclidean 空间 见到它

它有类似 定理 - 1-2, 定理 - 1-3 的定理 (定理 - 3-4)


正交与正交基

定义 正交

对双线性函数 \(f\), 称 \(\alpha,\beta\in V\) 正交 , 若 \(f(\alpha,\beta)=0\)


定义 正交基底

一组基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 称作正交基底 , 若 \((\forall 1\leqslant i,j\leqslant n,i\ne j), f(\epsilon_i,\epsilon_j)=0\)

定理 - 1-4

对任意线性空间 \(V\) 和其上的对称双线性函数 \(f\), 正交基底总是存在
进而 \(f\) 在该基底下的度量矩阵为对角矩阵,对角线上的非零元素个数为 \(f\) 的秩

证明
  • \(f\) 是零函数,则 \(V\) 上任意基底均为所求

  • \(f\) 是非零函数,即

    \[ (\exists\alpha,\beta\in V),~f(\alpha,\beta)\ne0 \]


    \(f(\alpha,\beta)=\displaystyle\frac{1}{2}\left(f(\alpha+\beta,\alpha+\beta)-f(\alpha,\alpha)-f(\beta,\beta)\right)\) (这里利用了 \(f\) 的对称性)
    可知

    \[ (\exists\epsilon\in V),~f(\epsilon,\epsilon)\ne0\tag{1.4.1} \]

    接下来对 \(\dim V\) 应用第二数学归纳法

    • \(\dim V=1\) 时,任意基底均为所求

    • 若对 \(1\leqslant\dim V\leqslant n-1\) 的情况命题都成立,考察 \(\dim V=n\) 的情形

      \((1.4.1)\) 中的 \(\epsilon\), 将其扩充为 \(V\) 的一组基底 \((\epsilon,\eta_{2},...,\eta_{n})\)

      \(\epsilon_i'=\displaystyle \eta_i-\frac{f(\eta_i,\epsilon)}{f(\epsilon,\epsilon)}\epsilon,\qquad i=2,3,...,n\)

      \((\epsilon,\epsilon'_{2},...,\epsilon'_{n})\)\(V\) 的基底,且
      \(f(\epsilon,\epsilon_i')=0,\qquad i=2,3,...,n\)

      因此

      \[ (\forall\alpha\in G[\epsilon'_{2},...,\epsilon'_{n}]),~f(\epsilon,\alpha)=0\tag{1.4.2} \]

      又显然 \(V=G[\epsilon]\oplus G[\epsilon'_{2},...,\epsilon'_{n}]\)

      考虑 \(f|_{G[\epsilon'_{2},...,\epsilon'_{n}]}\), 由归纳假设,\(G[\epsilon'_{2},...,\epsilon'_{n}]\) 中有正交基底 \((\epsilon_{2},...,\epsilon_{n})\)

      故由 \((1.4.2)\) 式可得 \((\epsilon,\epsilon_{2},...,\epsilon_{n})\)\(V\) 的一组正交基底

\(\Box\)

推论 - 1-4-1

  • \(V\)\(\mathbb{C}\) 上一 \(n\) 维线性空间,\(f\)\(V\) 上一对称双线性函数,则存在正交基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 使得对 \(V\) 上的任意向量 \(\alpha=\sum_{i=1}^nx_i\epsilon_i,\beta=\sum_{i=1}^ny_i\epsilon_i\) 均有

    \[ f(\alpha,\beta)=\sum_{i=1}^rx_iy_i \]

    其中 \(r=\operatorname{rk}f\)

  • \(V\)\(\mathbb{R}\) 上一 \(n\) 维线性空间,其余同上,则

    \[ f(\alpha,\beta)=\sum_{i=1}^px_iy_i-\sum_{i=p+1}^rx_iy_i \]

另一种写法:

  • 对于前者,\(f\) 的度量矩阵为 \(\operatorname{diag}\{\underbrace{1,...,1}_{\operatorname{rk}f},0,...,0\}\)
  • 对于后者,\(f\) 的度量矩阵为 \(\operatorname{diag}\{\underbrace{1,...,1}_{p},\underbrace{-1,...,-1}_{\operatorname{rk}f-p},0,...,0\}\)
证明

\(V\)\(\mathbb{R}\) 上一 \(n\) 维线性空间,则由 定理 - 1-4 可知,
存在正交基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\), 使得 \(f\) 的度量矩阵为 \(\operatorname{diag}\{d_1,d_2,\dots,d_p,-d_{p+1},-d_{p+2},...,-d_{r},0,...,0\}\), 其中 \(d_1,d_2,\dots,d_r>0,~0\leqslant p\leqslant r\leqslant n\)

考虑 \(f(\epsilon_i,\epsilon_i)=(-1)^{[i>p]}d_i,~1\leqslant i\leqslant r\)

\(\displaystyle\epsilon'_i={\epsilon_i\over\sqrt{d_i}}\), 则 \(f(\epsilon'_i,\epsilon'_i)=(-1)^{[i>p]}\)

容易验证 \((\epsilon'_0,\epsilon'_1,\dots,\epsilon'_r,\epsilon_{r+1},\epsilon_{r+2},...,\epsilon_{n})\) 为正交基底

故在正交基底 \((\epsilon'_0,\epsilon'_1,\dots,\epsilon'_r,\epsilon_{r+1},\epsilon_{r+2},...,\epsilon_{n})\) 下,\(f\) 的度量矩阵为 \(\operatorname{diag}\{\underbrace{1,...,1}_{p},\underbrace{-1,...,-1}_{\operatorname{rk}f-p},0,...,0\}\)

我们可以注意到负号产生的原因是 \(\sqrt{\phantom{-}}\) 要求被开方数非负,而在 \(\mathbb{C}\) 上没有这个限制,故在 \(\mathbb{C}\) 上即为 \(\operatorname{diag}\{\underbrace{1,...,1}_{\operatorname{rk}f},0,...,0\}\)

\(\Box\)

在后面还有进一步的讨论

习题

习题 - 1-1

\(V\)\(\mathbb{P}\) 上一 \(n\) 维线性空间,\(f_1,f_2,\dots,f_k\)\(V\)\(k\) 个线性函数,证明:

  1. \[ W=\{\alpha\in V|f_i(\alpha)=0\}\leqslant V \]

    \(W\)\(f_1,f_2,\dots,f_k\)零化子空间

  2. \(W\leqslant V\), 则存在 \(V\)\(k\) 个线性函数 \(f_1,f_2,\dots,f_k\) 使得 \(W\)\(f_1,f_2,\dots,f_k\) 的零化子空间

  1. 首先,\(\theta\in W\)

    又,若 \(\alpha,\beta\in W\), 即 \(f_i(\alpha)=f_i(\beta)=0,~i=1,2,...,k\)

    \((\forall s,t\in\mathbb{P}),~f_i(s\alpha+t\beta)=sf_i(\alpha)+tf_i(\beta)=0,~i=1,2,...,k\)

    因此 \(W\leqslant V\) 1

    • \(W=V\), 则令 \(f(\alpha)=0,~\forall\alpha\in V\), \(W\)\(f\) 的零化子空间

    • \(W=\{\theta\}\), 则 \(W\)\(L(V,\mathbb{P})\) 的零化子空间

    • \(\dim W=r\in[1,n)\), 取 \(W\) 的一组基 \(\epsilon_0,\epsilon_1,\dots,\epsilon_r\), \(V\) 的一组基 \(\epsilon_0,\epsilon_1,\dots,\epsilon_n\)

      \(f_i(\epsilon_j)=\delta_{ij},~i,j=1,2,...,n\)

      \(f_{r+1},f_{r+2},...,f_{n}\) 构成的零化子空间 \(M\)

      \((\forall\alpha\in W),~\alpha\in M\), 即 \(W\subseteq M\)

      又取 \(\alpha=\sum_{i=1}^nk_i\epsilon_i\in M\), 由 \(f_i(\alpha)=k_i,~i=1,2,...,n\) 可知 \(k_i=0,i=r+1,r+2,...,n\)

      \(\alpha\in W\), 即 \(M\subseteq W\)

      因此 \(W\)\(f_{r+1},f_{r+2},...,f_{n}\) 的零化子空间

\(\Box\)

习题 - 1-2

\(V\) 是复线性空间,\(\dim V\geqslant 2\), \(f\)\(V\) 上一对称双线性函数,证明:

  1. \[ (\exists\theta\ne\zeta\in V),~f(\zeta,\zeta)=0 \]

  2. \(f\) 非奇异,则存在线性无关向量 \(\zeta,\eta\) 使得

    \[ f(\zeta,\eta)=1,f(\zeta,\zeta)=f(\eta,\eta)=0 \]

  1. \(\dim V\geqslant2\) 可知,存在 \(\alpha,\beta\in V\) 使得 \(\alpha,\beta\) 线性无关

    \(f(\alpha,\alpha)=a,f(\beta,\beta)=b\)

    • \(a=0\)\(b=0\), 则命题得证
    • \(a,b\) 均不为 \(0\), 考虑 \[ f(\alpha+t\beta,\alpha+t\beta)=f(\alpha,\alpha)+2tf(\alpha,\beta)+t^2f(\beta,\beta) \] 此时 \(t\) 有根 \(t_1\), 故令 \(\zeta=\alpha+t_1\beta\), 则 \(f(\zeta,\zeta)=0\)
  2. 由 1 知,\((\exists\theta\ne\zeta\in V),~f(\zeta,\zeta)=0\)

    \(\zeta\ne\xi'\in V/\{\theta\}\), 由 \(f\) 非奇异知 \(f(\zeta,\xi')=b\ne0\)

    \(\xi=\displaystyle\frac{\xi'}{b}\)

    • \(f(\xi,\xi)=0\), 则命题得证

    • \(f(\xi,\xi)\ne0\), 考虑 \(f(\xi+t\zeta,\xi+t\zeta)\)

      \(f(\zeta,\xi+t\zeta)=1\)

      由 1 知,\(t\) 有根 \(t_1\) 使得 \(f(\xi+t_1\zeta,\xi+t_1\zeta)=0\)

      \(\eta=\xi+t_1\zeta\) 即可

\(\Box\)

对称双线性度量空间与线性方程组可解的几何解释

说实话,我挺讨厌这种万物都往方程组上靠的做法

对称双线性度量空间

就是有非奇异对称双线性函数的线性空间

特别的,当 \(\mathbb{P}=\mathbb{R}\) 时即称其为伪 Euclidean 空间

显然,这个非奇异对称双线性函数是满秩的,即

命题 - 2-1

\(n\) 维对称双线性度量空间 \(V\) 存在正交基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\), 使得 \(V\) 上的非奇异对称双线性函数 \(f\)

  • \(f(\epsilon_i,\epsilon_i)\ne0,~i=1,2,...,n\)
  • \(f(\epsilon_i,\epsilon_j)=0,~1\leqslant i,j\leqslant n,i\ne j\)

\(\Box\)

正交补空间

在继续讨论线性方程组之前,我们先引入正交补的概念

定义 正交补 (空间)

\(n\) 维对称双线性度量空间 \(V=(V,+,\cdot,\mathbb{P},f)\)\(V_1\leqslant V\), 称

\[ \{\alpha\in V|(\forall\beta\in V_1),~f(\alpha,\beta)=0\} \]

\(V_1\) 的正交补 (空间), 记作 \(V_1^\perp\)

显然 \(V_1^\perp\leqslant V\)

由定义立得

命题 - 2-2

  • \(\dim V_1=0\), 则 \(V_1^\perp=V\)

  • \(\dim V_1=r\geqslant1\), 且 \((\beta_0,\beta_1,\dots,\beta_r)\)\(V_1\) 的一组基,则

    \[ V_1^\perp=\{\alpha\in V|f(\alpha,\beta_i)=0,~i=1,2,...,r\} \]

    \(V_1^\perp\)\(\begin{cases} f(\alpha,\beta_i)=0\\i=1,2,...,r \end{cases}\) 的解集

若令 \(f\) 在基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 下的表示矩阵为 \(A\), \(\beta_0,\beta_1,\dots,\beta_r\) 的坐标分别为 \(B_1,B_2,\dots,B_r,~\alpha\) 的坐标为 \(X\), 则上述方程组可表示为

\[ X^TA(B_1,B_2,\dots,B_r)=\theta \]

另外,\(V_1^\perp\) 与上式的解空间 \(S\) 同构

\(\Box\)

定理 - 2-1

\(V\)\(n\) 维对称双线性度量空间,\(V_1\leqslant V\), 则

  1. \(\dim V_1+\dim V_1^\perp=\dim V\)
  2. \((V_1^\perp)^\perp=V_1\)
证明

\(\dim V_1=0\) 时,易知命题成立

\(\dim V_1=r\geqslant1\) 时,

  1. 只需证 \(\dim S=n-r\)

    \(S\) 即为 \((B_1,B_2,\dots,B_r)^TAX=\theta\) 的解空间 (等式两边取转置)

    \(B=(B_1,B_2,\dots,B_r)^T\), 则 \(\dim S=n-r\iff\operatorname{rk} BA=r\)

    \(\operatorname{rk}B=r\), 由 \(A\) 可逆知 \(\operatorname{rk}BA=\operatorname{rk}B=r\)

    因此 \(\dim S=n-r\)

  2. 由 1 知,\(\dim V_1^\perp=n-r,~\dim~(V_1^\perp)^\perp=r=\dim V_1\)

    \(V_1\subseteq(V_1^\perp)^\perp\)

    \((V_1^\perp)^\perp=V_1\)

\(\Box\)

注意 - 2-1-1

未必有 \(V_1\cap V_1^\perp=\{\theta\}\), 即未必有 \(V=V_1\oplus V_1^\perp\)

如在 \(\mathbb{C}^2\) 上引入 \(f((x_1,y_1),(x_2,y_2))=x_1x_2+y_1y_2\), 显然可构成对称双线性度量空间,而取 \(V_1=G[(1,i)]\), 显然 \(V_1=V_1^\perp\)

\(\Box\)

线性方程组可解的几何解释

进入正题

本节将在 \(n\) 维对称双线性度量空间 \(\mathbb{P}^n(E)\) 中讨论

\[ AX=\theta\tag{2.3.1} \]

\[ AX=B\tag{2.3.2} \]

其中 \(\mathbb{P}^n(E)\) 表示 \(\mathbb{P}^n\) 连同在自然基底下度量矩阵为 \(E\) 的双线性函数 \(f_E\) 所构成的对称双线性度量空间,显然有

\[ f_E([a_1,a_2,\dots,a_n]^T,[b_1,b_2,\dots,b_n]^T)=\sum_{i=1}^na_ib_i \]

  • 齐次线性方程组 \((2.3.1)\) 可记作

    \[ \begin{cases} f_E(A_i^T,X)=0\\ i=1,2,...,m \end{cases} \]

    其中 \(A_i=(a_{i1},a_{i2},...,a_{in}),~i=1,2,...,m\)

    \(V_1=G[A_1^T,A_2^T,...,A_m^T]\), 则上述齐次线性方程组的解空间恰为 \(V_1^\perp\)

  • 非齐次线性方程组 \((2.3.2)\) 有解 \(\iff\operatorname{rk}(A^1,A^2,...,A^n)=\operatorname{rk}(A^1,A^2,...,A^n,B)\iff B\in G[A^1,A^2,...,A^n]\)

    其中 \(A^i=(a_{1i},a_{2i},...,a_{mi})^T,~i=1,2,...,n\)

    考虑 \((2.3.2)\) 的转置齐次线性方程组

    \[ A^TY=\theta\tag{2.3.3} \]

    由上一部分的讨论可知,\((2.3.3)\) 的解空间为 \(G[A^1,A^2,...,A^n]^\perp\)

    \(B\in G[A^1,A^2,...,A^n]\iff B\)\((2.3.3)\) 的解空间正交

    这可以作为一个定理

定理 - 2-2

非齐次线性方程组 \((2.3.2)\) 有解当且仅当 \(B\)\((2.3.3)\) 的解空间正交

\(\Box\)

习题

习题 - 2-1

\(V\)\(\mathbb{P}\) 上一 \(n\) 维线性空间,\(V_1<V,\zeta\notin V_1\), \(f\)\(V\) 上一对称双线性函数,证明:

\[ (\exists0\ne\eta\in V_1+G[\zeta]),(\forall\alpha\in V_1),~f(\eta,\alpha)=0 \]

即证 \(\theta\ne\eta\in(V_1+G[\zeta])\cap V_1^\perp\)

\(\dim V_1=r\), 则 \(\dim(V_1+G[\zeta])=r+1,~\dim V_1^\perp=n-r\)

\(\dim((V_1+G[\zeta])\cap V_1^\perp)\ne0\)

\(\Box\)

euclidean 空间

定义 Euclidean 空间

\(V\) 为实线性空间,若其上一对称双线性函数 \(f\) 满足正定性 , 则称 \(V\) 连同 \(f\) 构成 Euclidean 空间

\(f\)内积 , 记作 \((~,~)\), \(f(\alpha,\beta)\) 可简记为 \((\alpha,\beta)\)

显然 Euclidean 空间是伪 Euclidean 空间

例 - 1

定义 \(f\) 如下:

\[ f(g(x),h(x))=\int_a^bf(x)g(x)\mathrm{d}x \]

易证 \(f\) 是内积,\(C[a,b]\) 连同 \(f\) 构成 Euclidean 空间

向量的长度与夹角 (度量)

Euclidean 空间有一个很好的性质,就是我们可以在其上定义向量的长度,夹角等在直观几何中的概念
这一点即使是在一般的伪 Euclidean 空间都是做不到的

定义 长度

\(V\) 为一 Euclidean 空间,\(\alpha\in V\), 称 \(\sqrt{(\alpha,\alpha)}\)\(\alpha\)长度 , 记作 \(|\alpha|\)


定义 单位向量

假设同上,称 \(\alpha\)单位向量 , 若 \(|\alpha|=1\)

如果 \(\alpha\ne\theta\), 则 \(\displaystyle\frac{\alpha}{|\alpha|}:=\frac{1}{|\alpha|}\alpha\) 为单位向量


在定义夹角之前,我们需要证明 \(\displaystyle\frac{|(\alpha,\beta)|}{|\alpha||\beta|}\leqslant1\)

在高中数学中,这个形式等价于 \(\displaystyle\left|\sum_{i=1}^na_ib_i\right|\leqslant\sqrt{\sum_{i=1}^na_i^2}\sqrt{\sum_{i=1}^nb_i^2}\), 这就是大名鼎鼎的 Cauchy 不等式

到了 Euclidean 空间,我们自然也会考虑是否能将 Cauchy 不等式推广过来

很幸运,这是可行的

定理 - 3-1 (Cauchy-Bunjakovski-Schwarz 不等式)

\(V\) 为一 Euclidean 空间,则对其上任意非零向量 \(\alpha,\beta\), 均有

\[ \frac{|(\alpha,\beta)|}{|\alpha||\beta|}\leqslant1 \]

等号成立当且仅当 \(\alpha,\beta\) 线性相关

若写成 \(|(\alpha,\beta)|\leqslant|\alpha||\beta|\), 则不需限制 \(\alpha,\beta\) 非零

证明

考察 \(\alpha-k\beta,~k\in\mathbb{R}\), 由内积的正定性可得

\[ k^2(\beta,\beta)-2k(\alpha,\beta)+(\alpha,\alpha)\leqslant0 \]

此式表明判别式非正,即 \((\alpha,\beta)^2-(\alpha,\alpha)(\beta,\beta)\leqslant0\)

亦即

\[ \frac{|(\alpha,\beta)|}{|\alpha||\beta|}\leqslant1 \]

\(\alpha,\beta\) 线性相关时,上式等号显然成立
反之,若上式等号成立,则 \((\exists t_0\in\mathbb{R}),~(\alpha-t_0\beta,\alpha-t_0\beta)=0\), 可得 \(\alpha-t_0\beta=0\), 即 \(\alpha,\beta\) 线性相关

\(\Box\)

Cauchy-Bunjakovski-Schwarz 不等式有两个著名的实例

  • \[ \left|\sum_{i=1}^na_ib_i\right|\leqslant\sqrt{\sum_{i=1}^na_i^2}\sqrt{\sum_{i=1}^nb_i^2} \]
  • \[ \left|\int_a^bf(x)g(x)\mathrm{d}x\right|\leqslant\sqrt{\int_a^bf^2(x)\mathrm{d}x}\sqrt{\int_a^bg^2(x)\mathrm{d}x} \]

接下来给出夹角的定义

定义 夹角

\(V\) 为一 Euclidean 空间,\(\alpha,\beta\in V/\{\theta\}\), 称 \(\displaystyle\arccos\frac{(\alpha,\beta)}{|\alpha||\beta|}\in[0,\pi]\)\(\alpha\)\(\beta\)夹角 , 记作 \(\langle\alpha,\beta\rangle\)

接下来我们可以尝试把我们熟知的,与长度和角度相关的几何定理都推广到 Euclidean 空间了 (其实,在 推论 - 3-2 的保障下,我们可以更大胆些)

定理 - 3-2

\(V\) 为一 Euclidean 空间,\(\alpha,\beta\in V\), 则

  1. \(|\alpha+\beta|\leqslant|\alpha|+|\beta|\) (三角不等式)
  2. \((\alpha,\beta)=0\implies|\alpha+\beta|^2=|\alpha|^2+|\beta|^2\) (勾股定理) > 可推广为 > > \[ > ((\forall1\leqslant i,j\leqslant m,i\ne j),~(\alpha_i,\alpha_j)\ne0),~\left|\sum_{i=1}^ma_i\right|^2=\sum_{i=1}^m|\alpha_i|^2 > \]
证明
  1. 定理 - 3-1, \[ |\alpha+\beta|^2=(\alpha,\alpha)+2(\alpha,\beta)+(\beta,\beta)\leqslant|\alpha|^2+2|\alpha||\beta|+|\beta|^2=(|\alpha|+|\beta|)^2 \]
  2. \[ |\alpha+\beta|^2=(\alpha,\alpha)+(\beta,\beta)=|\alpha|^2+|\beta|^2 \]

\(\Box\)

标准正交基底

简单来说,就是满足其所有基向量都是单位向量的一组正交基底

定义 标准正交基底

\(n\) 维 Euclidean 空间上的一组基 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\)标准正交的,若

  • \(|\epsilon_i|=1,~i=1,2,...,n\)
  • \((\epsilon_i,\epsilon_j)=0,~i,j=1,2,...,n,i\ne j\)

容易验证,\(n\) 维 Euclidean 空间存在标准正交基,而且我们还可以将其上任意基底标准正交化

定理 - 3-3 (标准正交化)

\((\alpha_0,\alpha_1,\dots,\alpha_n)\)\(n\) 维 Euclidean 空间上的一组基,则其上存在标准正交基 \((\beta_0,\beta_1,\dots,\beta_n)\) 使得

\[ G[\alpha_0,\alpha_1,\dots,\alpha_i]=G[\beta_0,\beta_1,\dots,\beta_i],~i=1,2,...,n \]

证明

观察定理形式可知是用归纳法证的

该证法也是构造性的

  • \(\beta'_1=\alpha_1\), 则 \(G[\beta'_1]=G[\alpha_1]\)

  • \(\beta'_2=\alpha_2+k\beta'_1\) 使得 \((\beta'_2,\beta'_1)=0\), 可推知当且仅当

    \[ k=-\frac{(\alpha_2,\beta'_1)}{(\beta'_1,\beta'_1)} \]

    时此式成立

    \(\beta'_2=\alpha_2+k\beta'_1=\alpha_2+k\alpha_1\) 可知 \(\beta'_1,\beta'_2\) 线性无关,故 \(G[\beta'_1,\beta'_2]=G[\alpha_1,\alpha_2]\)

  • 假设已找到 \(m<n\) 个两两正交的向量 \(\beta'_0,\beta'_1,\dots,\beta'_m\) 满足条件

    \[ \beta'_{m+1}=\alpha_{m+1}+\sum_{i=1}^mk_i\beta'_i \]

    使得

    \[ (\beta'_{m+1},\beta'_i)=0,~i=1,2,...,m \]

    \[ (\alpha_{m+1},\beta'_i)+k_i(\beta'_i,\beta'_i)=0,~i=1,2,...,m \]

    上式成立当且仅当

    \[ k_i=-{(\alpha_{m+1},\beta'_i)\over(\beta'_i,\beta'_i)},~i=1,2,...,m \]

    又可知 \(\beta'_{m+1}\)\(\alpha_0,\alpha_1,\dots,\alpha_{m+1}\) 的线性组合,\(\beta'_{m+1}\ne\theta\)

    因此 \(G[\alpha_0,\alpha_1,\dots,\alpha_{m+1}]=G[\beta'_0,\beta'_1,\dots,\beta'_{m+1}]\)

因此我们可以找到一组正交基 \((\beta'_0,\beta'_1,\dots,\beta'_n)\) 满足

\[ G[\alpha_0,\alpha_1,\dots,\alpha_i]=G[\beta'_0,\beta'_1,\dots,\beta'_i],~i=1,2,...,n \]

上述过程即 Schmidt 正交化

又令 \(\beta_i=\displaystyle\frac{1}{|\beta'_i|}\beta'_i,~i=1,2,...,n\), 命题即得证

\(\Box\)

应用 定理 - 3-3 的方法即可将任意基底标准正交化

此方法本质上还是矩阵乘法

推论 - 3-1

\((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\)\(n\) 维 Euclidean 空间 \(V\) 的一组标准正交基,则

  • \(V\) 的内积的度量矩阵为 \(E\)
  • \(\alpha,~\beta\in V\) 在其上的坐标分别为 \(A=(a_1,a_2,\dots,a_n)^T,~B=(b_1,b_2,\dots,b_n)^T\), 则 \[ (\alpha,\beta)=\sum_{i=1}^na_ib_i=A^TB \]

\(\Box\)

接下来是一个与内积证明和性质有关的定理

定理 - 3-4

\(V\)\(n\) 维实线性空间,\(f\)\(V\) 上一双线性函数,则下列命题等价:

  1. \(f\)\(V\) 上的内积
  2. \(f\)\(V\) 的任意基底下的度量矩阵 \(A\) 正定,即存在可逆矩阵 \(P\) 使得 \(A=P^TP\)
  3. \(f\)\(V\) 的某一基底下的度量矩阵 \(A\) 正定
证明

\(1\implies2:\)

可知 \(V\) 连同 \(f\) 构成 Euclidean 空间

故由 推论 - 3-1 可知,存在标准正交基 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\) 使得 \(f\) 的度量矩阵为 \(E\)

任取 \(V\) 上一组基底 \((\eta_0,\eta_1,\dots,\eta_n)=(\epsilon_0,\epsilon_1,\dots,\epsilon_n)Q\), 易知 \(Q\) 可逆,则 \(f\) 在该基底下的度量矩阵 \(A=Q^TEQ=Q^TQ\)

\(2\implies3:\) 显然

\(3\implies1:\)

不妨设该基底为 \((\eta_0,\eta_1,\dots,\eta_n)\)

假设 \(f\) 在该基底下的度量矩阵为 \(A=Q^TQ=Q^TEQ\), 则 \(E=(Q^{-1})^TAQ^{-1}\)

故存在基底 \((\epsilon_0,\epsilon_1,\dots,\epsilon_n)=(\eta_0,\eta_1,\dots,\eta_n)Q^{-1}\) 使得 \(f\) 的度量矩阵为 \(E\)

显然 \(f\) 是对称正定双线性函数,即 \(f\)\(V\) 上的内积

\(\Box\)

Euclidean 空间的同构

定义 Euclidean 空间同构映射

\(V,V'\) 为两个 Euclidean 空间,称 \(V\)\(V'\) 的同构映射 \(f\)\(V\)\(V'\)Euclidean 空间同构映射 , 若

\[ (\forall\alpha,\beta\in V),~(f(\alpha),f(\beta))=(\alpha,\beta) \]

此时,称 \(V\)\(V'\) 是同构的

显然这个同构也是等价关系

定理 - 3-5

两有限维 Euclidean 空间 \(V,V'\) 同构当且仅当 \(\dim V=\dim V'\)

证明

\(\implies\): 显然

\(\impliedby\):

只需证 \(n\) 维 Euclidean 空间 \(V\) 同构于 \(\mathbb{R}^n\)

\((\epsilon_0,\epsilon_1,\dots,\epsilon_n)\)\(V\) 的一组标准正交基,建立映射

\[ f_{\{\epsilon_i\}_{i=1}^n}:\alpha\mapsto(x_1,x_2,\dots,x_n)^T\in\mathbb{R}^n,~\alpha=\sum_{i=1}^nx_i\epsilon_i\in V \]

易知 \(f_{\{\epsilon_i\}_{i=1}^n}\)\(V\)\(\mathbb{R}^n\) 的线性同构映射

任取 \(\alpha=\sum_{i=1}^nx_i\epsilon_i,\beta=\sum_{i=1}^ny_i\epsilon_i\), 均有

\[ \begin{aligned} (\alpha,\beta)&=\sum_{i=1}^nx_iy_i\\ &=((x_1,x_2,\dots,x_n)^T,(y_1,y_2,\dots,y_n)^T)\\ &=(f_{\{\epsilon_i\}_{i=1}^n}(\alpha),f_{\{\epsilon_i\}_{i=1}^n}(\beta)) \end{aligned} \]

\(\Box\)

基于这个定理,我们有一个重要且有用的推论

推论 - 3-2

在 Euclidean 空间中,所有关于两个或三个向量的命题均可在三维直观几何空间验证

证明

在 Euclidean 空间中,两个或三个向量可生成维数不超过 3 的 Euclidean 空间,由 定理 - 3-5 可知其与三维直观几何空间或其子空间同构

而 Euclidean 空间中的命题均可只用空间说的加法,实数乘和内积描述,因此只需在三维直观几何空间中验证就行

\(\Box\)


在本章的最后,我们另给出一组定理

定理 - 3-6

\(V\) 为一 \(n\) 维 Euclidean 空间,\(\alpha_0,\alpha_1,\dots,\alpha_m\in V\), 则有如下平行的事实

  1. \(\alpha_i\ne\theta,~(\alpha_i,\alpha_j)=0,~i,j=1,2,...,m,~i\ne j\), 则 \(m\leqslant n\)
  2. \((\alpha_i,\alpha_j)<0,~i,j=1,2,...,m,~i\ne j\), 则 \(m\leqslant n+1\)
  3. \((\alpha_i,\alpha_j)>0,~i,j=1,2,...,m,~i\ne j\), 则不存在映射 \(f:\mathbb{Z}^+\to\mathbb{Z}^+\) 满足 \(m\leqslant f(n)\)

又在线性相关的角度,我们可以注意到更深刻的事实

  1. 条件蕴含 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关
  2. 条件蕴含 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 的任意真子组线性无关
证明
  1. \(\exists k_i\in\mathbb{R},~i=1,2,...,m,~s.t.~\displaystyle\sum_{i=1}^mk_i\alpha_i=\theta\)

    \[ k_j(\alpha_j,\alpha_j)=-(\alpha_j,\sum_{i=1,~i\ne j}^mk_i\alpha_i)=0,~j=1,2,...,m \]

    \((\alpha_j,\alpha_j)>0\), 故 \(k_j=0,~j=1,2,...,m\)

    因此 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关

    因此 \(m\leqslant n\)

  2. 不妨设 \(m=n+2\)

    \[ \exists k_i\in\mathbb{R},~i=1,2,...,n+1,\sum_{i=1}^{n+1}k_i^2\ne0,~s.t.~\sum_{i=1}^{n+1}k_i\alpha_i=\theta \]

    此时 \((\alpha_{n+2},\sum_{i=1}^{n+1}k_i\alpha_i)=0\)

    此式说明 \(k_0,k_1,\dots,k_{n+1}\) 中有正有负,不妨设

    \[ k_i>0,k_j<0,~i=1,2,...,s,~j=s+1,s+2,...,t,~1\leqslant s<t\leqslant n+1 \]

    \(\sum_{i=1}^sk_i\alpha_i=-\sum_{i=s+1}^tk_i\alpha_i\)

    \[ (\sum_{i=1}^sk_i\alpha_i,-\sum_{i=s+1}^tk_i\alpha_i)=-\sum_{i=1}^s\sum_{j=s+1}^t(k_i\alpha_i,k_j\alpha_j)<0 \]

    这与点积的正定性矛盾,故 \(m\leqslant n+1\)

    类似地,我们可证明 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 的任意真子组线性无关

    只需证 \(\alpha_0,\alpha_1,\dots,\alpha_{m-1}\) 线性无关

    \(\exists k_i\in\mathbb{R},~i=1,2,...,m-1,~s.t.~\displaystyle\sum_{i=1}^{m-1}k_i\alpha_i=\theta\)

    此时 \((\alpha_m,\sum_{i=1}^{m-1}k_i\alpha_i)=0\)

    此式说明要么 \(k_0,k_1,\dots,k_{m-1}\) 中有正有负,要么 \(k_0,k_1,\dots,k_{m-1}\) 均为 \(0\)

    • 若情况为后者,则命题得证

    • 若情况为前者,不妨设

      \[ k_i>0,k_j<0,~i=1,2,...,s,~j=s+1,s+2,...,t,~1\leqslant s<t\leqslant m-1 \]

      \(\sum_{i=1}^sk_i\alpha_i=-\sum_{i=s+1}^tk_i\alpha_i\)

      \[ (\sum_{i=1}^sk_i\alpha_i,-\sum_{i=s+1}^tk_i\alpha_i)=-\sum_{i=1}^s\sum_{j=s+1}^t(k_i\alpha_i,k_j\alpha_j)<0 \]

      这与点积的正定性矛盾,故情况只能为后者

  3. 由条件知 \(\alpha_i\ne\theta,i=1,2,...,m\)

    假设 \(f\) 存在

    • \(n=1\) 时,\(\alpha_0,\alpha_1,\dots,\alpha_m\) 中任意两个向量均线性相关,不妨设
      \(\alpha_i=k_i\alpha_1,~i=1,2,3,...m\), 显然 \(k_1=1\)

      假设 \(f(1)\in\mathbb{Z}^+\), 令 \(m=f(1)\), \(k\in\mathbb{Z}^+/\{k_1,k_2,\dots,k_m\}\), \(\beta=k\alpha_1\)

      \((\beta,\alpha_i)=kk_i(\alpha_1,\alpha_1)>0,~i=1,2,...,m\)

      即满足条件的向量组长度至少为 \(f(1)+1\), 与 \(m\leqslant f(n)\) 矛盾!

      因此 \(1\notin D(f)\)

    • \(n\geqslant2\) 时,\(\alpha_0,\alpha_1,\dots,\alpha_m\) 中存在两向量线性无关,设其为 \(\alpha'_1,\alpha'_2\)

      假设 \(f(n)\in\mathbb{Z}^+\), 令 \(m=f(n)\)

      \(\beta_k=\alpha'_1+k\alpha'_2,~k=1,2,...,m\), 则其中必有一向量 \(\beta_{k'}\) 满足 \(\beta_{k'}\ne\alpha_i,~i=1,2,...,m\)

      此时有 \((\beta_{k'},\alpha_i)=(\alpha'_1,\alpha_i)+k'(\alpha'_2,\alpha_i)>0,~i=1,2,...,m\)

      即满足条件的向量组长度至少为 \(f(n)+1\), 与 \(m\leqslant f(n)\) 矛盾!

      因此 \(n\notin D(f)\)

    因此 \(D(f)=\varnothing\), \(f\) 不存在

\(\Box\)

习题

习题 - 3-1

\(V\) 为一 \(n\) 维 Euclidean 空间,\(\alpha\)\(V\) 中一向量,证明:

  1. \(f(\beta)=(\beta,\alpha)\) 定义 \(V\) 上一线性函数
  2. \(g(\eta):=(\eta,\beta),~\beta\ne\alpha\), 则 \(f\ne g\)
  3. 对于 \(V\) 上任一线性函数 \(f\), 都存在向量 \(\alpha\), 使得 \(f\) 可由 \(f(\eta)=(\eta,\alpha)\) 定义
  1. 显然

  2. \(f=g\), 则 \((f-g)(\alpha-\beta)=(\alpha-\beta,\alpha-\beta)=0\), 矛盾

  3. 任取 \(V\) 上一组基 \(\epsilon_0,\epsilon_1,\dots,\epsilon_n\), 设 \(f(\epsilon_i)=t_i,~i=1,2,...,n\)

    考虑方程组

    \[ \begin{bmatrix} (\epsilon_1,\epsilon_1)&(\epsilon_1,\epsilon_2)&...&(\epsilon_1,\epsilon_n)\\ (\epsilon_2,\epsilon_1)&(\epsilon_2,\epsilon_2)&...&(\epsilon_2,\epsilon_n)\\ \vdots&\vdots&\ddots&\vdots\\ (\epsilon_n,\epsilon_1)&(\epsilon_n,\epsilon_2)&...&(\epsilon_n,\epsilon_n)\\ \end{bmatrix}\begin{bmatrix} k_1\\k_2\\\vdots\\k_n \end{bmatrix}=\begin{bmatrix} t_1\\t_2\\\vdots\\t_n \end{bmatrix} \]

    \(((\epsilon_i,\epsilon_j))_{n\times n}\) 的正定性可知方程组有唯一解,令 \(\alpha=\displaystyle\sum_{i=1}^nk_i\epsilon_i\)

    \((\epsilon_i,\alpha)=t_i=f(\epsilon_i)\)

    从而 \((\forall\eta\in V),~f(\eta)=(\eta,\alpha)\)

\(\Box\)

向量到子空间的距离与线性方程组的最小二乘法

若无明确说明,本章内容均在有限维 Euclidean 空间内进行讨论

向量在子空间的正射影

我们在 定理 - 2-1 得知 \(\dim V_1+\dim V_1^\perp=\dim V\), 而如果 \(V\)\(n\) 维 Euclidean 空间,我们有更进一步的结论

定理 - 4-1

\(V\) 为一 \(n\) 维 Euclidean 空间,则 \(\forall V_1\leqslant V\), 均有

\[ V=V_1\oplus V_1^\perp \]

证明

\(\alpha\in V_1\cap V_1^\perp\), 则 \((\alpha,\alpha)=0\), 由内积的正定性可得 \(\alpha=\theta\), 因此 \(V_1\cap V_1^\perp=\{\theta\}\)

\(V_1+V_1^\perp\subseteq V\), \(\dim V_1+\dim V_1^\perp=\dim V\)

因此 \(V=V_1\oplus V_1^\perp\)

\(\Box\)

有了这个定理,我们就可在 Euclidean 空间定义正射影了

定义 正射影

\(V\) 为一 \(n\) 维 Euclidean 空间,\(V_1\leqslant V\), 则 \(\forall\alpha\in V_1,~\alpha\) 均有唯一分解

\[ \alpha=\alpha_1+\alpha_2,~\alpha_1\in V_1,\alpha_2\in V_1^\perp \]

\(\alpha_1\)\(\alpha\)\(V_1\) 上的正射影

向量到子空间的距离

定义 向量间距离

\(V\) 为一 \(n\) 维 Euclidean 空间,\(\alpha,\beta\in V\), 称 \(d(\alpha,\beta):=|\alpha-\beta|\)\(\alpha\)\(\beta\)距离

类似在直观几何空间中的距离,Euclidean 空间中的距离也有如下性质

  • \((\forall\alpha,\beta\in V),~d(\alpha,\beta)=d(\beta,\alpha)\)
  • \((\forall\alpha,\beta\in V),~d(\alpha,\beta)\geqslant0\), 等号成立当且仅当 \(\alpha=\beta\)
  • \((\forall\alpha,\beta,\gamma\in V),~d(\alpha,\beta)\leqslant d(\alpha,\gamma)+d(\beta,\gamma)\) (三角不等式)

在三维直观几何空间中,一点到一平面的最短距离即是该点到垂足的连线,在 Euclidean 空间中表现为

定理 - 4-2

\(V\) 为一 \(n\) 维 Euclidean 空间,\(V_1\leqslant V,\alpha\in V\), \(\alpha_1\in V_1\)\(\alpha\)\(V_1\) 上的正射影,则

\[ (\forall\beta\in V_1,\beta\ne\alpha_1),~d(\alpha,\alpha_1)<d(\alpha,\beta) \]

证明

\(\alpha-\beta=(\alpha-\alpha_1)+(\alpha_1-\beta),~\alpha_1-\beta\in V_1,\alpha-\alpha_1\in V_1^\perp\)
\(|\alpha-\beta|^2=|\alpha-\alpha_1|^2+|\alpha_1-\beta|^2\)

\(|\alpha_1-\beta|^2>0\) 可知 \(|\alpha-\beta|^2>|\alpha-\alpha_1|^2\)

因此 \(d(\alpha,\alpha_1)<d(\alpha,\beta)\)

\(\Box\)

因此,我们可在 Euclidean 空间下定义向量到子空间的距离

定义 向量到子空间的距离

假设如 定理 - 4-2, 称 \(d(\alpha,\alpha_1)\)\(\alpha\)\(V_1\)距离


我们要求向量到子空间的距离,只需要求向量到正射影的距离即可

接下来将会给出正射影的求法

首先我们需要定义一个特殊矩阵

定义 Gram 矩阵

\(V\) 为一 \(n\) 维 Euclidean 空间,\(\alpha_0,\alpha_1,\dots,\alpha_m\in V\), 称

\[ ((\alpha_i,\alpha_j))_{m\times m} \]

\(\alpha_0,\alpha_1,\dots,\alpha_m\)Gram 矩阵 , 记作 \(G(\alpha_0,\alpha_1,\dots,\alpha_m)\)

接下来我们就可以给出做法了

定理 - 4-3

\(V\) 为一 \(n\) 维 Euclidean 空间,\(V_1=G[\alpha_0,\alpha_1,\dots,\alpha_m]\leqslant V\), \(\alpha\in V\), \(X=(x_1,x_2,\dots,x_m)^T\in\mathbb{R}^m\)

\[ \gamma=(\alpha_0,\alpha_1,\dots,\alpha_m)X=\sum_{i=1}^mx_i\alpha_i\tag{4-3.1} \]

\(\alpha\)\(V_1\) 上的正射影当且仅当

\[ G(\alpha_0,\alpha_1,\dots,\alpha_m)X=((\alpha,\alpha_0),(\alpha,\alpha_1),\dots,(\alpha,\alpha_m))^T\tag{4-3.2} \]

证明

显然 \(\alpha\) 的正射影 \(\gamma\) 一定存在,则

\[ \begin{aligned} (\text{4-3.1})&\iff \left(\alpha-\sum_{i=1}^mx_i\alpha_i\right)\in V_1^\perp\\ &\iff 0=(\alpha_j,\alpha-\sum_{i=1}^mx_i\alpha_i)=(\alpha,\alpha_j)-\sum_{i=1}^mx_i(\alpha_j,\alpha_i),~j=1,2,...,m\\ &\iff G(\alpha_0,\alpha_1,\dots,\alpha_m)X=((\alpha,\alpha_0),(\alpha,\alpha_1),\dots,(\alpha,\alpha_m))^T \end{aligned} \]

\(\Box\)

这里补充一点,定理 - 4-3 条件里并未限制 \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关

  • \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关,则 \(G(\alpha_0,\alpha_1,\dots,\alpha_m)\) 即为内积在 \(V_1\) 的度量矩阵,则 \(G(\alpha_0,\alpha_1,\dots,\alpha_m)\) 是正交矩阵,\(|G(\alpha_0,\alpha_1,\dots,\alpha_m)|\ne0\), 因此方程 \((\text{4-3.2})\) 的解唯一
    • \(\alpha_0,\alpha_1,\dots,\alpha_m\) 是一组标准正交基,则 \(G(\alpha_0,\alpha_1,\dots,\alpha_m)=E\), 此时 \[ X=((\alpha,\alpha_0),(\alpha,\alpha_1),\dots,(\alpha,\alpha_m))^T \]
  • \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性相关,则 \(X\) 的解显然不唯一

最小二乘法

这是个很有用的理论,不过放到这有点突兀,姑且当作前面内容的应用吧

在实际应用中,线性方程组 \(AX=B,~A\in\mathbb{R}^{m\times n}\) 由于测量精度等原因往往无解,即

\[ \sum_{i=1}^n(b_1-\sum_{j=1}^na_{ij}x_j)^2\ne0\tag{4.1} \]

此时,我们则需要寻找一组实数 \(x_1,x_2,\dots,x_n\) 使得式 \((4.1)\) 左端的值最小
这样的 \(x_1,x_2,\dots,x_n\) 即为 \(AX=B\)最小二乘解

下面我们将在 \(m\) 维 Euclidean 空间讨论该问题

\(A\) 按列分块,\(A=(\alpha_0,\alpha_1,\dots,\alpha_n),~\alpha_i\in\mathbb{R}^m,i=1,2,...,n\)

\[ AX=\sum_{i=1}^nx_i\alpha_i\in G[\alpha_0,\alpha_1,\dots,\alpha_n]\leqslant\mathbb{R}^m \]

而式 \((4.1)\) 左端用内积的语言描述即为

\[ (B-\sum_{i=1}^nx_i\alpha_i,B-\sum_{i=1}^nx_i\alpha_i)=|B-\sum_{i=1}^nx_i\alpha_i|^2\tag{4.2} \]

要使式 \((4.2)\) 的值最小,只需 \(d(B,\sum_{i=1}^nx_i\alpha_i)\) 最小

此时取的 \(x_1,x_2,\dots,x_n\) 即要使 \(\sum_{i=1}^nx_i\alpha_i\)\(B\)\(G[\alpha_0,\alpha_1,\dots,\alpha_n]\) 的正射影

这样的 \(x_1,x_2,\dots,x_n\) 是且仅是

\[ G(\alpha_0,\alpha_1,\dots,\alpha_n)X=((B,\alpha_0),(B,\alpha_1),\dots,(B,\alpha_n))^T\tag{4.3} \]

的解

\[ G(\alpha_0,\alpha_1,\dots,\alpha_n)=A^TA \]

\[ ((B,\alpha_0),(B,\alpha_1),\dots,(B,\alpha_n))^T=A^TB \]

因此式 \((4.3)\) 即为

\[ A^TAX=A^TB\tag{4.4} \]

由正射影的存在性可知该方程一定可解,其解为 \(X=(A^TA)^{-1}A^TB\)

\((4.4)\) 的可解性也可通过 \(\operatorname{rk}(A^TA)=\operatorname{rk}((A^TA,A^TB))\) 推得
(注意到 \(\forall A\in\mathbb{R}^{m\times n},AX=0\)\(A^TAX=0\) 同解)

习题

习题 - 4-1

\(V\) 为一 \(n\) 维 Euclidean 空间,\(\alpha_0,\alpha_1,\dots,\alpha_m\in V\), 证明:
\(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关当且仅当 \(|G(\alpha_0,\alpha_1,\dots,\alpha_m)|\ne0\)

  • \(\impliedby\):

    \(\displaystyle\sum_{i=1}^nk_i\alpha_i=\theta\)

    \(\displaystyle\sum_{i=1}^nk_i(\alpha_j,\alpha_i)=0,~j=1,2,...,n\)

    \[ G(\alpha_0,\alpha_1,\dots,\alpha_n)(k_1,k_2,\dots,k_n)^T=O\tag{4-1.1} \]

    \(|G(\alpha_0,\alpha_1,\dots,\alpha_m)|\ne0\) 知该方程只有零解

    \(\alpha_0,\alpha_1,\dots,\alpha_m\) 线性无关

  • \(\implies\):

    假设 \(|G(\alpha_0,\alpha_1,\dots,\alpha_m)|=0\), 则方程 \((\text{4-1.1})\) 有非零解

    \((\sum_{i=1}^nk_i\alpha_i,\alpha_j)=0,~j=1,2,...,n\)

    可得 \((\sum_{i=1}^nk_i\alpha_i,\sum_{i=1}^nk_i\alpha_i)=0\)

    因此 \(\sum_{i=1}^nk_i\alpha_i=0\), 与条件矛盾

\(\Box\)


参考资料

  • 高等代数教程 / 郭聿琦,岑嘉评,王正攀编著. —— 北京:科学出版社,2014. 7