距离与范数

本章主要首先介绍距离空间的概念、性质。在此基础上介绍范数以及赋范线性空间、Hilbert空间的概念与性质。并介绍向量空间、矩阵空间上的一些范数,进一步引入矩阵谱半径、条件数的概念以及其相关应用。

§1 范数与赋范空间,内积与向量范数 §2 矩阵范数* §3 矩阵的谱半径、矩阵的条件数及应用#

  • 1.范数与赋范空间。从距离概念开始引入范数的概念,进一步引入赋范空间并介绍赋范空间的一些性质。
  • 2.Hilbert空间、正交系。本节主要介绍一类特殊的线性赋范空间——Hilbert空间,该空间上范数是有内积诱导的。并介绍Hilbert空间上的标准正交系以及标准正交系下的元素坐标表示。
  • 3.向量范数、矩阵范数。本节主要介绍n维向量空间、n维矩阵空间上的一些范数,以及各类范数之间的关系。
  • 4.矩阵谱半径。本节主要介绍矩阵谱半径的概念,以及矩阵级数的敛散性与谱半径的关系。
  • 5.矩阵条件数。本节主要介绍矩阵条件数的概念,以及矩阵条件数在误差估计中的应用。

距离与距离空间

根据距离去定义极限,完备性

线性空间,范数,赋范线性空间,完备的赋范线性空间空间,Banach空间

向量与矩阵范数,酉矩阵,算子范数,谱范数,相容性

矩阵的谱半径,矩阵序列、矩阵级数,矩阵的条件数

距离和距离空间

抽象数学把集合叫做空间,从一个啥也不是的集合,到有优秀性质的空间,中间还有一些概念需要解决。

从欧几里得距离,抽象出距离的概念,定义了距离的集合就是距离空间。

微积分是高等算术,用来计算各种曲线、曲面,微积分是以极限为基础的,而极限就是在表达两个东西的距离足够近。

因此定义了距离,就可以把微积分里的极限模拟到抽象距离空间里。

有了极限就可以去谈收敛的问题,微分、积分都是在极限存在(收敛)下的一个极限表达式的记号。在集合上一个点列有可能收敛到集合外去,这就引出了空间的完备问题。任意 Cauchy 列在空间内收敛,就称空间完备。

范数

距离是衡量两个元素之间的关系。范数是单个元素的性质。

范数模拟了几何里长度的概念。定义了范数的线性空间称为赋范线性空间。一个线性空间如果定义了范数,那么可以利用范数来简介衡量两个元素的距离。

完备的赋范线性空间空间称为 Banach 空间。

范数有很多种,因此有了范数等价问题。范数等价保证了向量序列的收敛性与范数选取无关。

什么是长度?欧式长度是一个范数。

补充

在讨论范数的时候,就不再谈论抽象空间了。因为选定基后,抽象空间已经同构一个 \(\mathbb{C}^n\) 上的空间。因此讨论范数只考虑同构的 \(\mathbb{C}^n\) 或 \(\mathbb{R}^n\) 空间的范数即可。

因此也可以发现,范数的值是和坐标相关的。

向量范数

\[x = [ x_1, x_2, \cdots , x_n ]^T \in \mathbb{C}^n\]
  • 1范数 \(\Vert \boldsymbol{x} \Vert_1 = \Sigma_{k=1}^n \vert x_k \vert\)
  • 2范数 \(\Vert \boldsymbol{x} \Vert_2 = \sqrt{\Sigma_{k=1}^n \vert x_k \vert^2 } = \sqrt{\boldsymbol{x}^H \boldsymbol{x}}\)
  • ∞范数 \(\Vert \boldsymbol{x} \Vert_\infty = \max \vert x_i \vert\)
  • p范数
\[\Vert \boldsymbol{x} \Vert_p = \left [ \sum_{i=1}^n \vert x_i \vert ^p \right ] ^{\frac{1}{p}}\]

矩阵范数

向量是个 \(n \times 1\) 矩阵,把向量范数推广一下,可以直接定义出矩阵范数:满足一些条件的一个映射 \(\Vert \centerdot \Vert : \mathbb{C}^{n \times n} \to \mathbb{R}\)。

一些直接定义出来的范数的例子:

  • \(m1\) 范数 \(\Vert \boldsymbol{A} \Vert_{m_1} = \Sigma\Sigma \vert a_{ij} \vert\)
  • \(F\) 范数 \(\Vert \boldsymbol{A} \Vert_{F} = \sqrt { \Sigma\Sigma \vert a_{ij} \vert^2 }\)
  • \(m\infty\) 范数 \(\Vert \boldsymbol{A} \Vert_{m_\infty} = n \max \vert a_{ij} \vert\)

F范数的酉不变性

矩阵范数和向量范数的相容性

相容的代数定义:向量 \(\boldsymbol{x} \in \mathbb{C}^n\),矩阵 \(\boldsymbol{A} \in \mathbb{C}^{ n \times n}\),若 \(\Vert \boldsymbol{Ax} \Vert_a \le \Vert \boldsymbol{A} \Vert_m \Vert \boldsymbol{x} \Vert_a\) 则称 向量函数 和矩阵范数相容。

其含义为向量 \(\boldsymbol{x}\) 的长度为 \(\Vert \boldsymbol{x} \Vert_a\) 。矩阵 \(\boldsymbol{A}\) 作用后的新向量为 \(\boldsymbol{Ax}\) ,其长度为 \(\Vert \boldsymbol{Ax} \Vert_a\)

空间里任一向量变换后的长度都在一个确定的有界范围内。

这个矩阵范数是存在的,并且有

\[\frac{\Vert \boldsymbol{Ax} \Vert_a}{\Vert \boldsymbol{x} \Vert_a} \le \Vert \boldsymbol{A} \Vert_m\]

算子范数

如何找出上面这个范数呢?既然是任意向量,那么就找个特殊的 \(\Vert \boldsymbol{x} \Vert = 1\)

\[\Vert \boldsymbol{Ax} \Vert_a \le \Vert \boldsymbol{A} \Vert_m\]

大于左边最大的就行。找个最小的上界,令做一个范数:

\[\Vert \boldsymbol{A} \Vert_m = \max_{ \Vert \boldsymbol{x} \Vert = 1 } \Vert \boldsymbol{Ax} \Vert\]

这个范数是由向量导出的范数,诱导范数。矩阵也是个算子,更好听的名字:算子范数。

一些算子范数

  • \(\Vert \boldsymbol{A} \Vert_1 = \max_j \sum_{i=1}^n \vert a_{ij} \vert\) 极大列和范数
  • \(\Vert \boldsymbol{A} \Vert_2 = \sqrt{\lambda_1}\) 谱范数
  • \(\Vert \boldsymbol{A} \Vert_\infty = \max_i \sum_{i=1}^n \vert a_{ij} \vert\) 极大行和范数

任何向量范数都存在相容的矩阵范数。

谱范数

矩阵谱半径

矩阵级数

矩阵的条件数

对于矩阵方程 \(\boldsymbol{Ax} = \boldsymbol{b}\) ,如果对系数矩阵有一个小的扰动 \(\delta \boldsymbol{A}\) ,使得解 \(\boldsymbol{x}\) 只有小的扰动,那么这个矩阵性质比较好,称为"良态"的。

条件数就是衡量误差(即 \(\delta \boldsymbol{A}\) )经过矩阵 \(\boldsymbol{A}\) 之后,扩大为 \(\boldsymbol{x}\) 误差的程度。

举个例子原矩阵方程 \(\boldsymbol{Ax} = \boldsymbol{b}\) ,系数矩阵和常向量都有小扰动为 \(\delta \boldsymbol{A}\) ,\(\delta \boldsymbol{b}\),方程变为

\[(\boldsymbol{A} + \delta \boldsymbol{A})\hat{\boldsymbol{x}} = \boldsymbol{b} + \delta\boldsymbol{b}\]

衡量解的相对误差:

\[\frac{ \Vert \boldsymbol{x} - \hat{\boldsymbol{x}} \Vert }{ \Vert \boldsymbol{x} \Vert } \le \frac{ \text{cond} (\boldsymbol{A}) }{ 1 - \text{cond} (\boldsymbol{A}) \frac{ \Vert \delta \boldsymbol{A} \Vert }{ \Vert \boldsymbol{A} \Vert } } \left ( \frac{ \Vert \delta \boldsymbol{A} \Vert }{ \Vert \boldsymbol{A} \Vert } + \frac{ \Vert \delta \boldsymbol{b} \Vert }{ \Vert \boldsymbol{b} \Vert } \right)\]

对于求矩阵的 \(\boldsymbol{A}^{-1}\),也会有误差,衡量公式

\[\frac{ \Vert \boldsymbol{A}^{-1} - ( \boldsymbol{A} + \delta \boldsymbol{A} )^{-1} \Vert }{ \Vert \boldsymbol{A}^{-1} \Vert } \le \frac{ \text{cond} (\boldsymbol{A}) }{ 1 - \text{cond} (\boldsymbol{A}) \frac{ \Vert \delta \boldsymbol{A} \Vert }{ \Vert \boldsymbol{A} \Vert } }\]

里面的 \(\text{cond} (\boldsymbol{A})\) 就是条件数,计算方法

\[\text{cond} (\boldsymbol{A}) = \Vert \boldsymbol{A} \Vert \Vert \boldsymbol{A}^{-1} \Vert\]