无穷理论(一)连根式与连分数

大家好,这篇文章我们来讲下连根式和连分数.

连根式和连分数可以看作是一个极限的过程,但是在这里不详细讲解极限了.

连根式

我们都知道,连根式中分为两种,在这里我们依次讲解.

可换元法求解的连根式

这类连根式类似于无理方程,例如

$${\sqrt{6+\sqrt{6+\sqrt{6+\sqrt{6+\sqrt{\cdots}}}}}}=?$$

先设上式为 \(t\)

即为求 \(t\) 的值

等式平方,即

$$6+{\sqrt{6+\sqrt{6+\sqrt{6+\sqrt{\cdots}}}}}=t^{2} {}$$

注意到两式中都有

$${\sqrt{6+\sqrt{6+\sqrt{6+\sqrt{\cdots}}}}}$$

因此

$$6+t=t^{2}$$

通过一元二次方程求根公式,可解.

$$t_{1}=3,t_{2}=-2$$

由于二次根式的非负性,故\(-2\)舍去.

以上题目可以有些读者会问,\(t^{2}\)一式不是少了个根号吗,怎么会相等?

具体我们下一节讲.

无穷理论

首先我们要知道,比较集合数量大小的无穷基数用 \(\aleph\) 相关的符号表示.

概念

选择公理

选择公理(Axiom of Choice,缩写AC)是数学中的一条集合论公理,以下用一个较简单的描述:

选择公理
设C为一个由非空集合所组成的集合。那么,我们可以从每一个在C中的集合中,都选择一个元素和其所在的集合配成有序对来组成一个新的集合.
序数

序数,为集合论基本概念之一,是日常使用的第一、第二等表示次序的数的推广。序数概念是建立在良序集概念之上的,而良序集又是偏序集、全序集的特殊情形.

(更多见集合论【第一讲】)

全序集

设\((A,\leq)\)是偏序集,如果\((A,\leq)\)中的关系“\(\leq\)”满足条件:对于任意的\(a, b \in A\),\(a \leq b\) 或 \(b \leq a\) 至少有一个成立,那么就称关系“\(\leq\)”为序关系,称\(A\)为在这个关系下的全序集(也称有序集).

良序集

设集合\((S,\leq)\)为一全序集,\(\leq\)是其全序关系,若对任意的S的非空子集,在其序下都有极小元,则称\(\leq\)为良序关系,\((S,\leq)\)为良序集.

全序关系

在数学中,集合 \(X\) 上的全序关系(Total order),简称全序、又名线性序(linear order)、简单序(simple order),或(非严格)排序((non-strict) ordering),是在 \(X\) 上的反对称的、传递的和完全的任何二元关系.

偏序集

设\(R\)是集合\(A\)上的一个关系,如果\(R\)是自反的、反对称的和可传递的,则称R是集合A的偏序关系,简称偏序,记作“\(\leq\)”。对于\((a,b) \in R\),就把它表示成\(a \leq b\)。
若在集合\(A\)上给定一个偏序关系\(\leq\),则称集合\(A\)按偏序关系\(\leq\)构成一个偏序集合,集合A和偏序R一起称为偏序集,记作\((A,\leq)\).

等价类

在离散数学中,等价关系是指定义在集合A上的关系,满足自反的、对称的和传递的等性质。设R是定义在集合\(A\)上的等价关系,与\(A\)中一个元素\(a\)有关系的所有元素的集合叫做\(a\)的等价类。等价类应用十分广泛,如在编程语言中,我们使用等价类来判定标识符是不是表示同一个事物.

超限序数

大于有限数的序数也称作超限序数

有限序数

首先把空集\(\varnothing\)记作\(0\)。然后把\(0\)进行封装,得到\({0}\),把它记作\(1\)。再把目前为止已有的集合,即\(0\)和\(1\)进行封装,得到\({0, 1}\),把它记作\(2\)。继续把目前为止已有的集合,即\(0\)和\(1\)和\(2\)进行封装,得到\({0, 1, 2}\),把它记作\(3\)。以此类推。注意这里用到的符号“\(0\)”,“\(1\)”,“\(2\)”只不过是这些集合的简略表示。我们可以把这些符号一一展开,得到原始表示

maths
1
2
3
4
5
6
0 = {}
1 = {{}}
2 = {{}, {{}}}
3 = {{}, {{}}, {{}, {{}}}}
4 = {{}, {{}}, {{}, {{}}}, {{}, {{}}, {{}, {{}}}}}
...

我们把这些集合叫做有限序数(可以看作是自然数,但因为从别的理论出发也可以构造自然数,为了表示区分,习惯把上述集合论的构造叫做有限序数)

有限序数的顺序:对于任意有限序数\(n\)和\(m\),如果\(n\)在\(m\)里面,我们就说\(n\)排在\(m\)之前(\(m\)排在\(n\)之后)。比如因为\(1\)在\(3\)(即\({0, 1, 2}\))里面,所以我们说\(1\)在\(3\)之前(\(3\)在\(1\)之后)

序列

我们把从\(0\)开始的,按顺序的,中间没有遗漏的序数排列叫做序列。例如\(0\)是序列。\(0, 1\)是序列。\(0, 1, 2, \ldots\) 也是序列。但\(0, 2, 3\)不是序列,因为中间漏了\(1\)。可以看到除了\(0\)之外,所有有限序数都是对某个序列的封装。例如\(1\)是\(0\)的封装,\(2\)是\(0, 1\)的封装,\(3\)是\(0, 1, 2\)的封装

后继序数

我们把不以省略号结尾的序列的封装叫做后继序数,把对这种序列进行封装的操作叫做取后继。对于有限序数\(n\),我们把序列\(0, 1, \ldots, n\)的封装叫做\(n\)的后继,记作\(n^+\)。比如\(1\)是\(0\)的后继,\(2\)是\(1\)的后继。

(更多见第二讲)

maths
1
2
3
4
0⁺ = {0}       = 1
1⁺ = {0, 1}    = 2
2⁺ = {0, 1, 2} = 3
...

可以看到除了\(0\)之外,所有的有限序数都是后继序数,即目前为止我们所构造的\(0\)之后的序数都是对某个不以省略号结尾的序列进行封装得到的。我们希望扩展序数的构造法,使得对以省略号结尾的序列进行封装得到的集合也是序数

极限序数

(需要与第二讲辅助)

\(\omega^+\)是后继序数,但\(\omega\)本身不是后继序数,因为\(\omega\)是以省略号结尾的序列的封装。我们把这样的序数叫做极限序数,把对这种序列进行封装的操作叫做取极限,取得的极限序数就叫做其对应序列的极限。例如我们可以说\(\omega\)是对序列\(0, 1, 2, \ldots\)取极限得到的,它是序列\(0, 1, 2, \ldots\)的极限。\(\omega\)是最初的极限序数,排在\(\omega\)之后的下一个极限序数是\(\omega + \omega = {0, 1, 2, \ldots, \omega, \omega + 1, \omega + 2, \ldots}\),它是序列\(0, 1, 2, \ldots, \omega, \omega + 1, \omega + 2, \ldots\)的极限。容易看出,对任意序数,它要么是\(0\),要么是后继序数,要么是极限序数,三者必居其一

序数的无穷阶梯(超限归纳)

我们可以对\(\omega + \omega\)继续取后继,得到序列\(0, \ldots, \omega + \omega, \omega + \omega + 1, \omega + \omega + 2, \ldots\)。再对其取极限,得到\(\omega + \omega + \omega\),它是\(\omega + \omega\)之后的下一个极限序数。

把\(n\)个\(\omega\)用\(+\)号相连的式子记作\(\omega \cdot n\),有如下序列:\(0, \ldots, \omega, \ldots, \omega \cdot 2, \ldots, \omega \cdot 3, \ldots\)。我们把这个序列的极限记作\(\omega \cdot \omega\)。

类似地,把\(n\)个\(\omega\)用\(\cdot\)号相连的式子记作\(\omega^n\),有如下序列:\(0, \ldots, \omega, \ldots, \omega^2, \ldots, \omega^3, \ldots\)。我们把这个序列的极限记作\(\omega^\omega\)。

这个构造可以无穷的进行下去

示意

上述实则是超限归纳,超限归纳法(transfinite induction)是数学归纳法向(大)良序集合比如基数或序数的集合的扩展。

假设只要对于所有的\(\beta < \alpha\),\(P(\beta)\)为真,则\(P(\alpha)\)也为真。那么超限归纳告诉我们\(P\)对于所有序数为真。

就是说,如果\(P(\alpha)\)为真只要\(P(\beta)\)对于所有\(\beta < \alpha\)为真,则\(P(\alpha)\)对于所有\(\alpha\)为真。或者更实用的说:若要证明所有序数\(\alpha\)都符合性质\(P\),你可以假定它对于所有更小的\(\beta < \alpha\)已经是成立的。

通常证明被分为三种情况:

零情况:证明\(P(0)\)为真。

后继情况:证明对于任何后继序数\(\beta + 1\),\(P(\beta + 1)\)得出自\(P(\beta)\)(如果需要的话,也假定对于所有\(\alpha < \beta\)有\(P(\alpha)\))。

极限情况:证明对于任何极限序数\(\lambda\),\(P(\lambda)\)得出自\([P(\alpha) \text{对于所有} \alpha < \lambda]\)。

留意,以上三种情况(证明方法)都是相同的,只是所考虑的序数类型不同。正式来说不用分开考虑它们,但在实践时,因为它们的证明过程通常相差很大,所以需要分别表述。在一些情况下,“零情况”会被视为一种“极限情况”,因此可以使用极限序数来证明

有一个常见的误解是超限归纳法或超限递归法要求选择公理。其实超限归纳可以应用于任何良序集合。但是常见的情况是使用选择公理来良序排序一个集合,使其适用超限归纳法

基数

前文中一直小心措辞,我们只说序数的“顺序”,“前后“,而没有说”大小“。我们将看到,在无穷的世界里,一前一后两个序数也可以有相同的大小。基数是对集合大小的刻画,与之相对地,序数是对顺序的刻画。

基数:亦称势。公理集合论的基本概念之一。是度量集合大小的量。在德国数学家康托尔(Cantor,G.(F.P.))之前,无穷只是一个很模糊的概念,人们无法区分两个无穷集的大小。1873年,康托尔发现自然数集与实数集之间不存在一一对应的关系,由此意识到可以用一一对应作为度量无穷集合大小的尺度。他把集合的大小称为集合的势,记为 \(x'\),\(x\) 为一集合。并且他定义,若集合 \(A\) 与集合 \(B\) 之间可建立一一对应关系,则称 \(A\) 与 \(B\) 等势,记为 \(A \approx B\)。然而康托尔对势没有作非常严格的定义,而将集合的势定义为从集合中抽去元素特性及顺序特性得出的一般概念。德国数学家、数理逻辑学家弗雷格(Frege,(F.L.)G.)与英国数理逻辑学家罗素(Russell,B.A.W.)将集合的基数(势)定义为在等势关系下该集合所在的等价类。这一定义虽然比较严格,但这样定义的基数不是 \(ZF\) 公理集合论中集合的基数。在 \(ZF\) 公理集合论中,按如下方法定义集合 \(x\) 的基数 \(|x|\):

  1. 若 \(x\) 是可良序化的(每个集合都可以良序化),则定义 \(|x|\) 为最小的与 \(x\) 等势的序数。
  2. 若不然,则定义 \(|x|\) 为与 \(x\) 等势的真类中所有具有最小秩的元素的全体所组成的集合。

首先说说集合的势。这个可以简单的理解为集合中元素的个数。例如:集合 \(A{1, 2, 3, g, c, d}\) 集合 \(A\) 的势为 \(6\)。如果两个集合的势相等,我们就说这两个集合是等势的。再来说说集合的基数。集合 \(A\) 的势为 \(6\),势为 \(6\) 的集合有无数个,以所有势为 \(6\) 的集合为元素,组成一个新的集合。新组成的集合就称作集合 \(A\) 的基数。其实这个新的集合也是任意势为 \(6\) 的集合的基数。

康托尔-伯恩施坦定理

如果某个集合的基数是 \(a\),则如此定义的基数满足 \(|x|=|y|\),当且仅当 \(x \approx y\)。定义 \(1\) 是由美籍匈牙利数学家冯·诺伊曼(von Neumann,J.)于1928年引入的;定义 \(2\) 则是上述弗雷格与罗素思想的翻版。如果存在从集合 \(x\) 到 \(y\) 的单射,则定义 \(|x| \leq |y|\)。如果 \(|x| \leq |y|\) 且 \(|y| \leq |x|\),则 \(|x|=|y|\)。这就是著名的康托尔-伯恩施坦定理。

有限基数

首先在有限的世界里,集合的大小可以直观地理解为集合中元素的个数。有限序数本身就已经完美刻画出了有限集合的大小。有限基数就定义为有限序数。例如,\({a, b, c}\) 里面有三个元素,而有限序数 \(3 = {0, 1, 2}\) 里面也有三个元素,我们就说 \({a, b, c}\) 的基数是 \(3\),记做 \(|{a, b, c}| = 3\)。对任意有限序数 \(n\),我们有 \(|n| = n\)。

无限基数

我们直接扩展有限情况下的定义,认为对任意集合(包括无限集合) \(A\) 和 \(B\) 都有,\(A \approx B\) 与 \(|A| = |B|\) 要么同时成立,要么同时不成立。例如,如果我们找到了 \(\omega\) 与 \(\omega+1\) 的一一对应,我们就说 \(|\omega| = |\omega+1|\)。我们先看 \(\omega\) 与 \(\omega+1\) 分别有哪些元素。

maths
1
2
ω   = {0, 1, 2, ...  } 
ω+1 = {0, 1, 2, ... ω} 

我们可以这样一一对应:

maths
1
2
3
0  1  2  3  4 ...
|  |  |  |  |
ω  0  1  2  3 ...

直观上,\(\omega + 1\)比\(\omega\)多了一个元素\(\omega\),但通过上面的概念分析,我们认为\(\omega + 1\)只不过是排在了\(\omega\)之后,而在一一对应的意义上,它们是相同的无穷大.

容易看出,对任意有限序数\(n\),有\(\omega + n \approx \omega\),即\(|\omega + n| = |\omega|\)。例如\(\omega + 3\)可以这样与\(\omega\)一一对应.

maths
1
2
3
0   1    2   3  4  5  6 ...
|   |    |   |  |  |  |
ω  ω+1  ω+2  0  1  2  3 ...

一般地

maths
1
2
3
0   1    2   ...   n   n+1  n+2  n+3  n+4 ...
|   |    |   ...   |    |    |    |    |
ω  ω+1  ω+2  ...  ω+n   0    1    2    3  ...

我们扩展有限基数的定义,把任意集合\(A\)的基数定义为可以与\(A\)一一对应的最初序数。例如,可以与\(2\)一一对应的最初序数就是\(2\),因为排在\(2\)之前的序数\(1\)和\(0\)显然不能与\(2\)一一对应,所以\(2\)的基数就是\(2\),写作\(|2| = 2\)。也就是说这个定义与前文所述有限基数的定义是一致的。而对于无限的情况,首先我们有\(|\omega| = \omega\)。因为排在\(\omega\)之前的任意有限序数\(n\)都不能与\(\omega\)一一对应,所以\(\omega\)就是能与\(\omega\)一一对应的最初序数,所以\(\omega\)的基数就是\(\omega\),写作\(|\omega| = \omega\)。

maths
1
2
3
0  1  2  3  4 ... n   n+1   n+2 ...
|  |  |  |  |
0  1  2  3  4 ... n  (n之后无对应)

而\(\omega\)之后呢。我们已经看到,对任意有限序数\(n\),\(|\omega + n| = |\omega|\)。结合无限基数\(|\omega|\)的定义,我们有\(|\omega + n| = \omega\)。

良序基数与极限基数

对于任意的集合\(x\)和\(y\),有\(|x| \leq |y|\)或者\(|y| \leq |x|\),当且仅当选择公理成立。可良序化的集合的基数称为良序基数。每一个良序基数都是序数。因此,若设定某一选择公理,则每一个基数都是序数。对任意的序数\(\alpha\),存在大于\(\alpha\)的最小良序基数,记为\(\alpha\)。由此可见,所有的良序基数构成序数全域的一个无界的子类,即为真类。因此,可以定义一个从序数全域到所有无穷良序基数构成的真类上的保序映射,使得\(\forall \alpha < \beta (\alpha) < (\beta)\),式中\(\aleph\)读做“阿列夫”。还常用\(\alpha\)代替\((\alpha)\),表示第\(\alpha\)个无穷良序基数,用\(\omega_{\alpha}\)表示\(N_{\alpha}\)的序型,故\(N_0 = \omega_0 = \omega\),\(N_{\alpha + 1} = \omega_{\alpha + 1} = N_{\alpha}\)。若\(\alpha\)为极限序数,则\(N_{\alpha} = \omega_{\alpha} = \sup {\omega_{\rho} | \rho \in \alpha }\)。\(N_{\alpha}\)是极限基数,当且仅当\(\alpha\)是极限序数。

正则基数

正则基数是一种特殊基数。如果\(\alpha\)为极限序数,且\(\operatorname{cf}(\alpha) = \alpha\),则称\(\alpha\)为正则的。正则的基数称为正则基数。不正则的无穷基数称为奇异基数。由于正则的序数一定是基数,故人们对正则的序数、正则序数、正则的基数和正则基数这几个概念不加区别地使用。通常也有人将\(\omega\)称为正则基数,将\(N_{\alpha + 1}\)称为正则序数。正则性是基数的重要概念之一,它由德国数学家豪斯多夫(Hausdorff,F.)于1908年引入。关于正则基数的性质曾引申出许多重要的集合论命题,其中最重要的问题是:是否能在\(ZF\)系统中证明存在大于\(\omega\)的正则基数?一方面,由选择公理知,\(N_1,N_2,…,N_{\alpha + 1}\)都是大于\(\omega\)的正则基数。另一方面,以色列集合论学家吉帖克(Gitik,M.)于1979年在假定存在某种大基数真类的情况下,证明了不存在大于\(\omega\)的正则基数,也是和\(ZF\)系统相容的。

强不可达基数

强不可达基数是一种正则基数。简称不可达基数。既是正则的又是强极限的无穷基数。即如果正则基数\(\kappa\)满足\(\kappa > N_0\),且对任何\(\lambda < \kappa\)有\(2^{\lambda} < \kappa\),\(\kappa\)就是一个强不可达基数。强不可达基数一定是弱不可达的。在广义连续统假设成立时,每个弱不可达基数也是强不可达的。这时这两个概念是相同的。在\(ZFC\)系统中不能证明不可达基数的存在性。称这种基数为不可达的原因是它不可能从比它小的基数出发,使用通常的集合论运算得到。

弱不可达基数

弱不可达基数是一种正则基数。既是极限基数又是正则基数的不可数基数。若\(N_{\alpha}\)为弱不可达基数,则\(\operatorname{cf}(\alpha) = \alpha\),且\(\alpha\)是极限序数。因为\(\operatorname{cf}(N_{\alpha}) \leq N_{\alpha}\),\(N_{\alpha} \geq \alpha\),所以\(N_{\alpha} = \alpha\)。可见\(N_{\alpha}\)是非常大的。由定义还可看出,不可达基数\(\kappa\)不可能由比它小的基数通过基数的加法、乘法、乘幂和取极限等运算得到。豪斯多夫(Hausdorff,F.)在1908年提出了弱不可达基数的概念。现已知道弱不可达基数的存在性在\(ZFC\)系统中是不可证的。

奇异基数

奇异基数(singular cardinal number)是一种无穷基数。无穷基数可按共尾度的性质分成两大类:正则基数和奇异基数。若\(\operatorname{cf}(\omega_{\alpha}) < \omega_{\alpha}\),则无穷基数\(\alpha\)称为奇异的;若\(\operatorname{cf}(\omega_{\alpha}) = \omega_{\alpha}\),则\(\alpha\)称为正则的。即对无穷基数\(\kappa\),若存在递增的超穷序列\(\langle \alpha_{\nu} | \nu < \theta \rangle\),其中\(\alpha_{\nu}\)是序数且\(\alpha_{\nu} < \kappa\),该序列的长度\(\theta\)是小于\(\kappa\)的极限序数,则\(\kappa\)称为奇异基数。不是奇异的无穷基数称为正则基数。所有后继基数都是正则基数,奇异基数都是极限基数,例如:\(\omega, \omega + \omega\),\(\omega_1\)等都是奇异基数。存在任意大的奇异基数,如\(\alpha + \omega\)。

后继基数

后继基数(successor cardinal number)是基数的一种,设\(\alpha\)为一个序数,令\(\alpha^+\)表示大于\(\alpha\)的最小基数,设\(K\)为一个基数,若存在序数\(\alpha\),使\(K = \alpha^+\),则称\(K\)为后继基数,所有非\(0\)有限基数均为后继基数,\(0\)和\(\omega\)不是后继基数。

极限基数

极限基数是一种不可数基数,即与后继基数相对的一类基数。在超限基数正则序列,\(\aleph_1, \aleph_2, ..., \aleph_{\alpha}, ....\)中,若序数\(\alpha\)是极限序数,则\(\aleph_{\alpha}\)称为极限基数。每一个超限基数都是极限序数,若\(\alpha > 0\)是一极限序数,则\(\aleph_{\alpha}\)是序列\(\langle \aleph_{\beta} | \beta < \alpha \rangle\)的极限。

超限基数

集合有有限、无限之分,相应地,基数亦有有限、超限之分,有限基数就是自然数;超限基数记作\(\aleph_{\alpha}\),表示第\(\alpha\)个超限基数,其中\(\aleph\)读作阿列夫,\(\alpha\)是一个序数。按照\(\alpha\)的隶属情况,超限基数\(\aleph_{\alpha}\)亦可分为三类:第一类只含\(\aleph_0\)一个基数,它是可数集的基数;当\(\alpha\)为后继序数或极限序数时,\(\aleph_{\alpha}\)分别称为后继基数与极限基数,它们分别构成第二类与第三类超限基数

不可数基数

一个与自然数集不等势的无穷数集的基数统称为不可数基数

迭代性基数

如果\(k\)是迭代性基数,那么存在一组(\(<k\)个)\(<k\)的序数,进行某种运算后可以得到\(≥k\)的基数

非迭代性基数

如果\(k\)是非迭代性基数,那么不存在\(<k\)个\(<k\)的基数进行运算,使其\(\geq k\)的基数。也就是所有运算在非迭代性基数里面是封闭的

严格基数

如果\(k\)是严格基数,那么\(k\)的任何的基本列展开,每个序列上皆是基数。也就是该基数的构造中,所使用的序列全部都是基数。如\(\aleph_0\),\(\aleph_1\),\(\aleph_{\omega_1}\)

非严格基数

如果\(k\)是非严格基数,那么\(k\)无论何种构造,都要有非基数的序数存在。如\(\aleph_{\omega+1}\),\(\aleph_{\omega^{\omega+1}}\)等等,你看他们的构造,存在不是基数的序数,所以非严格基数由此得名,就是因为构造上有不是基数的东西。基数的严格性与大基数公理独立,存在公理任意强的非严格基数(比如第\(\omega+1\)个不可达基数,马洛基数等等)

马洛基数

马洛基数(Mahlo cardinals)是与不可达基数联系最为密切的一类大基数。若\(K\)是弱(或强)不可达基数,且小于\(K\)的所有正则基数的无界闭集是\(K\)的驻子集,则称\(K\)是弱(或强)马洛基数。一般情况下马洛基数指强马洛基数。早在1911年至1913年,马洛(Mahlo)就研究了现今称为弱马洛基数的一类基数

不可达基数

不可达基数是强弱不可达基数的统称。如果\(\kappa\)是不可数的、正则的极限基数,则称\(\kappa\)是弱不可达基数;如果\(\kappa\)是不可数的、正则的强极限基数,则称\(\kappa\)是强不可达基数。这两类大基数合称不可达基数(或不可到达基数),也有文献只把强不可达基数称为不可达基数。不可达基数的概念是波兰数学家谢尔品斯基(Sierpiński,W.)和波兰学者塔尔斯基(Tarski,A.)于1930年引入的。由于任何基数\(\lambda\)的后继基数\(\lambda^+\)不超过\(\lambda\)的幂\(2^{\lambda}\),所以每个强不可达基数必为弱不可达基数;又由于在广义连续统假设GCH之下,\(\lambda^+=2^{\lambda}\),所以在GCH之下,每个弱不可达基数也是强不可达基数。之所以如此称呼这类大基数,是因为不能用通常的集合论运算来“到达”它们。事实上,若\(\kappa\)是强不可达基数,又集合\(X\)的基数\(|X|<\kappa\),则幂集\(P(X)\)的基数也小于\(\kappa\);又若\(|S|<\kappa\),且对每个\(X\in S\),\(|X|<\kappa\),则\(|\cup S|<\kappa\)。这就是说,由小于\(\kappa\)的基数,无论进行何种运算,总达不到\(\kappa\)。可数无穷基数\(N_0\)也具有上述两条性质,因此,也可以说在有限基数的范围内,用除去无穷公理之外的任何集论运算,\(N_0\)也是“不可到达”的。这就清楚地看出,不可达基数确实是无穷基数\(0\)的一种自然推广。“存在不可达基数”已不是ZFC系统的定理。若想肯定这一事实,只有引入大基数公理。事实上,若\(\kappa\)是强不可达基数,则直到\(\kappa\)层的集\(V_{\kappa}\)就是ZFC系统的模型。这样,若存在强不可达基数,则ZFC系统便相容。但不可能在ZFC系统中证明ZFC系统的相容性,于是推知:“存在不可达基数”不是ZFC系统的定理.

超限数(超穷基数和超穷序数)

超限数(transfinite numbers)是大于所有有限数、仍不必定绝对无限的基数或序数。分别叫做超穷基数和超穷序数

  1. 最小超限序数是\( \omega \)。
  2. 第一个超限基数是\( \aleph_0 \),整数的无限集合的势。如果选择公理成立,下一个更高的基数是\( \aleph_1 \)。如果不成立,则有很多不可比较于\( \aleph_1 \)并大于\( \aleph_0 \)的其他基数。但是在任何情况下,没有基数大于\( \aleph_0 \)并小于\( \aleph_1 \)。

连续统假设声称在\( \aleph_0 \)和连续统(实数的集合)的势之间没有中间基数:就是说,\( \aleph_1 \)是实数集合的势。已经在数学上证实了连续统假设不能被证明为真或假,由于不完备性的影响。

某些作者,比如Suppes、Rubin使用术语超限基数来称呼戴德金无限集合的势,在可以不等于无限基数的上下文中;就是说在不假定可数选择公理成立的上下文中。给定这个定义,下列是等价的:
1) \( m \)是超限基数。就是说有一个戴德金无限集合\( A \)使得\( A \)的势是\( m \);
2) \( m + 1 = m \);
3) \( \aleph_0 < m \) 或 \( \aleph_0 = m \);
4)有一个基数\( n \)使得\( \aleph_0 + n = m \)。

连续统假设

1874年格奥尔格·康托尔猜测在可列集基数和实数基数之间没有别的基数,这就是著名的连续统假设。它又被称为希尔伯特第一问题,在1900年第二届国际数学家大会上,大卫·希尔伯特把康托尔的连续统假设列入20世纪有待解决的23个重要数学问题之首。1938年哥德尔证明了连续统假设和世界公认的\( ZFC \)公理系统不矛盾。1963年美国数学家保罗·寇恩证明连续假设和\( ZFC \)公理系统是彼此独立的。因此,连续统假设不能在\( ZFC \)公理系统内证明其正确性与否。

推广自然数次序的超限序数则用 \( \omega \) 相关的符号表示。

我们现在知道实数集的基数大于\( \aleph_0 \),而且\( \aleph_1 \)也大于\( \aleph_0 \),那么实数集的基数与\( \aleph_1 \)是什么关系呢?即实数集的基数会不会就是比\( \aleph_0 \)大的下一个基数呢?这个问题就是大名鼎鼎的连续统假设。这里直接给出结论:这个问题在目前公认的集合论理论框架内无法回答(有点类似于本科普文所假设的集合论前提知识下无法构造\( \omega_1 \))。你可以认为实数集的基数等于\( \aleph_1 \),或者任意\( \aleph_n \)(\( n \)是有限序数),都不会在目前的理论框架中产生矛盾。而继续完善理论框架,加入新的公理,使得这个问题有一个确定的回答,可以说是当代集合论研究的一条主线。

ZFC公理系统
  1. (ZF1)外延公理:一个集合完全由它的元素所决定。如果两个集合含有同样的元素,则它们是相等的。
  2. (ZF2)空集合存在公理:即存在一集合\( s \),它没有元素。
  3. (ZF3)无序对公理:也就是说,任给两个集合\( x \)、\( y \),存在第三个集合\( z \),使得\( w \in z \)当且仅当\( w = x \)或者\( w = y \)。这个公理实际说的是,给定两个集合\( x \)和\( y \),我们可以找到一个集合\( A \),它的成员完全是\( x \)和\( y \)。
  4. (ZF4)并集公理:也就是说,任给一集合\( x \),我们可以把\( x \)的元素的元素汇集到一起,组成一个新集合。准确的定义:“对任意集合\( x \),存在集合\( y \),使\( w \in y \)当且仅当存在\( z \)使\( z \in x \)且\( w \in z \)。”
  5. (ZF5)幂集公理:也就是说,任意的集合\( x \),\( P(X) \)也是一集合。准确的定义:“对任意集合\( x \),存在集合\( y \),使\( z \in y \)当且仅当对\( z \)的所有元素\( w \),\( w \in x \)。”
  6. (ZF6)无穷公理:也就是说,存在一集合\( x \),它有无穷多元素。准确的定义:“存在一个集合,使得空集是其元素,且对其任意元素\( x \),\( x \cup {x} \)也是其元素。”根据皮亚诺公理系统对自然数的描述,此即:存在一个包含所有自然数的集合。
  7. (ZF7)分离公理模式:“对任意集合\( x \)和任意对\( x \)的元素有定义的逻辑谓词\( P(z) \),存在集合\( y \),使\( z \in y \)当且仅当\( z \in x \)而且\( P(z) \)为真”。
  8. (ZF8)替换公理模式:也就是说,对于任意的函数\( F(x) \),对于任意的集合\( t \),当\( x \)属于\( t \)时,\( F(x) \)都有定义(ZF中唯一的对象是集合,所以\( F(x) \)必然是集合)成立的前提下,就一定存在一集合\( s \),使得对于所有的\( x \)属于\( t \),在集合\( s \)中都有一元素\( y \),使\( y = F(x) \)。也就是说,由\( F(x) \)所定义的函数的定义域在\( t \)中的时候,那么它的值域可限定在\( s \)中。
  9. (ZF9)正则公理:也叫基础公理。所有集都是良基集。说明一个集合的元素都具有最小性质,例如,不允许出现\( x \)属于\( x \)的情况。准确的定义:“对任意非空集合\( x \),\( x \)至少有一元素\( y \)使\( x \cap y \)为空集。”

注:以上全部即是ZF公理系统的内容,再加上选择公理就构成了\( ZFC \)公理系统。

(AC)选择公理:对任意集\( c \)存在以\( c \)为定义域的选择函数\( g \),使得对\( c \)的每个非空元集\( x \),\( g(x) \in x \)。

注2:空集公理是可以由其它公理导出。一般认为ZF公理系统可以不包含空集公理。

PS: \( ZFC \)公理系统除去选择公理就是 \( ZF \)系统。

广义连续统假设

广义连续统假设简称GCH,连续统假设的推广,是对一般无穷基数的幂的一种假设。它可以叙述为:对任何无穷集合\( A \),不存在集合的势大于\( A \)的势而小于幂集\( P(A) \)的势。广义连续统假设在 \( ZF \)系统中是不可判定的。

双射(比较无限集合势的大小)

在集合论中,一个由集合\( X \)至集合\( Y \)的映射称为双射的,若对集合\( Y \)内的任意元素\( y \),存在唯一一个集合\( X \)内的元素\( x \),使得\( y = f(x) \)。

换句话说,\( f \)为双射的若其为两集合间的一对一对应,亦即同时单射且满射。

一双射函数亦称为置换。后者一般较常使用在\( X = Y \)时。以由\( X \)至\( Y \)的所有双射组成的集合标记为\( X^Y \)。

(详情见集合论【第一讲】)

在前文中,我们似乎是在数数,先数了\( {a, b, c} \)里有三个元素,然后说\( |{a, b, c}| = 3 \)。但其实也可以不数。

我们认为一一对应比数数更本质。对任意两个集合\( A \)和\( B \),我们用\( A \approx B \)表示\( A \)和\( B \)的元素一一对应。例如,有\( {a, b, c} \approx 3 \),因为\( {a, b, c} \)的元素与\( 3 \)的元素可以一一对应。

maths
1
2
3
a 对应 0
b 对应 1
c 对应 2

容易看出,在有限的世界里,对任意有限集合\(A\)和\(B\),\(A \approx B\) 与 \(|A| = |B|\) 要么同时成立,要么同时不成立(数学中我们习惯说 \(A \approx B\) 当且仅当 \(|A| = |B|\))。例如有 \({a, b, c} \approx 3\) 与 \(| {a, b, c} | = 3 = |3|\) 同时成立,又例如有 \({a, b} \approx {c, d}\) 与 \(| {a, b} | = 2 = | {c, d} |\) 同时成立。同时不成立的例子则有 \({a} \not\approx {c, d}\) 且 \(| {a} | = 1 \ne 2 = | {c, d} |\)

幂集

所谓幂集(Power Set), 就是原集合中所有的子集(包括全集和空集)构成的集族。可数集是最小的无限集; 它的幂集和实数集一一对应(也称同势),是不可数集。 不是所有不可数集都和实数集等势,集合的势可以无限的大。如实数集的幂集也是不可数集,但它的势比实数集大。 设\(X\)是一个有限集,\(|X| = k\),根据二项式定理,\(X\)的幂集的势为\(2^k\)

幂集是集合的基本运算之一。由集合的所有子集构成的集合。对任何集合\(a\),\(a\)的幂集\(P(a) = {x | x \subseteq a}\)。在ZFC公理系统中,幂集公理保证任何集合的幂集均为集合。如\(P({a,b}) = {\emptyset,{a},{b},{a,b}}\).\(P(·)\)称为幂集运算

基数的无穷阶梯

类似序数的无穷阶梯,基数也是无穷的阶梯。\(\aleph_1\)之后,我们继续取后继和极限,终究能达到不与它一一对应的序数\(\omega_2\),它就是\(\aleph_2\)。直观地,我们有如下基数与序数的对应关系:

maths
1
2
序数:0 1 2 ... ω  ω+1 ω+2 ... ω⋅2 ... ω^2 ... ω^ω ... ω₁ ... ω₂ ...
基数:0 1 2 ... ℵ₀                                    ℵ₁     ℵ₂ ...

可数

如果集合的基数小于等于\( \aleph_0 \)(即它某个有限序数\( n \)或者\( \omega \)一一对应),我们就说这个集合可数。直观上就是可以用自然数给集合里的每个元素一个不漏的编上号,所以叫可数。由上文的展示,我们说任意有限序数是可数的,\( \omega \)是可数的,\( \omega^\omega \)也是可数的,但\( \omega_1 \)不可数,\( \omega_1 \)之后的序数都不可数。\( \omega_1 \)是最初的不可数序数,\( \aleph_1 \) 是最小的不可数基数

康托尔定理

康托尔定理(Cantor\'s Theorem):用\( P(X) \)记\( X \)的一切子集构成的集,用\( \text{card} X \)表示\( X \)的势,则\( \text{card} X < \text{card} P(X) \)。康托尔定理指的是在Zermelo-Fränkel集合论中,声称任何集合\( A \)的幂集(所有子集的集合)的势严格大于\( A \)的势。康托尔定理对于有限集合是明显的,但是令人惊奇的是它对于无限集合也成立。特别是,可数无限集合的幂集是不可数无限的。

实数集的基数

鉴于我们没有将\( \omega_1 \)直观地构造出来,我们这里举一个较为直观的例子,实数集,来展示不可数。所谓实数集,简单来说就是指包含圆周率这种无限不循环小数的集合。简单起见我们只展示0~1之间的实数不能编号(不可数)。直观上,既然0~1这种更小的范围的实数都不能编号,那更大的范围也肯定不能编号。首先我们就尝试给它编号。比如下表这样,每一行是一个实数,其中第一列是其编号,也是我们要与之对应的有限序数,它不断向下延伸。表中第三列的小数点以后各列就是0~1之间的实数的各位小数,它们不断向右延伸(如果是有限小数,那么就是从某一位后不断重复零)。

不管按何种方式编号,如果我们都能找出一个实数没有编上号,那么就证明了实数确实不能编号。我们只要找到一个实数,与表中的每一行都不一样就可以了。真的有吗?答案是肯定的。比如这么一个数,它的整数位是0,以满足0~1之间这个条件。它的第一位小数跟第一行(与有限序数0对应)的实数的第一位小数不同(比如表中是4,我们就使它是0,如果表中是0,我们就使它是1,总之跟表中不同就行)。然后我们使它的第二位小数跟第二行的实数的第二位小数不同,使它的第三位小数跟第三行的实数的第三位小数不同,以此类推。

示意

这样就找出了不在表中的实数0.0100000100010000...。为什么呢,因为它的第一位小数与表中第一行的第一位小数不同,于是跟第一行的实数不同,它的第二位小数与表中第二行的第二位小数不同,于是跟第二行的实数不同。总之我们找出的这个实数跟表中的每一行实数都至少有一位小数是不同的,于是它不在表中。这样就证明了实数是不能编号的,就是说\( \omega \)不能与实数集一一对应。

分析\( \infty \)与\( \infty + 1 \)大小

至于\( \infty \),则在分析中一般表示无界的变量范围或无界发散的极限值、给实数或复数系的紧化添加的无穷远点之类人造的点。

基数和序数都可以定义算术和比较,不过符号都不用\( \infty \)。

考虑无穷基数的话,集合基数的和是无交集合并的基数,任何无穷基数 + 1 结果都不变。比如说\( \aleph_0 + 1 = \aleph_0 \),\( \aleph_1 + 1 = \aleph_1 \),如此之类。这就是一些人说的自然数集合里添个元素还和原来的集合有同样多的元素。

考虑超限序数的话,集合序数的和是在两个良序集的无交并上定义一定良序关系后定义的。

不过对于 +1 这个运算,可以自然地看成下一个序数。因为序数本身就表示序关系,所以对某序数\( a \),有\( a < a + 1 \)。对于超限序数也是这样的,比如\( \omega < \omega + 1 < \omega + 2 < \ldots < \omega + \omega \)。对一般人来说序数比基数更晦涩一些。

\( \infty \)这个东西,如果用在区间中表示无界变量的范围,那么区间算术可以用平移来定义。比如说开区间\( (1,2) \)平移1是\( (2,3) \),可以记成\( (1,2) + 1 = (2,3) \)。那么对有限值\( a \),区间\( (a, \infty) + 1 \)就是\( (a + 1, \infty) \),上界仍然无界不变;\( (-\infty, a) + 1 \)是\( (-\infty, a + 1) \),下界仍然无界不变;\( (-\infty, \infty) + 1 \)是\( (-\infty, \infty) \)。注意区间算术的结果是数集,因此可以划等号。至于序关系如果需要可以自己定义。

\( \infty \)如果用于表示无上界或无下界发散的极限:因为\( \lim f(x) \)无界,所以\( \lim (f(x) + 1) \)也一定无界,从而有\( \lim (f(x)) + 1 \)无界。不过注意这里虽然会用\( \lim f(x) = \infty \)表示极限无界,但这里等号只是一种简写方式,两个无界发散的极限并不能就这么直接认为相等。无界的函数可能通过增长的阶(商的极限)来定义大小,也可能在两点紧化的实数中当成同一个东西。虽然可以写\( \lim f(x) = \infty \)和\( \lim f(x) + 1 = \infty \),但一般不会写\( \lim f(x) = \lim f(x) + 1 \)。具体的定义要看上下文而定。

\( \infty \)如果用于表示实数的一点紧化,即\( \mathbb{R} \)与\( { \infty } \)的并集。 那你要定义四则运算满足的各种好的性质,还要能把原来实数的定义嵌入进去。就\( \infty + 1 \)来说,考虑到运算的封闭性,结果要么是\( \infty \),要么还是个实数\( a \)。但如果\( \infty + 1 = a \)是实数就会得到实数\( a - 1 = \infty \)不是实数这种矛盾了;所以只能定义\( \infty + 1 = \infty \)。这时候不需要定义\( \mathbb{R} \)并\( { \infty } \)上的序关系你也知道只能有\( \infty + 1 = \infty \)。不过这时无法定义\( \infty - \infty \)运算作为加法的逆运算(否则会有0 = 1之类矛盾),代数性质已经不够好了。

实数的两点紧化、复数的一点紧化之类扩张也有类似的问题,定义出来的运算未必能满足所有好的代数性质(比如数域的性质)。不过相对合理地定义出的运算基本上都是\( -\infty + 1 = -\infty \)

简单理解0.999... = 1

先严谨地定义\(0.99\ldots\),然后这个等式就是一个平凡的结果。在我们看来,这种问题跟“0是不是自然数”是一个性质的问题。“0是不是自然数”是个数学问题么?当然不是,这纯粹是个记号问题,是个关于定义的语言问题至于\(0.99\ldots\)和1,它们确实不一定非得相等。如果你接受非标准分析,接受超实数,接受存在>0的无穷小作为一个固定的实体,那么你确实可以把\(0.99\ldots\)定义成1减掉某个无穷小。但是如果你使用的是标准实数系,把\(0.99\ldots\)定义成0.9+0.09+..这个级数的和,或者0.9,0.99,...这个实数列的上确界。那\(0.99\ldots=1\)就是很平凡的事情,基本是同义反复的废话

即序列\((1-1/10^{n})^{\infty}_{n=1}\)的极限,该极限为1

拉马努金连根式

接下来我们来看看数字诞生的天才所发现的拉马努金连根式

$$\sqrt{1+2 \sqrt{1+3 \sqrt{1+4 \sqrt{1+5 \sqrt{1+6 \sqrt{1+7 \sqrt{1+8 \sqrt{1+9 \sqrt{1+10 \sqrt{1+11\sqrt{1+... \ }}}}}}}}}}}=3$$

我初留意到这个公式时,感觉等号右边的自然数3应该不是最本质的结果。稍作调整后,我发现如下更一般的式子:

$$\sqrt{1+0\sqrt{1+1 \sqrt{1+2 \sqrt{1+3 \sqrt{1+4 \sqrt{1+5 \sqrt{1+6 \sqrt{1+7 \sqrt{1+8 \sqrt{1+9 \sqrt{1+... \ }}}}}}}}}}}=1$$
$$\sqrt{1+1 \sqrt{1+2 \sqrt{1+3 \sqrt{1+4 \sqrt{1+5 \sqrt{1+6 \sqrt{1+7 \sqrt{1+8 \sqrt{1+9 \sqrt{1+10 \sqrt{1+... \ }}}}}}}}}}}=2$$
$$ \sqrt{1+2 \sqrt{1+3 \sqrt{1+4 \sqrt{1+5 \sqrt{1+6 \sqrt{1+7 \sqrt{1+8 \sqrt{1+9 \sqrt{1+10 \sqrt{1+11 \sqrt{1+... \ }}}}}}}}}}}=3$$
$$\sqrt{1+3 \sqrt{1+4 \sqrt{1+5 \sqrt{1+6 \sqrt{1+7 \sqrt{1+8 \sqrt{1+9 \sqrt{1+10 \sqrt{1+11 \sqrt{1+12 \sqrt{1+... \ }}}}}}}}}}}=4$$
$$ \sqrt{1+4 \sqrt{1+5 \sqrt{1+6 \sqrt{1+7 \sqrt{1+8 \sqrt{1+9 \sqrt{1+10 \sqrt{1+11 \sqrt{1+12 \sqrt{1+13 \sqrt{1+... \ }}}}}}}}}}}=5$$

我注意到,以上式子利用了

$$1+(n-1) (n+1)=n^2$$

这一关系。按照拉马努金的思路,利用

$$n+(n-1) n(n+1) =n^3$$

得到拉马努金形式的开立方连根式:

$$\sqrt[3]{1+0\times1 \sqrt[3]{2+1\times 2 \sqrt[3]{3+2\times 3 \sqrt[3]{4+3\times 4 \sqrt[3]{5+4\times 5 \sqrt[3]{6+5\times 6 \sqrt[3]{7+6\times 7 \sqrt[3]{8+...\ }}}}}}}}=1$$
$$\sqrt[3]{2+1\times2 \sqrt[3]{3+2\times 3 \sqrt[3]{4+3\times 4 \sqrt[3]{5+4\times 5 \sqrt[3]{6+5\times 6 \sqrt[3]{7+6\times 7 \sqrt[3]{8+7\times 8 \sqrt[3]{9+...\ }}}}}}}}=2$$
$$\sqrt[3]{3+2\times 3 \sqrt[3]{4+3\times 4 \sqrt[3]{5+4\times 5 \sqrt[3]{6+5\times 6 \sqrt[3]{7+6\times 7 \sqrt[3]{8+7\times 8 \sqrt[3]{9+8\times9 \sqrt[3]{10+...\ }}}}}}}}=3$$
$$ \sqrt[3]{4+3\times 4 \sqrt[3]{5+4\times 5 \sqrt[3]{6+5\times 6 \sqrt[3]{7+6\times 7 \sqrt[3]{8+7\times 8 \sqrt[3]{9+8\times 9 \sqrt[3]{10+9\times10 \sqrt[3]{11+...\ }}}}}}}}=4$$
$$ \sqrt[3]{4+3\times 4 \sqrt[3]{5+4\times 5 \sqrt[3]{6+5\times 6 \sqrt[3]{7+6\times 7 \sqrt[3]{8+7\times 8 \sqrt[3]{9+8\times 9 \sqrt[3]{10+9\times10 \sqrt[3]{11+...\ }}}}}}}}=4$$

更进一步地,只要巧妙地把\(n^k\)作类似的分拆,我们就可以得到把自然数表示为拉马努金形式的任意开k次方连根式。例如

$$n^{17}+(n-1)n^{17} (n+1) =n^{19}$$

连分数

比较简单了,但我们这次要讲的却不止这么简单

连分数(continued fraction)是特殊繁分数。如果\(a_0, a_1, a_2, \cdots, a_n, \cdots\)都是整数,则将分别称为无限连分数和有限连分数。可简记为\(a_0, a_1, a_2, \cdots, a_n, \cdots\)和\(a_0, a_1, a_2, \cdots, a_n\)。一般一个有限连分数表示一个有理数,一个无限连分数表示一个无理数。

如果\(a_0, a_1, a_2, \cdots, a_n, \cdots\)都是实数,可将上述形式连分数分别叫无限连分数和有限连分数 。近代数学的计算需要,还可将连分数中的\(a_0, a_1, a_2, \cdots, a_n, \cdots\)取成以\(x\)为变元的多项式。在近代计算数学中它常与某些微分方程式差分方程有关,与某些递推关系有关的函数构造的应用相联系

研究连分数的动机源于想要有实数在“数学上纯粹”的表示。
多数人熟悉实数的小数表示:

$$r={\sum^{\infty}_{i=0}}a_{i}10^{-i}$$

这里的\(a_0\)可以是任意整数,其它\(a_i\)都是 \({0, 1, 2, \cdots, 9}\) 的一个元素。在这种表示中,例如数 \(\pi\) 被表示为整数序列 \({3, 1, 4, 1, 5, 9, 2, ...}\)。

这种小数表示有些问题。例如,在这种情况下使用常数 \(10\) 是因为我们使用了 \(10\) 进制系统。我们还可以使用 \(8\) 进制或 \(2\) 进制系统。另一个问题是很多有理数在这个系统内缺乏有限表示。例如,数 \(1/3\) 被表示为无限序列 \({0, 3, 3, 3, 3, ....}\)。

连分数表示法是避免了实数表示的这两个问题。让我们考虑如何描述一个数如 \(415/93\),约为 \(4.4624\)。近似为 \(4\),而实际上比 \(4\) 多一点,约为 \(4 + 1/2\)。但是在分母中的 \(2\) 是不准确的;更准确的分母是比 \(2\) 多一点,约为 \(2 + 1/6\),所以 \(415/93\) 近似为 \(4 + 1/(2 + 1/6)\)。但是在分母中的 \(6\) 是不准确的;更准确分母是比 \(6\) 多一点,实际是 \(6+1/7\)。所以 \(415/93\) 实际上是 \(4+1/(2+1/(6+1/7))\)。这样才准确。

去掉表达式 \(4 + 1/(2 + 1/(6 + 1/7))\) 中的冗余部分可得到简略记号 \([4; 2, 6, 7]\)。

实数的连分数表示可以用这种方式定义。它有一些可取的性质:

  • 一个数的连分数表示是有限的,当且仅当这个数是有理数。
  • “简单”有理数的连分数表示是简短的。
  • 任何有理数的连分数表示是唯一的,如果它没有尾随的 \(1\)。(但是 \([a0; a1, ... an, 1] = [a0; a1, ... an + 1]\)。)
  • 无理数的连分数表示是唯一的。
  • 连分数的项将会重复,当且仅当它是一个二次无理数(即整数系数的二次方程的实数解)的连分数表示。
  • 数 \(x\) 的截断连分数表示很早产生 \(x\) 的在特定意义上“最佳可能”的有理数逼近(参阅下述定理 \(5\) 推论 \(1\))。

最后一个性质非常重要,且传统的小数点表示就不能如此。数的截断小数表示产生这个数的有理数逼近,但通常不是非常好的逼近。例如,截断 \(1/7\) = \(0.142857...\) 在各种位置上产生逼近比,如 \(142/1000\)、\(14/100\) 和 \(1/10\)。但是明显的最佳有理数逼近是“\(1/7\)”自身。\(\pi\) 的截断小数表示产生逼近比,如 \(31415/10000\) 和 \(314/100\)。\(\pi\) 的连分数表示开始于 \([3; 7, 15, 1, 292, ...]\)。截断这个表示产生极佳的有理数逼近 \(3\)、\(22/7\)、\(333/106\)、\(355/113\)、\(103993/33102\)、...。 \(314/100\) 和 \(333/106\) 的分母相当接近,但近似值 \(314/100\) 的误差是远高于 \(333/106\) 的 \(19\) 倍。作为对\(π\)的逼近,\([3; 7, 15, 1]\) 比 \(3.1416\) 精确 \(100\) 倍

连分数表示无理数

根号2

因为 \(\sqrt{1}<\sqrt{2}<\sqrt{4}\)

即 \(1<\sqrt{2}<2\)

$$ \sqrt{2}=1+x \tag{1}\label{1} $$

其中 $$0<x<1$$

得 \(\sqrt{2}^2=(1+x)^2,2=1+2x+x^2,2x+x^2=1\)

$$ x=\frac{1}{2+x} \tag{2}\label{2} $$

\(\eqref{2}\)式代入\(\eqref{1}\)式

$$ \sqrt{2}=1+\frac{1}{2+x} \tag{3}\label{3} $$

此为第一次展开,即\(\eqref{3}\)式

\(\eqref{2}\)式代入\(\eqref{3}\)式

$$ \sqrt{2}=1+\frac{1}{2+\frac{1}{2+x}} \tag{4}\label{4} $$

此为第二次展开,即\(\eqref{4}\)式

......

若记\(\eqref{3}\)式为\(a_1\),\(\eqref{4}\)式为\(a_2\) ,你会发现\(a_2=1+\frac{1}{1+a_1}\)

以此类推,你会发现,第\(n+1\)次展开式\(a_{n+1}\)与第\(n\)次展开式\(a_n\) 的关系为:

$$a_{n+1}=1+\frac{1}{1+a_n}$$

而且如果从 \(a_1\) 开始带入的是 \(\sqrt{2}\) ,那么你会发现

$$a_n=a_{n-1}=\cdots=a_3=a_2=a_1=\sqrt{2}$$

貌似我们在不断绕圈圈但是实际上精确值却在上下摆动,比如代入值偏大,接下来则偏小,然后偏大,偏小...是一个极限的过程

那么这个波动是越来越大呢还是越来越小呢?

我们考虑任意相邻3次展开式 \(a_n,a_{n+1},a_{n+2}\) 的情况:

由于 \(a_{n+1}=1+\frac{1}{1+a_n}\)

$$\begin{align} a_{n+2}-a_{n+1}=\frac{1}{1+a_{n+1}}-\frac{1}{1+a_n} =\frac{a_n-a_{n+1}}{(1+a_{n+1})(1+a_n)},\\\\ \end{align}$$

因为 \(\sqrt{2}\in(1,2)\),即 \(a_1\in(1,2)\),且 \(a_{n+1}=1+\frac{1}{1+a_n}\)

所以展开任意次的值都在(1,2)范围内

$$|a_{n+2}-a_{n+1}|<\frac{|a_n-a_{n+1}|}{4}$$

由此可见,相邻3次展开式中,后两次展开式间的差值不到前两次展开式间的差值的 \(\frac{1}{4}\) !

可见,越到后面的展开式,波动越小,越来越小,很快变小,最终“夹住”精确值!所以也可以把连分数看成一个二分的过程

而且不管一开始我们带入的值是(1,2) 中的哪一个!

那么,我们不妨取 \(x=\frac{1}{2}\)

$$a_1=1+\frac{1}{2+x}=\frac{7}{5}$$

并展开5次和6次试试

$$a_5=1+\frac{1}{2+\frac{1}{2+\frac{1}{2+\frac{1}{2+\frac{1}{2+\frac{1}{2}}}}}}$$

看起来很难算吗?但实际上还好,只要一行一行写清楚就不会出错,甚至比夹逼法等要轻松

$$ a_5=1+\frac{1}{2+\frac{1}{2+\frac{1}{2+\frac{1}{2+\frac{1}{2+\frac{1}{2}[=\frac{5}{2}]}[=2+\frac{2}{5}=\frac{12}{5}]}[=2+\frac{5}{12}=\frac{29}{12}]}[=2+\frac{12}{29}=\frac{70}{29}]}[=2+\frac{29}{70}=\frac{169}{70}]}[=1+\frac{70}{169}=\frac{239}{169}]\\\\ \approx 1.414\ 201, $$
$$ a_6=1+\frac{1}{1+a_5}=1+\frac{1}{1+\frac{239}{169}}=\frac{577}{408}\approx1.414\ 216 $$

得 \(\sqrt{2}\) 的精确值介于1.414 201和1.414 216之间,

即通过5次和6次展开,我们就将其值精确到了小数点后4位!

用此法也能很快计算出其他根号值

那么,本节到此结束!

圆周率pi

$$\frac{\pi}{4}=1+\frac{1}{2+\frac{9}{2+\frac{25}{2+\frac{49}{2+\frac{81}{2+\cdots}}}}}$$

该式仅作了解即可,使用连分数计算圆周率的人很少,可能是因为计算量大。比如布朗开罗的连分数,顺带一提,拉马努金的椭圆积分法是目前已知最快的圆周率公式,将会在之后微积分栏目中讲解

连分数极限

在这里只留下几条定理,详细会在之后讲解微积分时证明

定理1

设 \(a\), \(b\) 为整数,且 \(0 < |b| \leqslant |a|\) 而

$$a_{1} = a, a_{2} = a + \frac{b}{a}, a_{3} = a + \frac{b}{a + \frac{b}{a}} \ldots$$

则数列 \({a_{n}}\)

收敛,且

$$\lim_{n \rightarrow \infty} a_{n} = \begin{cases} \frac{a + \sqrt{a^{2} + 4b}}{2} & \text{,若 } a, b \text{ 同号}\\ \frac{a - \sqrt{a^{2} + 4b}}{2} & \text{,若 } a, b \text{ 异号} \end{cases}$$

定理2

设 \(a\), \(b\) 为整数,且 \(0 < |b| < |a|\) 而

$$a_{1} = a, a_{2} = a - \frac{b}{a}, a_{3} = a - \frac{b}{a + \frac{b}{a}}, a_{4} = a - \frac{b}{a + \frac{b}{a - \frac{b}{a}}} \ldots$$

则数列 \({a_{n}}\)

收敛,且

$$\lim_{n \rightarrow \infty} a_{n} = \frac{a^{2} - 2b + \sqrt{a^{4} + 4b^{2}}}{2a}$$

定理3

设 \(m, n, b \in \mathbb{N}\) 且 \(b < m, b < n\) 而

$$a_{1} = m, a_{2} = m + \frac{b}{n}, a_{3} = m + \frac{b}{n + \frac{b}{m}}, a_{4} = m + \frac{b}{n + \frac{b}{m + \frac{b}{n}}} \ldots$$

则数列 \({a_{n}}\) 收敛,且

$$\lim_{n \rightarrow \infty} a_{n} = \frac{mn + \sqrt{m^{2} n^{2} + 4mnb}}{2n}$$

定理4

设 \(m, p, k, b \in \mathbb{N}\) 且 \(b < p, b < k\) 而

$$a_{1} = m, a_{2} = m + \frac{b}{p}, a_{3} = m + \frac{b}{p + \frac{b}{k}}, a_{4} = m + \frac{b}{p + \frac{b}{k + m}}, a_{5} = m + \frac{b}{p + \frac{b}{k + m + \frac{b}{p}}} \ldots$$

则数列 \({a_{n}}\) 收敛,且

$$\lim_{n \rightarrow \infty} a_{n} = \frac{(m - k) + \sqrt{(k - m)^{2} + \frac{4(bk + bm + mpk)}{p}}}{2}$$

定理5

设 \(m, p, b \in \mathbb{N}\) 且 \(b < m\) 而

$$a_{1} = \frac{b}{nm}, a_{2} = \frac{b}{mn + \frac{b}{m}}, a_{3} = \frac{b}{mn + \frac{b}{m + \frac{b}{mn}}}, a_{4} = \frac{b}{mn + \frac{b}{m + \frac{b}{mn + \frac{b}{m}}}} \ldots$$

则数列 \({a_{n}}\) 收敛,且

$$\lim_{n \rightarrow \infty} a_{n} = \frac{-m + \sqrt{m^{2} + \frac{4b}{n}}}{2}$$

写在文末

本文知识有点多,各位可以慢慢消化,数学的宝库是深不可测的,写在文末,希望数学能再狠狠地爱我们一次!PS:本文要高中及以上水平才可读懂,数学是多么地美,如果文中有错误或不足,欢迎在评论区补充

无穷理论(一)连根式与连分数

https://blog.tsinbei.com/archives/1154/

文章作者
math.sx
发布于

2023-02-13

修改于

2024-07-01

许可协议

CC BY-NC-ND 4.0

# 学习  数学

评论

昵称
邮箱
网址
暂无