当前位置: 华文世界 > 科学

数学与物理的界限

2024-09-03科学

如果十年前你问我能否建立一个涵盖所有物理现象的形式系统,我可能会断然否定,毕竟并非所有物理概念都能被清晰、精确地定义。但如果现在问我,我的答案却是肯定的。我现在确实认为,我们可以为所有物理学建立一个形式系统。是什么让我改变了看法呢?首先,在我的研究过程中,我竟然无意中踏上了构建这样一个系统的道路。

虽然最初我并未意识到这一点,但最终发现,我一直在做的正是这件事。既然我已经在做了,那就意味着这件事并非天方夜谭。那么,我现在是否认为所有物理概念都能被清晰、精确地定义呢?答案依然是否定的。物理学博大精深,我们不可能做到这一点。

问题的关键在于,我们要找到哪些部分可以被纳入形式系统,哪些部分最好留在形式系统之外。这实际上是在探索物理学和数学之间的边界,而这正是本文想要探讨的主题。我想与你分享我在这方面的学习心得,以及我多么希望十年前就有人为我指点迷津。或许你会觉得这些内容饶有趣味,或许你会想要参与我的研究,又或许这些内容能为你的研究带来启发。但无论如何,当你试图为物理学建立一个形式系统时,这些都是你必须铭记于心的。

首先,我们至少要对「形式系统」的概念有一个基本的了解。你可以将形式系统想象成一座由三个主要部分构成的建筑。第一部分是构成形式系统的基石——基本概念的集合,这些基本概念是无需借助其他概念进行定义的,如同建筑的地基。例如,在欧几里得几何中,「点」和「线」就是基本概念。我们只是假定它们存在,而无需解释它们究竟是什么。

我们只是说它们存在。接下来,我们需要一种形式语言来表达关于这些基本概念的陈述,如同建筑的框架。这种形式语言本质上是一套符号和规则,规定了如何将这些符号组合成合法的句子,如同建筑的蓝图。例如,我们可以用大写字母表示点,用特定的符号表示线段。

我们还会用到一些表示谓词的符号,以及一些表示逻辑连接词(比如「与」、「或」等等)的符号。所以,形式语言的核心在于如何操作这些符号,以及这些符号的具体含义。通过这些规则,我们就可以用形式语言书写句子了,进而就可以表达形式系统的第三个组成部分——公理。公理是关于基本概念的陈述,我们将其视为真理,如同建筑的梁柱。例如,在欧几里得几何中,其中一条公理是:任意两点之间存在一条直线连接它们。同样,如果你要建立一个形式系统,那么这条用自然语言表达的公理需要用形式语言中的符号来表达。所以,这就是形式系统的基本构成。你必须明确这三个部分才能定义一个形式系统,如同建造一座建筑需要地基、框架和梁柱。

如果我们考察数学的基础,你会发现所有数学分支都有其形式系统,其中最常见的是基于集合论的系统。在这个系统中,基本元素是集合。通常,我们会选择一种形式逻辑系统,例如一阶逻辑。然后,我们会定义一组公理,例如策梅洛-弗兰克尔公理,有时还会加上选择公理。有了这些基础,数学家就可以在其上构建所有其他的数学理论,如同在坚实的地基上建造高楼大厦。

所以,这构成了所有数学的形式系统的基础。那么问题来了,如果我们想对物理学做类似的事情,我们能做到吗?如果可以,我们应该怎么做?我们如何将物理学中那些纷繁复杂的现象,例如各种实验等等,纳入一个形式系统并进行量化分析呢?这就好比我们要用数学的语言来描述整个物理世界。

当然,无论我们采用何种方法,在一个形式系统中,我们始终要关注三个核心要素:基本概念、形式语言和基本公理。因此,我们必须弄清楚如何确定这三个要素,如同在建造物理学大厦之前,我们需要确定地基、框架和梁柱。对于形式语言来说,这并不是一个难题。我们可以直接使用一阶逻辑,或者其他任何已有的数理逻辑系统,这都不会有问题,如同我们已经有现成的建筑材料。

真正的挑战在于如何确定基本概念和公理,因为它们必须与物理现实相符,如同地基必须坚实可靠。我们的目标是,找到能够描述特定物理现象、物理系统或物理情境的合适的概念和公理。然后,根据我们想要在形式系统中表达的物理规律,确定合适的原始概念和公理,以便能够准确地描述我们想要研究的物理现象。这就好比我们要根据不同的地形和建筑需求来设计不同的地基。

我们会遇到的一个问题是,物理学中有很多内容必须保留在非形式系统中。例如,与实验相关的细节就无法完全纳入形式系统,因为我们在实验室中使用的实验设备本身并不属于形式系统。如何制造这些实验设备,如何用它们来探测特定的物理现象,这些细节都无法用形式语言来描述。因此,我们的思路是,将部分信息保留在非形式系统中,然后将其中的一部分映射到形式系统中。因此,我们需要区分物理世界和形式系统,认识到物理对象存在于物理世界中,而物理世界是一个非形式系统,这正是我最初的担忧所在。这就好比我们不能把所有的建筑材料都搬进大楼里,有些材料必须留在外面。

然后,我们选择合适的公理和原始概念,以便能够证明特定的物理对象可以用具有特定属性的符号集在数学上进行表示。实际上,我们需要选择那些能够被合理证明的公理和原始概念。这与纯粹数学系统的定义有所不同,因为在数学中,你可以自由地定义公理,例如选择公理。在数学中,有很多不同的方式可以表达与选择公理等价的内容。但是,如果你需要选择一个特定的公理,那么有些公理可能更容易从物理上进行解释,而有些则不然。因此,原始概念和公理的选择会受到我们能否对其进行合理证明的影响。这就好比我们要选择那些既符合力学原理又易于加工的建筑材料。

现在,我们已经开始探索这个领域,并且意识到物理学和数学之间存在着这种二分法。我们必须做出一些选择,决定哪些内容应该被纳入形式系统。现在,最 fundamental 的问题是,哪些类型的内容可以被形式系统所描述,哪些类型的内容则不能?我们可能会遇到哪些类型的挑战?这就好比我们要确定哪些部分可以用我们现有的建筑材料来建造,哪些部分则需要新的材料或技术。

我认为,在试图将所有物理概念都进行清晰、精确地定义时,我们遇到的两个最大的挑战是「意义网络」和「概念切割」。「意义网络」指的是,在自然语言和物理学中,不存在真正的基本概念,所有概念都是通过其他概念来定义的。例如,如果你查字典,你会发现「树」的定义是:一种木本多年生植物,具有单一的、通常会伸长的主茎。然后,你可能会问,什么是植物?如果你去查「植物」的定义,你可能会看到:幼小的树木、藤蔓和灌木。所以,你陷入了循环定义的困境。在物理世界中,没有任何一个概念可以真正作为基本概念。这是非形式系统和形式系统之间的一个重要区别:非形式系统是一个相互关联的概念网络,没有明确的起点;而形式系统则必须有一个明确的起点。因此,我们需要以一种合理的方式将这个概念网络展开,但这有时是无法做到的。这就好比我们想要用有限的词汇来定义无限的世界,这必然会导致循环定义或定义不完整。

另一个挑战是「概念切割」。这个概念指的是,所有物理概念都只在特定的适用范围内才能被清晰地定义。因此,我们必须进行「切割」,明确某个概念的适用范围。例如,「橙子」的概念。在日常生活中,例如在超市购物或谈论水果蔬菜时,「橙子」是一个非常清晰的概念。但是,如果你仔细思考橙子的生长过程,你会发现从花朵授粉到果实成熟之间是一个连续的过程。那么,我们应该在哪里进行「切割」,将某个时刻之前的状态定义为「不是橙子」,而将该时刻之后的状态定义为「橙子」呢?实际上,并不存在这样一个明确的时刻。因此,如果我们要精确地描述橙子的生长过程,我们无法找到一个明确的时刻,将「橙子」与「非橙子」区分开来。当然,在不同的语境下,「橙子」的概念仍然是清晰的。这就好比我们要用有限的色彩来描绘无限丰富的自然景色,我们必须进行取舍,才能突出重点。

另一个例子是,我们能否无限精确地定义「距离」和「温度」等物理量?实际上,我们做不到。在物理模型中,我们使用实数来表示这些物理量,并假设它们具有无限的精度,但这只是一种理想化的近似。那么,究竟什么样的物体才能被称为处于热力学平衡状态,从而使得「温度」的概念能够被清晰地定义呢?什么时候一个系统才能被认为达到了平衡状态?这些问题都很难,甚至不可能给出精确的答案。但我们通常会根据直觉判断,认为某个系统已经达到了平衡状态,并且可以对其定义温度。这就好比我们用一把有限精度的尺子来测量无限长的海岸线,我们只能得到一个近似的结果。

类似的问题还有很多。例如,我们在物理学中经常讨论「孤立系统」,但实际上,所有物体都通过引力与其他物体相互作用,因此不存在真正的孤立系统。因此,我们必须在某种程度上进行「切割」,忽略那些对我们研究的问题影响较小的因素。我们可能会说,对于研究地球上的汽车行驶来说,木星上发生的事情并不重要,因此我们可以将地球上的汽车视为一个孤立系统。所有这些「切割」都是在非形式系统中完成的。一旦我们完成了这些「切割」,形式系统就不会意识到我们曾经做过这些简化。这就好比我们在绘制一幅地图时,会根据需要选择不同的比例尺,忽略一些细枝末节,才能突出主要信息。

现在,我们已经对这些挑战有了一定的了解。接下来,我们需要决定,如果我们要建立一个涵盖所有物理现象的形式系统,例如我们在「物理学假设」项目中所做的那样,我们应该选择哪些基本概念作为形式系统的基石?这些基本概念必须非常普遍,因为我们希望能够将它们作为所有物理理论的基础。我们有一个指导原则:科学是普遍的、非矛盾的,并且是基于证据的。这意味着科学规律对每个人都适用,不会出现自相矛盾的情况,并且必须以实验观测为基础。这意味着,所有物理理论都必须能够对实验结果做出预测,并且这些预测必须与实验观测相符。因此,如果我们想要找到对每个人都适用,并且不会出现自相矛盾的基本概念,那么「逻辑」就是一个很好的选择。正如我们之前所讨论的,数学中的陈述都是用某种形式逻辑系统来表达的,例如一阶逻辑。这套逻辑系统规定了如何操作符号,以及如何判断一个陈述的真假。因此,我们不应该感到惊讶,物理学也需要一套逻辑系统。但与数学不同的是,数学中的真理是通过逻辑推理或证明来确定的,而物理学中的真理则必须以实验观测为基础。因此,我们需要一套能够处理实验可验证陈述的逻辑系统。我们需要能够判断哪些陈述是可以通过实验来验证的,哪些陈述则不能。这对于所有物理理论来说都是至关重要的,因为所有物理理论都必须与实验观测相符。这就好比我们要为物理学大厦选择最坚实、最普遍适用的地基。

那么,什么是「可验证陈述」呢?让我们先在非形式系统中探讨一下这个问题。例如,「巧克力好吃」这个陈述就不是普遍适用的,因为有些人不喜欢巧克力。「杀死一个人来救十个人是不道德的」这个陈述也不是普遍适用的,因为不同的人对此可能有不同的看法。而且,这个陈述也不是基于证据的,因为我们无法通过实验来验证道德判断的真伪。数学陈述,例如「数字 4 是素数」,也不是基于证据的。我们不需要做实验来验证数学陈述的真伪,而是通过逻辑推理或证明来确定它们的真假。「这个陈述是假的」这个陈述本身就是自相矛盾的,因此也不属于可验证陈述。类似地,「光子的质量正好是 0」或「光子的质量正好是某个具体的数值」这样的陈述也不是可验证的,因为我们无法无限精确地测量物理量。我们只能说,光子的质量小于某个具体的数值,例如 10 的负 13 次方电子伏特。所有关于连续物理量的实验陈述都必须包含一个有限的误差范围。例如,「如果水银柱的高度在 24 到 25 毫米之间,那么它的温度在 24 到 25 摄氏度之间」就是一个可验证的陈述。这些可验证的陈述让我们能够建立对物理理论的信心,例如,我们可以利用这些陈述来制造温度计。另一个例子是,「如果我取 2 正负 0.01 千克的钠 24,并等待 15 正负 0.01 小时,那么只会剩下 1 正负 0.1 千克」。这个陈述描述了放射性衰变的规律,其中包含了有限的误差范围。因此,所有物理理论都必须包含「可验证陈述」的概念,以便我们能够判断哪些陈述是可以通过实验来验证的,哪些陈述则不能。因此,「可验证陈述」是一个很好的基本概念,因为它对于所有物理理论来说都是至关重要的。这就好比我们要选择那些能够经受实验检验的建筑材料。

那么,我们如何在形式系统中将「可验证陈述」的概念形式化呢?一个常见的做法是,将陈述中的每个概念都用形式语言中的符号来表示。例如,我们可以将「电子是一个基本粒子,并且带负电荷」这个陈述表示为:e 是一个常数,表示电子;f p 是一个谓词,表示「是基本粒子」;n c 是一个谓词,表示「带负电荷」。因此,这个陈述可以表示为:f p(e) ∧ n c(e)。但这种做法存在很多问题。首先,正如我们之前所讨论的,存在「意义网络」的问题。我们很难对「电子」、「质量」、「物理逻辑」、「力」等概念给出清晰、精确的定义,因为这些概念之间存在着复杂的相互依赖关系。同样地,也存在「概念切割」的问题。例如,我们如何定义一个物体是「不可移动的」?我们如何将不同的物体归类到同一个系统中?我们如何区分系统和环境?所有这些问题都需要我们进行「概念切割」,而「切割」的方式取决于我们研究的具体问题,因此不存在一种通用的「切割」方式。此外,如果我们试图将所有概念都形式化,我们还会遇到语义悖论的问题。例如,「不能用少于 20 个单词描述的最小正整数」就是一个语义悖论。因此,我们不应该试图将所有概念都形式化,因为这会导致很多问题。这就好比我们试图用有限的图纸来描述无限复杂的建筑结构,这必然会导致图纸过于繁琐或出现逻辑错误。

那么,我们应该如何处理「可验证陈述」的概念呢?我的建议是,将「陈述」本身作为形式系统的基本概念。例如,「光子的质量小于 10 的负 13 次方电子伏特」这个陈述,虽然包含了很多复杂的物理概念,但在形式系统中,我们将其视为一个整体,一个无需解释的基本概念。形式系统不需要知道「质量」、「光子」、「电子伏特」等概念的具体含义,只需要知道这是一个可验证的陈述即可。这样,我们就可以避免很多问题。当然,你可能会问,如果我们只是将「陈述」作为基本概念,那么我们还能做什么呢?关键在于,我们需要找到那些能够描述「可验证陈述」之间关系的规则和公理。通过这些规则和公理,我们就可以构建一个丰富的数学结构,即使我们只定义了很少的基本概念。这就好比我们把每个房间都视为一个整体,而无需考虑房间内部的具体布局,然后通过连接不同的房间来构建整个建筑。

那么,「陈述」应该是形式系统中最小的基本概念吗?我们能否只依靠单个陈述来保证普遍性、非矛盾性和与证据的联系呢?答案是否定的。因为逻辑一致性不是单个陈述的属性,而是一组陈述的属性。例如,「这个陈述是假的」这个陈述本身就是自相矛盾的。但如果我们有两个陈述,「下一句是假的」和「上一句是真的」,那么每个陈述本身都没有问题,但它们组合在一起就产生了矛盾。这说明,逻辑一致性是针对一组陈述而言的,而不是针对单个陈述而言的。此外,逻辑关系和语义也只有在一组陈述的语境下才能被清晰地定义。例如,「教皇是罗马的主教」和「主教只能沿对角线移动」这两个陈述,如果我们将其孤立地看待,那么它们之间并没有什么联系。但如果我们将它们放在天主教的语境下,那么我们就可以得出结论:「教皇只能沿对角线移动」。这说明,我们需要将陈述分组,并将其放在一个共同的语境下进行解释。我们将这种分组称为「逻辑上下文」。逻辑上下文在非形式系统中负责维护逻辑一致性和语义清晰性。在形式系统中,逻辑上下文只是一个集合,包含了一些陈述。形式系统本身并不了解这些陈述的具体含义,只是将它们视为基本概念。这就好比我们把每个楼层都视为一个逻辑上下文,每个房间都是一个陈述,而整栋大楼就是我们的形式系统。

此外,我们还需要将形式系统与实验观测联系起来。为此,我们需要为每个陈述定义一个「测试」。这个测试可以无限次成功,可以无限次失败,或者可以是不确定的。如果测试成功,那么我们就认为该陈述是真的;如果测试失败,那么我们就认为该陈述是假的;如果测试不确定,那么我们就无法判断该陈述的真假。但是,并不是所有陈述都存在一个能够在有限时间内确定其真假的测试。例如,「存在外星生命」这个陈述,如果我们找到了外星生命,那么我们就验证了这个陈述;但如果我们没有找到外星生命,我们也不能断定外星生命不存在。因此,这个陈述的测试可能永远不会终止。类似地,「光子的质量正好是 0」这个陈述,如果光子的质量不是 0,那么我们最终会找到一个足够小的误差范围,从而判断光子的质量不为 0;但如果光子的质量正好是 0,那么我们永远无法通过实验来验证这一点。因此,这个陈述的测试也可能永远不会终止。因此,「可验证陈述」的概念需要进一步明确:如果一个陈述是真的,那么它的测试必须能够在有限时间内成功。因此,我们在形式系统中需要捕捉的概念是:存在一个逻辑上下文,它包含了一些陈述,其中一些陈述是可验证的。我们可以在这些可验证的陈述上定义公理,并利用这些公理来构建一个丰富的数学结构。但我们不需要将测试本身纳入形式系统,因为这会增加系统的复杂性,而不会带来实质性的好处。这就好比我们只需要知道每个房间是否可以通过安全检查,而无需知道具体的检查流程。

那么,这个基本概念是否足够基本呢?我们能否用「可验证陈述」的概念来描述物理学中的各种方程,例如微分方程呢?答案是肯定的。例如,牛顿第二定律 F=ma,通常情况下,我们认为 F、m 和 a 都是实数或矢量。但在实际应用中,我们总是会对这些物理量进行测量,并且测量结果总是包含一个有限的误差范围。因此,牛顿第二定律实际上表达的是可验证陈述之间的一种逻辑关系。例如,我们可以将牛顿第二定律表示为:如果质量在 m±Δm 千克之间,加速度在 a±Δa 米每二次方秒之间,那么力在 F±ΔF 牛顿之间。其中,ΔF 是一个可以计算出来的误差范围。这说明,所有物理方程实际上都表达了可验证陈述之间的一种逻辑关系。这与物理学是基于实验的这一基本原则相符。这就好比我们用数学公式来描述建筑的结构和力学性能,这些公式必须与实际的测量数据相符。

因此,我们可以为实验科学建立一个形式系统,前提是我们认识到物理世界本身是一个非形式系统,因此并非所有物理现象都能被形式系统所描述。实际上,大多数重要的物理推理都是在非形式系统中进行的,例如「概念切割」等等。形式系统的精确性来自于它对物理现象的简化和抽象。数学的精确性也来自于它对现实世界的简化和抽象。数学之所以能够如此精确,并不是因为它能够描述所有现象,而是因为它只关注那些能够被精确描述的现象。在数学的基础中,例如集合论,我们通过限制允许的陈述类型来避免逻辑矛盾。因此,形式系统的精确性来自于它对复杂性的简化。这有助于我们理解从非形式系统到形式系统的映射过程。这就好比我们建造的物理学大厦只能是现实世界的一个简化模型,我们必须忽略一些细节,才能抓住主要矛盾。

此外,我们还需要对物理学中的逻辑系统进行扩展,以便能够处理实验可验证的陈述。我们应该寻找那些所有物理理论都必须满足的要求,并将其作为形式系统的基本原则。那么,这些基本原则是否足够呢?我们是否还需要其他的基本原则呢?此外,我们还需要注意,基本概念的选择应该尽可能简单,以便能够清晰地表达必要的复杂性。例如,我们不需要将「测试」的概念纳入形式系统,因为这只会增加系统的复杂性,而不会带来实质性的好处。公理和定义的选择也应该尽可能简单,以便能够直接从物理上进行解释。例如,「可验证陈述」的概念就是一个很好的例子,因为它可以直接从物理实验中得到证明。当我们定义关于可验证陈述的公理时,我们应该能够清晰地解释这些公理的物理意义。这就好比我们选择的建筑材料应该既坚固耐用,又易于加工和组装。

总而言之,这些是在为物理学建立形式系统时需要牢记的要点。