智客公社

标题: 论人类下一代语言的可能—4.3数学与自然语言的一些比较 [打印本页]

作者: dzlqsq 时间: 2022-10-29 08:19
标题: 论人类下一代语言的可能—4.3数学与自然语言的一些比较
我们先从数学应用的例子开始。这一主题下很容易想到牛顿的《自然哲学的数学原理》。在这本书里，牛顿大量使用了文字的叙述，定律往往是先给出命题的语句表述，在证明与求解时才回到数学。然而正如书名所示，本书实质是用数学描述经典物理学，为此牛顿还发明了称为“流数术”的微积分。牛顿在本书的“致读者—作者的序言”开始处写到：
“由于古代人（正如帕普斯所说）在自然事物的研究中极重视力学；而现代人，抛开实体的形式和隐藏的性质（qualitates occultae）,努力使自然现象从属于数学的定律；因此这一专著的目的是发展数学，直到它关系到哲学时为止”。
牛顿把其理论组成了公理化系统，书的前二章分别是“定义”与“公理或运动定律”。在“定义”这一章节他给出了所用概念的定义，它们是：质量、惯性、力、向心力等，另外附注里牛顿提到了时间与空间的定义，他认为这应该是人们熟知而可缺省的。在第二章节“公理或运动定律”里牛顿给出了他的三大运动定律，以今天的标准，万有引力定律也应该放在这。在这二章节内容的基础上，更多的内容在后面章节演绎出。牛顿的《自然哲学的数学原理》是近现代科学形成的标志。
公理化系统的概念、命题可以是用自然语言表述，也可以用数学表述，在这一意义上，自然语言与数学形成了比较关系。应用数学时，会使用各种数字，更典型的是代表数量的字母：a、b……x、y，以及其他抽象符号替代了文本词汇，由数学方程、函数等公式替代语句命题，然后是通过公式的转换计算展开它的系统。我们可以具体比较下万有引力定律的数学表示与自然语言表示。数学公式的表示是：F=（Gm1m2）/r²。自然语言语句的一般表述是：自然界中任何两个物体相互吸引，引力的大小跟这两个物体的质量乘积成正比，跟它们的距离的二次方成反比。直观上我们也能知道数学公式的表示更简洁、精确，自然语言语句的表示复杂且不准确，在上面常见的万有引力表达语句中，直接忽略了引力常数G。
应用数学时，各种数字以及代表数量的字母，都是对应至不同类型的数，各类型的数是在同一谱系里的存在。同类型的数，相互之间有着确定的关系；简单类型的数，可视为复杂类型数的特例。这些符号用于标识对象时，它们直接的意义都是同样的理解——被标识对象某些方面通过计量可对应的结果。数学通常说是关于量的学问，相比较，自然语言更多是描述事物的质。质与量并不一定是一种对立，有质的地方，往往有可感知的广延，广延指对象的某一性质的感知在程度或顺序上的不同，应用中一个量就是标识一个或多个向度上的广延：长度、面积、角度、比例、速度、频率……
计量是一种可实施的操作，对不同环境中不同类型量的计量需要发展出不同的计量技术。除了计量实施的直接间接性差异外，原理都是相同的。应用上测量的主要问题是精度问题，测量能得到的是某个精度下的值，而不会是绝对精确的值，在给定计量单位下不可以测量的无理数，实用角度来说，也是精度要求与确定逼近计算方法的问题。计量带来了符号与对象统一的对应方式，计量操作是针对对象进行的，这也使这种对应关系具有一定的客观性。
自然语言里的命名，朴素地说是事物分门别类得到的，本质上是自由的、约定的。自然语言里能指与所指的对应，没有统一可操作的程序来达成，每一符号的理解是具体的，需要不同的感知、经验或其他的智力因素来达到意义。自然语言背后的分类与划分，所产生的概念很容易相互交叉或矛盾，并带来思维上的混乱。如“正义”、“美丽”这样一些概念，它们在质上就是说不清楚的。
认识上我们知道速度这种量，把速度的变化识别为另一个量——加速度，就不是显而易见的事。量是普遍存在的，只是它可能被纷乱的现象掩盖，把对象、对象的某一属性、对象间的某种关系或其他要素识别为一种量，建立起计量方法，很多时候是认知的艺术。一个概念被抽象出来，可能是先发现一种可计量或可计算的方法，时间的概念就有这样的性质。人类在时间、空间计量上的进步，一直推动着我们的认知与实践更加有序。
通过量的标识，原来各种各样的感知现在可以以同样的形式呈现，成为可以相互比较、计算的存在。不同商品以货币计量后变得可交换，正是这种实践延伸的一个结果。在“媒介视角的语言观——符号使用的开始”一节里我们说到：“本书也认为上面的结论反证地来说更有意义：如果我们能找到一种普适的关系关联媒介形态与其指称的对象，我们将创造一种超级的语言”，数学正是这种超级语言。
我们回到万有引力定律自然语言表示与数学公式表示的比较。数学公式（Gm1m2）/r²，在一个表达中列示了所有要素与关系，每一部分与其他部分处于固定的关联中。数学公式以一种简洁、整体的结构形式直接刻画了要素与要素间的关系（复杂的情形中，也有程度的问题）。用自然语言的语句表示时，需要分解成多个陈述句来表示。大脑需要把分散的多个符号串的描述合成一个可理解的图景。自然语言在认知方向的使用，应用的主要是陈述句，其他类型的语句如果用到也只是一种辅助的作用。一般的观点，英文里的陈述句大概是五种句型。可以发现不管什么句型，陈述句多是只有一个主语。自然语言的语句是焦点化的，每一语句倾向于降解到单一维度单一关系来讲解，这样稍微复杂一点的事情，就得构造多个子句来描述。
自然语言里陈述句的句型非常有限。各种各样的内容，自然语言里都是以同样这几种句型结构形成表达。显然，句型结构并不表现被表征事件可能具有的结构、关系、变化、规律，也不可能表现。使用上的关键是正确地组合子句，以及每一子句选取合适的词汇来配列，这种选择相当灵活，通常不存在唯一的组合。数学公式是一整体性的结构，不同公式各有其结构；每一公式中，各成分间处于确定的关系中，每一成分的形式并不是要点，只要能保持简洁且不会发生歧义，每一成分选择什么字母或其他符号没有实质的影响，它们只是占位符而已。
可以看出，陈述句型只是一类主观的表述结构。自然语言里的每一个语种，其中的句型是在其历史过程中塑造出的。那些基础的句型，如各语种中普遍存在的主谓句型，最可能是源于对人类日常活动的描述、我们将其中的形式固化泛化，应用于其他不同性质事件的描述。这会残留着拟人化的影子，并可能导致了历史早期阶段万物有灵论的泛滥。对现代人类来说，很容易明白并适应这里的游戏规则，而不会产生理解困惑。扩大来说，自然语言的语法是表述方式的规则，其本身并不反映对象世界的任何的规律，其用途是创造线性空间上不同类型词汇组合的规则性。这种规则性的形成表面上由社会性心理习惯推动，背后实际也受到所用媒介场的约束。
数学公式的表示不只是一种静态的表义，而是一种演算装置。在领域理论构建时，如牛顿的《自然哲学的数学原理》那样，一组符号与数学公式构成领域公理化系统的初始，这些初始的符号、公式可来自一个或多个数学分支。从这组符号与公式出发，通过逻辑与数学的演绎，可推出其他的符号、公式，最终形成一个系统。理论应用时，公理系统里的初始的符号、公式或它们的实例，或者这些公式进一步推导出的其它公式的实例，可用来为实际问题建模，解释本领域可观察到的现象，或解决实际的问题。领域现象的任一状态可以体现为建模公式各个量上的一个特定取值组合，反过来，各个量在其值域范围符合建模公式的一个取值组合，是领域现象可能的一个状态。通过模型，可以从一些自变量计算出因变量。条件所限无法实施测量的量，建立与可计量的量的数学公式，就可能通过数学公式计算得出各状态下的量值。如果时间是公式里的一个自变量，通过公式运算得到其他量的值，我们也就可以推知现象的过去与将来。
为实际问题所建立的模型，能够完全准确地反映现象可能的状态。这也源自数学的特性，从最简单的方面来说，长度测量时，测量结果都会对应一个实数数值。你可以去怀疑是否任意一个实数数值在现实中都能找到一个对应的实际长度，但你不用担心测量的结果没有数字对应。前面说过，实数应用了无限的概念，其实现的效果是：实数是无限且致密的。
从初始的符号、公式开始，通过演绎得到其他的符号、公式，理论上说，这个过程除数学分支及逻辑的符号与公式外，不需要另外引入其他的符号与公式，符号与公式的使用是闭合的。另一方面，从数学分支里选用公式或其实例来描写领域的规律时，为支持数学公式的演算：公式的结合、转换、派生以及数值计算等，需要将所引用数学公式关联的内容也带进来，结合领域里的约束条件，演绎操作才能进行。在本书里称数学这种性质的应用是一种投射应用。
数学投射型的应用中，一方面提供了数学公式来描写领域规律或事实，另一方面数学公式及其关联的数学分支里的内容自带了符号操作的规则，二方面是合二为一的。在自然语言应用中，表述方式与内容是分开的二个方面。自然语言的语法只是一种组织表述的主观规则。自然语言应用于具体领域时，语言本身只是提供组合的方法与一些通用的词汇。领域里的专用术语还需要另外构造，领域的各种结论也是专门组成的语句。构词与造句时主要考虑语义，同时要遵循语法的要求。比喻地来说，自然语言用于构建知识时，建筑是从沙、石、水泥开始的；数学的应用则可直接提供预制件，来匹配使用。正因如此，自然语言更适合作为通用的表述工具。

《自然哲学的数学原理》（牛顿，商务印书馆 2021年））
作者: 3380126 时间: 2022-10-29 14:23
我只是路过，不发表意见
作者: 陈水东 时间: 2022-10-31 07:05
这帖子写的不错
作者: 耀世 时间: 2022-10-31 13:37
占位编辑

欢迎光临智客公社 (http://bbs.cnaiplus.com/) Powered by Discuz! X3.4