人工智能会说“外语”吗？——自然言语与计算机言语刍议

aqxu001 · 2021-1-16 05:12:17

言语是人类表达交流和思想的重要工具。言语反映人的思想，人运用言语沟通、表达、创作。人类日常运用的言语被称为自然言语，自然言语包括词汇语音语义语法等方面。用于机器程序编写的言语被称为计算机言语，由数字、字符以及语法规则构成。人类的自然言语有不同语种、分属不同语系，计算机言语根据编写规则的不同也分为各种门类。人运用言语对话交流写作思索的才能，即言语智能，被看作是人类智能的一个方面。相对的，机器（计算机）具有辨认计算机言语、运转程序、执行操作的才能，计算机言语可以看作是后天内在于机器里的言语。假如计算机可以了解作为“外语”的自然言语，完成对自然言语的翻译，了解并执行人的命令，乃至与人对话，能否可以以为计算机具有了与人相似的言语智能呢，本文将回答这一成绩。

自然言语与计算机言语的定义

人类日常生活中运用的言语称之为自然言语，人类用言语表达想法，交流沟通，描画对象。言语作为一种载体，承载了语词的外延。人类的多种言语分属不同的语系，但是言语和言语之间可以对应和翻译。每种言语都是一个包括词汇、语法和语音的系统，在系统中根据语法规则运用词汇停止表达。正如哲学家、言语学家乔姆斯基在《言语与心智》中所讲：“知道某种言语的人都掌握了一套规则系统，这套系统以确定的方式为有数种能够的句子指派声响和意义。”但是运用自然言语的个体并不见得可以看法到这套言语系统的规则和外延：“知道言语的人并没无看法到曾经掌握了这些规则或正在运用这些规则，也没与任何理由假定言语规则的这种知识可以被带入看法中”。

自然言语的习得基于生活和社会交往。儿童掌握言语的过程是经过大量对话接触词汇和句子，在对话聊天中的习得语句模型，再掌握语法，可见自然言语的学习是从语义到语法的，因此一些学者站在人类言语天赋论的立场上讨论言语习得，例如乔姆斯基以为人脑中有一种天生的普遍语法，这一普遍语法存在于人脑中一个叫做言语习得机制的地方。他试图解释言语研讨与人类本质的关系，以为言语反映人类心智的过程并且决议思想特征和发展的各方面。

从言语系统来看，自然言语这个系统是波动性和变动性兼具的。在一种言语存在的前提下，它的词汇和基本语法是波动的，同时言语在传承运用中，遭到时代、环境的变化影响，又在不断更新、衍生和发展。

计算机言语，是指按照规定的语法规则，运用数字、字符来编写程序，使得计算机可以停止各种工作的言语，它包括机器言语、汇编言语、高级言语等。在不同的思索程序设计方式和程序设计模型中，字符和语法规则构成的语句按照指令执行操作。计算机言语的设计初衷是为了使人可以更好地控制和操作计算机。目前，一切计算机做的每次动作每个步骤，都是按照计算机言语编好的程序来执行。计算机的运转操作是这样一个流程：接受输入，婚配对象，输入回答。在执行操作中，计算器首先要了解人的输入命令，对自然言语停止转换翻译，运用程序源代码由相应言语的解释器翻译成目的代码机器言语，再停止编译操作，将程序源代码翻译成目的代码机器言语。

可以说，计算机言语是人机对话的媒介。计算机言语在构造中可以辨认并翻译自然言语，执行操作，输入结果，其中的翻译过程是人机合作乃至人机对话的关键。机器只要在了解人类输入的命令之后才能继续执行操作。在智能机器产生之前，人对机器的输入指令方式是单一的，但如今的智能机器曾经在逐渐尝试经过语音和图像的辨认了解人的命令，目前这种才能次要依赖于语料库分析、强化婚配搜索以及深度学习。

假如把自然言语的词汇看作是一套符号，它的语法看作是符号的运用规则，那么相较而言，计算机言语也是符号和规则的运用。计算机的编码解码输入与输入，以及在人机交互中的运算，也相似与人在表达和交流中运用言语听读说写的过程。在这个意义上，计算机言语似乎可以看作是计算机的自然言语。假如计算机是真正智能的，那么在它看来，人类的自然言语可以算作是一门外语。但计算机能具有智能吗？

要比较自然言语与计算机言语，一个重要的视角是从自然言语和计算机言语中的逻辑系统来辨析两种言语的内在逻辑。逻辑是言语的重要外延，一种言语的逻辑结构和语法系统，是使其本质区别于其他言语和语种的根源所在。

自然言语与计算机言语中的逻辑

在自然言语的运用中，歧义和含混是不可避免的，各种言语之间的翻译也存在曲解和偏向。学者们想要处理表达中语词的歧义和模糊，找到人类言语中共通的深层结构，于是自创数学的方法，发明了方式化言语。方式化言语提出的初衷是人们要想使逻辑学像数学那样也有一套通用的符号，从而试图建立一种普遍的、没有歧义的言语。经过这种言语，可以把一切的思想推理都转变为演算，变得和数学一样准确。逻辑学家们试图用方式化的系统和符号准确描写自然言语描画的世界，以更准确地停止推理、分析和判别。因此在逻辑言语的研讨中，也包括了对自然言语生成语法的研讨。

自然言语可以看作是一套符号系统，其中的语词是文明背景下表达观念的符号。但是自然言语中的逻辑不只是语法结构上的，也是在语义之中的。我们日常表达中某些语词的歧义和模糊，在语法中很难判别，但可以经过上下文以及语境的带入简单处理。维特根斯坦就以为自然言语是用来表达对象的，一个命题或语句的意义源自内在于它的真实对象，我们学习言语的过程就是掌握语词与对象之间的关联。我们无法从一个单独的词获得意义，而要经过关联和活动，所以自然言语在一定环境和特定的游戏规则下才具有意义。

因此，自然言语的逻辑比方式化言语的逻辑多一个维度。自然言语是人类心智的一部分，包含在语词中的逻辑是人类心智独有的逻辑才能。正如维特根斯坦指出的：单个的词汇和语法结构并不能传达残缺的意义。自然言语的习得也无法单从言语的逻辑结构学习来获得。因此，在自然言语的习得中，心智就是一个重要概念。

机器运用的计算机言语也是一种方式化言语。它是人先赋予机器并成为其内有先在的言语。计算机在了解和执行人的命令时，需求将自然言语翻译为机器可了解的计算机言语，再停止程序操作。将自然言语的方式化描写，这一步骤对计算机程序的机械模拟至关重要，但了解力模拟不同于机械模拟。机械模拟触及的是方式性质，而了解力模拟触及的是准语义性质。现阶段计算机以机械模拟为主并经过逻辑言语与人的自然言语对话。因此，虽然计算机对自然言语的处理可以算作一种翻译，但就目前而言这种翻译与自然言语中两个言语之间的互相翻译是不同的。

计算机在消弭歧义过程中，需求大量的知识，包括言语学知识（词法、句法、语义、上下文等）和关于世界的常识认知。这也形成了目前自然言语处理的两个次要困难。从自然言语的视角衡量计算机言语，高度方式化使其对语境的描写才能有限，也无法像自然言语那样传达多层信息。因此，方式化言语虽然在准确度上拥有优势，语境塑造才能和表达力却必然弱于自然言语。在自然言语的了解中，词汇安装如何与句法结构产生联络，从而构成句子表达涵义，这是方式化言语很难完全描写的，这也是计算机辨认自然言语时产生错误的一个重要缘由。当然，随着语料库建设和语料库言语学的发展，计算机原先处理自然言语时次要运用的基于句法-语义规则的感性主义方法已退居其次，现今自然言语的处理技术引入了统计数学的方法，在婚配搜索和自动学习的方法支持下逐渐减少错误。

认知迷信以为思想和认知是知识的逻辑运算，而计算化的自然言语分析则次要依赖逻辑言语的表述。假如从行为主义的角度出发，机器拥有计算机言语，并且在后天的操作执行和运用中不断强化愈加准确，这是一种习得和巩固。在这个意义上，计算机言语于计算机而言似乎可以说是它的自然言语。但是，虽然自然言语和计算机言语各自都包含很多种类，二者多样种类的缘由是不一样的，不同于人类言语的多样性根源于历史文明和地域的区别，计算机言语则是在编写程序时面向不同的需求而开发。因此，自然言语与计算机言语承载的外延是不同的。从根本上讲，自然言语表现的心智与计算机言语表达的心智是有所不同的。

自然言语与心智

假如说自然言语是人类表达的工具和思想的媒介，那么自然言语与心智的关系密不可分，在一定程度上，人对言语的运用才能是心智才能表现之一种。心智与智能不同，心智是智能的一部分，它泛指人的知觉、感觉、记忆、学习、了解、创新等才能。

心智才能包含了对自然言语的了解。日常生活中运用自然言语时，可以同时获得关于描画对象的语音、笼统以及外延。我们在日常生活中，但凡听到别人描画一件东西，或看到别人指着一个对象有所称谓，那么我们就记住了这东西叫什么，往后要再指称那件东西时，就讲出异样的词汇。我们也能从别人的语音、动作、表情和眼神，乃至肢体动作、声调口吻来体会到语句中的各种心情与感受。也就是说，在自然言语中，语词的意义并不局限于单个词的含义，它还包括了指称对象的容貌，语音、讲述者的意图以及当时的语境。自然言语的涵义是在社会交往和对话中完全表现的，对这些涵义的片面把握，需求心智才能，反之也是对心智存在的印证。正如乔姆斯基所述：语词构成句子的表层规则是语法，但句子的真正含义体如今深层结构上。深层结构是经过某些心智的操作而与表层结构相关联的。也就是说，自然言语一切词汇、声响和意义之间的联络，是基于心智基础上的语法结构。

再者，自然言语的学习也是心智才能的一个反映。以乔姆斯基为代表的心智主义者以为言语和语法结构是人类心智的本质和特征。不管言语运用者在个体阅历和个人才能方面具有多大的不同，他们都会按照极为相似的方法完成言语实际系统的构造义务。我们的心智中后天就拥有认知结构和言语才能，在后天的运用中逐渐强化对语法规则的掌握。 “在某种基础性的层面上，我们人类不是在学习言语，真实的状况是，言语在心智中自行长大。”

有别于乔姆斯基，哲学家蒯因的言语实际是基于阅历主义与行为主义的立场。他既反对彻底的阅历主义还原论也反对纯粹的先验知识，他以为言语之所以能表达含义，是依赖于行为习得的，人们在言语行为中表现出的心智才能也是逐渐后天习得的。掌握并运用言语的心智才能是后天的并且可以经过训练得到强化的。在蒯因看来，我们掌握言语的才能来自于公共知识，是一种人类共同阅历知识背景的传承，而非先验的存在：“即便我们要议论某种独特的感官觉知的质量，多半也要求助于公共物体，桔子的颜色，臭鸡蛋的滋味，诸如此类。要持续通达以往的感觉材料，异样也靠了指涉物体。我们固然该当好好探求关于物体的日常话语背后的感官觉知、感觉刺激，但这些是概念成形或言语的背景，而不是它们的下层结构。”

假如按照乔姆斯基的实际，那么我们赋予一台智能计算机的初始内在，可以算作它的后天“心智”，当然这样的心智是人给予的并且是不完全的。假如按照蒯因的实际，计算机在被构造的前提下，曾经获得了知识背景，并且能在学习中不断强化言语才能，这似乎意味着它有能够在强化学习中获得真正的智能，包括与人同等程度的言语智能。

机器言语与心智

在人工智能著名的图灵测试中，假如一个人可以与一台机器停止一次足够长的对话，假如对话人不能分辨回答是来自一台机器或者一个人，那么就断定这台机器就是拥有智能的。可见，图灵想象中的智能计算机次要才能就是对言语的了解和运用才能。测试将机器拥有智能定义为几个方面：机器要能回答输入文本的成绩；可以对语词停止含义解释；可以了解语词组成的句子；可以把一种言语翻译为另一种言语。言语才能是判别计算机能否拥有智能的重要标准。甚至可以说，从图灵测试的机制看来，言语才能可以等同为智能。

假如智能必然要掌握言语才能，如前所述，人类运用的自然言语虽有模糊不清和歧义难解的内容，表达力确是强于方式化言语的。计算机假如要具有真正的智能，必需要具有在不同语境中了解自然言语的才能。但是这一才能在现有的技术中几乎是办不到的。德雷福斯在《计算机不能做什么》一书中提到，机器要获得智能，要处理困难成绩之一即言语中的歧义成绩。虽然如今已有强化婚配搜索和大数据的支持，自然言语的歧义成绩表面上得到了部分处理。但是假如参照我们人类运用自然言语的方式，真正了解并能运用一门言语，除了需求掌握必要的推理规则（包括专家知识推理和常识推理），还要具有上下文环境的了解与领悟才能。有了这样的才能，才算是具有心智，拥有智能。

在讨论机器智能与心智时，很多研讨者都希望从人类智能的产生和结构中获得启示。从简单发育到复杂思索，人的智能看似有规律可循，但假如细心思索，即便是最简单、最后级的智能，都触及千万脑细胞、肌肉细胞的大范围共同协作。这些简单的行为内嵌了太多智能，都是日常讲话和行为中不曾看法到的深层心智才能。言语智能作为其中的一种，假如思索言语机制的来源以及言语机制在人类智力忽然质变的过程中所承担的角色时，至少两个基本的成绩就会出现：第一，最小的承载意义的元素的核心语义内容，包括方式最为简单的元素。第二，允准符号停止有限制组合的准绳。假如希望经过分层渐进地分析人类心智产生的生理结构和逻辑结构，从而尝试在模拟这种结构中赋予机器以心智。那就必然会面临两个困境：一是人的大脑就是一个不能够完全掌握的黑箱；二是心智作为一个没有实体但的确有的存在，对技术而言是不可捉摸的存在。

就心智主义的立场而言，计算机是不能够拥有与人类同等的心智才能的，虽然它可以随着技术发展获得愈加精细准确的自然言语处理技术，在操作执行中表现得可以听懂自然言语的一切指令。从行为主义的立场来讲，假如一台机器表面具有了同人类一样的言语才能，可以了解并表达自然言语，似乎可以以为它是具有心智的机器。但是，自然言语和方式化言语互相转换中不可避免的成绩，也预示了由行为主义出发的模拟不能够完全与人一样。

结论

随着技术的发展，计算机可处理的自然言语文本数量不断增长，面向海量信息的文本发掘、信息提取、跨言语信息处理、人机交互等运用需求下，计算机的自然言语处理研讨也在不断推进。但是，自然言语在描画和表达中，具有指向性、逻辑性，传递并承载了文明。这也就意味着，自然言语不只是一些语词符号的组合，和方式化的言语不同，自然言语虽然也在一定的逻辑语法下运用，具有沟通、交流、表达、创造等功能，但言语还具有文明属性，一种言语的习得不只是会运用其中的语词和语法规则，还包括了对一种文明的了解和认同。在这个层面上，现有的智能机器无论对自然言语的处理做到何种程度，都尚未拥有真正的智能。因此，我们可以将言语的正常运用作为证明其他生物具有与我们相反心智的极其明白的阅历性证据，但不能作为心智与人类才能的来源的判别性证据。

笛卡尔讲“言语是人类思想的核心标志”，意即言语才能和人的思想才能密不可分并且言语才能是人类心智的表征。他还提出：人类心智的两个重要才能，了解力和意志，是机器（自动机）无法完成的。由于心智没有实体，自动机无论如何模拟表层结构，都不能够创造出心智。笛卡尔的预言在明天看来虽然缺乏论证残缺性，结论依然正确。言语的运用表达和创造是人类智能的重要内容，假如将来的智能机器将拥有同人类一样甚至更强的智能，那么它必然掌握了人类言语才能同等的了解运用才能。这在现有的计算机言语层面是做不到的。而至于将来机器能否籍由新的打破性的技术学会“外语”，那又是另一个成绩了。

参考文献：

德雷福斯. 计算机不能做什么: 人工智能的极限[M]. 三联书店，1986.

诺姆·乔姆斯基. 言语与心智[M]. 中国人民大学出版社，2015.

诺姆·乔姆斯基. 乔姆斯基言语哲学文选[M]. 商务印书馆，1992.

诺姆·乔姆斯基. 句法实际的若干成绩[M]. 中国社会迷信出版社，1986.

蒯因.语词和对象[M]. 中国人民大学出版社，2012.

维特根斯坦.哲学研讨[M].商务印书馆，2000.

弗雷格.弗雷格哲学论著选辑[M].商务印书馆，2006.

nuoya00888 · 2021-1-16 10:56:40

为保住菊花，这个一定得回复！

冰凉怡夏 · 2021-1-17 13:10:16

向楼主学习

世界清静了 · 2021-1-18 09:16:55

还有没有详细介绍？

		自动登录	找回密码
密码			立即注册

人工智能会说“外语”吗？——自然言语与计算机言语刍议

本帖子中包含更多资源

大神点评3

最近发表

公社版块

关注我们