找回密码
 立即注册
搜索

关于自然言语的一个小科普请接收!

20世纪,全世界对自然言语处理的研讨都堕入了一个误区。当时,学术界对人工智能和自然言语了解的普遍以为:要让机器完成翻译或者言语辨认等只要人类才能做的事情,就必须先让计算机了解自然言语,而做到这一点就必须让计算机拥有相似我们人类这样的智能。(明天几乎一切的迷信家都不再坚持这一点,而很多门外汉还误以为计算机是靠相似我们人类的这种智能处理了上述成绩。)

为什么会有这样的看法?是由于人类就是这么做的,道理就这么简单。对于人类来讲,一个能把英语翻译成汉语的人,必定能很好地了解这两种言语。这就是直觉的作用。在人工智能范畴,包括自然言语处理范畴,后来把这样的方法论称作“飞鸟派”,也就是看着鸟是怎样飞的,就能模拟鸟造出飞机,而不需求了解空气动力学。

理想上我们知道,怀特兄弟发明飞机靠的是空气动力学而不是仿生学。不要笑话我们长辈来自于直觉的天真想法,这是人类看法的普遍规律。明天,机器翻译和言语辨认曾经做的不错,并且有上亿人运用过,但是这个范畴之外的大部分人依然错误地以为这两种运用是靠计算机了解了自然言语才完成的。理想上,它们全部靠得是数学,更准确地说是靠统计。

在20世纪60年代,摆在迷信家面前的成绩时怎样才能了解自然言语,当时普遍的看法是首先要做好两件事,即分析语句和获取语义。这实践上优势惯性思想的结果:它遭到传统言语学研讨的影响。学习东方言语,都要学习语法规则、词性和构词法等。当然,应该承认这些规则是我们人类学习言语的好工具,而恰恰这些语法规则又很容易用计算机的算法描画,这就更坚定了大家对基于规则的自然言语处理的决计。

对于语义的研讨和分析,相比较而言要不系统得多。语义也比语法更难在计算机中表达出来,因此直到20世纪70年代,这方面的工作照旧乏善可陈。由于语义对于我们开解自然言语是不可或缺的,因此各国政府把很大比例研讨经费提供给“句法分析”相关研讨的同时,也把一部分钱给了语义分析和知识表示等课题。

举个例子:我们学习英语时,无论在中学和大学英语考试成绩多么好,也未必能考好GRE,更谈不上看懂英文电影。缘由就是我们即便学了10年的英语语法,也不能涵盖全部的英语。而且即便可以写出涵盖一切自然言语现象的语法规则集合,也很难用计算机来解析。自然言语在演化过程中,产生了词义和上下文相关的特性,因此,它的文法是比较复杂的上下文有关的文法。

在上个世纪70年代,基于规则的句法分析(包括文法分析或者语义分析)很快就走到了止境。从20世纪80年代末至今的25年里,随着计算才能的提高和数据量的不断增进,过去看似不能够经过统计模型完成的义务,渐渐都变得能够了,包括很复杂的句法分析。到20世纪90年代末期,发现经过统计得到的句法规则甚至比言语学家总结的更有压服力。

因此明天,自然言语处理的研讨从单纯的句法分析和语义了解,变成了非常贴近实践运用的机器翻译、语音辨认、文本到数据库自动生成、数据发掘和知识的获取等等。

选自吴军的《数学之美》,文中有的了解的不到位,会不断修正的,请见谅




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评2

土豆看火影 2019-5-12 11:55:24 来自手机 显示全部楼层
无论是不是沙发都得回复下
回复

使用道具 举报

aiyiyi68 2019-5-12 18:22:07 来自手机 显示全部楼层
看帖要回,回帖才健康,在踩踩,楼主辛苦了!
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies