找回密码
 立即注册
搜索

终于有人把自然言语处理、机器学习、深度学习和人工智能讲明白了


导读:本文将带你了解自然言语处理的概念、运用,以及与机器学习、深度学习和人工智能之间的关系。

作者:卡蒂克·雷迪·博卡(Karthiek Reddy Bokka)、舒班吉·霍拉(Shubhangi Hora)、塔努吉·贾因(Tanuj Jain)、莫尼卡·瓦姆布吉(Monicah Wambugu)

来源:华章科技



01 自然言语处理的基础知识

为了便于了解,我们将这个术语分为两部分:
    自然言语是一种无机且自然发展而来的书面和行动交流方式。 处理意味着运用计算机分析和了解输入数据。

如图1-1所示,自然言语处理是人类言语的机器处理,旨在教授机器如何处理和了解人类的言语,从而在人与机器之间建立一个简单的沟通渠道。


▲图1-1 自然言语处理



自然言语处理的运用很广泛,例如,在我们的手机和智能音箱中的个人语音助手,如Alexa和Siri。它们不只可以了解我们的说话内容,而且可以根据我们说的话采取举动,并做出反馈。自然言语处理算法促进了这种与人类沟通的技术。

在上述自然言语处理定义中要思索的关键是:沟通需求以人类的自然言语停止。几十年来,我们不断在与机器沟通:创建程序来执行某些义务并执行。

但是,这些程序是用非自然言语编写的,由于它们不是行动交流的方式,也不是自然或无机发展而来的。这些言语,例如Java、Python、C和C ++,都是在次要思索机器的状况下创建的,并且一直思索的是“机器可以轻松了解和处理的是什么?”

虽然Python是一种对用户愈加敌对的言语,且易于学习和编码,但与机器沟通,人类必须学习机器可以了解的言语。自然言语处理、机器学习、深度学习的关系如图1-2所示。


▲图1-2 自然言语处理的维恩图



自然言语处理的目的与此相反。自然言语处理不是以人类顺应机器的方式学习如何有效地与它们沟通,而是使机器可以与人类保持分歧,并学习人类的交流方式。其意义更为严重,由于技术的目的本来就是让我们的生活更为轻松。

我们用一个例子来澄清这一点,你的第一个程序是一段让机器打印“hello world”代码。这是你顺应机器并要求它用其了解的言语执行义务。

经过向其发出这个命令来要求你的语音助手说“hello world”,并做出“hello world”的反馈,就是自然言语处理运用的一个例子,由于你用自然言语与机器通讯。机器符合你的沟通方式,了解你所说的内容,处理你要求它执行的操作,然后执行义务。
02 自然言语处理的重要性

图1-3阐明了人工智能范畴的各个部分。


▲图1-3 人工智能及其一些子范畴



与机器学习和深度学习一样,自然言语处理是人工智能的一个分支,由于其处理自然言语,所以它实践上是人工智能和言语学的交叉。

如上所述,自然言语处理使机器可以了解人类的言语,从而在两者之间建立有效的沟通渠道。但是,自然言语处理的必要性还有另一个缘由。那就是,像机器一样,机器学习模型和深度学习模型对数值数据最有效。数值数据对人类来说很难自然产生。很难想象我们用数字而不是言语交谈。

因此,自然言语处理与文本数据一同工作,并将其转换成数值数据,从而使机器学习模型和深度学习模型可以适用于文本数据。因此,它的存在是为了经过从人类那里获取言语的行动和书面方式,并将它们转换成机器可以了解的数据,来弥合人类和机器之间的交流差距。

得益于自然言语处理,机器可以了解并回答基于自然言语的成绩、处理运用自然言语的成绩以及用自然言语交流等。
03 自然言语处理的才能

自然言语处理有许多有益于人类生活的理想运用。这些运用程序属于自然言语处理的三大功能:

1. 语音辨认

机器可以辨认自然言语的口语方式,并将其翻译成文本方式。比如智能手机上的听写,你可以启用听写功能并对着手机说话,它会将你所说的一切转换成文本。

2. 自然言语了解

机器可以了解自然言语的口语和口语。假如给机器一个命令,它就能了解并执行。例如,在你的手机上对Siri说“嘿,Siri,打电话回家”,Siri就会自动为你打电话回家。

3. 自然言语生成

机器可以本人生成自然言语。例如,在手机上对Siri说“Siri,如今几点了?”Siri回复说:“如今是下午2:08”。

这三种才能用于完成和自动化许多义务。让我们来看看自然言语处理的一些运用。

留意:文本数据被称为语料库(corpora)或一个语料(corpus)。
04 自然言语处理中的运用

图1-4描画了自然言语处理的普通运用范畴。


▲图1-4 自然言语处理的运用范畴



1. 自动文摘

包括对语料库生成摘要。

2. 翻译

要求有翻译工具,以从不同的言语翻译文本,例如,谷歌翻译。

3. 情感分析

这也被称为情感的人工智能或意见发掘,它是从书面和行动语料库中辨认、提取和量化情感和情感形状的过程。情感分析工具用于处理诸如客户回复和社交媒体帖子之类的事情,以了解对特定事物的心情反应和意见,比如新餐厅的菜质量量。

4. 信息提取

这是从语料库中辨认并提取重要术语的过程,称为实体。命名实体辨认属于这一类,将在下一章中解释。

5. 关系提取

关系提取包括从语料库中提取语义关系。语义关系发生在两个或多个实体(如人、组织和事物)之间属于许多语义类别之一。

例如,假如一个关系提取工具被赋予了关于Sundar Pichai的内容,以及他是谷歌的CEO,该工具将可以生成“Sundar Pichai就职于谷歌”作为输入,Sundar Pichai和谷歌是两个实体,“就职于”是定义它们之间关系的语义类别。

6. 聊天机器人

聊天机器人是人工智能的一种方式,被设计成经过语音和文本与人类交流。它们中的大多数模拟人,使你觉得在和另一个人说话。聊天机器人在健康产业被用于协助患有抑郁症和焦虑症的人。

7. 社交媒体分析

社交媒体的运用,如Twitter和Facebook,都有标签和趋向,并运用自然言语处理来跟踪和监控这些标签和趋向,以了解世界各地正在交谈的话题。此外,自然言语经过过滤负面的、攻击性的和不恰当的回复和帖子来协助优化过程。

8. 个人语音助理

Siri、Alexa、谷歌助手以及Cortana都是个人语音助理,充分应用自然言语处理技术来了解和回应我们。

9. 语法检查

语法检查软件会自动检查和纠正你的语法、标点和拼写错误。

关于作者:卡蒂克·雷迪·博卡(Karthiek Reddy Bokka),语音和音频机器学习工程师,毕业于南加州大学,目前在波特兰的 Bi-amp Systems公司工作。他的兴味包括深度学习、数字信号和音频处理、自然言语处理以及计算机视觉。

舒班吉·霍拉(Shubhangi Hora),Python开发者、人工智能爱好者和作家。她有计算机迷信和心思学背景,对与心思健康相关的人工智能特别感兴味。

塔努吉·贾因(Tanuj Jain),在德国公司工作的数据迷信家。他不断在开发深度学习模型,并将其投入消费以商用。他对自然言语处理特别感兴味,并将本人的专业知识运用于分类和情感评级义务。

莫尼卡·瓦姆布吉(Monicah Wambugu),金融技术公司的首席数据迷信家,该公司经过应用数据、机器学习和分析来提供小额贷款,以执行替代信誉评分。她是加州大学伯克利分校信息管理与系统硕士研讨生。

本文摘编自《基于深度学习的自然言语处理》,经出版方授权发布。


延伸阅读《基于深度学习的自然言语处理》



引荐语:关于基于深度学习的自然言语处理的基础知识大全,内容片面且新颖,讲解专业且规范,是走上知晓深度学习与自然言语处理之路的优秀范本。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

hyby999999 2020-7-13 12:38:39 来自手机 显示全部楼层
呵呵。。。
回复

使用道具 举报

冰莫凝 2020-7-14 07:31:55 显示全部楼层
关注,等大神更新完了再看!楼主加油!
回复

使用道具 举报

冰凉怡夏 2020-7-14 22:21:18 来自手机 显示全部楼层
发发呆,回回帖,工作结束~
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies