找回密码
 立即注册
搜索

机器学习:什么是自然语言处理

狐步 2023-12-15 08:05:23 显示全部楼层 阅读模式
自然语言处理NLP)是机器学习的重要子领域,自然语言处理的主要任务就是处理机器(计算机)和人类(自然)语言之间的交互。自然语言不仅限于语音和对话。它们也可以是书面文本和手语。NLP任务的数据也可以是不同的形式,例如,来自社交媒体的帖子、网页、甚至是医疗处方的文本、护士的护理记录、来自语音邮件的音频、控制系统的命令、甚至是喜欢的音乐或电影等等都可以作为自然语言处理的数据源。

如今,NLP已广泛渗入我们的日常生活:比如我们常用的机器翻译;天气预报文本的自动生成;语音搜索很方便;各种语音对话的智能系统,比如小度,小爱同学;还有文本朗读技术,这些都有应用到自然语言处理技术。

如果机器能够像人类一样理解语言,我们可以认为它们是智能的。1950年,著名的数学家艾伦·图灵(Alan Turing)在一篇著名的文章《计算机械与智能》中提出了一种测试机器智能的标准。现在称为图灵测试,其目的是检查计算机是否能够充分理解语言,从而让人们觉得这是另一个人而不是一台机器。遗憾的是,到目前为止还没有计算机通过图灵测试。但是1950年代标志着NLP历史的开始。

理解一种语言可能很困难,但是自动将文本从一种语言翻译成另一种语言会更容易吗?我们可以想象这种翻译会涉及到词典查询和新文本的生成。一种更实际可行的方法是收集已经由人类翻译的文本,并在这些文本上训练计算机程序。1954年,科学家在Georgetown-IBM的实验中声称,机器翻译将在三到五年内解决。

不幸的是,到目前还没有能够击败人类翻译者的机器翻译系统。但是,自从引入深度学习以来,机器翻译一直在不断发展。

对话代理或聊天机器人是NLP中的另一个热门话题。计算机能够与我们对话的事实也曾改变了企业的运营方式。2016年,微软的AI聊天机器人Tay可以在Twitter上实时与用户交谈。她从用户在Twitter上发布和评论的内容中学习了如何说话。但是,推友们发来的推特含有很多不良内容,这些不良内容也被她学习了,并且她开始在自己的供稿中输出不适当的内容。最终她在发布后的24小时后被下架了。

和上面的应用相比,NLP的一个重要较低的水平的应用例子则是词性划分。词性POS)是一种语法词类如名词或动词。词性标记尝试为句子或较大文档中的每个单词确定适当的词性。下表提供了英语POS的示例:




好了,今天就大概介绍一下什么是自然语言处理及其应用,感谢您耐心看完,之后会介绍python中NLP的常用工具,发表这些东西的主要目的就是督促自己,希望大家关注评论指出不足,一起进步。内容我都会写的很细,一个目的就是零基础也能懂,因为自己就是什么基础没有从零学Python的。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评2

伪善の上帝 2023-12-15 13:23:40 来自手机 显示全部楼层
前排支持下了哦~
回复

使用道具 举报

颖伊儿 2023-12-17 21:42:30 显示全部楼层
纯粹路过,没任何兴趣,仅仅是看在老用户份上回复一下
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies