找回密码
 立即注册
搜索

自然语言改变了我们的生活方式

人类的语言充满了歧义,这使得编写准确确定文本或语音数据预期含义的软件变得异常困难。
谐音,同音词,讽刺,成语,隐喻,语法和用法例外,句子结构的变化-这些只是人类语言中的一些不规则现象,需要人类花费多年的时间来学习
作为人类,您可以说,说或写英语,西班牙语或中文。但是,计算机的本地语言(称为机器代码或机器语言)在大多数人中是很难理解的。在计算机设备的最初时期,通讯不是通过单词进行的,而是通过数百万个产生逻辑操作的零和一个进行的,为了解决以上问题,加上人工智能领域的发展,自然语言处理(NLP)被重视并且大力开发相关技术
自然语言处理兴起于美国。第二次世界大战之后,二十世纪五十年代,当电子计算机还在襁褓之中时,利用计算机处理人类语言的想法就已经出现。当时,美国希望能够利用计算机将大量俄语材料自动翻译成英语,以窥探苏联科技的最新发展。研究者从破译军事密码中得到启示,认为不同的语言只不过是对“同一语义”的不同编码而已,从而想当然地认为可以采用译码技术像破译密码一样“破译”这些语言。
1954年1月7日,美国乔治敦大学和IBM公司合作实验成功地将超过60句俄语自动翻译成英语。虽然当时的这个机器翻译系统非常简单,仅仅包含6个语法规则和250个词,但由于媒体的广泛报道,纷纷认为这是一个巨大的进步,导致美国政府备受鼓舞,加大了对自然语言处理研究的投资。实验完成者也当即自信地撰文称,在三到五年之内就能够完全解决从一种语言到另一种语言的自动翻译问题。他们认为只要制定好各种翻译规则,通过大量规则的堆砌就能够完美地实现语言间的自动翻译
自然语言处理(NLP)距离我们遥远吗?
简而言之,NLP表示自动处理自然的人类语言,例如语音或文本,尽管概念本身很有趣,但该技术背后的真正价值来自与各行各业的应用。
NLP可以帮助您完成许多任务,并且应用领域似乎每天都在增加。让我们举一些例子:
1, 医学临床:
NLP可以基于电子健康记录和患者自己的语音来识别和预测疾病。例如,Amazon Comprehend Medical是一项使用NLP从患者病例记录,临床试验报告和其他电子健康记录中提取疾病状况,提供准确的药物和治疗结果的服务。
2,社交媒体/市场/整合营销:
企业可以通过识别和提取社交媒体等来源的信息来确定客户对服务或产品的评价。这种情感分析可以提供大量的有关客户选择和他们的决定购买和使用产品的信息。
3,信息搜索:
IBM的一位发明家开发了一种认知助手,该认知助手通过了解所有有关您的信息,然后像个性化搜索引擎一样工作,然后使您想起名字,歌曲或任何您想不起来的东西。
4,企业邮件处理:
诸如Yahoo和Google之类的公司通过分析流经服务器的电子邮件中的文本并在垃圾邮件甚至没有进入收件箱之前就停止了垃圾邮件处理,从而使用NLP对电子邮件进行过滤和分类。
5,传媒新闻业:
为了帮助识别虚假新闻,麻省理工学院的NLP小组开发了一种新系统,以确定消息来源是否准确或在政治上有偏见,从而检测新闻来源是否可以信任。
6,手机移动端设备:
亚马逊的Alexa和苹果的Siri就是智能语音驱动界面的创建,这些界面使用NLP语音提示,并进行各种操作,例如找到特定的商店,告诉我们天气预报,建议到达办公室的最佳路线或在家中打开灯。
7,金融交易:
洞悉正在发生的事情以及人们在谈论什么对于金融交易者而言可能非常有价值。NLP被用来跟踪新闻,报告,关于公司之间可能合并的评论,然后将所有内容合并到交易算法中以产生巨额利润。记住:买谣言,卖新闻。
8,人力资源领域:
NLP还被用于人才招聘的搜索和甄选阶段,确定潜在员工的技能,并在潜在人才活跃于就业市场之前对其进行发现。
9,法律行业:
在IBM Watson NLP技术的支持下,LegalMation开发了一个平台来自动执行常规诉讼任务,并帮助法律团队节省时间,降低成本并转移战略重点。
10,医疗保健行业:
NLP在医疗保健行业尤其蓬勃发展。在医疗机构正越来越多地采用电子病历的同时,这项技术正在改善护理服务,疾病诊断并降低成本。可以改善临床数据意味着可以通过更好的医疗保健更好地了解患者并从中受益。
一般而言,NLP任务将语言分解成较短的基本部分,试图理解各个部分之间的关​​系,并探索这些部分如何协同工作以创造意义。
这些基础任务通常用于更高级别的NLP功能,例如:

内容分类。基于语言的文档摘要,包括搜索和索引编制,内容警报和重复检测

信息发现和建模。准确地捕获文本信息中的含义,并将高级分析应用于文本,例如优化和预测

上下文提取。自动从基于文本的源中提取结构化信息

情绪分析。在大量文本中识别情绪或主观意见,包括平均情绪和观点挖掘

语音到文本和文本到语音的转换。将语音命令转换为书面文本,反之亦然。

文件摘要。自动生成大文本正文的摘要

机器翻译。自动将文本或语音从一种语言翻译成另一种语言
对于自然语言处理(NLP)技术研究的主力军来自于全球各所高校,新一代的人才培养至关重要,我们就此来了解一下全球顶级大学的研究项目:

1, 斯坦福大学:
深度学习自然语言处理
探索NLP的基本概念及其在当前和新兴技术中的作用。您将全面了解用于语言信息处理的现代神经网络算法。通过掌握最先进的方法,您将获得从单词表示和句法处理转向设计和实现复杂的深度学习模型的技能,以用于问题回答,机器翻译和其他语言理解任务
您将学到什么

• 自然语言的计算特性

• 用于语言理解任务的神经网络模型

• 词向量,句法和语义处理

• 共指,问题解答和机器翻译
https://online.stanford.edu/courses/xcs224n-natural-language-processing-deep-learning

2, 哥伦比亚大学:
自然语言处理
NLP @ CU组由七名高级研究人员组成,他们是多个项目的首席研究员,并为各个层次的研究生提供建议。在任何一年中,博士学位数量 学生人数从大约15到25,而且硕士生的数量要大得多。其他成员包括博士后研究员,访客,本科生研究助理和顾问
哥伦比亚大学特别擅长的领域包括:

• 音韵学,韵律

• 形态学

• 语法和解析

• 词法语义,词义歧义

• 语篇处理,语篇共指

• 对话,口语

• 体裁,方言变化

• 生成,总结,问题解答

• 信息提取,数据挖掘

• 机器翻译

• 语言和社交网络

• 阿拉伯语NLP

• 语言资源的创建,例如语料库,词汇

• 对自然语言处理技术,资源和人类语言使用的评估

3, 哈佛大学:
我们小组的研究出版文章开放源代码项目的重点是文本摘要,神经机器翻译,可视化递归神经网络,缩小神经网络的算法,文档中实体跟踪的模型,多模式文本生成,语法错误纠正和新方法用于文本生成
https://nlp.seas.harvard.edu/

4, 德克萨斯大学奥斯汀分校:
自然语言处理
侧重于使用统计方法和深度学习的现代自然语言处理。解决的问题包括文本的句法和语义分析以及情感分析,问题回答和机器翻译等应用程序。涵盖的机器学习概念包括二进制和多类分类,序列标记,前馈,递归和自我关注的神经网络,以及预训练/转移学习
https://www.cs.utexas.edu/graduate-program/masters-program/online-option/courses/natural-language-processing

5, 加州大学伯克利分校:
深度学习和自然语言处理
本课程广泛介绍了语言现象,以及我们尝试通过机器学习对其进行分析的尝试。我们将涵盖广泛的概念,重点是实际应用,例如信息提取,机器翻译,情感分析和摘要
https://ischoolonline.berkeley.edu/data-science/curriculum/natural-language-processing/

6, 哈佛大学:
自然语言处理
课程的绝大部分内容都集中在应用流行的文本挖掘方法上。结果,目标受众可能还包括定性研究人员,他们希望在访谈,媒体和其他基于语言的现场研究中添加定量分析
https://online-learning.harvard.edu/course/introduction-natural-language-processing?delta=0






(以上想更多了解美国大学相关研究专业的同学们可以联系我)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

大神点评3

@Xizi_d0bPoFlO 2024-4-23 07:04:16 显示全部楼层
老哥,这波稳
回复

使用道具 举报

讽刺大人 2024-4-23 14:10:54 显示全部楼层
加油!不要理那些键盘侠!
回复

使用道具 举报

@Xizi_o3YrXI3W 2024-4-23 19:59:01 来自手机 显示全部楼层
不错 支持下
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies