门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助
公社首页
中国人工智能社区
公社版块
公社群组
Group
升级会员
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
帖子
公社群组
用户
道具
勋章
任务
设置
我的收藏
退出
首页
›
智能技术
›
自然语言
›
自然语言处理(NLP)系列(一)——自然语言理解(NLU) ...
返回列表
自然语言处理(NLP)系列(一)——自然语言理解(NLU)
[复制链接]
NhkmPUSb
2022-8-31 21:07:05
显示全部楼层
|
阅读模式
作为人工智能领域的基础,自然语言处理(NLP)一直是该领域最热门技术之一。近年来,一种潜在的新语言模型GPT-4出现,他
能够掌握更广泛的会话主题,甚至成为对话的 “主导者”
,实时语言翻译更加精准,与人的交流变得更加准确,可运用于每一个行业。
什么是自然语音处理(NLP)?
自然语言处理(NLP)是研究人与计算机交互的语言问题的一门学科。它研究人与计算机之间用自然语言进行有效通信的理论和方法。融语言学、计算机科学、数学等于一体的科学。自然语言处理的工作原理是先接收到通过人类使用演变而来的自然语言;再转译成自然语言,这通常是通过基于概率的算法进行转变的;最后再分析自然语言并输出最终结果。NLP就是利用人类交流所使用的自然语言与机器进行交互通讯的技术,对自然语言各方面(包括话语、句法结构、单词、语意解释等)的分析,理解出用户想表达的意思,从而得到机器可读并理解的语言。
自然语言处理是人工智能中最为困难的问题之一。
自然语言处理(NLP)的核心任务
自然语言处理(NLP)的两个核心任务分别是自然语言理解(NLU)和自然语言生成—(NLG)。自然语言的理解就是希望机器可以和人一样,有理解他人语言的能力;自然语言的生成就是将非语言格式的数据转换成人类的语言格式,以达到人机交流的目的。
什么是自然语言理解(NLU)?
NLU是所有支持机器理解文本内容的方法模型或任务的总称,即能够进行常见的文本分类、序列标注、信息抽取等任务。简单来说,就是希望机器人能够像人一样,具备正常的语言理解能力。
自然语言理解可以让机器从各种自然语言的表达中区分出哪些话归属于一类,而不是仅仅依赖过于死板的关键词。
自然语言理解(NLU)应用广泛
1.应用于2022年北京冬奥会和冬残奥会
2022年北京冬奥会和冬残奥会期间,为帮助视障人士听得见奥运文字、帮助听障人士看得见奥运声音,科大讯飞研发的虚拟主播“冰冰”和“小晴”通过集成多语种识别、自然语言理解、机器翻译等核心技术,形成一站式视频生产和编辑服务的能力,替代真人进行全天候新闻播报。
2.AI主播新闻播报
2021年12月6日,北京朝阳首位AI主播正式入驻“北京朝阳”客户端。据悉,北京朝阳客户端此次上线的AI主播基于虚拟数字人技术,为了让主播语音表达自然,通过自然语言理解技术,让虚拟主播具备高拟人度的表现力和感染力。
3.机器翻译
基于规则的翻译效果,想提升翻译的效果,必须建立在对内容的理解之上。市面上的词典搭载了YNMT神经网络翻译、ASR语音识别、NLU自然语言理解等技术,现已在语言翻译领域树立起行业标杆。
4.机器客服
如果想实现问答,就要建立在多轮对话的理解基础之上,自然语言理解是必备的能力。
5.智能音箱
智能音箱中,NLU 也是重要的一个环节。很多语音交互都是很短的短语,音箱不但需要能否识别用户在说什么话,更要理解用户的意图。
NLU的实现难点?
1.语言的多样性
自然语言没有什么通用的规律,且自然语言的组合方式非常灵活,字、词、短语、句子、段落等不同的组合可以表达出多种不同的含义。
2.语言的歧义性
如果不联系上下文,缺少环境的约束,语言可能会产生很大的歧义性。
3.语言的鲁棒性
自然语言在输入的过程中,尤其是通过语音识别获得的文本,会存在多字、错字、少字、噪音等问题。
4.语言的知识依赖
语言是对世界的符号化描述,语言依赖着世界知识。
5.语言的上下文
上下文的概念包括很多种:对话的上下文、设备的上下文、应用的上下文等。
近年来,人工智能的进步促进自然语言处理的发展,也使得自然语言处理面临挑战,比如更优的算法、语言的深度分析、多学科的交叉等,深度学习为自然语言处理带来了重大技术突破。随着NLP模型变得越来越大,需要更多的数据来训练它们。
景联文科技作为长三角地区规模最大的AI基础数据服务商之一,依托于自身全面的数据资源,技术优势以及丰富的数据处理经验,景联文科技提供完整的自然语言处理全领域数据处理能力,全链条AI数据服务,从数据采集、清洗、标注、到驻场的全流程、一站式AI数据服务,为企业提高完整的数据解决方案,协助人工智能企业解决整个人工智能链条中数据标注环节的相对应问题,可提高数据处理速度,降低处理成本。并于2020年上线了自有标注平台,保证数据的安全合规性,涵盖了绝大多数主流标注工具,支持NLP标注业务。现有数据库拥文本成品数据集50T。
景联文科技|AI基础数据服务|数据采集|数据标注|假指纹制作|指纹防伪算法
助力人工智能技术加速数字经济相关产业质量变革,赋能传统产业智能化转型升级
文章著作权归景联文科技所有,商业转载请联系景联文科技获得授权,非商业转载请注明出处;图片源自网络,如有侵权请联系我们进行删除。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
大神点评
3
好肚量醉鹅
2022-9-1 07:00:20
来自手机
显示全部楼层
只看文字不过瘾啊~
回复
使用道具
举报
爱琴海里柠檬树
2022-9-1 21:53:38
显示全部楼层
珍爱生命,果断回帖。
回复
使用道具
举报
红颜素手
2022-9-2 12:22:47
显示全部楼层
向楼主学习
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖后跳转到最后一页
NhkmPUSb
注册会员
0
关注
0
粉丝
13
帖子
Ta的主页
发布
加好友
最近发表
道明光学:生产的石墨烯散热膜可应用于手机、平板、电脑及智能穿
新加坡媒体:为妥善照顾公园鸟类,新加坡飞禽公园3款机器人明年
智能家居概念20日主力净流入16.09亿元,宜通世纪、和而泰居前
一架无人机坠毁在以北部居民楼内 暂无人员伤亡报告
“机器人之战”:俄乌冲突1000天激发AI军事化热潮
上海颁发首批无人驾驶车牌?系误读,识别标牌并非车牌
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们