门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助
公社首页
中国人工智能社区
公社版块
广播
Follow
升级会员
动态
Space
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
文章
帖子
公社群组
用户
好友
收藏
道具
勋章
任务
淘帖
动态
日志
相册
分享
记录
留言板
广播
群组
门户
导读
排行榜
设置
我的收藏
退出
首页
›
智能技术
›
自然语言
›
你对自然语言处理了解多少呢?
返回列表
你对自然语言处理了解多少呢?
[复制链接]
szgaoyahon
2024-4-22 20:55:57
显示全部楼层
|
阅读模式
什么是自然语言处理?
自然语言处理,英文Natural Language Processing,简写NLP。简单的断词为两个词“自然语言”和“处理”。自然语言指的我们人类的表达语言,包含汉语、英语、法语等。“处理”即计算机对人类语言的识别、计算和加工。他会模拟人类对语言的理解,并返回期望的结果。
比如:你对计算说:“你吃了吗?”,计算机回复:“我睡了三个小时”。显而易见,这不是我们“人”的思考和回答方式。其实对自然语言处理最终目标就是,让计算机完全理解我们的人类的含义。达到真正的智能交互。
大致来说,NLP可以分为以下几个领域:
【文本检索】:维基百科等搜索引擎
【机器翻译】:谷歌自带的谷歌翻译
【文本分类/情感分析】:多标签化的分类应用、支付宝给每个人的财报定位
【信息抽取】:一大段文字中抽取重点词汇
【序列标注】:分词、词性标注、关键词抽取、语义角色标注等等
【文本摘要】:提取文本核心,自动生成文本的摘要
【问答系统】:各大电商系统中的智能客服系统
【对话系统】:苹果的Siri、QQ小冰、各种机器人等
【知识图谱】:从文本中建立知识化的联系,图谱本身不具有应用意义,建立在图谱基础上的知识检索、知识推理、知识发现才是知识图谱的研究方向
【文本聚类】:古老的领域,从大量文本中自动发现规律
涉及的基本技术:
分词、词性标注、句法分析、词干提取、命名实体识别、指代消歧、关键词抽取、词向量与词嵌入、文本生成等等
常见的算法:
tfidf、BM25、TextRank、HMM、CRF、LSI、主题模型、word2vec、GloVe、LSTM/GRU、CNN、seq2seq、Attention……
对于目前阶段,我们举例遇到一些的困难:
①:句子“我们把香蕉给猴子,因为它们饿了”和“我们把香蕉给猴子,因为它们熟透了”有同样的结构。但是代词“它们”在第一句中指的是“猴子”,在第二句中指的是“香蕉”。如果不了解猴子和香蕉的属性,无法区分。
②:南京市长江大桥,根据断词来去解析这句话,可以分为
a.南京市 长江大桥 b.南京 市长 江大桥
相信大家看到这个词汇,根据讲话的抑扬顿挫能很明确的分辨出词语的意思,但是如果是一句话,计算机可能会难以区分或误判。此为基本的分词问题
③:“你这个豆腐怎么卖?” “一块两块”,那么机器很有可能就混乱了。是一块两块还是要买两块。
④:“小明受到了老师的表扬,他很高兴”,这个“他”是指“小明”还是指“老师”
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
大神点评
3
刘慧玲
2024-4-23 07:01:03
显示全部楼层
前排支持下了哦~
回复
使用道具
举报
偌小兜
2024-4-23 13:14:55
来自手机
显示全部楼层
是爷们的娘们的都帮顶!大力支持
回复
使用道具
举报
sumengchao
2024-4-23 18:49:35
显示全部楼层
秀起来~
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
szgaoyahon
高级会员
0
关注
0
粉丝
96
帖子
Ta的主页
发布
发消息
加好友
最近发表
外媒:乌称俄在夜间发动188架“创纪录”数量的无人机袭击,俄方
马斯克转发中国蜂群无人机视频,怒喷:美国还在生产F-35战机!
“买5台家电后我被迫下了4个APP”,智能家居为何难以互联互通?
智能家居系列总览
中国智能家居行业发展深度与投资前景预测报告(2024-2031年)
深圳市阿龙电子取得一种智能穿戴设备的自适应数据采集方法及系统
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们