门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助
公社首页
中国人工智能社区
公社版块
公社群组
Group
升级会员
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
帖子
公社群组
用户
道具
勋章
任务
设置
我的收藏
退出
首页
›
智能技术
›
自然语言
›
你对自然语言处理了解多少呢?
返回列表
你对自然语言处理了解多少呢?
[复制链接]
szgaoyahon
2024-4-22 20:55:57
显示全部楼层
|
阅读模式
什么是自然语言处理?
自然语言处理,英文Natural Language Processing,简写NLP。简单的断词为两个词“自然语言”和“处理”。自然语言指的我们人类的表达语言,包含汉语、英语、法语等。“处理”即计算机对人类语言的识别、计算和加工。他会模拟人类对语言的理解,并返回期望的结果。
比如:你对计算说:“你吃了吗?”,计算机回复:“我睡了三个小时”。显而易见,这不是我们“人”的思考和回答方式。其实对自然语言处理最终目标就是,让计算机完全理解我们的人类的含义。达到真正的智能交互。
大致来说,NLP可以分为以下几个领域:
【文本检索】:维基百科等搜索引擎
【机器翻译】:谷歌自带的谷歌翻译
【文本分类/情感分析】:多标签化的分类应用、支付宝给每个人的财报定位
【信息抽取】:一大段文字中抽取重点词汇
【序列标注】:分词、词性标注、关键词抽取、语义角色标注等等
【文本摘要】:提取文本核心,自动生成文本的摘要
【问答系统】:各大电商系统中的智能客服系统
【对话系统】:苹果的Siri、QQ小冰、各种机器人等
【知识图谱】:从文本中建立知识化的联系,图谱本身不具有应用意义,建立在图谱基础上的知识检索、知识推理、知识发现才是知识图谱的研究方向
【文本聚类】:古老的领域,从大量文本中自动发现规律
涉及的基本技术:
分词、词性标注、句法分析、词干提取、命名实体识别、指代消歧、关键词抽取、词向量与词嵌入、文本生成等等
常见的算法:
tfidf、BM25、TextRank、HMM、CRF、LSI、主题模型、word2vec、GloVe、LSTM/GRU、CNN、seq2seq、Attention……
对于目前阶段,我们举例遇到一些的困难:
①:句子“我们把香蕉给猴子,因为它们饿了”和“我们把香蕉给猴子,因为它们熟透了”有同样的结构。但是代词“它们”在第一句中指的是“猴子”,在第二句中指的是“香蕉”。如果不了解猴子和香蕉的属性,无法区分。
②:南京市长江大桥,根据断词来去解析这句话,可以分为
a.南京市 长江大桥 b.南京 市长 江大桥
相信大家看到这个词汇,根据讲话的抑扬顿挫能很明确的分辨出词语的意思,但是如果是一句话,计算机可能会难以区分或误判。此为基本的分词问题
③:“你这个豆腐怎么卖?” “一块两块”,那么机器很有可能就混乱了。是一块两块还是要买两块。
④:“小明受到了老师的表扬,他很高兴”,这个“他”是指“小明”还是指“老师”
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
大神点评
3
刘慧玲
2024-4-23 07:01:03
显示全部楼层
前排支持下了哦~
回复
使用道具
举报
偌小兜
2024-4-23 13:14:55
来自手机
显示全部楼层
是爷们的娘们的都帮顶!大力支持
回复
使用道具
举报
sumengchao
2024-4-23 18:49:35
显示全部楼层
秀起来~
回复
使用道具
举报
发表新帖
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
网贷观察
szgaoyahon
中级会员
0
关注
0
粉丝
95
帖子
Ta的主页
发布
加好友
最近发表
道明光学:生产的石墨烯散热膜可应用于手机、平板、电脑及智能穿
新加坡媒体:为妥善照顾公园鸟类,新加坡飞禽公园3款机器人明年
智能家居概念20日主力净流入16.09亿元,宜通世纪、和而泰居前
一架无人机坠毁在以北部居民楼内 暂无人员伤亡报告
“机器人之战”:俄乌冲突1000天激发AI军事化热潮
上海颁发首批无人驾驶车牌?系误读,识别标牌并非车牌
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们