门户
图库
科技
数据
VR
区块链
学院
论坛
百科
导航
登录
注册
帮助
公社首页
中国人工智能社区
公社版块
公社群组
Group
升级会员
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录后你可以:
登录
首次使用?
点我去注册
搜索
搜索
本版
帖子
公社群组
用户
道具
勋章
任务
设置
我的收藏
退出
首页
›
公社水吧
›
大话智能
›
刷脸支付?人工智能识别人脸靠谱吗?
返回列表
刷脸支付?人工智能识别人脸靠谱吗?
[复制链接]
不发芽儿的豆儿
2024-1-6 09:36:34
显示全部楼层
|
阅读模式
想知道这个问题,首先就得了解人工智能是如何识别图片的。
传统机器学习识别与深度学习识别对比
传统机器学习识别是通过人为提取图片特征,比如人脸五官,形成庞大的特征资源库。再由机器对需要识别的图片进行特征提取和对比从而对图片进行识别。
而深度学习是通过建立神经网络,让神经网络自己去学习图片各特征与结果之间的权重。
图像识别
计算机眼中的图像
计算机只认识0和1的二进制,那么人类眼中色彩丰富的图片计算机是如何识别和存储的呢?在计算机眼中一张色彩鲜艳的图片其实就是有数字组成的矩阵。灰度图像和色彩图像。彩色图像(R、G、B)表示颜色,图片在计算机中表现为三阶张量。
计算机眼中的图像
计算机眼中的图像
CNN卷积神级网络
图像识别一般是用卷积神经网络来建立深度学习模型的。之所以不用全连接神经网络的原因是:一张图片每一个像素点都是参数,输入的参数太多、网络层数有限制。假设一张1000*1000大小的图片,输入层就有1000*1000 = 100万个节点,假设一个影藏层有100个节点,那么光这一层就有(1000*1000+1)*100 = 1亿个参数;而卷积神经网络能在减少图片输入参数的前提下又不失图片本身的特征。
CNN神经网络主要包括卷积层、池化层、全连接层:
CNN模型
CNN模型
卷积
提取图像中的特征作为滤镜。如下图,提取了X的三个特征
特征提取
提取特征作为滤镜后,使用滤镜扫描图片:以图像每一个点为中心,取周围N*N格点构成一个面,称为卷积核,每一格给予不同的权重,计算加权总和,当做这一点的outPut,再移动至下一个点以相同方式处理。
滤镜扫描
滤镜扫描
通过三层滤镜扫描后得到:
滤镜扫描结果
池化
池化是一种压缩图片但会保留图片重要资讯的手段,采用滑动视窗,取范围内最大值。例如滑动视窗大小2*2,并且每次滑动2格,则图片会被缩小为原来的四分之一。
池化过程
池化结果
CNN
再加上其他的一些其他元件,如ReLu激活函数、全连接等,构成完整的CNN(卷积)神经网络。
通过CNN神经网络的判别后,会给出各结果的可能性,可能性最高的极大可能就是我们要的结果。
CNN图像识别方式
目前图像识别的程度
深度学习图像识别有一个很知名的比赛,每年都会有知名的模型出来,像AlexNet、VGGNet、ResNet等,模型层数也是越来越多,准确率也越来越高。今年这个比赛已经不再举行了,因为现在识别准确率已经十分高了,将近97%的准确率,再举行比赛已经没有意义了。
人工智能图像识别准确率飞速提升
像ResNet识别狗的图片,都能区分出狗的品种来,这可是很多人类都不见得做的到的
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
大神点评
1
maoln
2024-1-6 09:37:08
显示全部楼层
转发了
回复
使用道具
举报
发表新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
不发芽儿的豆儿
高级会员
0
关注
0
粉丝
103
帖子
Ta的主页
发布
加好友
最近发表
1299元起,大疆DJI Neo无人机发布:135g重+掌上起降+4K视频录制
翼飞发布Taurus X8 Pro Max穿越无人机:载重4.5kg,续航15分钟
DJI NEO 首发体验:135g的它,却是我心目中最好的航拍无人机
大疆发布旗下最轻、最小无人机DJI Neo:仅135克重,1299元起
2架隐形无人机现身西部荒漠,不声不响,一技术已反超美国
中国民用无人机物美价廉,乌克兰三方购得,外交部:责任不在中方
公社版块
版块推荐
更多版块
智能穿戴
智能家居
机器人
无人驾驶
无人机
反馈吐槽
闲聊灌水
大话智能
大数据
图像识别
自然语言
数据挖掘
大话智能
数据挖掘
北大讲座
清华讲座
网贷观察
股市评论
区块链
闲聊灌水
反馈吐槽
站务通知
关注我们