找回密码
 立即注册
搜索

刷脸支付?人工智能识别人脸靠谱吗?

想知道这个问题,首先就得了解人工智能是如何识别图片的。

传统机器学习识别与深度学习识别对比

传统机器学习识别是通过人为提取图片特征,比如人脸五官,形成庞大的特征资源库。再由机器对需要识别的图片进行特征提取和对比从而对图片进行识别。

而深度学习是通过建立神经网络,让神经网络自己去学习图片各特征与结果之间的权重。



图像识别






计算机眼中的图像

计算机只认识0和1的二进制,那么人类眼中色彩丰富的图片计算机是如何识别和存储的呢?在计算机眼中一张色彩鲜艳的图片其实就是有数字组成的矩阵。灰度图像和色彩图像。彩色图像(R、G、B)表示颜色,图片在计算机中表现为三阶张量。



计算机眼中的图像











计算机眼中的图像






CNN卷积神级网络

图像识别一般是用卷积神经网络来建立深度学习模型的。之所以不用全连接神经网络的原因是:一张图片每一个像素点都是参数,输入的参数太多、网络层数有限制。假设一张1000*1000大小的图片,输入层就有1000*1000 = 100万个节点,假设一个影藏层有100个节点,那么光这一层就有(1000*1000+1)*100 = 1亿个参数;而卷积神经网络能在减少图片输入参数的前提下又不失图片本身的特征。

CNN神经网络主要包括卷积层、池化层、全连接层:



CNN模型











CNN模型






卷积

提取图像中的特征作为滤镜。如下图,提取了X的三个特征



特征提取






提取特征作为滤镜后,使用滤镜扫描图片:以图像每一个点为中心,取周围N*N格点构成一个面,称为卷积核,每一格给予不同的权重,计算加权总和,当做这一点的outPut,再移动至下一个点以相同方式处理。



滤镜扫描











滤镜扫描






通过三层滤镜扫描后得到:



滤镜扫描结果






池化

池化是一种压缩图片但会保留图片重要资讯的手段,采用滑动视窗,取范围内最大值。例如滑动视窗大小2*2,并且每次滑动2格,则图片会被缩小为原来的四分之一。



池化过程











池化结果






CNN

再加上其他的一些其他元件,如ReLu激活函数、全连接等,构成完整的CNN(卷积)神经网络。

通过CNN神经网络的判别后,会给出各结果的可能性,可能性最高的极大可能就是我们要的结果。



CNN图像识别方式






目前图像识别的程度

深度学习图像识别有一个很知名的比赛,每年都会有知名的模型出来,像AlexNet、VGGNet、ResNet等,模型层数也是越来越多,准确率也越来越高。今年这个比赛已经不再举行了,因为现在识别准确率已经十分高了,将近97%的准确率,再举行比赛已经没有意义了。



人工智能图像识别准确率飞速提升






像ResNet识别狗的图片,都能区分出狗的品种来,这可是很多人类都不见得做的到的

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

大神点评1

maoln 2024-1-6 09:37:08 显示全部楼层
转发了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册