人工智能科普｜我们经常听说的人脸识别技术，究竟是什么（1）

419635697 · 2023-5-9 16:13:31

在移动互联网时代，人脸识别技术中最难的部分是创造出适应各种光线环境的人脸预处理算法，需要在各种复杂的光线环境中提取到人脸信息。

计算机视觉中的“5常”任务

提到人脸识别，同学们应该都不陌生，随着近几年AI技术的发展，人脸识别的应用已经深入我们生活的各个方面。

比如我们在网上购买了一些零食准备付款的时候，可能就会用到支付宝的人脸验证技术；还比如最近滴滴打车进行整改，要求司机每天出车前通过人脸识别后才能接单。

讲完这些案例，我们先来对人脸识别的概念做些解析，人脸识别是计算机视觉的子课题之一。计算机视觉是让人教会机器去“看清”这个世界，计算机视觉中有5项常见任务，分别是分割、检测、识别、描述、推理。

分割是将图像分解成若干特定、具有独特性质的目标区域，用户输入一张原始照片，机器可以对其做一些场景语义分割，将照片中的蓝天、汽车、树木区分开来。

检测是发现目标并确定位置，最常见的任务有三类：这张图片中是否有XX？XX的数量是多少？XX的位置在哪里？

识别是判断目标类别、性质或相似性，通常它会由2类常规任务构成，第一类任务是相似检索问题，比如我们经常会用到的搜索引擎中的图像搜索功能；第二类任务是相似比对问题。

描述任务用通俗易懂的话来讲就是“看图说话”，由机器介绍图片或视频中的内容。

最后一类常规任务是推理，根据图像或视频内容发掘故事，以上图为例，机器根据“小伙子上篮”这张图像进行背后故事挖掘，猜想可能是小伙子为了进校篮球队而苦练上篮。
基于计算机视觉的人脸识别系统

人脸识别技术中也有2项常见任务：判断图像或视频中出现的人是不是同一人，即人脸认证；判断这个人到底是谁，即人脸检索。人脸认证和人脸检索的核心均为人脸相似度的判决。

机器在判断两张图片中人脸的相似度时一般有以下4步：人脸检测---人脸预处理---人脸特征提取---特征对比。通过这些步骤其实不难看出人脸识别技术是模仿人类识别人脸的过程，用计算机比较人脸图像的相似性。

看到这里可能有些同学要问：既然是比较相似性，那我们该如何评价人脸识别的效果呢？

说到人脸识别的效果，就不得不说下人脸识别的公开测试集，目前在国际上比较有名的人脸识别公开测试集有2个，一是LFW公开集，此公开集中6000个图像对，最高准确率已经达到99.83%，超过了人眼的水平；另一个公开集是华盛顿大学发布的MegaFace公开集。

如果从公开测试集的效果来看人脸识别技术已经逐步接近甚至是超过人眼的水平。
1：1人脸相似判决的评判标准

根据两张照片的真实匹配关系与预测匹配关系，可以将预测结果分类：

在这4类结果中，通常会计算出2个关键指标：召回率和虚警率。召回率即召回人数在所有人数的占比，虚警率即虚警人数在所有人数中的占比。

机器在进行人脸识别的时候，通常会给出两张照片人脸的相似性，而不是直接输出结果：是or否。

在这种情况下我们需要取出不同的应用阈值，以下图为例，黑色线条代表负样本的相似性分布、橙色线条代表正样本的相似性分布。随着坐标轴的变化，正负样本的相似性也在不断变化。

在实际使用过程中，我们需要对相似性做一些数值控制，取其中某一段的应用阈值，并且将这段应用阈值从0到1的分布标注出来。

在标注应用阈值的过程中会产生识假、召回、拒真、虚警这4个指标，根据召回率和虚警率可以得出ROC曲线，得出ROC曲线的意义在于我们可以判断出不同人脸识别算法的效果，同时也可以给出更加实用的参考指标。

不同应用对虚警率/召回率要求不同，因此人脸验证系统的阈值通常是可配置，应用系统只给出单方面效果(如虚警率万分之一)是不客观的。
人脸识别效果的影响因素

虽然在公开集中人脸识别取得了很高的准确率，甚至在某些特定情况的准确率已经超过了人眼识别，但在实际应用过程中会存在很多影响因素，在业内一般将这些影响因素分为2大类：一类是外因，一类是内因。

外因的影响因素主要有光线影响，比如说极端的光线或者人脸光照分布不均等，除了光线以外摄像头分辨率也是一个很大的影响因素，拍摄角度不好或者离拍摄人物很远的时候，会导致机器识别不出人脸。

除了外因，人自身的因素同样影响到识别效果，比如说人脸部的遮挡——墨镜、刘海、口罩等；还有些拍照角度以及脸部纹理变化都会影响人脸识别的效果。

		自动登录	找回密码
密码			立即注册

人工智能科普｜我们经常听说的人脸识别技术，究竟是什么（1）

本帖子中包含更多资源

最近发表

公社版块

关注我们