在线人脸比对人脸识别应用

作者根据多年从事人脸识别项目的经验，总结了人脸识别技术在安防和商业领域的应用以及产品设计的细节，并将其归纳为应用层下的一系列人脸识别文章。本文针对系列文章中的第三篇文章——介绍了人脸比对的相关内容。全文重点介绍了人体比较类型和人脸比较元素。

一、人脸比对类型

人脸对比类型可以分为四种，分别是：人脸1:1、人脸1:N、人脸1:n、人脸M:N。

人脸识别的应用无非就是围绕这四种比较方法，下面将依次介绍每一种比较类型。

00-1010 face 133601一般用于证人验证，可以简单理解为：证明你是。

比如在乘坐火车、飞机、出入境、银行卡时，通常需要验证本人是否与本人持有的身份证是同一个人。

如下图所示，系统只需要读取二代身份证中的人脸照片，并与我现场拍摄的照片进行对比。

人脸1:1，又称静态人脸比较，具有合作的特点。完成比对，需要用户携带身份证，积极配合采集人脸。

1. 人脸1:1

人脸1:n:将一张人脸照片与人脸数据库中的多张人脸逐一进行比对，比对次数与人脸数据库中的人脸数相同。——平台采集到一张“我”的照片后，从海量的人像数据库中找到与当前用户面部数据匹配的图像，并进行匹配，找出我是谁。

人脸1:n也叫动态人脸比较。

对比照片是从动态视频中获取的，同时具有不合作的特点。——整个比较过程是无感的，不需要人的配合。这两个特点使得人脸1:n能够快速登陆警方追捕逃犯，但难度远高于人脸1:1。通常受光照和脸部姿势变化的影响。——比如侧脸、低头、背光的现象，会大大提高漏脸报案率。)

人脸1:n中“n”的大小人脸数据库中的照片数量)会影响人脸识别的准确性和比对速度，因此比对人脸数据库的规模会设置得相对较小。

2. 人脸1:n

人脸1:N也叫静态大数据库检索：即以人脸图片和人脸相似度为检索条件，在人脸数据库中搜索与其相似相似度大于设定阈值)的图片——类似于百度地图搜索。

实际上，检索过程是对人脸进行n次比较，留下分数大于阈值的结果。

1:n的人脸数据库大小比1:N大很多，最多可以支持1亿张人脸检索，所以这里的N是大写的。

3. 人脸1:N

人脸M:N其实是两个人脸数据库的对比。

比如人脸数据库A有m张脸，人脸数据库B有n张脸。要想看到人脸数据库A和B中包含了多少个相同的人，需要将人脸数据库A中M的人脸与人脸数据库B中N的人脸逐一进行比较，相当于将M 1:N的人脸相加的结果。

人脸M:N常用于累犯侦查和身份核查。

比如办理三抢一盗之类的案件，80%的案件通常是惯犯所为。因此，将线索位置的过路人数据库和累犯数据库与人脸M:N进行比对碰撞，可以快速查到嫌疑人，找出侦查方向。

00-1010

4. 人脸M:N

人工智能算法的进化必须有数据支撑。

使用大量的标注数据训练模型，识别准确率可以从70%提高到99%。客观准确的数据是人工智能应用的必要条件。

获取面部数据的五种方法：

监控摄像头、手机摄像头和其他类型的摄像头：拍摄的视频和照片是人脸原始数据的主要来源。在项目中，这类摄像机往往通过RTSP、FTP等协议对接，获取实时视频流或图片流。NVR/DVR等视频存储设备：存储大量视频资源，通过ONVIF协议对接此类设备即可获取数据。第三方企事业单位人事信息数据库：如公安八大信息资源数据库、企业员工信息数据库等。这类数据很难获取，会涉及到第三方平台的对接，以及保密性和网络安全。互联网中的开放数据集：常用的人脸数据集如WebFace、FDDB、LFW、YouTube Face等。提供高质量的标注数据，可用于算法测试和模型训练。网络爬行：通过编写或使用免费的网络爬虫程序，在万维网上自动抓取图片。它们被广泛用于互联网数据收集。

二、人脸比对的要素

人脸比对数据库提供人脸识别的比对模板——人脸1:N、人脸1:n和人脸M:N必须有人脸比对数据库进行比对。

《应用层人脸识别二)》系列第二篇：人脸

库》详细的介绍了人脸库的建立方法。

3. 比对阈值

比对阈值：人脸比对的相似度。

人脸比对结果以相似度值呈现，在人脸比对之前需要设定一个相似度的门槛值，大于这个门槛则判定两张照片可能为同一个人。

比对阈值对人脸识别的准确率、漏报率影响颇大，比对阈值设置的越高准确率就越高，漏报率也会随之升高。比对阈值没有一个固定的标准，应根据应用场景来灵活调整。

例如：刷脸支付更关注比对准确率，需要调高阈值；而公安嫌犯人脸布控要求降低漏报，就需要适当调低阈值。

4. 芯片

人工智能的三要素是算法、算力和数据，而芯片决定了算力。

深度学习工程的两大关键环节training（训练）和inference（推测）需要大量的算力支撑，普通的CPU无法满足计算要求。

相继推出的高性能GPU、TPU、FPGA、ASIC等加速芯片，大大提升了计算速度，同时也促进了算法的发展。

GPU在人脸1:n、1:N、M:N比对中是不可或缺的，而部分人脸1:1计算量不大，可以不使用加速芯片。亿级人脸检索在GPU的加速下可以达到秒级返回结果。

5. 人脸算法

人脸算法效果决定了人脸识别的上限，也是人脸比对最关键的要素。随着深度学习技术的普及，各大公司的人脸算法效果差距也越来越小。

目前主流的人脸识别算法可以分为以下四类：

基于人脸特征点的识别算法基于整幅人脸图像的识别算法基于模板的识别算法利用神经网络进行识别的算法

2018年11月20日公布的，有工业界黄金标准之称的全球人脸识别算法测试FRVT)结果（如下图）：

排名前五的算法都被中国包揽：

依图科技yitu)继续保持全球人脸识别竞赛冠军，在千万分之一误报下的识别准确率超过99%。排名第二的算法也来自依图科技。商汤科技sensetime)摘得第三名和第四名。中国科学院深圳先进技术研究院siat)排名第五。

人脸算法虽然在各种数据集的测试中准确率颇高，但还远没达到在商业应用中的满意程度。

目前仍然有很多缺陷需要解决，例如：

姿态问题：

人脸识别主要依据人的面部表象特征来进行，“如何识别由姿态引起的面部变化？”就成了该技术的难点之一。

姿态问题涉及：头部在三维垂直坐标系中，绕三个轴的旋转造成的面部变化。其中，垂直于图像平面的两个方向的深度旋转会造成面部信息的部分缺失。这使得姿态问题成为人脸识别的一个技术难题。

针对姿态的研究相对比较的少，目前多数的人脸识别算法主要针列正面、准正面人脸图像。当发生俯仰或者左右侧而比较厉害的情况下，人脸识别算法的识别率也将会急剧下降。

图像质量问题：

人脸图像的来源可能多种多样，由于采集设备的不同，得到的人脸图像质量也不一样。

特别是对于那些低分辨率、噪声大、质量差的人脸图像（如：手机摄像头拍摄的人脸图片、远程监控拍摄的图片等），“如何进行有效地人脸识别？”就是个需要关注的问题。

而对于高分辨图像对人脸识别算法的影响，也需要进一步的研究。

现在，我们在人脸识别时，一般采用的都是相同尺寸、清晰度很接近的人脸图片，所以图像质量问题基本可以解决。但是，面对现实中更加复杂的问题，还是需要继续优化处理。

遮挡问题：

对于非配合情况下的人脸图像采集，遮挡问题是一个非常严重的问题。

特别是在监控环境下，往往被监控对象都会带着眼镜、帽子等饰物，使得被采集出来的人脸图像有可能不完整，从而影响了后面的特征提取与识别，甚至会导致人脸检测算法的失效。

人脸算法在人脸五官被挡的情况下表现的不是很好。

目前对遮挡识别效果较好的DeepID2算法，可稳定识别遮挡在20%以内，块大小在30*30以下的人脸。

样本缺乏问题：

基于统计学习的人脸识别算法是目前人脸识别领域中的主流算法，但是统计学习方法需要大量的训练。

由于人脸图像在高维空间中的分布是一个不规则的流形分布，能得到的样本只是对人脸图像空间中的一个极小部分的采样。关于“如何解决小样本下的统计学习问题？”，还有待进一步的研究。

以上就是系列文章的第三篇——《应用层下的人脸识别（三）：人脸比对》的相关内容。

欢迎大家添加公众号“阳春柏樰”与我继续交流图像识别相关问题。

三、相关阅读

应用层下的人脸识别（一）：图像获取

应用层下的人脸识别（二）：人脸库

本文由@阳春柏樰原创发布于人人都是产品经理。未经许可，禁止转载

题图来自Unsplash，基于CC0协议

在线人脸比对人脸识别应用