近年来,卷积神经网络在人脸检测中取得了很大的成功,然而这些方法在处理人脸中多变的尺度,姿态,遮挡,表情,光照等问题时依然比较困难。为此,腾讯优图推出名为 DSFD (中文名为双分支人脸检测器)的全新算法,该算法在著名人脸检测数据集上取得喜人结果,如今腾讯优图决定将之进行开源。
腾讯优图的研究员们发现,虽然之前的人脸检测算法大都采用深度学习模型,并在特征学习的过程中也有采用特征金字塔网络(Feature Pyramid Network),但在面对遮挡、暗光、大姿态、小脸等复杂场景时,仍容易出现误检或漏检的情况。因此,在 FPN 基础上,腾讯优图团队采用了 3 种不同级联方式的空洞卷积(Dilated Convolution),设计了特征增强模块 FEM,充分学习到了不同感受野下的人脸特征。
本文提出了一种新的方法,分别处理了人脸检测方向的三个关键点,包括更好的特征学习,渐进式的损失函数设计以及基于锚点分配的数据扩充:
(1)新的「特征增强」模块(FEM:Feature Enhance Module)
FEM 在采用 Top-Down 层间信息融合的同时,在同一「感受野」内做了更多的 enhancement。因此在 width and depth 上学习到了更有效的 context 和 semantic 信息。
(2)「分层锚点渐进」式的代价函数监督(PLA:Progressive Anchor Loss)
模型采用 2 个层级(hierarchy),基于第一层(low-level)和第二层(high-level)的差异性,适配了不同尺寸的 anchor。在训练过程中,PAL 对整个模型形成了更有效的监督。
(3)「改进的锚点匹配策略」(Improved Anchor Matching Strategy)
One-stage detector 由于在输出层分配有密集的 anchor,anchor 与 face 匹配的好坏直接影响训练效果。优图的研究人员 data augmentation 过程中充分考虑了不同大小的 face 和各个 anchor 的关系,提出了一种新的数据扩增法。
DSFD 算法
该算法已被计算机视觉顶级会议 CVPR 2019 接收,原文《DSFD: Dual Shot Face Detector》由南京理工大学计算机科学与工程学院 PCALab 与腾讯优图实验室合作完成。
在两个著名的人脸检测数据集 WIDER FACE 和 FDDB 的 5 个评测维度上,DSFD 算法均刷新了当时的世界纪录,取得了 Top1 的人脸检测结果:
WIDER FACE 评测结果
FDDB 评测结果
为了与更多同行探讨 DSFD 算法的实际应用,腾讯优图在近日公布了开源地址:
Github 开源地址:https://github.com/TencentYoutuResearch/FaceDetection-DSFD
据了解,目前腾讯优图的人脸检测技术已在安防、金融、社交、交通等多个应用场景落地,并在手机 QQ、微众银行、天天 P 图等多个公司内外部产品上进行应用验证。