随着围绕面部识别的所有炒作和媒体报道,这项技 電話名單 术已经存在相当长一段时间了。第一个关于面部识别的严肃算法工作是2001 年发布的 Viola-Jones 对象检测框架。尽管它是一个用于识别图像中对象的通用框架,但它很快就被应用于人脸识别并取得了巨大的成功。该算法受欢迎的主要原因是它的速度:虽然学习过程非常慢,但检测过程却非常快。
早在 2001/2004 年,采用此算法的普通台式计算机就可以在 0.07 秒内处理 300px X 300px 的帧(更多详细信息请参见此处)。准确率虽然无法与人类相比,但达到了令人印象深刻的 90%。
然而,直到 2010-2020 年,卷积神经网络成为面部识别的最佳方法,才取得了真正的进展。其原因是原始计算能力和巨大的系统内存的可用性,这要归功于基础设施即服务 (IaaS)提供商提供的云计算。历史上第一次,计算机在面部识别方面持续击败人类,尤其是在识别大量随机面部时。
来源:
面部识别如何工作?
,涉及多个专门的子系统。
以下是不同阶段的含义:
检测/跟踪:预处理阶段的这一部分负责识别和跟踪给定图像或视频文件中的人脸。一旦这个过程完成,我们就可以确定源材料中存在一张脸,并且可以对其进行进一步处理。如有必要,跟踪阶段还负责跟踪特定部分、特征或面部表情。
对齐:由于给定图像或视频中的面部不遵循任何规则,因此面部识别问题变得更糟。脸部可能会被放大或缩小,从树后向外窥视,或者位于侧面轮廓中,这使得面部识别任务进一步复杂化。这就是面部对齐的用武之地:它告诉您面部在给定图像/视频中的位置以及其特征的轮廓是什么。