因为疫情防控,出门戴口罩已经养成了习惯。
尽管戴着口罩上班,遇到单位的同事,几乎都能辨认出是谁,大老远相互打招呼基本上不大会出现错认人的。为什么大半个面部都遮住了,我们还是能够将其辨认出来呢?
我们对熟悉的人的记忆,绝不仅仅是记住他的面部特征,还包括他的身高、胖瘦、身体轮廓、行动姿态、语音语调等多种信息,这些信息都被我们的大脑所记录。在对他人进行辨识的时候,只要其中的一部分信息与我们脑海中记忆的某个人的信息匹配了起来,大脑就会进一步检索和比对,并最终确认此人是谁。在道路上,你可以通过一个人的背影大致确定他是谁;在傍晚暗淡的光线下,你也可以很准确地确定对面走过来的人是谁,其原理都是相同的。
这让我联想起了最近比较流行的人脸识别系统。现在银行等金融领域都采用了这样的技术,来辨别驱使资金流动者是否是持卡人本人;在重要场所的进出口,不少门禁也用上了人脸识别的技术;在考试等领域,人脸识别也是组织考试作弊的重要利器。
那么,人脸识别的工作原理是怎样的呢?
人脸识别还不能像人一样,通过对人的身体的各种特征的全面了解来辨析他是谁,它只将辨析的部位聚焦在人的面部,“人脸识别”的名称就是由此而来的。
但机器进行人脸识别的过程,与人识别对方是谁的过程原理上是大体相同的。其流程如下:
首先,要让机器预先阅读相关人的照片,通过阅读个体的几张照片,可以将个体的脸部轮廓进行描绘,特别是个体的面部可用于区分他人的独特之处,比如眼睛的大小,脸的长度等等,将这些信息并记录在数据库中。不同的个体会有不同的面部特征,这些特征和个体之间有着一一对应的关系。
其次,在某人通过机器时,机器对该人的面部拍照,抓取面部的特征信息;
第三,将抓取的面部信息进行模式化的处理,让其和机器的数据库中已经存储的信息进行比对,以便确认此人是谁。
现在到上海的机场乘飞机,安检的时候就有自助服务,先将自己的身份证号码放在一个机器上,让机器读取你的身份证信息,同时储存在你身份证里的照片特征也被机器提取并模式处理;然后你走进去到前面一个机器前,让机器抓拍你的照片,它会和你的身份证上的照片进行比对,确认是同一个人,就让你通过了。
我看到有人在微信上说,城市的道路上安装了很多高清摄像头,现在人们都带上了口罩,这些探头就不能分辨出谁是谁了。情况真的是这样的吗?
下面再稍微深入一点探讨一下人脸识别的技术。那些比较专业的术语这里就不涉及了。
机器得到一张人脸的照片后,首先做的第一件事情是将其灰度化,即转换成黑白图片,彩色的图片对它来说没有多大价值。
我们都知道,像素是组成照片的最基本的元素,每一个像素在图片上都有明确的位置位置和被分配的色彩数值。在黑白照片上,不同像素的位置和明暗度不同,有机组合成了一个人的面部形象。
机器做的第二件事情,就是把人脸的灰度图像按照4x4、或9x9、或16x16像素的大小,将其分割成一个个的小方块。分割的越小,机器的识别就会越精细。然后分析每个小方格中不同像素的明暗度,并从整体上判断在这个小方格中,哪个方位最明亮、哪个方位最灰暗,从最明亮向最灰暗的方向画一个箭头,表示像素明暗变化的方向。每一个这样的箭头均表示明暗梯度,它们能显示出图像从明亮到黑暗流动的过程。
这样,机器就把原始图像转换成一个非常简单的HOG(方向梯度直方图)表达形式,它可以很轻松的捕获面部的基本结构,从而避免大量的运算。为了在HOG图像中找到脸部,我们需要做的是,与已知的一些HOG图案中,看起来最相似的部分。这些HOG图案都是从其他面部训练数据中提取出来的。
脸部的HOG表达形式
机器在对一个人的面部进行这样的特征处理的过程中,还会生成128个测量值,这些测量值是一个人所特有的,与他人不同,机器就是通过这些测量值来辨别谁是谁的。这里面的过程很复杂,这里就不多说了。
除此之外,机器还在做的另外一件事情,就是辨析人的面部特征点。瓦希德·卡奇米和约瑟菲娜·沙利文在
2014
年发明的一种算法,其基本思路是找到68个人脸上普遍存在的点(称为特征点,landmark),包括:下巴轮廓17个点
[0-16]、左眉毛5个点
[17-21]、右眉毛5个点
[22-26]、鼻梁4个点
[27-30]、鼻尖5个点
[31-35]、左眼6个点
[36-41]、右眼6个点
[42-47]、外嘴唇12个点
[48-59]、内嘴唇8个点
[60-67]。
68个特征点
有了这68个特征点,很多事情就好办了。机器辨别一个人是谁,不是说非要将这68个特征点全部比对其才行,只要有大部分点聚焦于某一个人,机器便会自动找寻出这个人。在现实中,经常会出现一些特殊的情况,比如说一个人拍照的时候侧着身,或者戴着口罩,这都不妨碍机器从中提取其中的大部分特征点。就拿戴口罩来说吧,戴上去之后会遮住嘴巴、鼻尖等部位,但也只有25个左右特征点无法准确采集数据,能采集的依然是大部分,所以还是能够识别的。
你看,人脸识别的技术和人识别他人的方法,是否有很多相似之处?
人脸识别技术经过70多年的发展,到今天已经发展成为一门以计算机视觉数字信息处理为中心,糅合信息安全学、语言学、神经学、物理学、AI等多学科交合的综合性技术学科,内涵已极为丰富,并且发展快速。上面所讲的只是一些皮毛,旨在说明人脸识别作为深度学习的一个应用案例,在模仿人脑思维方面还是取得了不少的进展的。
加载中,请稍候......