文章
一、引言
人脸识别技术是基于人的脸部特征信息进行身份鉴别的计算机技术,其流程包括人脸图像采集、人脸检测、人脸特征提取、人脸特征匹配和识别等。人脸识别技术在公安实战中具有信息获取隐蔽和识别效率高的优点,人脸图像信息可以通过设备主动采集而不易被个体察觉,信息获取相对隐蔽,从而避免引起被检测人的抵触情绪;还可以对采集图像中的多个人脸进行并行识别和判断,处理效率高。
随着人们对社会稳定性要求的提高,在机场、出入境边检、检查站、银行、公安系统及涉密机构等人群密集及高安全性的场所中,对高危人员身份自动识别、快速预警的需求日益迫切。而近年来,我国大力推进公安信息化建设"金盾工程",建成了八大资源库,积累了海量的数据,其中包含了海量的图片数据。充分挖掘各类数据的深层联系,并结合人脸识别技术,进一步服务公安安全,是实现公安实战智能化的重要研究课题。
伴随着公安数据资源的不断丰富和人脸识别技术准确性的不断提高,应用中也暴露出了一些问题,比如:公安数据量大、种类繁多、存储分散等。在人脸识别行业中,各厂商的算法尽管已经相当成熟,但又各有优点。本文将从公安大数据与人脸识别技术结合的角度入手,探讨基于大数据的人像比对系统的建设方案。
二、系统总体架构
公安大数据人像比对系统以公安信息化积累的各类数据为基础,以人像算法引擎为技术支撑,依托"公安云",搭建数据融合、资源共享的"云"人像底库。其总体架构如图1所示,包括以下六部分:
图1系统总体架构图
1.多算法引擎:多算法引擎集成了市场上多个厂家的人像算法引擎,通过构建算法融合接口,屏蔽各厂家服务的差异,对外提供统一的接口规范,实现与各层的无缝对接,便于引擎的扩展。
2.基础数据层:公安基础数据包括户籍数据、出入境数据、检查站数据等业务数据及采集的各类证件照片和现场照,是构建人像底库的数据"原料"。
3.数据汇聚层:该层将分散存储的公安基础数据进行整合,通过数据抽取、数据清洗、特征提取等流程完成基础数据的处理,是构建共享"云存储"的数据"工厂"。
4.云存储层:该层基于公安云平台构建人像底库,包括图片底库、特征底库和业务信息库,为应用服务提供数据支撑。
5.应用服务层:该层基于云存储层构建的人像底库、特征底库及业务信息库,结合多算法引擎提供的人脸检测、特征提取、特征检索等接口,实现图片检索、单图比对、底库管理、历史检索等业务功能,支撑实战应用。
6.实战应用层:民警通过Web可视化界面,调用应用服务层接口,进行实战应用。
三、多算法融合引擎
在人像引擎的建设中,为了吸纳各种算法的优点,需要部署多种算法的引擎,通过多算法的融合,构建多算法引擎。
目前各厂商人像算法引擎提供的算法服务大多采用HTTP请求的方式调用服务和返回结果。然而,由于没有统一的接口规范,各引擎在请求参数、返回结果等方面存在不一致问题。为了尽可能地发挥各算法的应用优势,在架构设计时,为了屏蔽差异性,采用接口顶层封装的形式对外提供服务,结构如图2所示。
图2多算法融合引擎结构图
调用接口时,将请求参数封装为PhotoRequest对象,经过参数建模识别需要调用的引擎接口,将参数拼装为请求,分发到对应的人像算法引擎;人像算法引擎请求的结果经过应答解析器解析,封装成PhotoResponse对象,返回给接口调用方。调用方可根据自身需求,完成人脸检测、特征提取、特征检索等对应业务。
四、数据汇聚与云存储
人像底库是人像比对系统支撑实战应用的数据资源库,包括图片底库、特征底库和业务信息库三部分。图片底库建在对象存储系统OSS中,以路径形式存储在业务信息库中用于引用;特征底库存储在各人像引擎的文件系统中,通过特征库ID及特征ID可关联出对应的业务信息,各库关系如图3所示。
图3人像底库结构图
建设人像底库需要对公安基础数据进行汇聚,经过加工处理,提取有效数据和图片,并结合多算法引擎,抽取图片特征。
数据汇聚的过程分为数据抽取、数据清洗、特征提取三个部分,采用数据抽取工具KETTLE完成该过程。数据抽取是将分散存储的公安原始数据汇集到云平台,并分类存储,使数据在逻辑上存储在同一位置;数据清洗是去除原始数据中的重复数据、无效数据等冗余数据,保证数据的准确性和可用性;特征提取是调用多算法引擎提供的特征抽取接口,抽取图像特征,将图片、特征值及业务数据分别保存在云端的人像底库、特征底库及业务信息库,并在图像、特征及业务信息之间建立对应的关系。图4为户籍基础数据汇聚过程。
图4户籍基础数据汇聚过程
五、应用服务设计
人像比对系统根据公安实战需求设计为图片检索、图片筛查两个核心功能及单图比对、历史检索和底库管理三个辅助功能。
1.图片检索:人像比对系统的核心功能是将获取的未知身份的人脸与已知身份的人像底库进行比对,从而确认检索人脸的身份。
该功能的业务流程如图5所示。首先,用户上传需要检索的图片,通过调用多算法引擎的人脸检测接口,分析出图像中所包含的一个或多个人脸框,将图片及识别的人脸框返回到前端并显示给用户。然后,用户选择需比对的人脸及人像底库,后台封装为PhotoReuqest对象,调用多算法引擎的特征检索接口,返回比中图片的PhotpResponse对象,使用特征库ID和特征ID关联出比中人像的业务信息和图片信息,合并同一人在不同时期或不同证件的记录,并按照比分从高到低进行排序。最后,通过进一步关联人员身份标签库明确人员身份,将比对结果展示给用户,用户可根据比分进行研判,进一步确认比中信息。图6为该功能的实战应用效果图。
图5图片检索功能业务流程
图6图片检索功能实战应用
2.图片筛查:在出入境口岸、检查站等人员流动频繁的场所,需要对出入的人员进行实时自动图像比对,快速识别出高危人员。
该功能的业务流程如图7所示。通过数据抽取工具Kettle实时抽取现场采集的图片,设置比分预警阈值,自动调用多算法引擎的特征检索接口,将比对结果经过解析和业务信息关联,进行身份匹配,将高于预警阈值的比中结果直接推送到前端用户界面,用于现场研判。图8为该功能在出入境口岸的实战应用效果图。
图7图片筛查功能流程
图8图片筛查功能实战应用
3.单图比对:该功能的应用场景是判断在不同场合出现的人员是否为同一人。用户将获取到的两张图片进行上传,通过调用特征比对接口,将两张图片的特征值进行比对,返回相似概率,用于研判。
4.历史检索:该功能是对人像检索的历史记录进行回溯,并使用已确认身份的检索图片进一步丰富人像底库。
5.底库管理:可对已经建立的人像底库进行管理,提供底库信息统计、底库详情查看、底库图片上传等功能,为人像底库的建设提供信息展示和信息完善的空间。
六、结束语
公安大数据的积累和人脸识别技术的发展为公安实战智能化提供了数据资源和技术支持,以此为支撑的大数据人像比对系统在智能预警、高效研判等方面取得了长足发展,必将在维护国家安全、公共安全以及打击犯罪中发挥重要作用。
人工智能 生成合成内容 标识办法
中安协 数安委 行业白皮书