一位女士在演示虹膜识别。(资料图片)
模式识别国家重点实验室的研究者们在认真研究模式识别的机理,力图让电脑像人脑那样分析和识别文字、图像、视频、音频等。经济日报记者 沈 慧摄
模式识别国家重点实验室以模式识别基础理论、图像处理与计算机视觉以及语音语言信息处理为主要研究方向,为开发智能系统提供关键技术,科研成果大量应用于国防建设、社会安全保障和国民经济发展领域
打开天天P图,选择“变脸”之如花美眷模式,来张自拍,原本有些“朴素”的面孔瞬间“美若天仙”——这种看起来不可思议的“魔法”,其背后是人脸检测和人脸配准技术的应用,而这只是中国科学院自动化研究所模式识别国家重点实验室颇具代表性的研究成果之一。
眼睛的“脸”、步态的“脸”、声音的“脸”、大脑的“脸”……模式识别国家重点实验室是一个一本正经看“脸”的地方。在这里,研究者们行走在电脑与人脑之间,专注研究各类“脸”,科研成果大量应用于国防建设、社会安全保障和国民经济发展领域。
一个眼神“确定”你
北京北四环,模式识别国家重点实验室内,一台白色机器前一位女士缓缓走来。机器发出悦耳的声音:“请靠近。”女士听从指令向前挪了挪,眼睛对准机器。“王雅丽。”声音再次响起,身份确认完成。
这个鉴别身份的技术就是虹膜识别。虹膜是位于人眼表面黑色瞳孔和白色巩膜之间的圆环状薄膜,在近红外光下呈现出丰富的视觉纹理特征,如斑点、条纹、细丝、冠状、隐窝等。“虹膜是唯一、稳定、安全的人体生物特征,在常见的生物特征模态中身份识别精度最高、比对速度最快、安全防伪最强,适合于大规模人群的身份认证应用。”中科院自动化所工程师黄晨告诉经济日报记者。
据介绍,伤痕、干燥、油腻、污渍等,都会影响指纹识别的效果;人脸识别则容易受到光线、年龄、肤色、姿态、表情、妆容等多种因素的影响。
虹膜识别要实现应用并非易事。虹膜图像获取是虹膜识别的第一个关键步骤。中国科学院院士谭铁牛回忆说,上世纪90年代末我国虹膜识别研究刚刚起步,那时国外不仅不提供用于算法研究的数据库,就连虹膜采集设备也不卖。
实验室从零开始,通过自主创新,打破国际上的虹膜识别技术垄断,完成了从跟跑者到领跑者角色的转变。如今,在虹膜图像获取方面,实验室实现了从单目到双目、由近及远以及从固定到移动状态的图像获取。与此同时,团队自主建设的CASIA虹膜图像数据库成为目前国际上使用最广泛的虹膜图像数据库,有来自170多个国家和地区的3万多个科研团队申请使用。
在完成基础研究的同时,实验室的虹膜识别技术也从实验室走向了市场。去年,虹星科技有限公司研发的“驾驶员生物特征识别一体机”正式投产,将虹膜识别距离从40厘米拓展到了1.2米,仅需两秒钟即可完成身份确认。该设备的核心技术与团队正是来自模式识别国家重点实验室。
“虹膜识别技术被普遍认为是最具有发展前景的生物认证技术,具有高安全性,可用于安防、国防、电子商务等多个领域。目前,我国已形成以北京为主的虹膜研发和生产聚集地。”虹星科技有限公司创始人侯广琦说。
一个步态“锁定”你
与侯广琦不同,模式识别国家重点实验室副主任王亮这些年一直在跟踪研究另一种生物特征识别——步态识别。
何谓步态识别?即根据一个人走路的姿态和人体信息进行身份鉴定。“比如,你平日熟悉的朋友,有一天走在街上,只凭背影你就能知道是他。”王亮说,虽然相对于人脸识别,步态识别的准确率还较低,影响识别效果的因素还很多,但在安防等一些特殊应用领域,步态识别有远距离识别这一特定优势。
远距离识别能相隔多远?按照实验室目前的水平,只看走路的姿态,50米外,眨两下眼睛的时间,摄像头就可以准确辨识出特定对象。“人脸识别准确率虽高,但太远了看不清。虹膜识别的采集距离目前最远可以达到1.2米至1.8米。”王亮说。
步态识别以其远距离、难隐藏性、非接触性和非侵入性等特点从众多生物特征识别中脱颖而出,大量应用于各个行业。以实验室孵化的银河水滴科技有限公司为例,一些石油企业开始引入其步态识别技术完善防控网络,防范非法闯入者对油田安全的威胁和对油田经济利益的损害;在智能家居领域,该公司的技术可以很好地区分用户属性,替代遥控器等传统操作工具,让家电感知更加智能化。
银河水滴公司还与公安系统合作,首次利用步态识别技术搜索到犯罪嫌疑人。现有的公安系统缺乏有效的视频分析和检索工具,平均每个现发案件需要人工审核数百甚至上千小时的视频资料。利用步态识别技术,对真实监控摄像头拍录的数小时视频进行搜索比对,最终警方在近千人的目标人群中成功确认嫌疑人范围,完成国内首次步态识别办案工作。
“不同人的运动神经敏感度、肌肉力量特点、身体结构不同,这决定了步态的唯一性和稳定性,可以满足特殊领域的应用需求。”黄晨表示。
计算机学会决策
虹膜、人脸、指纹、掌纹、掌静脉、笔迹、步态……事实上,各种生物特征识别只是模式识别国家重点实验室众多研究方向中的一个。
究竟什么是模式识别?模式识别是对表征物体或现象的各种形式数据(主要是感知数据,如图像、视频、语音等)进行处理和分析,进而对物体或现象进行描述、分类和解释的过程,是信息科学和人工智能的重要组成部分。“通俗点说,就是让计算机模拟人类去听、去说、去看、去读、去思考、去决策,让电脑像人脑那样分析和识别文字、图像、视频、音频等。”王亮解释说。
实验室面向国家战略需求和国际学科前沿,开展基础性、前瞻性、战略性和系统性的创新研究,已成为引领模式识别领域科学研究的重要基地。
实验室研发的高性能机器翻译系统,率先实现了汉语和蒙藏维等少数民族语言之间的自动翻译,翻译的准确率和速度均已达到国际先进水平,该系统广泛应用于大型跨国公司、军队等部门,在保障国家信息安全方面发挥了重要作用。
针对各类文档图像,实验室提出了有效的版面分析、文本行提取和识别方法,获得了领先的性能,在金融和安全等领域实现了规模化应用。
实验室研发的高性能多模态人机交互平台,具有远场语音识别和情感识别能力,以及个性化的语音合成系统,向众多企业授权使用。
实验室脑网络组研究中心联合陆军总医院和广州总医院组成联合攻关团队,在基于“植物人”病因、年龄和病程作为重要预测指标的基础上,使用基于脑功能磁共振影像的患者脑功能网络特征,结合机器学习相关算法,构建了一个计算模型预测患者一年之后恢复意识的可能性,准确率达到88%。
在研究计算机感知外部世界的同时,实验室引入了脑连接信息对脑区进行精细划分,成功绘制出全新的人类脑图谱:脑网络组图谱包括246个精细脑区和亚区,比传统的脑图谱精细4至5倍,该项成果入选2016年“中国十大科技进展”“中国十大医学进展”和改革开放40年中国科学院40项标志性重大科技成果之一。
“以模式识别基础理论、图像处理与计算机视觉以及语音语言信息处理为主要研究方向,研究人类模式识别的机理以及有效的计算方法,为开发智能系统提供关键技术,这是实验室肩负的主要使命。”王亮说。