您现在的位置:首页 封面 > 正文

脸,越刷越“大”

日期:2019-10-30 【 来源 : 新民周刊 】 阅读数:0
阅读提示:包括人脸识别技术在内的人工智能技术,在资本、政府、市场需求等多种因素的作用下,正以狂飙突进之势向各行各业渗透。在应用领域,中国已经大大超前于世界。
作者|陈 冰


破案“利器”


  年少不听张学友,听懂已是狱中人。流水的演唱会,铁打的犯罪嫌疑人。在经历了一系列演唱会上逃犯被抓事件之后,歌神张学友收获了“捕神”这一新称号。

  2018年4月,第一起在逃人员在张学友演唱会上被抓,迄今为止,警方已在张学友演唱会上陆续抓捕了约百名犯罪嫌疑人或在逃人员。张学友演唱会简直成了流动的派出所,以至于有歌神开演唱会的地方,警察叔叔都会幽默发文“激动了,摩拳擦掌中”。

  让歌神张学友意外喜提“捕神”称号的正是大名鼎鼎的“人脸识别技术”。茫茫人海中,只要被AI锁定,基本上在安检的时候,在逃人员就会被警方确认过眼神——你就是我们警察局要找的人。

  还记得今年4月份震惊全国的北大才子吴谢宇弑母案吗?4月20日凌晨4点多,吴谢宇进入重庆江北机场T2航站楼。在3号门进入防爆安全检查区域等待检查期间,吴谢宇被监控设备4次抓拍,每次相似度比对都大于、等于98%。他不知道,4次抓拍显示相似度的同时,他被通缉时的照片也已经被关联出来。几分钟后,机场民警对吴谢宇进行盘查,并将其抓获。至此,潜逃1380天后,弑母案嫌犯吴谢宇在“天眼”系统的帮助下,仅仅不过10分钟就被警方抓捕。

  实际上,在国内的机场、高铁站、地铁、演唱会检票门口等公众场合,几乎都安装上了人脸识别系统。正是在“老大哥”的“关照”下,各地警方抓捕了一系列成年旧案中的嫌犯。在兰州市,人脸识别帮助民警在24小时内抓获犯罪嫌疑人。在太原市,民警运用人脸识别,利用一张光线不佳的照片,将深夜作案难觅其踪的惯犯逮捕归案。在泉州,使用非常模糊的影像在20分钟内搜索到犯人行迹。如今,这些四处潜逃的嫌疑犯们恐怕只有瑟瑟发抖的份了吧!


穿越时空找到你


  不光是抓罪犯,在寻找被拐儿童方面,“人脸识别”也立下奇功。

  2014年陈可辛导演《亲爱的》,讲述了家长们寻子十年的悲情故事,剧中张译扮演的暴发户韩德忠一直是寻亲组织的主心骨,最终他没有血缘关系的好兄弟找到了失踪的儿子,而他自己依然还是在希望与失望的深渊中不断煎熬……特别是他躲在车里,对着好兄弟黄渤发了一条短信:“我做了这么多,偏偏找到的是你。我找不动了。”滑落眼眶的单眼半滴泪,成为影片中最让人泪目的片段。

  对于中年人来说,最怕的不是上有老、下有小的尴尬境遇,也不是被“996”压榨的糟心工作,而是中年丧子,而比丧子更可怕的则是孩子被拐,从此家庭破碎,亲人两隔!

  我国每年都有新增失踪人口,加之流动节奏加快,一旦错失了寻回走失人员的黄金时间,就只能从市县一级适龄人口中进行搜索,这意味着至少数十万级别的检索规模。如果进一步扩大搜索范围至省一级,检索规模将急剧扩大到千万以上,比对的难度堪称“大海捞针”。

  被拐的幼儿往往年龄很小,仅凭一张幼年的照片,警方有没有可能找回已经丢失十几年的孩子呢?因为这段时间正是人一生中人脸变化最为剧烈的阶段,幼儿随着年龄的逐渐增长,脸型、眼睛、嘴角等标识特征会发生明显的变化,机器的人脸识别率也会随之下降。国际上此前还没有成功跨越10年通过人脸识别技术找到失踪儿童的先例。

  2017年底,警方开始和腾讯优图公司联合进行技术研发,希望能够通过跨年龄的人像比对来寻找被拐的孩子,这就要求算法不仅要解决同一个人在同一个时期图像中噪点、畸变的干扰问题,还要解决同一个人在不同年龄段下的人脸识别问题,通过数据分析,推断幼儿成长以后的模样,而年龄跨度越大,孩子的相貌变化越大,识别难度也就越大。这对算法模型和数据量来说都是极大的挑战。

  工程师们对0岁-18岁的人脸的成长变化进行模拟建模,生成大量可供学习的人脸样本,然后采用深度神经网络算法来学习这些人脸在成长过程中的复杂变化。可是当时跨年龄人脸识别没有成熟的算法模型,加上数据样本有限,实验效果一开始一直不是很理想。

  后来,工程师们想到了 “用机器教机器”的方法。经过成千上万次的模型训练,终于训练出了一个可以进行跨年龄人脸识别的深度神经网络模型。简单来说,如果把成年人的人脸识别模型作为老师,那么就让儿童的人脸识别模型来学习其中的“技巧”,尽量消除年龄变化对识别精度的消极影响。

  功夫不负有心人,经过近半年的努力,经过很多个夜晚的挑灯夜战,终于有了突破性进展。这一名为分布式蒸馏学习法则的算法模型进行跨年龄人脸识别的准确率达到了96%以上。

  利用这一模型,优图团队对警方提供的海量数据进行了第一次实际比对,警方圈定了与每个被拐孩子最像的排名前五的结果进行了最后线下确认。通过DNA检测,第一批成功确认了4个走失超过10年以上的被拐儿童,其中有3个是最高分命中,当中有一个孩子仅仅只有几个月大时的照片。

  “喜出望外,甚至有点不敢相信。”作为腾讯守护者计划的安全专家,李新曾有过8年从警经历,这并不是他第一次参与寻亲打拐案件。然而,这次使用人工智能寻亲的经历却很不平凡,这让过往警方大海捞针式的人力摸排彻底成为过去。

  截至目前,当年在四川先后被拐卖的10名孩子已经找回7人。公安部刑侦局副局长陈士渠表示,这批被拐儿童的大部分成功找回,充分证明人工智能对于查找被拐多年儿童能够发挥重要作用,跨年龄人脸识别这一技术在DNA比对之外,又为公安机关查找被拐儿童提供了一条有效的途径,“具有里程碑意义”。

  实际上,人脸识别技术不仅能比对活人,它甚至能够让尸体开口说话。

  浙江一处殡仪馆内,有一颗冷冻了5年的头颅。在调查清楚死者身份之前,谁也不知道这个生命有过怎样的故事,但它逝去的方式极为残忍,尸体被发现时,身体的其他部分已经被肢解、遗弃,只有难以瞑目的头颅,浸泡在防腐液里。

  除了拍照存证、留取DNA,5年前的浙江警方束手无策。

  后来,在将积案、重案的资料照片和人像库数据进行比对之后,死者遗照与库内一个年轻人的照片高度吻合,情况出现了转机。依图科技安防技术专家罗忆回忆,他们调出了死者父母的DNA,再次比对,终于确认了这颗头颅的身份。外出打工再也没有回家的儿子终于有了明确的下落,这场搁置已久的命案得以继续展开调查。


AI“四小龙”



  在这些急速破案的背后,隐藏着一个又一个的关键词——天网、云眼、雪亮工程,以及AI供应商。其中,我们最耳熟能详的是AI“四小龙”——商汤、旷视、依图和云从。

  不过,如果以为人脸识别技术仅仅运用在警方侦破案件方面,那实在太小看这项飞速发展的技术了。安防、金融是目前人脸识别应用最广泛的两个领域。

  云从科技是我国银行行业最大的人脸识别供应商之一,包括农行、建行、中行、交行等全国400余家银行14.7万个网点已采用云从的产品,应用于柜台、直销银行、手机银行、网银等场景,公司为全国银行提供对比服务日均2.16亿次。其中,中国农业银行超级柜台、刷脸取款,是全国首先应用人脸识别技术的四大行之一。

  云从孵化自中国科学院重庆研究院,受托参与了人工智能国标、行标制定,并成为第一个同时承担国家发改委人工智能基础平台,工信部芯片平台等国家重大项目建设任务的人工智能企业。从初创到跻身独角兽,云从科技仅仅用了三年,在这背后,“国家队”的标签是云从有异于另三家的最大光环——已完成的四轮融资中,全部来自中资机构,其中有多个国家基金参投,其中不乏知名地方政府基金。

  国际权威调研机构Gen Market Insights于2018年发布的《全球人脸识别设备市场研究报告》显示,2017年排名前三的人脸识别厂商收入市场份额为20.37%,其中云从科技以12.88%的市场份额(占世界比例)领跑全球,其后的二三名分别是4.18%的Aurora以及3.31%的浙大网新集团。报告还称,中国2017年人脸识别产值占全世界29.29%市场份额,2023年将达到44.59%。

  云从高级品牌经理傅小龙在接受《新民周刊》采访时指出,云从的3D结构光人脸识别技术能够更好地提升安全性。传统的基于2D人脸识别的摄像头和采集设备,通常是基于少量的样本去预测、假设,并通过编写的程序来判断人脸的纹理信息,嘴巴大小,两眼间距离等,得到的是二维平面的信息。从算法的角度来看,无论我们把光照打得多足,角度处理得多正,我们始终不知道更深层次的信息,如眼睛凹陷的程度,鼻子的高度,甚至脸型的相关信息等。

  正是因为人脸识别系统仍然存在一些漏洞,攻击者可以通过静止照片,人脸视频等方式攻破现有安全系统。因此,随着反欺骗手段的发展,活体检测技术应运而生。这种技术一般采用指令动作配合的方式,如人脸左转、右转、张嘴、眨眼等。但通过用户配合来完成身份认证的方式带来的用户体验效果并不佳;此外,这种技术无法防止视频攻击或人脸合成技术的攻击。

  面对市场需求与现有技术之间的不匹配,云从科技于2018年2月7日正式宣布推出“3D结构光人脸识别技术”,结构光人脸识别将深度信息与其他局部特征作为深度网络的输入,保留了更多的三维模型信息,识别效果相比可见光人脸识别有数量级的提升。此外,在光照环境差、人脸角度较大、人脸表情变化大的情况下比可见光人脸识别效果好很多。在安全性、识别精度以及识别速度方面都实现大幅提升,其准确率在千万分之一误识率下达99%以上,速度由1-2秒缩短至毫秒级,此外,更能防御面具、视频等欺诈手段。

  “四小龙”中最受关注的或许是被称为“融资机器”的商汤。

  商汤创始人汤晓鸥,是香港中文大学信息工程系系主任,也曾任微软亚洲研究院的视觉计算组主任。据已披露的数据,商汤至今已经累计融资超30亿美元,估值超70亿美元。除了金融、安防领域,在互联网领域,商汤通过深度学习算法,帮助新浪微博全新的“面孔专辑”功能实现检测出图片中的面孔,并分类归纳。商汤科技的图像处理技术,针对图片中的暗光以及雾气等进行处理,还原出清晰的图片,已广泛应用于微博相机。

  与此同时,商汤的 SenseAR 增强现实感引擎,可为面部、手势实现各种好玩的 AR 特效,它基于商汤的人脸关键点检测、人脸跟踪技术,可以实现精准定位效果,Faceu (激萌)就是应用商汤的技术。在手机领域,商汤可以为手机拍照提供人像背景虚化功能,以及智能相册中的人脸聚类功能。目前 OPPO、小米等手机中,应用了商汤的此项技术。在小米 MIUI 中,商汤人脸识别算法就实现了 " 一人一相册 " 的面孔相册分类功能。云端存储照片将被自动分类,避免了手动分类照片的繁琐操作,优化了用户体验。

  值得一提的是,2017年,商汤宣布实现盈利。其产品不仅包括C端的智能拍照、相机美颜等手机产品,还有面向B端的智慧安防、智慧楼宇等智慧城市板块以及自动驾驶等领域。

  四小龙中,在上市道路上跑得最快的是旷视。他们在今年8月份向港交所提交了招股书。创始团队中,旷视的三位创始人都毕业于清华姚班(清华学堂计算机科学实验班,由世界著名计算机科学家姚期智院士于2005年创办)。在资金方面,旷视至今已经获得9轮融资,累计融资13.5亿美元,估值40亿美元。

  与上市同时进行的,还有业务架构的调整。旷视之前为美图旗下的美图秀秀 App、美颜相机、美颜手机等一系列软硬件产品提供了人脸识别技术支持。其中美图秀秀和美颜相机 App 通过旷视的人脸检测和关键点检测技术,可以在图像中精准定位人脸和五官位置,从而进行人像美白、五官美化等处理,快速完成精准修容。

  在出行领域,旷视为滴滴出行提供了人像识别的身份验证系统,用来保证司机注册账户和本人信息相符。而e 代驾、易到用车也采用了旷视的人脸识别技术对司机身份进行核验。神州租车则通过旷视的实名验证系统,对客户进行管理和服务。

  现在,在核心技术上,旷视正在从人脸识别平台Face++升级为系统化AI算法引擎Brain++;在业务场景上,则从城市管理、物流、零售、地产、手机、金融等垂直场景升级为城市大脑、供应链大脑、个人生活大脑三大IoT场景业务群。

  依图和其他三家业务范围最不同的领域在于医疗。

  2016年底,依图就开始和广州市妇女儿童医院合作,启动了“咪姆熊”智能医生研发项目。通过自动学习来自56.7万名儿童患者的136万份高质量电子文本病历中的诊断逻辑,该AI应用于诊断多种儿科常见疾病,准确度与经验丰富的儿科医师相当。研究人员随机抽出12000份患儿病历,并把20位“参赛”儿科医生按年资和临床经验高低分成5组,看看AI的成绩和哪一组医生接近。结果显示,AI模型的平均得分高于两组低年资医生,接近三组高年资医生。

  2019年初,依图和广州市妇女儿童医疗中心联合研究的利用人工智能技术诊断儿科疾病的重磅科研成果在国际著名医学科研期刊《自然医学》(Nature Medicine)上发表。这是全球首次在顶级医学杂志发表有关自然语言处理(NLP)技术基于中文文本型电子病历(EMR)做临床智能诊断的研究成果。

  2016年,依图成立了子公司依图医疗。 2018年11月,依图医疗推出AI防癌地图项目,将“医生+AI”的阅片模式引入肺癌和乳腺癌等多个高发高危癌症的筛查,以减少医务人员的负担和误诊漏诊现象的发生,为大规模疾病早筛行动的开展提供有力的技术支持,推动中国肿瘤筛查进入“AI+”时代。

  由此可见,包括人脸识别技术在内的人工智能技术,在资本、政府、市场需求等多种因素的作用下,正以狂飙突进之势向各行各业渗透。除了金融、安防之外,互联网、消费电子、汽车电子、零售、医疗、教育等诸多领域都在逐步引入人脸识别,遍地开花是大势所趋。虽然国内在相关领域的理论水平、人才储备还与美国有一定的差距,但中国的庞大网民数量和成熟的移动互联网生态,是产生数据的沃土,能够提供丰富的AI使用场景。在应用领域,中国已经大大超前于世界。

  有关机构预测,到 2020 年,人脸识别的市场规模预计达到 2000 亿元,其中通关安防产品达到 700 亿元,在线支付达到 500 亿元,这将是一个很可能产生新的阿里巴巴、腾讯体量级公司的行业。

  脸,真的是越刷越大!

编辑推荐
精彩图文
俱乐部专区 / CLUB EVENT