一群创造奇迹的腾讯人工智能工程师,如何找回一个又一个被拐卖儿
撰稿 陈乐 王晓晶
长久以来,儿童拐卖案一直是公安机关的巨大难题:案件跨度常常超过10年,孩童相貌变化快,又不曾留下任何生物学特征,因此过去许多年里,真正破获的儿童拐卖案非常有限。
但在2018年底,因为一项新技术的应用,四川省的一起重大积案——轰动全省的426案——在短期内获得突破,当年被拐卖的13名儿童中有10人确认身份。破案中应用的“跨年龄人脸识别技术”,如今的识别精度已经进化到96%,极有可能让带给千万家庭痛苦的人口拐卖成为历史。而创造这项技术的,是一个叫优图实验室的机构。
9月一个下午,在上海漕河泾开发区软件园,我穿过安装了人脸识别的门禁,去探访优图实验室,这个腾讯最为成功的AI 实验室之一——只要涉及人脸识别和图像识别功能的腾讯应用几乎都有它的身影,比如QQ,QQ空间,天天P图,人脸支付,AI医疗等等,你也许并不知道,事实上它已经融入我们的日常生活。
与想像中的酷炫风格有所不同,这里显得有点过于朴实了:一片密集的工位,然后是一个个格子间。在其中一个小房间里,我见到了优图的总经理吴运声。他身材清瘦,声音低哑,但言语间流露出一种坚硬。“优图一直是充满危机感的”,他说。
这多少令人有些惊讶。人们往往以为,技术的创新只关乎技术人员的智慧与灵感,并没有意识到,它可能还来自于一个团队长达数年的艰苦战斗,危机中自我保存的本能,来自于一种要创造价值的现实主义情怀。
我和优图多名工程师进行了交流,请他们讲述了优图的故事,那是一个典型的腾讯式的故事。这要从2012年,他们濒临解散说起。
成为冗余
回想起那一年,人们也许会记得腾讯历史上第二次架构调整,宣布迈向移动互联网的大潮;却很少有人会记得,在那次大型转场中,一个曾被寄予厚望的技术组织——腾讯研究院,宣告解散。研究院本意是发展长期技术,却因业务各有技术团队,研究院的技术无人使用,也便逐步瓦解了。先是蜕变成产品部门,然后产品也难以为继。
直到七年后,黄飞跃还记得每天回宿舍后那种迷茫的心情,“我是清华博士毕业,在学校水平还可以,动手能力也不差,怎么会这么失败?”他带着小团队在研究院做一款叫QQ影像的产品,日活曲线低位走平,员工曲线则不断下降,到最后几乎只剩他自己了。
他的领导吴运声也迷失在产品丛林里。他博士肄业,是那种总会冲到最前线的领导者。他已经意识到,没有配套,做产品的失败是必然的。他想了很久,既然是技术人员,那就应该维持本色。有一天,他们在新闻看到以色列在发展图片压缩技术,突发奇想,如果掌握这项技术,就可以证明自己的价值——为公司节省带宽成本。
他们知道这家公司的风格,很多时候,没有命令告诉你必须做什么。很难说有禁区,全靠自己探索。团队在公司四处推销,请别人吃晚饭,恳请他们使用压缩技术——不必付出任何成本,只要写一封邮件证明使用过他们的技术就可以了。就这样“求爷爷告奶奶”,他们拿到第一封邮件,然后是第二封,第三封。那种喜悦就像拥有一个真正新生儿,他们给项目起了一个名字,叫优图,黄飞跃想,将来无论散落在哪里,有了名字,它就有自己的生命。
研究院果真在不久后就解散了。因为压缩技术小有名声,优图被腾讯高级执行副总裁汤道生接收了。时隔七年,吴运声仍有一个难以忘怀的场景。那是在部门重组后的第一次答疑会上,老板们坐在对面一排,他则坐在底下,等待一个全新的开始。突然听到汤道生喊,“SIMON(他的英文名)坐到前面来。”就像瞬间接到了信号:请大家安心。
汤道生是一个敏锐的人,他总是小心翼翼保护着那些尚不明朗的新生事物,为他们腾挪生长空间,等时机成熟,他再去总办争取资源。
在腾讯,headcount(人员编制)是最值钱的东西。优图要来能干什么?暂时不清楚。汤道生把他们放在QQ空间团队里,那里是公司最大的图片聚集地。藏在一个大的团队里,就不那么显眼,他就有空间“腾挪”,优图实验室就成了一个“冗余”。冗余,就是你看不清它具体方向,但默许它的存在,这种有包容度的空间,马化腾称之为管理的灰度。像这样的“冗余”,大大小小分布在公司各处。
使出全力
对优图来讲,这是更好的选择,至少他们现在有了QQ空间的业务场景了。他们思考良久,决定往人脸识别的方向去攻克。当时人脸识别并不像今天那么火热,但从一开始,他们就想得很明白,“做一个技术一定要想它用在什么地方”,这几乎成了优图生存的第一法则。
就像推销压缩技术时那样,他们跑去说服QQ空间的产品经理去开发一个有关人脸的新功能。他们说,他们的技术能把人像识别出来。他们还承诺,所有的需求优图全给做好,策划给做好,接口也给做好,你只管拿去用——如果说存在第二法则的话,那就是把合作对象当作你的客户。
在团队成员的印象中,他们每一次合作都使出了全力。不管什么需求,“我们都给做”,甚至为了让对方答应使用自己的技术,一些打杂的事情也可以帮忙做,因为做了之后,就可以跟对方说:“我都帮你把这个事情做了,我们的技术你就用一下吧?”
在优图团队,会呈现出一种有些神奇的场景。博士也可以像销售一样跑业务,求别人用他们人脸识别技术——还是免费的。慢慢的开始有人在内网上赞扬优图,他们跑过去问发贴的人,能不能把那个帖子置顶啊?渐渐地,找他们支持的团队越来越多,他们服务的业务部门超出了QQ空间,QQ音乐,还做了腾讯滨海大厦和微众银行的人脸识别。他们后来自己总结的时候说:那几乎就是“一个技术人员的本能”。
在腾讯,通常一个技术团队是依附产品存在的。一个成功产品背后必然拥有一个成功的技术团队。但作为研究院的遗产,优图既没有办法独立做产品,也没有办法只做研究不去落地。为了活下去,他们把自己变成了服务全公司的技术团队。
尽管优图的技术已经支持越来越多的产品和服务,但很多情况下,对于这些产品来说,优图的技术也只是辅助,而不是一个产品核心路径上的必备需求。这种情况也让优图团队成员感到忧虑,直到做微众银行人脸开户的项目。2014年微众银行做人脸远程开户,接触了几个团队,优图是最积极的。对优图来说,这是令人兴奋的机会,微众银行没有线下门店,只能依靠线上开户,自然人脸识别就成了业务中的核心。然而技术难度很大,也没有可以借鉴的案例,吴运声下令在两个月内攻克出来,为此还和技术人员相互拍了桌子,结果是自然而然的——他们必须迎上去。直到验收那一天,一位国家领导人成功试验开户,他们才松了一口气。
到了下半年,他们已经进入腾讯滨海大厦的场景中了。那是一项全新的挑战,过去的场景大多发生在线上,而这次则需要获取海量线下数据;过去传统图像比对是1:1 ,现在则是1比数万。等到他们成功攻关,他们就积累了更多的数据和更好技术,不久后就去研究跨年龄人脸识别了,那是 1比数千万的高难度比对,是人脸识别领域一个公认的难点,特别是青少年阶段,人脸特征变化最大。
当希望利用新技术找到被拐儿童的的需求转到优图时,他们其实还没有把握。世界上还没有过成功的案例。但优图实验室的总监李绍欣决心要全力以赴。很多个夜晚,研究员们消耗在这些事情上。他们加了数不清的班,提交了5个版本算法模型,其中大大小小的修改多达上千次。
打硬仗
浓厚的危机感下面,优图始终强调一种“打硬仗”的文化。
如今随着产业互联网战略展开,他们也进军TO B 战场,把技术能力开放给行业合作伙伴,而对手则是所有的人脸识别公司,战争也便升级了。给万达做智慧零售时,自己成员因为一个摄像头的点位,困在40、50度的风道里很长时间。
但他们都默认了要“吃苦”这件事。他们很清楚,打仗不仅仅是技术人员的算法角逐,更是一个团队的协作。每个案子各有困难,让黄飞跃很感慨的一件事是,有一次为客户做智能升级方案时,白天不让采集数据,他们只能晚上和周末去加班采集。那时天气特别热,晚上蚊子也很多,“管理的同事还专门买了一堆西瓜、花露水安抚他们。”
也在打仗的过程,他们不断充实自己的队伍。2016年AI热潮涌起,在一场汇报后,马化腾和刘炽平给了他们100个headcount,最终优图实验室独立出来,成为腾讯视觉研究中心。如今输出的行业解决方案超过15套,腾讯明星业务线项。
腾讯研究院失败了,优图却成了一个意外。我问吴运声,在这个艰难的过程中,始终支持着他的最大的愿望的是什么,他说:我希望有一个团队,它能做研究,能够做先进的东西,又能够带给你实实在在的价值。我希望优图一直能够朝这个方向去发展。
他们记得通过“跨年龄识别”首次比对出4个孩子的那一天,消息传来时,几名研究员正在如常地对着电脑写代码,他们激动地叫出了声,李绍欣一下子从凳子坐起来,“很惊奇,很惊喜”,另一位同事则干脆哭了起来。