美图CTO张伟:5年前谁也不会想到会花70%时间在人工智能上

2017-05-17 13:17 来源:雷锋网 
2017-05-17 13:17:42来源:雷锋网作者:责任编辑:赵刚

  视觉文化时代,「颜值」作为生活之美的展示,被览阅和品味,不仅成为一种文化符号,更成为一种可以被消费和增值的商品。

  美图做的就是「颜值」这门生意。

  在国内,或许没有哪家公司能比美图更能精准把握人们对于「颜值」的需求。单是围绕这一点,美图就分步有序地打造了 20 多个美颜类 app,以及为自拍功能定制的手机。在初期一片唱衰和嘲讽中,手机已然成为美图营收主要的贡献者,2016 年近 75 万台的销量,为美图提供了 14.7 亿的收入。

  如果你走在商业街里,推开一家家私营服装店,会发现这些店主们十有八九,用的都是美图标志性的盾牌形状手机。

  新花样:视频实时分割

  「美」总是需要新花样的。肤白长腿大眼远远不够,还更需要有趣的内容和形式。而这种「花样」需要繁复的基础技术作为支撑。

  对于目前最火热的人工智能技术,美图自然也看到了它背后蕴含的颠覆性力量。

  在美拍平台上,明星柳岩所拍摄的美少女变身视频,已经拥有接近200万的播放量,里面所展现的「百变背景」功能,可以在视频中进行实时图像分割,将人物从真实场景中抠出,放置在特定的卡通背景中,并加入 AR 特效和音乐效果。

专访美图 CTO 张伟:5年以前,我们也不会想到会花 70% 的时间在人工智能上

  这项技术的实现,用了深度学习。

  在 CV 圈,图像分割技术并不新鲜。对于一张静态的图片进行分割,可以花费很长时间来处理,但是「实时」则要求达到每秒 30 帧的处理速度。在这极短的时间内需要进行的工作包括:人像识别和分割、边缘处理、背景替换、实时美颜美型、AR 效果添加等多个环节。

  保证视频实时分割的响应性、速度和可靠性,综合考验了一家公司技术团队的研发和工程能力。

  在AI领域的发声

  作为一家 2C 的产品公司,美图一直以来营造的是一个接地气的亲和品牌形象,随着科技感更强的手机品牌的推出,美图也逐渐在人工智能领域寻找更强的存在感。在「百变背景」正式推出之前,美图就把相关 Demo 搬到了学术大会 VALSE(视觉与学习青年学者研讨会)上。

  这场四月中旬召开的学术会议,参会者达2500多人,聚拢了国内顶尖AI公司代表和计算机视觉青年研究人才。

  在 VALSE 用于展示论文 Poster 墙的附近,就是 Demo 区,排列着国内大大小小的计算机视觉公司展台,包括 BAT、旷视科技、格灵深瞳、云从科技、滴滴出行等。与其它 AI 公司展台动辄「识别率」和人脸比对系统坐镇的高冷范儿相比,美图展台的 Demo 产品更易令人产生参与的欲望,试玩的人自然络绎不绝,内行走过,也会不禁念叨一句「哟,他们家产品挺有意思」。

专访美图 CTO 张伟:5年以前,我们也不会想到会花 70% 的时间在人工智能上

  (VALSE 现场图)

  不可否认,美图的产品招人喜欢。

  美图在人工智能领域并不算喊得很大声的那一个,但是动作下得很早。

  2010 年,美图成立了一个专注于前沿影像技术研发的实验室:MTLAB(美图影像实验室)。这次推出的「百变背景」功能,就出于 MTLAB 之手。

  MTLAB 地理上分布在北京、厦门和深圳,北京注重于长期、基础性技术研究,厦门 MTLAB 侧重 AI 应用落地,深圳则偏重于硬件产品的算法支持。这个实验室早在 2012 年的时候就关注了深度学习技术。美图 CTO 张伟在接受雷锋网(公众号:雷锋网)采访时,介绍道:

  「大概在 2011、12 年就开始加入人工智能部分的研发了。原因是,这东西一开始看起来是万能的,当然后面发现有很多问题。」

专访美图 CTO 张伟:5年以前,我们也不会想到会花 70% 的时间在人工智能上

  (美图 CTO 张伟)

  虽然不同地区实验室侧重点不同,但是为了确保研发和产品的无缝衔接,往往会把同一个项目的研发人员,分在北京、厦门和深圳三地。其他部门的员工,大约每两周都要与实验室的同事碰头,产品经理分享新的 app 资讯,实验室同事分享新的 paper 和技术趋势。

  实际上,一个新的产品功能,都是在研发和产品团队反复「磋商」的氛围中诞生的。

  「我们基本上是一个研发小组先做 demo,demo 不错的话,交给一个中间架构团队把它封装成一个组件,交给前端。然后在公司里面去问,哪个产品团队对这个新技术感兴趣?有团队感兴趣的话,产品团队里的设计师们,就会拿过去做二次开发,然后再对这个组件提一些性能、速度、效果方面的建议。」

  谈及美图来这次 VALSE 大会的缘由,张伟经常提到一个词汇就是「看到」。美图虽然是年资较长的上市公司,在人工智能领域投入也不菲,但 AI 这个标签并不是其与生俱来的。就算是在人工智能领域重度参与的英伟达,其 CEO 黄仁勋还在最近的采访中表示「将来某一天,我们可能会成为一家人工智能计算公司」。这是向 AI 转型的公司都要共同面临的课题,要反复向外界强调自己在 AI 领域的存在。所以美图需要参加 AI 圈的活动,不论学术的还是业界活动:

  「因为我们毕竟在做 AI 这个领域,我们希望大家看到我们,我们也看到他们。」

  如果不做人工智能,美图就会空掉

  人工智能对于美图公司来说,到底处在一个什么样的位置?作为 CTO 的张伟一句话说明了一切:

  「我花 70% 的时间在上面...... 我们觉得如果再过三年,这家公司不做 AI,可能就会空掉了。

  美图从一家工具型公司,往人工智能公司转型,不仅仅是出于产品需求,更是攸关性命的一项抉择。在他看来,人工智能这项技术,可以把美图已有的东西重新刷一遍,将技术水平提升到一个前所未有的高度。

  「很多人工智能创业公司有个问题,就是『为人工智能而人工智能』,这不是一个合理的东西。但我们就是有一个很明确的目标,比如女性变美这件事情,这件事情很垂直,深度学习能做吗?一定能做!大数据能不能起到作用,一定能起作用!」

  李开复曾经盛赞美图是一家「顶级人工智能公司」。对此,张伟本身的用词会更加谨慎:

  「开复老师这么说,是对我们一个非常高的肯定。如果你去看开复老师对于人工智能的定义,是包含两个方面,就是机器学习+大数据。那至少另外一半我们是有的。剩下的机器学习,我个人认为,深度学习相关的东西,美图已经涉及的足够深了。」

  众所周知,美图坐拥人脸和图像数据巨矿,剩下的,就是对挖矿工具的深度打磨。张伟认可人工智能技术的巨大价值:

  「整个世界都在等炼油的技术,数据就像石油一样,如果没有炼油的工具,石油就是一团黑水。但只要你有了炼油的工具,只要能挖到石油,那就跟印钞机一样。」

  但同时,他是一个坚定的「非技术决定论者」,他认为一项 AI 技术的成功应用,还涉及到产品、设计、商业等各种因素。

  虽然美图拿手的是人脸技术,但是出于对电商和广告抱持的野心,美图研发团队的人员同样投入大量精力在其他物体的识别技术上。

  「我们内部做人脸的人数,跟做其它物体识别人数,比例为 1:7。」

  没有对手,有什么意思?

  美图的产品,并非没有对手。例如打头阵的美图秀秀 app,市面上就有很多类似的竞争对手,而且有的是来自于 BAT 级别的公司,美图当然有危机感,但对此张伟用了一个很性情的词儿--「酷」。

  「我们有很强的危机感,但这实际上是一件很酷的事情。没有对手,有什么意思?我们也知道一些竞争对手的相关团队有挺多人,我们投入很大的精力和资金去追赶,但是当证明完自己之后,我们在想一个问题,就算你比其它公司多出 0.1%、0.2% 个点,还是远远不够的。」

  归根结底,还是一个老观点,技术并不是唯一决胜的关键,美图的「颜值」生态链,包括庞大垂直的用户群、对用户需求的精准把控、品牌效应和商业模式构成了一个完整的链条,这是其核心竞争力。

  「我们每一个产品都有一个竞争对手,但是合在一起,我们觉得没有像我们一样的综合体。我们的看法是,如果我们再把技术往深的地方做,一定会把别人拉开一大段距离。但即便拉不开大距离,以我们目前产品、运营、品牌的综合实力,我们不会觉得有多大问题。因为不只是比技术。」

  所以,在 AI 技术方面,美图并不忌讳借用外力。甚至为了更快取得先机,会主动寻求与更多第三方合作机会。而美图这次参加 VALSE 大会,其实也是为了跟 AI 业界同仁进行一次深度的交流,谈一谈可能的合作。

  「美图不然自己做,不然就靠第三方的资源建立起来,构建自己独一无二的生态系统...... 我们正在跟世界上很多不同的团队,一起来做深度学习的工作,互相学习和交流,而我们也在做学术方面的工作。」

  谈及如今 AI 公司几乎标配的「首席科学家」,张伟也是保持着开放的态度。

  「每个公司邀请首席科学家的目的不同,可能是为了更好的融资,也可能是为了让公司的技术水平进一步提升。对于美图而言,如果一位科学家的加入能给我们的研发水准带到一个新的高度,我们也很愿意敞开怀抱去迎接他的到来。」

[责任编辑:赵刚]

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明员工 | 光明网邮箱 | 网站地图

光明网版权所有

立即打开