最强大脑人机大战第一场落幕 百度高管解读背后故事

2017-01-07 18:12 来源:中文科技资讯  我有话说
2017-01-07 18:12:21来源:中文科技资讯作者:责任编辑:赵刚

  昨晚23:20,《最强大脑》第四季人机大战第一场在江苏卫视落下帷幕。这场被称为跨越30年的“千脸识别”之战,经过了将近1小时的鏖战,以“百度大脑”派出的小度机器人3:2战胜王峰告终。

王峰、郑才千、李威讨论谁对战小度

  比赛现场,人类选手在经过长达15分钟犹豫和怯场后,最后派出“世界记忆大师”王峰迎战百度大脑。比赛共分两轮,在第一轮比赛中,小度和人类选手需要通过分析照片中出现的幼年人脸,来识别出现场20年后的成年人,面对双胞胎识别这一难题,小度精准识别,以72.99%—高于第二张0.01%的识别率成功锁定目标,而名人堂王峰则1:0落败。

  在第二轮中,小度和王峰面对照片中出现的人数众多、现场实时照片传输、现场摄像机捕捉晃动、灯光干扰、化妆、微整形等影响,顶住压力,表现同样优秀,在30张共近千人脸的小学毕业照中成功选出了主人公。最终小度机器人以3:2击败名人堂选手王峰。

  为什么小度机器人能做到跨年龄识别的准确性?背后有什么不为人知的瞬间?在1月5日百度举办的人机大战提前观赛会上,百度深度学习实验室主任林元庆第一时间披露了人脸识别背后的技术难点,以及百度本次赴战背后的故事。


百度深度学习实验室主任林元庆演讲中

  以下为演讲实录:

  林元庆:媒体朋友们,大家下午好!我是百度深度学习实验室的林元庆,今天也非常高兴代表百度的人工智能给大家分享一下我们参加这个比赛的一些心得。百度在人工智能起步的时候非常早,搜索里面用到非常多人工智能的技术,百度人工智能最核心的就是百度大脑,经过非常多年的积累,现在百度大脑拥有世界上最大规模的神经网络,万亿级别的参数,千亿的训练数据,亿级别的特征,这个是非常强大的人工智能系统。在最近开的世界互联网大会上,百度大脑也是唯一一个国内获奖的世界领先成果奖。

  我们最近也获得了人工智能四大巨头之一的称号,我们自己觉得这应该是代表了国内最高的人工智能的水平。这次参加比赛的主要是以深度学习实验室为主,主要是在计算机视觉和深度学习的平台、深度学习的平台在座的各位听说过,和谷歌的类似,只不过百度有百度的优势,在一些方面比它们做的更好。

  刚才我们看到的人脸识别,其实就是计算机视觉。这是我们深度学习实验室现在做的方向,人脸识别是其中的一个方向,这里面还有两个方向没有列,一个是智能驾驶,一个是增强现实。智能驾驶是2015年从深度学习实验室孵化出去的项目,专门成立了独立的事业部做智能驾驶。两个礼拜之前增强现实也独立出去,成立增强现实实验室,这两个都是深度学习实验室孵化出来的项目。因为这两个项目都已经做的非常好,我们觉得应该给它更多的空间发展,从实验室走到现实当中。

  这次《最强大脑》比拼的是人脸识别,蒋昌建老师也提到了,我们一直保持的是世界第一。2016年最看重的是一些营运,今年我们投入了非常大的力量,希望能够把人脸识别做成一个非常实用的技术。人脸识别在2016年有一些性能的提升,这是在我们内部非常难的测试集上,实际上从实际的应用里面来,我们把一些非常容易的去掉了,过去的这几年,2015年年底在这个测试集上最好的精度是8%的错误率。经过2016年的改进,9月份错误率降低到2.3%,这是非常大的降低。最后,我们希望能够把错误率降到1%以下,大家看到基本上有将近10倍左右的降低,这个是非常大的。我们平常说这个技术做的好,我们提高了20%、30%,这个是错误率降低了10倍,是非常棒的。

  我们今年选择参加《最强大脑》,在这里我解释一下图象识别这一块,人脸和人脑的识别不一样,比如说猫,就算是3岁的小孩,猫摆出不同的姿势,各种各样的猫都能够很好的识别。机器如果精确的识别,后面需要非常海量的数据训练,可能是成千上万的数据。训练的结果还不一定正确,下一次碰到姿势不一样的猫,有可能识别错。虽然我们人工智能技术过去几年取得了长足的进步,但是识别还是一个非常难的事情。

  《最强大脑》挑战的是比识别猫更难的,历史上有许多次的人机大战,比如说最近几天大家讨论的Master,之前的AlphaGo、深蓝等等。比如说针对下棋,空间还是有限的。识别需要一些模糊推理的能力,其实这里面还不是传统的计算器很擅长的。甚至我自己也把我的高中毕业照给一些同事看过,基本上是很难识别出来的。最后有同事识别出来,我说你们怎么识别?看气质。看气质的东西我说计算机怎么搞?这次和《最强大脑》做的几期节目,这些任务,比如说跨年龄的,第三期的遮挡,戴着口罩和大墨镜、帽子从上往下照,看到鼻子以下的部位,这些任务是大家公认没有解决好的问题,这些事情还是蛮难的,不是说大家都能做的很好的。

  这次百度也希望从综合的方面和人类比一下,最后能不能做的非常好。我们经过了很多年的研发,最后看一看我们和这些人类比,到底我们的水平在哪里。特别是我们这次的比赛,大家看王峰最后的题目做出来的时候,特别是非常强大的,我切身的体会到他们和普通人真的不一样,他们的能力非常强,这些题目确实是非常难的,不是很传统的识别,我们的对手还是非常强劲,比如说王峰。

  《最强大脑》今年早些时候找到我们的时候,也不知道这个节目能不能做好,因为这是前所未有的,没有一家公司在这方面专门做过这些内容,他们也不知道,在国内找了很多家公司看一看谁能做的比较好。这个是他们当时给我们的测试,当时基本上是《最强大脑》坐一排,百度的坐一排,把这些数据给我们,看一看你能做对多少个。但是在这上面,总共八个,我们只错了一个,难度还是蛮大的。从《最强大脑》的节目组来讲,看完了我们做的以后被我们震住了,选择百度和他们做这一档节目。这里面还看了语音的能力,综合来说百度在这方面非常强,最后他们选择和百度做这一期节目。

  过去两个多月的时间备战,准备上这个节目。我大概给大家一个概念,这里面到底做了哪些特别棒的事情。最后的人脸系统分两步训练的,第一步训练的是通用的人脸识别系统,不是专门针对跨年龄的,这次成功最关键的是这一块,训练了一个非常强大的人脸识别系统。我们的数据里面是两百万人,每个人有一百张照片,我们用一个非常大的数据训练我们的人脸识别系统,这是百度很多年积累起来的数据,这个过程的迭代是数据和算法一起迭代,这里面非常难的事情是你要有非常好的算法,充分利用这些数据。利用这些数据,你能设计出非常好的算法符合这些数据。

  这里给大家一个感性的认识,大家经常听到ImageNet一千类,150万张照片,我们大概是两百万类,类别我们是它的两千倍。如果按图片的数量来算,他们是150万,我们是两亿,基本上是一百多倍。如果把这些数据放在一起,看的是这样的内容。因此,在量级上差别还是非常大的。如果大家要训练的话,业界也得五天到七天,如果训练到这么大的数据,如果是一百倍的话得训练一年多,这里面有非常好的算法设计,包括很好的计算等等各个方面,我们能把这个模型训练起来。

  这是我们准备当中的花絮,要做成一件事情是很难的,特别和《最强大脑》比赛,这个过程很忐忑,也很兴奋。忐忑的是事情能搞定吗?兴奋的是终于有一个机会去看一看我们的人工智能技术做了这么多年,跟人还有多大的差距,或者是已经到达了什么样的水平。我个人从国庆开始就没有放假,一直到节目做完,基本上中间一天都没有放假,两三点这都是正常的,我的团队经常是三点、四点以至于到第二天,这个很正常。我觉得要做成一件事情,这是最基本的。比如说我们的同学在封闭的会议室里过生日,我加入百度大概一周年,大家一起庆祝。为了节目我们把人工智能的能力植入到小度身上,代表百度参加比赛,我们自己在这个过程中,觉得小度特别猛。

  大家可能也有疑问,百度做了这么多技术,亮点在哪里。现在我们做的人脸识别的门禁技术,在百度的大厦里已经落地了,百度整个公司有30条左右的闸机已经用了人脸识别系统,人走在那里稍微站一下直接就往里走,一秒到两秒的时间,不用卡了。这个技术是1比N的人脸识别,我们能做到非常高的精度,业界也是首创。之前市场上的系统是1比1的,比如说银行的应用里面,你要提交身份证和人脸的信息,系统会拿身份证照片比对一下是不是同一个人,一张比一张,一比一的比对,市场上基本是这个系统。公安抓逃犯的系统是1比N,精度不会做的特别高,用机器筛一遍,还是需要人去看的,1比N很难做到非常高的精度。我们这个系统第一次能够做到,百度目前的系统里大概是一万人,很精确的识别一万里面的一个人,或者这个人不在这个系统里,是外来的人,它就会拒绝掉你。我们现在是万级别,还能做到非常高的精度,这个绝对是国内首创,也是我们下面会重点来推的方向。

  这是在乌镇落地的项目,这个是它的注册系统,注册完了以后就可以往里走,现在很多景点有指纹识别系统,精度很难做的特别高,都是一比一的,过的时候出示一下身份证,小孩和老人的精度很难做。因为老人的指纹都磨损了,指纹通过基本上是在10秒左右一个人,我们这个系统是非常革命性的,我们是用人脸做的,1比N的,不需要再出示你的身份证,基本上通过率是一到两秒左右,非常快。在今年下半年,大家去景区,很多景区应该多会有这样的系统,如果你看到的话,一定是百度的系统。

  我们也会做1比1的系统,成功的在百度自己的产品上线,外部的泰康保险都会用,确实在性能上比目前市场上的竞品好很多。一些系统转过去要有一些成本,百度精度上做的非常好,原来用了别人的,现在转到用百度,我相信接下来会越来越多。

  当然,我们也很容易想到其他内容,在这方面我们也在推进,比如说公安方面识别罪犯,1比N做的非常好,原来的精度做的不够好。现在,我们希望百度这边能够做出非常高精度的1比N的人脸识别系统。甚至识别被拐卖的儿童,和打拐办也在推进,还有安防等等,很多和人脸识别相关的应用,后续都会大力推进。

  现在人工智能在接下来的五到十年里是一个非常重要的技术,我们后面人类和人工智能一定是共存的,我们百度更相信最后是人工智能帮助人类,比如说《最强大脑》这个节目不是宣传打败了人类,输赢我们不是最看重的,最重要的是看一看百度和中国的人工智能已经到了怎么样的水平,这是我们特别关心的。后面的五年、十年,甚至二十年、五十年,我们一定会跟人工智能的技术共存,希望我们把这些技术用好,帮助人类解决问题,而不是让这些技术成为人类的对立面。如果大家想做人工智能的可以加入像百度这样的公司,大家一起努力,把技术用到最好。

  这几期做节目的过程中也发现了,从旁观者的角度来看,挺值得我们思考的。比如说每一期的节目,如果是小度赢了,很多观众觉得蛮沮丧的,如果是人类赢了,大家会很欢呼。我觉得我们应该从另外一个方面看,比如说王昱珩说过人类发明汽车的时候,不会因为汽车比我们跑的快我们很沮丧。我们发明的这些技术最后是为我们所用的,这些技术会是未来的技术,这一次《最强大脑》的人机大战,我们也在思考怎么样和人工技术共存,怎么样更好的利用人工智能技术,谢谢大家!

[责任编辑:赵刚]

WAP版|触屏版

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明员工 | 光明网邮箱 | 网站地图

光明网版权所有

立即打开