百度AIG实力首秀:这才是DuerOS、Apollo的实力来源

2017-07-10 13:19 来源:中国网 
2017-07-10 13:19:45来源:中国网作者:责任编辑:赵刚

  “晚安,关灯”,“请将我送到公司”,“好饿,订个外卖吧”……这些看起来是人与人之间的对话正发生在人机之间。在7月5日的百度AI开发者大会(Baidu Create 2017)上,DuerOS开放平台亮相让设备“听清听懂满足”用户需求,同样获得现场来宾极大关注的还有合作伙伴超过50个的Apollo自动驾驶生态。

  在产业界、传统企业、创业者们关注解决方案开放的同时,更多极客、科学家、AI公司们将目光投向AI核心能力的开放和底层算法的开源。

  当天的AI技术与开放平台分论坛为到场嘉宾详细讲解了包括语音、自然语言处理、图像、视频、增强现实、PaddlePaddle等核心技术的进展及开放情况,而这些技术正是DuerOS和Apollo的底层能力来源。

  从开放上层能力到开放全平台能力

  百度开放的,不仅仅是Apllo和DuerOS。正如百度集团总裁兼COO陆奇在主论坛所言:“Apollo强大的生态、DuerOS唤醒万物的能力,都是基于百度大脑,都是用百度大脑来获得越来越多的知识和能力,它们都是基于百度智能云。”

  百度大脑和百度云共同组成了包含Cloud、BigData、算法层、感知层、认知层、平台层的中国“最完整”的AI平台架构。此架构中包含了百度一流的AI技术和强大的大数据和大计算能力。

  开放与封闭,意味着两种截然不同的发展路径与价值取向。从科技企业本身的利益出发,选择开放还是封闭究竟哪一个更有利,目前尚无定论,但从近期业内对苹果对待开发者态度的评价来看,封闭似乎不再受欢迎。对于开发者而言,科技巨头全面开放其技术能力,其价值更是显而易见。

  但选择开放,不仅意味着技术能力的输出,更意味着其自身的技术能力势必将接受来自合作企业与开发者随时随地的测试与检验。也就是说,选择开放,不仅需要勇气,更需要底气。

  开放背后的底气——顶尖技术 +完整平台

  去年的百度世界大会,百度创始人、董事长兼首席执行官李彦宏曾宣布开放“百度大脑”的核心能力及底层技术。而此次AI开发者大会上,百度宣布开放语音、自然语言处理、视频、增强现实、机器人视觉共5个类目,14项新技术,持续打造共赢的开放生态。也就是说截至目前,百度AI技术开放平台已经开放60项核心技术,成为行业最全面、最完整的AI技术开放平台。

  “我们把所有强大的AI能力放在一起,用最简单最方便的形式提供给每个开发者,”陆奇称。这也是百度一直遵循的技术输出理念。据悉,百度具有包含上亿级别实体的知识图谱、业内领先的自然语言处理技术、近十亿用户画像、从像素到语义级别的视频理解技术以及国内首个深度学习开放平台等技术优势。

  底层核心技术支撑多层次开发需求

  语音交互成为人机交互的下一代入口,语音技术需求日益增加。百度语音技术部总监高亮在分论坛现场介绍了本次新开放的远场识别及语音唤醒、定制化语音合成、语音合成音色、情感语音交互(Emotional CUI)等技术,开发者可以实现不同场景的智能应用,满足用户需求。

  百度在开放语音技术,让机器听清用户的同时,更重要的是开放能让机器懂得用户需求的自然语言处理技术。此次分论坛由百度自然语言处理部总监赵世奇详细介绍了能力强大的语言理解与交互技术平台——UNIT。该平台将开放语言理解技术、交互技术,从百度大数据中自动汲取最有价值的数据提供给开发者使用,为开发者提供多种定制化方案,还首创『训练师』模式,助力开发者训练对话机器人,赋予机器“理解”自然语言,听懂用户需求,以及与用户进行多轮次对话的能力。今年"百度之星"开发者大赛的命题就是基于UNIT平台提供的语言理解与交互技术,“设计和开发一个以对话式人机交互为核心的智能产品”。

  此次分论坛上,百度研究院院长林元庆介绍了视频分析与理解、机器人视觉和人脸识别等技术。本次开发者大会发布了全面的视频语义理解技术,包括视频封面选摘、视频分类、视频比对、细粒度识别、视频审核、视频公众人物识别、视频结构化分析等。此外,林元庆还介绍了世界第一个室外语义分割RGBD视频数据集,以及完整的机器人视觉解决方案。

  增强现实(AR)技术作为全新的视觉交互形式,越来越受到营销、娱乐、游戏等行业关注。百度增强现实实验室主任吴中勤现场发布全新DuMix AR开放平台,为开发者提供AR SDK、内容制作工具、云端内容平台和内容分发服务。吴中勤表示,未来百度将提供更多场景的AR行业解决方案,赋能各行各业,共同探索AR价值。

  已经开源的深度学习算法平台PaddlePaddle,在本次论坛上由百度杰出科学家徐伟进一步披露了其发展路径和开放计划。近期,百度将面向社会开放计算资源,全新推出PaddlePaddle研发云,开放大规模数据集及开放应用模型库。对众多深度学习计算硬件持开放态度,并鼓励最优深度学习硬件。

  分析称,从基础层的深度学习算法开源,到感知层和认知层核心技术的开放,再到为企业和开发者提供全方位解决方案,整合后的百度AI技术架构呈现出层次分明、类目多样、规模宏大的特点。而全新升级的AI技术开放平台,将帮助百度成为AI行业底层技术的标准,构建开发者生态,与开发者共同探索AI技术的更多可能。

[责任编辑:赵刚]

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明员工 | 光明网邮箱 | 网站地图

光明网版权所有

立即打开