正在阅读: 王海峰谈人工智能:语音合成也取得巨大进展
首页> IT频道> 互联网 > 正文

王海峰谈人工智能:语音合成也取得巨大进展

来源:光明网2019-08-28 18:02

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  算力是AI发展的重要基础。8月27-28日,由中国工程院信息与电子工程学部主办的AICC 2019人工智能计算大会上,与会嘉宾就AI计算和AI创新展开了探讨。百度首席技术官王海峰发表题为《人工智能加速产业智能化升级》的演讲,分享了百度对于AI计算发展的洞察,并介绍百度AI在算力、算法等层面的最新进展和助力产业智能化的成果。

王海峰谈人工智能:语音合成也取得巨大进展

  王海峰表示,迄今为止人类经历的三次工业革命,分别以机械技术、电气技术和信息技术为核心驱动力,而这些技术都表现出很强的通用性。当前,我们身处以人工智能为核心驱动力量的新一轮科技革命和产业变革大潮,人工智能正在将人类社会带入智能时代。

  百度是国内投入最早、技术最强、布局最完整的AI领军企业,在AI技术领域保持领先优势,并积极建设人工智能开源开放平台,推动应用落地,促进产业智能化的发展。百度人工智能技术多年积累和业务实践的集大成——百度大脑布局完整,核心技术领先,既有基础的算法、数据和算力,也有语音、视觉、AR/VR 等感知技术,自然语言处理、知识图谱等语言与知识技术,还包括开源开放、支持产业应用的AI平台与生态,并打造了完整的AI安全防护体系。

图片包含 天空, 监视器, 蓝色  描述已自动生成

  近年来,在数据、算法和算力三要素的共同作用下,人工智能技术取得巨大进步,尤其是深度学习领域突破显著。

  语音识别的准确率不断提升,在很多场景中已经超过人类。百度今年实现了注意力模型在大规模线上语音识别系统中的应用,同时准确率进一步提升。该技术应用于智能音箱和语音输入法等产品,实现高精准的中英文混合语音识别。

  语音合成也取得巨大进展。百度前不久上线的并行WaveRNN模型,解决了WaveNet模型需要大量计算资源的问题,合成效果大幅提升,同时能够满足在线的实时需求。

  通过结合端侧的算力,百度领先的语音技术正在发挥越来越大的价值。百度打造了一款针对远场语音交互的芯片“鸿鹄”,按照车规级打造,采用HiFi4自定义指令集,双核DSP核心,平均功耗仅100mW,可实现远场阵列信号的实时处理和高精度低误报语音唤醒,并集成离线语音识别功能,适配车载语音交互、智能家居等各种场景。

  计算机视觉技术也越来越实用化,形成适用于不同应用场景的技术矩阵,如文字识别(OCR)、图像处理、人脸/人体识别、图像生成、人机交互等。综合应用语音和视觉技术,机器可以自动合成虚拟形象。百度大脑的虚拟形象自动生成技术,可以对语音信号和视频信号进行识别与理解,再通过唇动生成,以及语音、面部和肢体的合成,自动生成一个虚拟形象。

  在认知技术上,百度建立了完整的、包含知识图谱、语言理解、语言生成等在内的语言和知识技术体系,构建了世界上最大的多源异构知识图谱,在包含数亿实体、千亿级事实,能够满足90%用户需求的实体图谱的基础上,针对不同的应用场景和知识形态建立起关注点图谱、行业知识图谱、POI图谱、事件图谱等多种知识图谱。例如视频理解知识图谱,百度大脑结合视觉、语音和自然语言处理技术解析多模态信息,并与知识图谱的相关实体建立关联,通过计算和推理,得到视频内容的结构化语义表示,从而精确解析一部视频中出现的人物及其关系、音频、事件、主题等信息。

  在自然语言处理方面,百度发布了基于知识增强的ERNIE 模型,通过建模海量数据中的实体概念等先验语义知识,学习真实世界的语义关系。这种融合知识的语义建模大幅增强了模型的语义表示能力,在共计16个中英文自然语言处理任务上超越了谷歌BERT和XLNet, 取得了SOTA效果。百度的语言与知识技术已经广泛应用于机器同传、智能写作等产品中。在机器同传领域,百度综合联合词向量解码、语篇翻译模型等新技术,实现高准确、低时延的机器同传,并发布了语音到语音的机器同传系统:DuTongChuan(度同传),翻译效果极具竞争力。

  人工智能技术快速发展,离不开算力的支撑。算法持续突破,算力缺口巨大,王海峰认为,这需要算法、计算架构等多方面努力来解决。

  百度大脑的AI计算架构,实现了芯片、互联、系统和调度的协同设计和技术创新,并紧密结合百度飞桨(PaddlePaddle)训练与推理框架,提供面向算法优化的极致效率,并做到异构、无感的使用。

  王海峰指出,在智能时代,深度学习框架起到承上启下的作用,下接芯片,上承各种应用,是“智能时代的操作系统”。百度打造了中国首个也是目前国内唯一开源开放、功能完备的深度学习平台——百度飞桨。飞桨的核心框架,包括开发、训练和预测,以及涵盖推荐、视觉、自然语言处理、语音等在内的丰富模型库。同时,飞桨提供包括迁移学习、强化学习、自动化网络结构设计、训练可视化工具、弹性深度学习计算、图神经网络等在内的工具组件,以及零基础定制化训练和服务平台EasyDL、一站式实训开发平台AI Studio和端计算模型生成平台EasyEdge等服务平台。飞桨也与浪潮在算力层面进行合作,进一步降低深度学习应用门槛,加速推动产业智能化变革。

  基于对中国产业的深度洞察和对中国开发者的理解,飞桨具备五大核心优势:同时支持动态图和静态图的编程,能够兼顾易用性和效率;开源70多个经过真实业务场景验证的官方模型,涵盖视觉、NLP、推荐等 AI核心技术领域;具备适用大规模数据场景的分布式训练能力,从优化算力的角度为深度学习的应用提供支撑;提供包括底层硬件、推理引擎、多种程序设计语言、方案与服务工具在内的端到端全流程部署方案,助力产业开发者实现应用的快速落地。同时,针对没有深度学习技术基础的开发者,百度飞桨提供定制化训练和服务平台EasyDL,让他们可以基于自身业务需求和数据,快速训练定制化AI模型。

  以百度飞桨深度学习平台为核心基础,百度大脑实现了AI算法、计算架构和应用场景融合创新,成为“软硬一体AI大生产平台”。在数据和算力的基础上,打通了人工智能产业化应用落地的全部流程,实现了AI技术的标准化、自动化、模块化,助力开发者快速实现应用,带来价值。

  基于百度大脑AI平台,百度的AI技术已经应用于各行各业,带来了巨大的产业价值。王海峰以百度地图AI化数据生产、水培蔬菜智能种植,以及不同行业的应用为例,介绍了人工智能助力产业智能化的效果。例如,百度飞桨基于遥感影像数据,研究高精度、高自动化的目标地物检测、土地覆盖和土地利用分类方法,可以辅助国家进行重大工程用地扩张与变化情况的监测工作,并对土地资源的利用进行有效管理与控制;基于视觉技术及深度学习算法构建的智能无土栽培解决方案,将原来农业专家的个人经验进行了数字化、产品化,使无土栽培作物生产具备了规模化生产的可能性。

  据麦肯锡预测,人工智能将显著驱动经济增长,更快应用AI 的领跑者将获得更大的经济收益。现阶段,百度人工智能技术度持续发展突破和深度学习技术及平台的开源开放,将加速人工智能技术与产业融合,加速产业智能化,让AI时代更快到来!(李经)

[ 责编:赵艳艳 ]
阅读剩余全文(

相关阅读

您此时的心情

新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 核心价值观百场讲坛第九十九场走进中国商飞

  • 智慧媒体重要赛事+重磅成果20日将亮相!

独家策划

推荐阅读
9月17日,安徽省肥西县金牛蚕桑农民专业合作社的农民在整理蚕茧。新华社记者刘军喜摄  9月17日,安徽省肥西县金牛蚕桑农民专业合作社的农民为蚕添加桑叶。新华社记者刘军喜摄  9月17日,安徽省肥西县金牛蚕桑农民专业合作社的农民在整理蚕茧。
2019-09-18 10:38
9月17日,果农在河北省清河县葛仙庄镇花园村采摘山楂。近年来,当地在引导农民集中连片发展无公害山楂种植的同时,积极推动农旅融合,带动了13个村2100余户种植户致富增收。近年来,当地在引导农民集中连片发展无公害山楂种植的同时,积极推动农旅融合,带动了13个村2100余户种植户致富增收。
2019-09-18 10:37
9月17日,广西都安瑶族自治县密洛陀文化公园广场,演员在启动仪式上表演节目《在希望的田野上》。当日,2019年广西庆祝“中国农民丰收节”启动仪式暨河池市“庆丰收·促脱贫”系列活动在都安瑶族自治县举行,各族群众和来宾一起载歌载舞欢庆丰收节。
2019-09-18 10:34
9月17日,河北省唐山市丰润区宇轩农产品农民专业合作社员工在晾晒核桃(无人机拍摄)。近日,河北省唐山市丰润区核桃喜获丰收,近10万亩优质核桃陆续下树,销往全国各地市场。近日,河北省唐山市丰润区核桃喜获丰收,近10万亩优质核桃陆续下树,销往全国各地市场。
2019-09-18 10:26
这是位于湖北省红安县七里坪镇的长胜街(8月2日摄)。新华社记者 程敏 摄  农民在湖北红安县一处红薯田进行除草作业(2018年6月27日无人机拍摄)。
2019-09-18 10:23
9月17日,河北省内丘县实验小学学生在邢瓷文化体验馆内参观。学生们来到内丘“邢窑三馆”——中国邢窑博物馆、邢窑遗址博物馆、邢瓷文化体验馆,参观邢白瓷藏品,学习邢白瓷知识,感受家乡邢窑文化。
2019-09-18 10:22
当日,“发现‘中纹’之美——首届中华符号数字化创意设计大赛”颁奖仪式在北京故宫博物院举行。本次大赛于3月28日启动,分为“中华符号全国征集大赛”和“中华符号创意设计大赛”两个阶段,最终评选出优胜作品33份,其中图形图案类17份,办公应用类7份,创意字体类9份。
2019-09-18 10:21
这是9月17日无人机拍摄的贵州省榕江县计划乡计划村阳开苗寨梯田。近日,贵州省黔东南苗族侗族自治州榕江县计划乡计划村阳开苗寨的水稻陆续成熟,农民们抢抓农时收割稻谷。从空中俯瞰,层层叠叠的梯田线条分明,与古朴的苗寨木楼相互映衬,美不胜收。
2019-09-18 10:17
2019年8月30日,“赵继宗院士西藏神经外科技术指导中心”在西藏自治区第二人民医院成立,以西藏自治区第二人民医院为支点,辐射促进西藏全区神经外科发展。 新华社记者 晋美多吉 摄  9月17日,西藏自治区第二人民医院的医生通过直播视频观摩赵继宗院士脑动脉肿瘤手术示范。
2019-09-18 10:18
《祖国畅想曲》由于京君作曲,浙江交响乐团演出,分为《光辉历程》《绿水青山》《民族团结》《走向未来》4个乐章。《祖国畅想曲》由于京君作曲,浙江交响乐团演出,分为《光辉历程》《绿水青山》《民族团结》《走向未来》4个乐章。
2019-09-18 10:18
津巴布韦驻华使馆参赞阮葛芮莱·穆咋普(左二)与吐鲁番市高昌区职业技能教育培训中心学员(右二)交流培训学习情况(9月10日摄)。”  两位非洲国家及非盟驻华外交官与乌鲁木齐市固原巷社区“社区家庭”(托儿所)的小朋友们亲切握手(9月9日摄)。
2019-09-18 09:56
9月17日,村民在采摘成熟的食用菌。内蒙古呼伦贝尔市莫力达瓦达斡尔族自治旗尼尔基镇丰华村建立食用菌基地,大力发展滑子蘑、平菇、猴头菇等菌类产业。内蒙古呼伦贝尔市莫力达瓦达斡尔族自治旗尼尔基镇丰华村建立食用菌基地,大力发展滑子蘑、平菇、猴头菇等菌类产业。
2019-09-18 09:19
9月17日,在巴基斯坦首都伊斯兰堡,来自巴基斯坦剑桥学校的学生表演歌舞《友谊》。由巴基斯坦中国文化中心和全巴基斯坦—中国友好协会联合主办的巴基斯坦学生诗歌、作文与对话比赛颁奖仪式当天在巴基斯坦首都伊斯兰堡举行。
2019-09-18 09:18
9月17日,在阿富汗东部帕尔万省,警察在查看爆炸现场。当天早些时候,阿东部帕尔万省举行的一场总统竞选集会活动遭炸弹袭击,造成24人死亡、32人受伤。当天早些时候,阿东部帕尔万省举行的一场总统竞选集会活动遭炸弹袭击,造成24人死亡、32人受伤。
2019-09-18 09:18
这是9月17日在纽约联合国总部拍摄的第74届联合国大会开幕式现场。第74届联合国大会17日在纽约联合国总部开幕。本届联大的主题为“激励多边努力消除贫困,促进优质教育、气候行动和包容性”。新华社记者 李木子 摄
2019-09-18 09:16
9月17日,在法国巴黎北郊布尔歇展览中心举行的第22届中国纺织品服装贸易展览会上,客商在一家中国展商的展台咨询。第22届中国纺织品服装贸易展览会(巴黎)(简称“秋季巴黎展”)9月16日至19日在布尔歇展览中心举行。
2019-09-18 09:15
考古人员在江西南昌西汉海昏侯墓遗址主椁室的发掘现场清理文物(2015年11月14日摄)。 新华社记者 万象 摄  考古专家在江西南昌西汉海昏侯墓主棺发掘现场工作(2015年12月22日摄)。
2019-09-17 10:29
9月16日拍摄的仿宫廷紫砂壶。本次推出的仿宫廷紫砂壶,再现了故宫博物院收藏的六款清代乾隆年间出自江苏宜兴窑的宫廷紫砂壶名品。本次推出的仿宫廷紫砂壶,再现了故宫博物院收藏的六款清代乾隆年间出自江苏宜兴窑的宫廷紫砂壶名品。
2019-09-17 10:25
2019年6月12日,人们在俄罗斯圣彼得堡街头参加鲜花大游行,庆祝“俄罗斯日”。建于1703年的圣彼得堡是俄罗斯第二大城市,位于波罗的海芬兰湾东端的涅瓦河三角洲。建于1703年的圣彼得堡是俄罗斯第二大城市,位于波罗的海芬兰湾东端的涅瓦河三角洲。
2019-09-17 10:20
加载更多