点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:ShortDF突破多模态模型质效困局
首页> IT频道> 今日头条 > 正文

ShortDF突破多模态模型质效困局

来源:光明网2025-09-23 17:47

  当前,文生图、文生视频等生成式人工智能技术正得到越来越广泛的应用,但在一些场景中,生成速度和生成质量难以兼顾的矛盾也尤为突出。针对这一痛点,中国联通数据科学与人工智能研究院聚力攻关并实现了突破,提出模型推理加速方案ShortDF,突破多模态模型生成效率与质量瓶颈,并赋能多场景应用。

  当前主流的多模态生成模型大多以扩散模型为基础,通过在训练过程中给清晰的图像或视频添加随机噪声,再运用反向去噪规律,实现从指令文本到匹配图像或视频的生成。

  通俗来讲就是先教会模型“画面或视频怎么由正常变混乱”,学习并记住这个过程,然后模型便可照此规律按指令文本“把混乱画面或视频变正常”。其中的去噪过程作为关键核心,在这个过程中,如何选择路径也决定了生成效率和质量。

  现有的路径选择方法主要分为两类:一类是马尔科夫链式方法,如DDPM,Denoising Diffusion Models,即按照规定路线循规蹈矩走完所有路口,虽然稳妥但耗时长,生成效率较低;另一类是人工跳步式方法,如DDIM,Denoising Diffusion Implicit Models,凭借经验人为设定抄近道仅走少量路口从而实现效率提升,但因为路径缺乏自适应性,容易发生图像模糊或形变等问题。

  中国联通数据科学与人工智能研究院提出了一种创新方法——ShortDF(Shortest path optimizing in Denoising Diffusion model去噪扩散模型最短路径优化),可在路径图中找到合适路径,并做路径压缩。直观来说,就像具备会进化的“智能导航”,不再固定走完所有步骤,也不预设定走哪些步骤,而是动态选择最优路径并做路径压缩,让一步抵多步,从而实现效率和质量的权衡。

  ShortDF在多个业界主流基准数据集上均取得了显著性能提升,其中在CIFAR-10数据集上的表现尤为突出:原本需要10步生成的DDIM图像,ShortDF仅用2步即可完成,实现了约5倍的速度提升,同时图像清晰度(FID指标)提升18.5%。

  这些实验结果验证了ShortDF在多模态生成任务的高效推理能力,实现了在保证生成质量的前提下推理速度的大幅度提升。凭借这一突破性成果,ShortDF入选CVPR 2025的Highlight论文(全球超1万篇投稿中仅2.97%入选),获得国际人工智能学术界的高度认可。

  目前,ShortDF技术已在多种内容生成场景中应用,有效确保了生成质量的同时提升了生成效率,优化了用户体验。ShortDF针对扩散类模型具备通用性,应用空间广泛,适用于文生图、文生视频、图像及视频编辑等多种功能场景。

  未来,中国联通数据科学与人工智能研究院将继续推动多模态生成技术的优化与创新,解决模型产业化落地的“最后一公里”问题,让高效高质的AI生成技术在文创、工业、教育、医疗等更多领域得到更广泛和深入的应用。让人工智能惠及更多个人及企业,推动人工智能+规模化发展。(张伟)

阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平会见文莱王储比拉

  • 习近平会见联合国教科文组织总干事阿纳尼

独家策划

推荐阅读
当日,"中国流动科技馆"广西巡展融安站开展,吸引众多学生和家长前来参观、体验。该站巡展为期49天,涉及声、光、电、磁等科学设置,旨在引导青少年学习科学、体验科学、参与科学
2026-05-13 15:00
贵州省黔西市金兰镇宝石村,废弃荒山经过修复治理后,栽植的绿油油茶树破萤成蝶
2026-05-13 14:31
阿禾公路全程209.45公里,北起阿勒泰市,南至布尔津县禾木喀纳斯蒙古族乡禾木村,是北疆"千里画廊"的核心景观大道,串联起森林、峡谷、草原、湿地等多样地貌
2026-05-13 14:15
江苏省南京市围绕实施积极应对人口老龄化国家战略,推动全市养老服务从"有"向"优"提质升级,持续完善契合南京市情的养老服务体系,提升老年人晚年生活的获得感、幸福感
2026-05-13 14:12
当前正值小麦灌浆期,是小麦植株综合性状最明显的时期,山东省东营市广饶县广饶县加强小麦种子生产源头监管,有序开展小麦良种繁育去杂、去劣、提纯,有效提高小麦种子质量和纯度,保障种子质量,实现小麦良种繁育丰产增收
2026-05-13 14:07