点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
4月2日,昆仑万维AI音乐生成大模型“天工SkyMusic”面向社会开启免费邀测。本轮邀测将面向行业媒体、专家与感兴趣的音乐从业者,开放1000个免费名额。
一直以来,AI音乐生成大模型都是AI大模型行业最受关注的落地应用之一。早在2022年12月,昆仑万维就发布了「昆仑天工」AIGC全系列开源算法与模型,其中就包括多模态音乐内容生成大模型。此后,昆仑万维更是通过AI音乐生成大模型为北京市东城区域文商旅融合品牌“故宫以东”打造了年度数字主题曲,将AI音乐前沿科技与东城区历史文化深度融合。
本次启动邀测的“天工SkyMusic”采用音乐音频领域类Sora模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性;Diffusion Transformer 负责演唱,通过LDM让Music Patches被还原成高质量音频,使得「天工SkyMusic」能够支持生成80秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力,让模型具备多模态的情感理解与表达能力。
昆仑万维创始人周亚辉表示,“未来三十年,人类社会将从感知线,变成表达线,整个人类社会在自我表达侧要翻1000倍;创作和自我表达是未来30年在整个社交和文化领域增长最快的曲线,会有越来越多人表达自我,表达对世界的理解、对社会事物的态度,表达越来越艺术化和趣味化;这种表达在过去很困难,因为工具门槛高,而未来30年是自我表达的30年,我们要用AI把人类创作的门槛降得足够低,让人们更充分地实现自我表达。”
昆仑万维致力于创造一个每个人都能够自由地发挥自己最大潜力的未来。通过通用人工智能,昆仑万维希望构建一个更加智能、更加互联、更加理解和尊重每个人个性的世界。
当前,昆仑万维已打造了集AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力于一体的“天工3.0”多模态“超级模型”(Super Model),成为AI行业全新里程碑。(李记)