钢琴《APT》钢琴谱


即将崭露头角的AI音乐新星,在2025年闪耀登场!

在技术领域,国产大模型再次站在了世界的前沿。就在3月26日,国内领先的科技公司昆仑万维举办了一场引人注目的发布会,宣布推出最新的音乐大模型Mureka V6和O1,全球音乐圈都为之震撼。

特别值得关注的是昆仑万维推出的全球首个引入CoT技术的音乐推理大模型Mureka O1。这一技术突破不仅在文本和视觉任务中展现出色,更是将“强推理、慢思考”的理念引入到音乐生成领域。通过加入思考与自我批判能力,Mureka O1在生成音乐时能够更准确地把握用户期望的风格流派、增强整体结构和连贯性、优化旋律质量。它还通过自动、客观的评分系统来验证生成曲风、结构和旋律的优劣,从而大幅提升了音乐创作的质量,达到了SOT别的生成效果。

在与Suno V4的较量中,Mureka O1不仅不落下风,更在多项主观和客观评测指标中实现了超越。在主观评测中,Mureka O1的听感明显优于Suno V4,其人声、背景音乐(BGM)和混音质感均表现出色。在配器丰富度、作曲结构和旋律动机质量等方面,Mureka O1也实现了显著提升。而在客观评测中,包括发音准确率、音乐片段连贯性、文本相关性以及内容享受度、内容可用度、制作复杂度等指标,Mureka O1均展现出了领先优势。

令人欣喜的是,更高的音乐质量并未牺牲生成速度。Mureka O1的生成速度相比Suno V4有了显著提升,完整歌曲的生成时间缩短了一半。这意味着AI音乐生成在创作逻辑与连贯性、创作自由度与个性化、情感表达以及生成速度等方面都迈入了一个全新的阶段。

这一突破性的进展依托于昆仑万维升级的音乐生成基座模型Mureka V6。该模型不仅支持多种语言的歌词和歌曲生成,还支持纯音乐生成和音色克隆等功能,为国产AI音乐生成产品增添了更多可能性。Mureka V6还创下了两个全球前列的成就:

1. 全球首批开放API服务的高质量AI音乐生成平台之一,支持五种API服务。这为开发者和音乐平台提供了将Mureka的音乐生成能力无缝集成到自家产品或平台中的机会,加速了AI音乐创作的应用并实现了商业价值。

2. 全球首个开放模型微调功能的AI音乐生成平台。用户可以利用Mureka的基础模型训练出符合自己需求的专属音乐模型,大大增强了AI音乐创作的灵活性和个性化。这一功能为音乐人、制作人以及品牌和游戏开发者提供了定制化的AI音乐解决方案。

实测上手

AI展现神曲制造潜力

Mureka的创作界面用户友好,我们可以自由切换Mureka V6和Mureka O1,选择最适合自己想要生成的音乐风格的模型版本。我们尝试了Mureka V6。除了首次支持10种语言外,Mureka V6生成的人声更加清晰,编曲更出色,歌词也更准确。在跨国界的文化交流中,Mureka V6消除了因口音不标准而影响歌曲听感的问题,让全世界的听众都能感受到灵感的回响。我们让Mureka V6根据同一段中文提示词创作了中文、英文和日文歌,以下是Mureka V6的创作成果展示:

如此强大的AI音乐生成能力,让人对未来的音乐创作充满期待。旋律新颖,尤其是这首日文歌,不标明是AI生成,还以为是某个热门动漫的片头曲呢!Mureka V6的亮点之一是支持生成纯音乐,为视频添加背景音乐(BGM)变得轻而易举。

机器之心视频号每天都在面临一个迫切需求,即为视频选择合适的BGM。当我们输入提示词:“充满活力的电子流行音乐,适合科技向视频”,系统即给出了高质量的音乐结果,其质量不逊于无版权网站精选的音乐。这体现了Mureka V6的强大能力。

大部分AI生成的音乐存在一些通病,如旋律简单或者听感奇怪。Mureka O1的思维链能力为其注入了连贯的中间推理和决策步骤,使其生成更具深度和层次感的音乐。与V6及其他模型相比,Mureka O1的编曲更丰富,旋律起伏自然,结构更合理。

操作简单到无需复杂步骤,只需选择简单模式,输入想要的风格或点击骰子随机摇出风格选项,即可享受创作音乐的乐趣。我们也可以切换到高级模式,输入歌词并添加一些歌曲描述,以满足更个性化的需求。

Mureka O1不仅简化了复杂的音乐编辑任务,还保留了专业级的控制选项。无论是音乐达人还是小白,都能在其工作流中发挥大作用。参考歌曲功能和上传歌曲作为创作参考的特色,让我们的脑洞不再受技术限制。

作为全球首个正式开放五种API服务的音乐生成模型,Mureka确实探索了深度。接入API后,可以在Mureka的基础上微调专属音乐模型,为音乐人、制作人、品牌和游戏开发者提供更自由和高效的AI音乐定制方式。

在AI音乐生成中引入思考能力对提升生成质量有着巨大的影响。昆仑万维为此打造了MusiCoT技术,为音乐生成量身打造了一种新颖的CoT提示词技术。该技术改变了AR模型的生成范式,引入了中间推理,更贴合人类的创作模式。

MusiCoT将CLAP音频嵌入视为可分析的音乐思考,通过预测展平的RVQ来实现更稳定的MusiCoT训练。该技术将CLAP嵌入与文本和音频学习训练相结合,实现更强匹配性。MusiCoT的双重采样策略也值得一提,它为不同领域的token采样提供了灵活的选择。

得益于以上技术先进性,Mureka系列在主客观指标中持续产生出色的生成性能。去年Suno V3的出现让AI音乐创作更加普及化,降低了门槛。而昆仑万维则在此基础上不断推进技术创新,成为AI音乐生成领域的引领者。其多样化的变现路径和持续的功能优化都表明了公司在推动AI音乐创作普及和创新方面的决心。

未来,昆仑万维将继续加大在模型能力上的投入,并依托Mureka基座模型推出更多丰富的音乐功能。同时重视AI音乐创作的开发者生态与合作伙伴建设以保持其全球第一梯队的领先地位。随着AIGC的不断发展和创新我们将能够看到更多美好的想象变为现实为人们带来更多表达自我的方式。