Mureka V7 : 昆仑万维推出的最新AI音乐生成模型
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
主要介绍
昆仑万维于2025年7月23日正式发布Mureka V7,这是全球首款具备“专业级”音乐创作能力的AI模型,标志着AI音乐生成从“工具化”迈向“人性化”。该模型支持10种语言创作,单曲最长5.5分钟,用户仅需输入歌词、风格或主题,即可在2分钟内生成完整音乐作品。Mureka V7在音质、旋律连贯性、人声真实度等核心指标上超越海外竞品Suno V4.5,并首次实现“先规划整体结构,再填充细节”的创作逻辑,被业界誉为“AI音乐领域的革命性突破”。

功能特点
- 高效生成:支持简单模式(纯文字提示)和高级模式(自定义歌词、参考歌曲、歌手音色),生成时间缩短至1分钟内。
- 音质飞跃:人声真实度提升44%,整体音质提升近一倍,告别“AI味”的千篇一律。
- 风格复刻:通过参考音频输入,可精准复刻目标歌曲的风格、情绪和编配,同时生成原创变奏版本。
- 音频编辑:提供局部编辑、延长、乐器分轨、裁剪等功能,支持纯音乐生成(如Vlog背景音乐)。
- 音色定制:配套发布Mureka TTS V1引擎,支持通过文本描述生成个性化音色(如“12岁清脆童声”“冷静AI助手音”)。
优缺点
优点:
- 创作门槛低:零音乐基础用户可快速生成高质量作品,专业音乐人可将其作为灵感催化剂。
- 商业化友好:生成音乐无版权风险,支持企业API集成,适用于短视频、影视、游戏等场景。
- 技术领先:MusiCoT技术使生成音乐的结构完整性、旋律连贯性达行业一流水准。
缺点:
- 长序列任务局限:目前最长支持5.5分钟单曲,超长作品需分段生成后拼接。
- 硬件依赖:高级功能(如高精度音色克隆)需较高算力支持,低端设备可能体验延迟。
如何使用
- 访问官网:登录Mureka官方平台(需科学上网)。
- 选择模式:
- 简单模式:输入主题(如“反思性流行歌曲”)或提示词(如“电子舞曲,未来感,强节奏”),点击生成。
- 高级模式:上传参考歌曲、自定义歌词、选择歌手音色或描述目标风格(如“周杰伦式中国风R&B”)。
- 编辑优化:使用内置工具调整乐器分轨、延长片段或裁剪音频。
- 导出分享:支持MP3格式下载,无水印且可商用。
框架技术原理
Mureka V7的核心创新在于MusiCoT(Analyzable Chain-of-Musical-Thought Prompting)技术,其流程分为三步:
- 结构规划:模型先生成全局音乐蓝图,明确段落、情绪、编配等布局,解决传统自回归模型“只顾局部,不顾全局”的问题。
- 细节填充:基于结构规划生成音频token,确保乐章推进自然、情绪递进合理。
- 风格对齐:通过CLAP(对比式语言-音频预训练模型)构建可解释的音乐思维链,支持任意长度参考音频输入,实现风格复刻与变奏。
创新点
- 链式思维创作:首次将“先规划后生成”的逻辑引入AI音乐,生成作品具备专业音乐人的结构化思维。
- 音色捏脸技术:Mureka TTS V1支持通过文本描述生成全新音色,摆脱传统音色库限制。
- 多模态交互:支持文本、音频、视频(提取音频)多类型输入,覆盖全场景创作需求。
评估标准
- 主观指标:结构完整性、旋律连贯性、情绪递进自然度、整体音乐性。
- 客观指标:
- 良品率:从V6的43.4%提升至57.7%(输入歌词生成好听歌曲的概率)。
- 音质评分:人声真实度提升44%,混音质感达行业一流水准。
- 风格复刻准确率:参考音频输入下,风格匹配度超90%。
应用领域
- 内容创作:短视频BGM、播客配音、Vlog背景音乐生成。
- 影视游戏:影视配乐、游戏音效、虚拟偶像歌声合成。
- 音乐教育:辅助作曲教学、灵感启发、编曲实践。
- 企业服务:通过API为企业提供定制化音乐解决方案(如广告曲、品牌主题歌)。
项目地址
- 官方平台:Mureka V7创作入口
- 技术报告:详见昆仑万维发布的《MusiCoT: Chain-of-Thought Prompting for Musical Creativity》论文。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...