• 最近访问:
发表于 2025-07-23 21:11:00 股吧网页版
昆仑万维正式上线最新音乐模型Mureka V7
来源:证券时报网 作者:燕云

K图 300418_0

  7月23日,昆仑万维(300418)为全球用户带来最新音乐模型Mureka V7,以及全新的音频模型Mureka TTS V1——支持Voice Design音色设计能力。

  用户使用Mureka V7,只需要输入歌词或选择风格、主题,再点击“生成”,即可生成一首歌。这不仅是一次效率的大幅跃迁,更是音乐品质的质变。

  据了解,传统的自回归(Autoregressive, AR)模型虽然已经具备较强的音频保真能力,但其基于逐token预测的范式,本质上并不符合人类在音乐创作中“先规划整体,再填充细节”的思维过程,这种不匹配往往导致生成音乐缺乏连贯的结构性与艺术性。

  基于此,公司在Mureka V7版本大幅优化了MusiCoT (Analyzable Chain-of-Musical-Thought Prompting)技术,专为音乐生成而设计的链式思维(Chain-of-Thought, CoT)提示方法。该方法显著提升了模型生成结果的整体性与发声表现。

  据介绍,MusiCoT 技术在正式生成音频token之前,先引导模型生成一份全局音乐结构规划,明确整体的段落、情绪、编配等布局。这一过程有效解决了传统AR模型中“只顾局部,不顾全局”的问题,使生成作品具备更自然的乐章推进与情绪递进。

  此外,通过结合CLAP(对比式语言 - 音频预训练模型),MusiCoT 构建出一条具备明确语义指向的“音乐思维链”,不仅让整体结构更可分析与可控,更允许输入任意长度的参考音频作为风格提示,从而提升模型在复刻、变奏等创作需求中的灵活性,规避直接复制的风险。

  同时,基于大量实验,MusiCoT技术在主观与客观双重指标下均展现出卓越效果。无论是结构完整性、旋律连贯性还是整体音乐性,均优于传统方法,且在多项评测中表现已达到行业一流水准。

  在本版本中,MusiCoT技术不仅在结构层面实现了对音乐创作思维的拟合与对齐,更通过Mureka团队数据的scale-up以及Embedding信息粒度的细化,完善了强可控性与可扩展性,最终实现了文本-音频模态之间的差距进一步减小。公司表示,未来将持续迭代该技术,进一步提升AI音乐生成的创意性与工业化能力。

  此外,昆仑万维还首次推出Mureka TTS V1,支持Voice Design能力,用户可以通过文本输入想要的语音特征获得对应的音色。(燕云)

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500