• 最近访问:
发表于 2025-08-11 14:16:11 股吧网页版
昆仑万维发布SkyReels-A3模型
来源:中国证券报·中证网

K图 300418_0

  中证报中证网讯(王珞)8月11日,昆仑万维正式发布SkyReels-A3模型。该模型基于“DiT(Diffusion Transformer)视频扩散模型+插帧模型进行视频延展+基于强化学习的动作优化+运镜可控”,能实现任意时长的全模态音频驱动数字人创作。

  据公司介绍,作为音频驱动(audio-driven)人像视频生成模型,SkyReels-A3就像给任意照片或视频装上“AI声带”,能够实现让一张照片“活”起来、创作一段新的视频、给现有视频“改台词”。

  同时,公司基于对实际应用场景(如广告、直播带货等)的分析,发现这些场景不仅需要更长的一致性视频,在特定交互动作上的自然度和清晰度也有待加强,因此构造了针对线上直播等场景的数据,对于此类场景中的视频生成进行了特定优化。

  为了让镜头语言更加灵动,昆仑万维构造了一种基于ControlNet结构的镜头控制模块,通过精细化镜头参数的输入,实现帧级别精准运镜控制。具体来说,镜头控制模块提取参考图的深度信息,配合相机参数,渲染目标运镜轨迹的参考视频,该参考视频随后作为显式运动先验,引导模型逐帧复现精准的运镜效果,生成带有运镜效果的数字人视频。当前预设了8种常见的运镜参数,用户可以根据需要选择相应运镜,并且每个运镜的强度可0-100%连续调节,满足不同需求,生成专业的运镜效果。

  昆仑万维表示,SkyReels-A3正在把“让影像随声而动”这件事变成人人可上手操作的工具,不需要专业影棚、不需要昂贵设备,只要一段声音和一张照片,人人都能创造无限时长、无限可能的数字内容。

  让静态照片开口说话、让现有视频改词不换脸、让数字人直播永不掉帧,SkyReels-A3为电影制作、虚拟直播、游戏开发与教育内容创作沟通提供了低门槛、低成本、高保真的AI技术制作方案,让个性化、交互式内容的创作前所未有的高效与便捷。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500