• 最近访问:
发表于 2026-02-05 20:27:30 股吧网页版
快手可灵,上线新模型
来源:上海证券报


K图 01024_0

  2月5日,可灵AI正式全球上线3.0系列模型,预计将于近期全量上线。记者注意到,在此轮大版本更新中,AI“一致性”问题得到进一步的解决。

  多位短剧行业从业者表示,“一致性”问题一直是困扰AI视频生成长度的核心问题,随着模型性能的快速迭代,AI在影视工业中的应用空间将不断扩大。

  据了解,此次快手发布的可灵3.0系列模型,覆盖图片生成、视频生成、编辑及后期等影视级全流程链路,标志着AI正式进入影视与创意内容的核心生产环节。

  从技术上看,此次可灵3.0系列模型基于All-in-One产品和技术理念构建,形成一个多模态输入与输出高度统一的一体化视频模型体系。这意味着它的多模态能力并非简单叠加,而是通过统一架构,将影像创作中的理解、生成与编辑整合为一个连续流程,让创作在单一模型内完成闭环。

  值得一提的是,今年以来已经有多家厂商在新模型产品中应用类似一体化训练生成的技术。

  而具体到视频创作领域,这种更高效的模型让创作者可以同时使用文字、图片、声音与视频作为输入,并直接获得可用的专业影像级输出结果,创作过程不再被拆分为多个工具与步骤。

  从实际体验来看,此次版本的AI在影视领域更为专业,在分镜系统中,AI已经能够实现深度解读剧本意图,自动调度机位与景别。记者注意到,在演示视频中,无论是经典的“正反打”对话,还是复杂的跨分镜转场,AI均能做到一键生成。这无疑极大地提升了影视生产的效率。

  而在创作者最关心的稳定性上,长期困扰行业的一致性问题也获得突破性进展。

  据介绍,可灵AI团队通过整合视频主体上传、音色绑定及全球首创的“图生视频+主体参考”等一系列技术。AI生成视频实现了人物形象、动作与声音在复杂镜头切换中保持稳定,文字清晰、品牌标识可识别,即便在多语言场景下,视觉风格与角色特征也能高度统一。

  “过去制作AI视频为了保持画面人物的稳定,普遍采用先生成人物三视图,然后将其按照首尾帧的模式,逐步放入AI视频模型中,生成补充帧。”一位AI影视创作者告诉记者,这样的拆分往往只能制作数秒,且过程中还可能存在人物突变的问题。

  而此次的新版本模型可支持最长15秒的连续生成,并引入智能分镜与自定义镜头控制,让创作者能够直接组织镜头节奏与叙事结构,不再依赖碎片化拼接,从而让镜头具备情绪递进与画面张力。

  “此次推出的Omni版本进一步强化了角色一致性与指令响应的敏锐度。”快手相关负责人介绍道,创作者只需上传参考素材,模型即可实现对特定主体视觉特征与音色的原生提取与绑定。基于特征解耦技术,角色、道具等元素可在不同场景中自由复用,始终保持同一张脸、同一种声音。

  据公司介绍,可灵AI 3.0完成了从“可用”到“可控”,再到“专业调度”的三次关键跃迁。自2024年6月发布全球首个面向用户的DiT视频生成模型以来,可灵AI推动行业进入“可用时代”;进入2.0阶段后,通过模型能力和表现力的持续提升,实现了从“可用”到“好用”的演化。

  据公开数据,截至2025年12月,可灵AI已拥有超过6000万创作者,生成超过6亿个视频,服务超过3万家企业用户,年化收入运行率达到2.4亿美元。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500