• 最近访问:
发表于 2026-04-16 17:48:01 股吧网页版
“欢乐马”之后“欢乐生蚝”来了!阿里发布世界模型视频产品
来源:南方都市报

  阿里AI视频家族“上新”。继AI视频生成工具HappyHorse(欢乐马)后,阿里再推针对视频领域的世界模型产品。4月16日,阿里发布可实时构建和交互的世界模型产品HappyOyster(快乐生蚝)。该模型基于原生多模态架构而建,支持多模态理解与音视频联合生成,目前可实现漫游(Wander)和导演(Direct)两大核心能力,用户可以实时构建可互动、可演绎、可探索的AI数字世界。同时,用户生成的数字世界,不仅能被完整保存,还能开放给其他用户进行二次创作。据悉,该产品由阿里ATH创新事业部团队研发,与此前爆火的HappyHorse同属一个团队。

  已应用于游戏、影视领域

  在产品能力上,HappyOyster呈现出差异化优势,支持独家提供实时导演功能,用户可通过自然语言指令随时介入世界演化、调度角色事件,实现从被动探索到主动创作的跨越。在视觉表现上,HappyOyster漫游模式的画面质量更高,风格泛化能力更强。

  在漫游模式中,用户仅需一句话或一张图,即可生成具备物理一致性的完整空间,物体位置稳定、场景持久存在,视角与光照也能跟随第一人称视角持续移动;此外,用户能自由切换方向与镜头运动,突破初始画框的边界。

  目前Happy Oyster支持长达1分钟的连续实时位移与镜头控制,并支持多样化的风格切换;在导演模式下,用户能够在视频的任意节点,通过文字、语音或图像等多模态输入,随时实现镜头切换、剧情改写、角色调度,在充分的交互中生成一个光照、重力、角色动作与场景因果持续演化的世界,并能选择题材风格。目前,HappyOyster的导演模式支持连续生成 3 分钟以上的480p或720p实时画面。据了解,阿里HappyOyster已在改变游戏、影视创作等传统的内容创作模式和交互体验。

  多家企业押注“世界模型”

  相比大语言模型相对成熟的模型架构和技术范式,世界模型仍属于前沿探索领域。对于世界模型,英伟达的定义是,世界模型是用于理解现实世界动态(包括物理属性和空间属性)的神经网络。它们可以使用文本、图像、视频和运动等输入数据来生成模拟实际物理环境的视频。

  阿里此次发布的HappyOyster与谷歌的Genie3同属采用同样的建模方式,采用长时间跨度上的世界演化建模型,区别于传统文生视频模型输入提示词、等待渲染、获得成片的被动流程;同时通过学习海量长视频数据,以及文本、动作指令、图像参考等多样控制信号,使得模型能主动理解空间、物理与因果规律,预测情节和画面的演变,从而把“被动生成内容”转变为“主动模拟世界演化”,为构建可交互的通用世界模拟器提供了关键技术路径。

  在行业内,多家视频模型企业也在押注世界模型。今年1月,爱诗科技还推出了全球首个支持1080P的通用实时世界模型PixVerse R1,该模型为全球首个支持最高1080P分辨率通用实时世界模型,已首次将视频生成的延迟从“秒级”降至“即时”响应,实现了“所想即所见、所说即所现”的实时交互体验,标志着AIGC领域的视频生成正式从“静态输出”迈入“实时交互”的全新阶段。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500