• 最近访问:
发表于 2025-11-21 16:45:50 股吧网页版
腾讯混元发布并开源HunyuanVideo 1.5 元宝上线生视频能力
来源:上海证券报·中国证券网 作者:谭镕

  上证报中国证券网讯(记者谭镕)11月21日,腾讯混元大模型团队正式发布并开源HunyuanVideo 1.5。这是一款基于Diffusion Transformer(DiT)架构、参数为8.3B的轻量级视频生成模型,支持生成5至10秒的高清视频。目前,腾讯元宝最新版已上线该模型能力。用户可通过两种方式即可体验:一是输入文字描述(Prompt),直接实现“文生视频”;二是上传图片配合文字描述,将静态图片转化为动态视频。

  此前,视频生成领域的开源SOTA旗舰模型至少有20B,需要超过50GB显卡方可部署。HunyuanVideo 1.5的出现大幅降低了硬件部署门槛,以极低的门槛就可以获得旗舰模型的体验,目前模型已上传至Hugging Face和Github社区。

  据介绍,HunyuanVideo 1.5模型具备全面且强大的核心能力,支持中英文输入的文生视频与图生视频。模型还具备强指令理解与遵循能力,能够精准地实现多样化场景,包括运镜、流畅运动、写实人物和人物情绪表情等多种指令;同时支持写实、动画、积木等多种风格,并可在视频中生成中英文文字。在画质方面,模型可原生生成5至10秒时长的480p和720p高清视频,并可通过超分模型提升至1080p电影级画质。

  同时,HunyuanVideo 1.5创新的SSTA稀疏注意力机制(全称Selective and Sliding Tile Attention, 选择性滑动分块注意力)在保证高质量生成的同时显著提升推理效率,配合多阶段渐进式训练策略,在运动连贯性、语义遵循等关键维度均达到商用水平。

  HunyuanVideo 1.5 GSB(Good Same Bad)评测结果

  腾讯元宝称,自上线以来,元宝不断拓展AI能力的边界,此次“一句话生视频”的上线,标志着元宝在多模态能力上迈出了关键一步,正式实现了从文本、图片、音频到视频的“图文音视”全模态覆盖。这不仅是元宝产品能力的升级,更让AI成为一个贴近用户的实用工具。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500