从视频生成工具到“世界模型”距离有多远？_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2025-10-31 17:48:50 股吧网页版

从视频生成工具到“世界模型”距离有多远？

来源：中国经营报

　　当Sora在2024年2月面世之时，OpenAI以“世界模拟器”描绘Sora的终极愿景——一种能够理解和模拟现实物理世界的模型框架，将其视为通往AGI（通用人工智能）的重要里程碑。2025年10月，第二代Sora登陆苹果应用商店后仅5天下载量就超过了100万次，增速超过ChatGPT。

　　在Sora驰骋的将近两年时间里，视频生成模型赛道已聚集了谷歌、Meta等科技巨头以及Runway、Luma AI、Midjourney等创业公司。在国内市场，阿里、腾讯、字节、快手、百度等企业也已推出了数十款视频大模型产品。不仅如此，入局者仍在扩充，比如美团日前开源了其首款视频生成模型LongCat-Video。

　　视频生成模型“进化”到了什么样？在哪些应用场景中实现了破局？从视频生成模型到“世界模型”还需要跨越哪些关卡？……针对这些大众关心的问题，《中国经营报》记者做了相关的采访。

　　社交娱乐的新“名片”

　　近期密集体验了Sora2、即梦、可灵、混元等视频生成App的互联网分析师丁道师向本报记者表示，以往可能只有10%的专业人员适合从事内容创作，实际上，这对人类创造力而言是一个巨大浪费，现在借助AI工具，可能90%的人都能进行较高质量的内容创作，尤其是那些具备思想深度、丰富想象力，却缺乏写作、设计、剪辑等实操技能的人，如今能够通过这些AI工具将创意想法转化为高质量内容，让创作的核心回归到思想与想象力本身。

　　丁道师展示了自己在Sora App上生成的几个视频作品，比如“胸口碎大石”“与OpenAI CEO山姆·奥特曼跳舞”“上海外滩跑步”“与杜甫饮酒作诗”等，整体画面很逼真。在他看来，随着Sora这类产品的不断迭代升级，未来制作影视、游戏、动漫的效率将会呈现几何倍数增长。

　　记者观察到，AI视频正在成为当下社交网络的新名片，在抖音、视频号等短视频平台，AI生成头像、AI生成视频的相关特效广受欢迎，它满足了消费者在数字社交中的个性化、好奇心、情绪宣泄等心理需求。

　　知乎答主“AI绘画阿杰”于今年9月时使用海螺、即梦、百度绘想等多款AI视频生成工具，给美剧《绝命毒师》写了一个第6季的剧本大纲。不过，他基于自身的实践操作表示，不认同“AI电影马上要来”的说法，电影并不是简单的事情，并不是只靠懂点AI技术就能做出来，需要“内行人”下场去做。

　　事实上，一年多来，在影视娱乐领域，已有不少“内行人”拥抱AI创作新方式。就在今年9月中旬，中国香港电视界首部AI生成的短剧《在我心中，你是独一无二》上线，每集不超过2分钟，官方称此剧100%由AI生成，剧中两名AI主演还开设了个人社交账号与粉丝互动。不过需要说明的是，该剧的视效、配音仍由专业制作团队优化或完成。

　　虽然AI影视作品刚刚起步、整体数量有限，但是抖音、快手、腾讯视频、芒果TV等视频平台均在入局以抢食市场。记者了解到，在“抖音AI短剧排行榜”中，《兴安岭诡事》《奶团太后宫心计》《惊鸿掠野之重整家门》等作品均取得了可观的流量成绩，播放量破亿次。不难看出，“AI短剧”正在快速崛起，形成影视娱乐的新品类，也成为人们在数字世界中的社交新形态。

　　腾讯研究院高级研究员陈孟、助理研究员夏琪骅撰文指出，Sora2的推出，标志着视频生成技术正在进入全民可用的成熟阶段，将给视频相关领域带来深远影响。从变革中的视频化社交，到快速崛起的微短剧，再到专业的影像内容创作，正在开启一场视频内容生态的全面革新。

　　从社交工具到生产力工具演进

　　根据腾讯研究院的研究结论，当下通用大模型正在加速从技术提供商向应用平台服务商转变，而要撬动广泛的大众市场、让AI创作成为普遍需求，社交无疑是最好的驱动力。因此，以Sora为代表，从技术工具升级为社交平台，引领AI应用竞争进入新阶段——不再是单纯的技术参数比拼，更重要的是以技术支撑大众化的用户场景、自我再生的内容生态。

　　生数科技副总裁王川近期公开表示，多模态生成大模型正迎来系统性可用窗口，其中视频生成技术发展尤为迅速，以Sora2为代表的模型给视频社交带来创新，表现在内容生态重塑、社交逻辑的重构、内容消费体验的升级等方面。需要指出的是，就在前不久，生数科技旗下Vidu迎来升级，称用户在30秒内可完成多个镜头切换，创作者可利用Vidu完整讲述一个精彩故事。

　　深度科技研究院院长张孝荣关注到了美团在视频生成模型领域的入局动作，他认为，虽然美团强调最新开源的LongCat-Video模型是该公司探索“世界模型”迈出的第一步，但它的意图并不是单纯地去与一众通用大模型“硬碰硬”，更倾向一种“深耕自家田地”的策略考量。未来，视频生成模型融入自身既有业务以及持续投入的自动驾驶、具身智能等深度交互业务场景中，这表明该技术发展具有明确的业务指向性。值得注意的是，与语言大模型类似，视频生成模型也在探索垂直场景的专用模型，事实上，这类模型在电商广告、短视频制作、影视级内容创作中已有初步试水，未来有望拓展至更多行业领域与实际场景中。

　　快思慢想研究院院长、特邀评论员田丰也认为，美团及其他企业的入局标志着视频生成的主战场正从“拼参数”的通用模型竞赛，转向“拼落地”的垂直生态竞争，成功关键并非技术领先，而是能否与自身商业场景深度耦合，实现闭环价值，比如人工智能生成营销视频、品牌故事。这预示着不会简单重复LLM“基础模型+微调”的路径，而是会出现大量为特定任务、特定数据定制的“专属模型”。

　　视频生成模型，近期随着谷歌nano-banana、OpenAI的Sora2等产品的上线应用，朝着“世界模拟器”的前进方向又迈进了一步。张孝荣指出，这条道路依然充满着较大挑战，要成为真正的“世界模型”，还需要跨越很多关卡，比如对于复杂物理规律的精准模拟、前后逻辑及画面的一致性等，还有对于生成内容的可控性，用户很难像导演一样对生成内容进行精准灵活的操控。更为重要的是，无论是监管层、产业界，还是社会大众，一直对视频生成技术的滥用怀有质疑与担忧，随着视频生成的内容越来越逼真，个人图像信息被滥用，涌现大量难以分辨的虚假视频，对法律监管及社会信息构成新的技术挑战。

　　商业研究机构Fortune Business Insights研报数据显示，全球AI视频生成市场规模去年已达到6.15亿美元，预计今年这一数字将达到7.17亿美元，2032年则将达到25.63亿美元，其间的年均复合增速为20%。

（文章来源：中国经营报） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》