创新消费力|快手：用大模型点燃北京AI第一城的生产力_财经评论(cjpl)股吧

股吧首页 > 财经评论吧 > 正文

最近访问：

财经评论吧

返回财经评论吧>>

- 重要股东股权质押数据全览

东方财富资讯君

发表于 2025-08-05 17:34:31 股吧网页版

创新消费力|快手：用大模型点燃北京AI第一城的生产力

来源：北京商报

　　从中关村科学城的实验室到快手可灵AI事业部的工位，我国AI浓度最高的北京不断向外辐射创新推动力。这里有全国近四成备案上线的大模型，AI企业数量超2400家，核心产业规模接近3500亿元。北京的AI成绩源于智源研究院的技术突破，亦庄、朝阳区等超3.3万P算力供给等看不见的支撑，还有以可灵AI为代表的大模型应用对生活生产场景的渗透。

　　技术、人才、场景、政策的多重加持，让北京率先探索出“技术突破—产业应用—创新消费”的AI发展闭环。从高端制造业的智能生产，到内容平台的创意爆发，再到城市治理的智慧升级，快手的案例只是缩影，AI第一城群星闪烁。

　　当前，多模态大模型几乎成为大模型企业标配，可生成图片、可生成视频、可多样化交互，这种更容易感知的生产方式，让抽象的代码离用户更近，它可以是生产线上的“创意工人”，也可以在体验式消费中提供情绪价值。

　　“制作”到“智作”的生产力革命

　　2024年6月，异类Outliers团队用一个晚上生成了一部小短片，那是一辆小汽车飞上太空的影像，技术来自于可灵AI。一个月后，导演陈坤带着与可灵AI共创的《山海奇镜之劈波斩浪》，在中影国际影城cinity 7号厅超前点映。

　　当天他向媒体披露了多组数据，“同样体量和质量的短剧，制作周期最少需要3—6个月，视频大模型让《山海奇镜之劈波斩浪》的制作只用了2个月”，“过去我们做传统影视，外拍需要100多人的制作团队，包括演员、摄影、灯光、音响、剧务、服化道等。现在全片没有一个画面是真人拍摄，服化道也可以通过AI生成”。

　　观众不见得熟悉“幕后”故事。7月27日，在2025世界人工智能大会期间，快手可灵AI举办了以“生成式AI应用元年”为主题的生态论坛。会上披露，可灵AI目前已在全球拥有超过4500万创作者，产品自发布以来迭代升级30余次，累计生成超2亿个视频和4亿张图片，服务超过2万家企业客户。与此同时，可灵AI还重磅发布了全新升级的多图参考和灵动画布等功能。

　　AI故事的主角不光在屏幕里，文旅机构和各大高校把可灵AI的“快来惹毛我”创意特效玩出了梗，将知名地标变成毛绒玩具，相关内容在快手站内的播放量数以亿计，还火到了小红书等站外平台。

　　从“制作”到“智作”一字之差，创意的狂欢可见，成本上的明显差别却不为人知。据快手内部测算，AI大模型预计可以把客户的短视频营销素材制作成本降低60%—70%甚至更高。

　　“制作”到“智作”的流程变化，也不是简单地增减某一环节，而是重构。

　　2025年6月，异类Outliers团队制作的全球首部AI单元故事集《新世界加载中》在快手上线，第一个单元《马丁症》上线当天收获2100万次收看。

　　16分钟的《马丁症》，制作团队最喜欢一段漫画风格的打斗戏。如果用传统拍摄手法来制作，每个人的动作和轨迹是可控的，但当前AI很难让快速连续的打斗动作衔接得自然流畅。异类Outliers成员设计了详细的动作脚本，利用可灵AI的首尾帧技术，来脑补中间的过渡画面，整个过程其实非常繁琐，最终呈现出来后，还是让团队很欣慰和激动的。

　　方法论上，异类Outliers创始人陈翔宇强调，“必须根据已有的或者自研技术去建立阶段性的、不断更新的AI制作体系、脚本、美术、动画、算力储备还有算法测试，再到最终成片，每一步都需要在表达和执行性之间反复试探”。

　　据他透露，上线的这一系列影片其实在2024年底已制作完成，中间有新的技术迭代。自2024年6月发布，快手可灵AI累计完成超20次迭代，2025年5月底可灵2.1系列模型上线，目前可灵AI全球用户规模突破2200万，累计生成超过1.68亿个视频及3.44亿张图片，为超过1万家的企业客户提供API（应用程序编程接口）服务。

　　通过API，技术普惠得以在各个领域共享。以电商领域为例，传统的商品拍摄需雇佣模特、租赁影棚、反复修图，如今商家只需上传服装照片，AI便能生成不同肤色、体型的虚拟模特展示效果，甚至自动合成动态视频。

　　基于大模型，医疗行业同样经历着效率革命。

　　近日，清华大学智能产业研究院院长张亚勤表示，AI医院用2天时间便可完成三甲医院2—3年的诊断量，而且目前来看诊断的准确率很高，超过了96%。他所指的人工智能医院，是2025年4月清华大学成立的。按照规划，初期将建设AI医院系统，依托北京清华长庚医院及北京清华长庚互联网医院试运行，以全科医学科和眼科、放射诊断科、呼吸科等专科为试点。

　　从“功能”到“体验”的消费升级

　　2025年被业界定义为大模型应用落地元年，全球大模型技术加速从“技术验证”向“商业闭环”跨越，大模型+消费的想象上限也不断被拉高，对电商退货成本的控制是观察窗口之一。

　　可灵AI平台的AI试衣功能是一种能让人“穿”上指定衣服的图像生成技术。

　　想象一下，消费者正在家里，也许还穿着睡衣，躺在沙发上在网上购物，看到一件心仪的衣服，但不确定穿在自己身上会是什么样子。这时候，消费者只需要上传一张自己的照片，虚拟试穿就会把这件衣服“穿”在身上。

　　可图虚拟试穿在可图文生图模型基础上，引入衣服SKU（最小存货单位）保持网络、人物pose（姿势）、背景修复等技术，实现任意衣服、任意身材、任意动作的试穿效果生成。就算在复杂的人物背景下，也可以生成高质量的试穿结果。

　　消费者可以通过可图虚拟试穿各种类型的衣物，它能细致地保留衣物上的图案、文字和花纹的细节，保证试穿效果和实物商品一致。

　　站在时间维度，AI+电商的体验感也有不同。24小时，数字人主播在直播间持续介绍商品，AI驱动的虚拟人能实时回答商品问题，也能根据用户弹幕调整讲解重点。

　　2024年四季度，快手AIGC短视频营销素材和虚拟数字人直播解决方案的日均消耗突破3000万。2025年一季度，快手仅AIGC营销素材的日均广告消耗就已达3000万元。

　　“人货场”关系再造，消费从标准化走向个性化，当AI能瞬间理解并满足个体需求时，传统零售的货架逻辑被颠覆，内容成为电商商品的载体，消费者在优质内容的影响下进行消费决策。

　　这种以内容驱动消费决策的新范式，在2025年春节营销中迎来爆发式落地。快手可灵AI联合快手电商推出“灵蛇奇遇”主题活动，携手周大福、玛氏箭牌、青岛啤酒，以可灵AI创作的“灵蛇”形象为核心，独家首发蛇年新春定制生肖联名款产品，依托可灵AI强大的视频生成技术能力，打造灵蛇奇遇主题爆款视频。线上直播线下联动营销，数据显示，该项目总曝光量4亿，AI概念视频播放量超1000万，三大品牌单日GMV（商品交易总额）破历史峰值。

　　新体验带来消费新增量。传统产业如服装，有数据显示，预计到2028年，全球AI时尚市场规模将达到49.5亿美元。新技术正在为“美丽经济”解锁新玩法，用AI定制化生产只是方式之一。

　　从技术提供方到各个产业和消费者，再回到大模型应用企业本身，商业通路被打开。根据快手2025年一季度财报，可灵AI营收超过1.5亿元。3月（正式推出后的第10个月）实现年化经常性收入（ARR）超1亿美元，4月和5月的月度付费金额均超过1亿元。

　　AI之都的全球坐标

　　应用是技术呈现的方法，技术实现的核心要素是基础设施，对资金、协调能力和服务能力有要求的AI基础设施尤为考验一个城市的能力。

　　位于朝阳区酒仙桥的北京数字经济算力中心，是一座五层建筑，可提供的每秒百亿亿次计算能力，相当于50万台高性能电脑同时工作。

　　位于三层的核心机房摆放着成排的国产AI服务器，这些闪着微光的机器，已经吸引朝阳区AIGC视听产业创新中心落地，推出支持数字人建模、数字创意、影视制作等“虚拟制片工具包”，助力影视行业AIGC视听作品快速孵化；在医疗领域，北京数字经济算力中心与中日友好医院共建“医疗可信数据空间”，开发“樱智医疗大模型”，涵盖多科室专病模型及助诊、助研等全场景应用。

　　据北京市经信局最新数据，2025年一季度北京市算力供给总规模超3.3万P，预计年底算力供给总规模将超4.5万P。

　　从酒仙桥向西，位于海淀的智源研究院从核心技术和原始创新切入，推动人工智能领域发展政策、学术思想、理论基础、顶尖人才与产业生态的五大源头创新。

　　北京之所以能领跑AI竞赛，技术基座的自主可控是关键。6月，智源研究院继“悟道”系列大模型后，推出“悟界”系列大模型，其中RoboOS 2.0实现了小脑技能的免适配注册机制，显著降低开发门槛，典型场景下，相关代码量仅为传统手动注册方式的1/10。

　　北京市通过多政策协同积极推进各领域应用场景开放，积极组织应用场景供需对接，形成支持大模型应用落地的产业环境。

　　诸如算力和大模型等AI基础设施，为各类AI应用的开发和测试提供了全方位支撑，企业创新因此形成了闭环合力。头部企业如快手、百度聚焦底层技术突破，中小企业开发细分场景应用，最终在消费端完成价值验证。

　　政府工作报告起草组成员、国务院研究室副主任陈昌盛3月答记者问时表示，2024年政府工作报告首次提出要实施“人工智能+”行动。2025年春节前后，中国人工智能产业确实跑出了“加速度”。提及人工智能应用时，他还提到可灵在国际上的评价。

　　也是在2025年开年，《北京具身智能科技创新与产业培育行动计划（2025—2027年）》《北京市加快推动“人工智能+新材料”创新发展行动计划（2025—2027年）》等多项政策出台。

　　不难看出，北京人工智能发展与硅谷侧重基础研究的路径不同，走出了一条“技术研发—场景验证—商业转化”的特色道路，这种模式路径既推动了生产力提升，也催生了新的消费形态。

　　当北京迈向AI之巅，快手这样的企业如同城市脉络中的根系。它们将技术融入短视频、直播电商等老百姓的日常土壤。北京之所以成为AI第一城，正因懂得：真正的智能高地，不在实验室的参数里，而在普通人指尖流转的生活中。

　　北京商报记者魏蔚

　　· 对话 ·

　　快手科技副总裁、可灵AI技术负责人张迪：

　　我们要做AI时代的“右脑”

　　北京商报：近代有多种视觉表达形式，AI是其中一种，您认为AI表达的特点体现在哪里？

　　张迪：过去人类视觉表达的媒介是摄像机，移动设备崛起后变成了手机。与摄像机、手机等相比，AI让视觉表达的能力边界进一步扩展，能够以更低的成本创造出更具想象力的内容，让每个人都能用AI讲出好故事。以可灵AI为代表的大模型技术正在构建全新的视觉表达基建。打个比方，一部具有科幻感的广告短片，使用可灵AI后能节省约90%的成本。

　　目前可灵AI已成为拥有AI图片、AI视频和AI音频能力的多模态创意生产力平台。可灵AI用户规模已突破2200万，累计生成1.68亿个视频和3.44亿张图片，ARR（年度经常性收入）超1亿美元。

　　北京商报：2025年一季度可灵AI营收超过1.5亿元，4月和5月的月度付费金额均超过1亿元，可灵AI获得这些商业化成绩靠什么？

　　张迪：是技术研发能力与应用落地能力的双重作用。可灵AI的技术实力，源自研发能力和研究能力的齐头并进。围绕底层技术，仅过去两年，可灵AI团队已发表超80篇国际顶刊顶会论文，获得超过3万次引用。

　　以技术路线为例，一方面，可灵AI基于现有成熟技术路线精耕细作，将模型性能做到极致；另一方面，跳出现有技术路线，另辟蹊径地前瞻探索未来更有前景的技术路线。整个科技行业发展非常快，AI发展非常快，最重要的还是AI转化为新质生产力。

　　北京商报：从2024年至今，视频生成是大模型赛道的竞争重点，不只在北京，全球都在讲多模态生成的故事，在一众同行中，可灵AI怎样给自己定位？

　　张迪：我们的愿景是让每个人都能用AI讲出好故事。一个好故事的讲述，从能力实现的角度，要首先用画面复刻出人们内心的那个想法，如果再进一步，能用AI呈现出超越人们内心的想法，真正实现人与人工智能的互动创作、启发式创作，实现从可用到好用，是接下来我们要做的事。(内容源自公开信息整理)

（文章来源：北京商报） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

温馨提示： 1.根据《证券法》规定，禁止编造、传播虚假信息或者误导性信息，扰乱证券市场；2.用户在本社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》