• 最近访问:
发表于 2025-08-05 17:34:31 股吧网页版
创新消费力|快手:用大模型点燃北京AI第一城的生产力
来源:北京商报

  从中关村科学城的实验室到快手可灵AI事业部的工位,我国AI浓度最高的北京不断向外辐射创新推动力。这里有全国近四成备案上线的大模型,AI企业数量超2400家,核心产业规模接近3500亿元。北京的AI成绩源于智源研究院的技术突破,亦庄、朝阳区等超3.3万P算力供给等看不见的支撑,还有以可灵AI为代表的大模型应用对生活生产场景的渗透。

  技术、人才、场景、政策的多重加持,让北京率先探索出“技术突破—产业应用—创新消费”的AI发展闭环。从高端制造业的智能生产,到内容平台的创意爆发,再到城市治理的智慧升级,快手的案例只是缩影,AI第一城群星闪烁。

  当前,多模态大模型几乎成为大模型企业标配,可生成图片、可生成视频、可多样化交互,这种更容易感知的生产方式,让抽象的代码离用户更近,它可以是生产线上的“创意工人”,也可以在体验式消费中提供情绪价值。

企业供图

  “制作”到“智作”的生产力革命

  2024年6月,异类Outliers团队用一个晚上生成了一部小短片,那是一辆小汽车飞上太空的影像,技术来自于可灵AI。一个月后,导演陈坤带着与可灵AI共创的《山海奇镜之劈波斩浪》,在中影国际影城cinity 7号厅超前点映。

  当天他向媒体披露了多组数据,“同样体量和质量的短剧,制作周期最少需要3—6个月,视频大模型让《山海奇镜之劈波斩浪》的制作只用了2个月”,“过去我们做传统影视,外拍需要100多人的制作团队,包括演员、摄影、灯光、音响、剧务、服化道等。现在全片没有一个画面是真人拍摄,服化道也可以通过AI生成”。

  观众不见得熟悉“幕后”故事。7月27日,在2025世界人工智能大会期间,快手可灵AI举办了以“生成式AI应用元年”为主题的生态论坛。会上披露,可灵AI目前已在全球拥有超过4500万创作者,产品自发布以来迭代升级30余次,累计生成超2亿个视频和4亿张图片,服务超过2万家企业客户。与此同时,可灵AI还重磅发布了全新升级的多图参考和灵动画布等功能。

  AI故事的主角不光在屏幕里,文旅机构和各大高校把可灵AI的“快来惹毛我”创意特效玩出了梗,将知名地标变成毛绒玩具,相关内容在快手站内的播放量数以亿计,还火到了小红书等站外平台。

  从“制作”到“智作”一字之差,创意的狂欢可见,成本上的明显差别却不为人知。据快手内部测算,AI大模型预计可以把客户的短视频营销素材制作成本降低60%—70%甚至更高。

  “制作”到“智作”的流程变化,也不是简单地增减某一环节,而是重构。

  2025年6月,异类Outliers团队制作的全球首部AI单元故事集《新世界加载中》在快手上线,第一个单元《马丁症》上线当天收获2100万次收看。

  16分钟的《马丁症》,制作团队最喜欢一段漫画风格的打斗戏。如果用传统拍摄手法来制作,每个人的动作和轨迹是可控的,但当前AI很难让快速连续的打斗动作衔接得自然流畅。异类Outliers成员设计了详细的动作脚本,利用可灵AI的首尾帧技术,来脑补中间的过渡画面,整个过程其实非常繁琐,最终呈现出来后,还是让团队很欣慰和激动的。

  方法论上,异类Outliers创始人陈翔宇强调,“必须根据已有的或者自研技术去建立阶段性的、不断更新的AI制作体系、脚本、美术、动画、算力储备还有算法测试,再到最终成片,每一步都需要在表达和执行性之间反复试探”。

  据他透露,上线的这一系列影片其实在2024年底已制作完成,中间有新的技术迭代。自2024年6月发布,快手可灵AI累计完成超20次迭代,2025年5月底可灵2.1系列模型上线,目前可灵AI全球用户规模突破2200万,累计生成超过1.68亿个视频及3.44亿张图片,为超过1万家的企业客户提供API(应用程序编程接口)服务。

  通过API,技术普惠得以在各个领域共享。以电商领域为例,传统的商品拍摄需雇佣模特、租赁影棚、反复修图,如今商家只需上传服装照片,AI便能生成不同肤色、体型的虚拟模特展示效果,甚至自动合成动态视频。

  基于大模型,医疗行业同样经历着效率革命。

  近日,清华大学智能产业研究院院长张亚勤表示,AI医院用2天时间便可完成三甲医院2—3年的诊断量,而且目前来看诊断的准确率很高,超过了96%。他所指的人工智能医院,是2025年4月清华大学成立的。按照规划,初期将建设AI医院系统,依托北京清华长庚医院及北京清华长庚互联网医院试运行,以全科医学科和眼科、放射诊断科、呼吸科等专科为试点。

  从“功能”到“体验”的消费升级

  2025年被业界定义为大模型应用落地元年,全球大模型技术加速从“技术验证”向“商业闭环”跨越,大模型+消费的想象上限也不断被拉高,对电商退货成本的控制是观察窗口之一。

  可灵AI平台的AI试衣功能是一种能让人“穿”上指定衣服的图像生成技术。

  想象一下,消费者正在家里,也许还穿着睡衣,躺在沙发上在网上购物,看到一件心仪的衣服,但不确定穿在自己身上会是什么样子。这时候,消费者只需要上传一张自己的照片,虚拟试穿就会把这件衣服“穿”在身上。

  可图虚拟试穿在可图文生图模型基础上,引入衣服SKU(最小存货单位)保持网络、人物pose(姿势)、背景修复等技术,实现任意衣服、任意身材、任意动作的试穿效果生成。就算在复杂的人物背景下,也可以生成高质量的试穿结果。

  消费者可以通过可图虚拟试穿各种类型的衣物,它能细致地保留衣物上的图案、文字和花纹的细节,保证试穿效果和实物商品一致。

  站在时间维度,AI+电商的体验感也有不同。24小时,数字人主播在直播间持续介绍商品,AI驱动的虚拟人能实时回答商品问题,也能根据用户弹幕调整讲解重点。

  2024年四季度,快手AIGC短视频营销素材和虚拟数字人直播解决方案的日均消耗突破3000万。2025年一季度,快手仅AIGC营销素材的日均广告消耗就已达3000万元。

  “人货场”关系再造,消费从标准化走向个性化,当AI能瞬间理解并满足个体需求时,传统零售的货架逻辑被颠覆,内容成为电商商品的载体,消费者在优质内容的影响下进行消费决策。

  这种以内容驱动消费决策的新范式,在2025年春节营销中迎来爆发式落地。快手可灵AI联合快手电商推出“灵蛇奇遇”主题活动,携手周大福、玛氏箭牌、青岛啤酒,以可灵AI创作的“灵蛇”形象为核心,独家首发蛇年新春定制生肖联名款产品,依托可灵AI强大的视频生成技术能力,打造灵蛇奇遇主题爆款视频。线上直播线下联动营销,数据显示,该项目总曝光量4亿,AI概念视频播放量超1000万,三大品牌单日GMV(商品交易总额)破历史峰值。

  新体验带来消费新增量。传统产业如服装,有数据显示,预计到2028年,全球AI时尚市场规模将达到49.5亿美元。新技术正在为“美丽经济”解锁新玩法,用AI定制化生产只是方式之一。

  从技术提供方到各个产业和消费者,再回到大模型应用企业本身,商业通路被打开。根据快手2025年一季度财报,可灵AI营收超过1.5亿元。3月(正式推出后的第10个月)实现年化经常性收入(ARR)超1亿美元,4月和5月的月度付费金额均超过1亿元。

  AI之都的全球坐标

  应用是技术呈现的方法,技术实现的核心要素是基础设施,对资金、协调能力和服务能力有要求的AI基础设施尤为考验一个城市的能力。

  位于朝阳区酒仙桥的北京数字经济算力中心,是一座五层建筑,可提供的每秒百亿亿次计算能力,相当于50万台高性能电脑同时工作。

  位于三层的核心机房摆放着成排的国产AI服务器,这些闪着微光的机器,已经吸引朝阳区AIGC视听产业创新中心落地,推出支持数字人建模、数字创意、影视制作等“虚拟制片工具包”,助力影视行业AIGC视听作品快速孵化;在医疗领域,北京数字经济算力中心与中日友好医院共建“医疗可信数据空间”,开发“樱智医疗大模型”,涵盖多科室专病模型及助诊、助研等全场景应用。

  据北京市经信局最新数据,2025年一季度北京市算力供给总规模超3.3万P,预计年底算力供给总规模将超4.5万P。

  从酒仙桥向西,位于海淀的智源研究院从核心技术和原始创新切入,推动人工智能领域发展政策、学术思想、理论基础、顶尖人才与产业生态的五大源头创新。

  北京之所以能领跑AI竞赛,技术基座的自主可控是关键。6月,智源研究院继“悟道”系列大模型后,推出“悟界”系列大模型,其中RoboOS 2.0实现了小脑技能的免适配注册机制,显著降低开发门槛,典型场景下,相关代码量仅为传统手动注册方式的1/10。

  北京市通过多政策协同积极推进各领域应用场景开放,积极组织应用场景供需对接,形成支持大模型应用落地的产业环境。

  诸如算力和大模型等AI基础设施,为各类AI应用的开发和测试提供了全方位支撑,企业创新因此形成了闭环合力。头部企业如快手、百度聚焦底层技术突破,中小企业开发细分场景应用,最终在消费端完成价值验证。

  政府工作报告起草组成员、国务院研究室副主任陈昌盛3月答记者问时表示,2024年政府工作报告首次提出要实施“人工智能+”行动。2025年春节前后,中国人工智能产业确实跑出了“加速度”。提及人工智能应用时,他还提到可灵在国际上的评价。

  也是在2025年开年,《北京具身智能科技创新与产业培育行动计划(2025—2027年)》《北京市加快推动“人工智能+新材料”创新发展行动计划(2025—2027年)》等多项政策出台。

  不难看出,北京人工智能发展与硅谷侧重基础研究的路径不同,走出了一条“技术研发—场景验证—商业转化”的特色道路,这种模式路径既推动了生产力提升,也催生了新的消费形态。

  当北京迈向AI之巅,快手这样的企业如同城市脉络中的根系。它们将技术融入短视频、直播电商等老百姓的日常土壤。北京之所以成为AI第一城,正因懂得:真正的智能高地,不在实验室的参数里,而在普通人指尖流转的生活中。

  北京商报记者魏蔚

  · 对话 ·

  快手科技副总裁、可灵AI技术负责人张迪:

  我们要做AI时代的“右脑”

  北京商报:近代有多种视觉表达形式,AI是其中一种,您认为AI表达的特点体现在哪里?

  张迪:过去人类视觉表达的媒介是摄像机,移动设备崛起后变成了手机。与摄像机、手机等相比,AI让视觉表达的能力边界进一步扩展,能够以更低的成本创造出更具想象力的内容,让每个人都能用AI讲出好故事。以可灵AI为代表的大模型技术正在构建全新的视觉表达基建。打个比方,一部具有科幻感的广告短片,使用可灵AI后能节省约90%的成本。

  目前可灵AI已成为拥有AI图片、AI视频和AI音频能力的多模态创意生产力平台。可灵AI用户规模已突破2200万,累计生成1.68亿个视频和3.44亿张图片,ARR(年度经常性收入)超1亿美元。

  北京商报:2025年一季度可灵AI营收超过1.5亿元,4月和5月的月度付费金额均超过1亿元,可灵AI获得这些商业化成绩靠什么?

  张迪:是技术研发能力与应用落地能力的双重作用。可灵AI的技术实力,源自研发能力和研究能力的齐头并进。围绕底层技术,仅过去两年,可灵AI团队已发表超80篇国际顶刊顶会论文,获得超过3万次引用。

  以技术路线为例,一方面,可灵AI基于现有成熟技术路线精耕细作,将模型性能做到极致;另一方面,跳出现有技术路线,另辟蹊径地前瞻探索未来更有前景的技术路线。整个科技行业发展非常快,AI发展非常快,最重要的还是AI转化为新质生产力。

  北京商报:从2024年至今,视频生成是大模型赛道的竞争重点,不只在北京,全球都在讲多模态生成的故事,在一众同行中,可灵AI怎样给自己定位?

  张迪:我们的愿景是让每个人都能用AI讲出好故事。一个好故事的讲述,从能力实现的角度,要首先用画面复刻出人们内心的那个想法,如果再进一步,能用AI呈现出超越人们内心的想法,真正实现人与人工智能的互动创作、启发式创作,实现从可用到好用,是接下来我们要做的事。(内容源自公开信息整理)

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500