• 最近访问:
发表于 2026-06-05 20:15:11 股吧网页版
专访国家数据发展研究院袁军:词元成智能时代“水电煤”
来源:新京报 作者:陈维城

  我国日均词元调用量突破140万亿,相当于每天可生成超1.7万部《流浪地球2》,AI已从实验室走向日常应用。

  近日,国家数据发展研究院副院长袁军接受新京报贝壳财经专访,深度解读词元如何重塑AI商业模式、高质量数据集建设路径及算电协同破局之道。

  作为国家数据局首个正局级事业单位,国家数研院正通过国家数据集管理服务平台,推动数据从“静态存储”转向“动态燃料”,解决行业数据“结构失衡、精度不足”痛点。

  袁军指出,AI时代竞争核心转向词元使用效率,同时需破解算电协同“不可能三角”,并牵头成立创新联合体,打通西部绿电与东部算力的供需堵点,为智能经济筑牢基础设施底座。

  词元正成为智能时代的“水电煤”

  新京报贝壳财经:今年以来,Token成为热词,目前我国日均Token调用量已超140万亿,这是一个什么概念?“词元”成为智能时代的“结算单位”后,将如何重塑AI产业的商业模式?

  袁军:如果我们把中国人工智能模型每天的信息吞吐量全部用来生成4K、24帧的高清电影,这个规模足以让我们“拍”出超1.7万部《流浪地球2》。海量的词元消耗,说明了一件事,中国的人工智能已经从实验室中的“技术概念”变成了大家日常生活中不可或缺的“生产工具”;词元也正在成为智能时代的“水电煤”,并深刻改变着人工智能产业的商业模式。

  比如以前企业买软件,通常是一次性买断或者包年包月。现在按词元来结算,就像咱们平时交水电费一样,用多少算多少。在智能经济体系中,词元统一了交易的沟通语言,使得数据要素的流通能够实现自动计价与结算。

  以前评估一个产品行不行、商业估值高不高,大家看的是“日活”“月活”等流量指标。但在人工智能时代,厂商不只要拼用户量,更要拼谁能用更少的词元消耗解决更困难的问题。谁掌握了这种效能均衡,谁就能够引领市场的定价权。

  新京报贝壳财经:Token如何更好地与建设高质量数据集有机结合?这对建设高质量数据集提出哪些新要求?

  袁军:词元让数据集建设实现了产业视角的升维,把数据从“静态的存储资源”,变成了“动态的智能燃料”。以前我们衡量数据集用GB、TB,那算的是硬盘空间,是“仓储逻辑”。现在切换为词元,就像买菜从“论斤称”变成了“按营养成分结算”。

  当词元成为全行业买单的计费标尺,建立基于词元的数据价值体系就成为可能。这让数据不再是一锤子买卖,而是有望变成可以参与市场利润分配的资产。

  数据被词元化之后,这就要求未来的数据集建设必须从“盲目堆积”转向“精准提纯”,力争喂给大模型的每一口数据尽可能都是干货。高质量数据集的目的,是教给大模型用最少的词元来解决问题。这样训练出来的人工智能才能做到字字珠玑,降低无谓的词元消耗和算力浪费。

  技术搭建基础设施的“骨架”,制度赋予流通规则的“灵魂”

  新京报贝壳财经:国家数研院在推动“高质量数据集”建设中,如何解决特定行业“有数据但看不懂、有场景但喂不饱”的工程化难题?

  袁军:当前,互联网上的通识数据已经快消耗殆尽,但真正能决定行业垂类模型性能的行业数据的供给还处于较低水平。数据“燃料”的短缺,已成为摆在人工智能行业面前的紧迫难题。为提升垂类模型的专业能力,要求我们不能再靠简单堆砌低质量数据,而是要构建一套从底层工具到顶层人才的“精炼体系”。

  当前,我国高质量数据集建设客观上还面临着三个痛点:一是建设主体分散,导致数据管理部门难以全面掌握资源底数与建设进展;二是供给侧信息不对称,容易出现重复建设、质量参差不齐等问题;三是需求侧获取成本高、周期长,制约技术创新效率。

  4月底在数字中国峰会上,受国家数据局委托,依托国家数据发展研究院建设和运营的国家数据集管理服务平台正式发布并启动试运行,标志着我国高质量数据集建设工作迈入集约化管理新阶段。这也是国家层面首次推出数据集管理服务平台。

  国家数据集管理服务平台采用“物理分散、逻辑集中”的汇聚模式,构建全国统一的数据集资源目录与管理体系,将推动高质量数据集供得出、流得动、用得好,实现全国“底数一本账、调度一盘棋、协作一张网”的工作格局。

  新京报贝壳财经:随着大模型应用深入,数据泄露、模型幻觉、隐私合规等风险频发。数据基础设施建设能否从根本上解决大模型时代的“数据可信”与“隐私保护”难题?

  袁军:破解大模型时代的“数据可信”与“隐私保护”难题需要建立在技术与制度双重保障的基础之上。从问题的本质来看,大模型应用中的数据泄漏和隐私合规风险,不仅是技术漏洞,也是数据权责不清、流通规则缺失的制度性难题。数据一旦离开持有方,权属如何界定、责任如何追溯、收益如何分配?这些问题如果不能很好地回答,再先进的技术也难以落地。

  从技术路径来看,国家数据基础设施通过数联网、可信数据空间等核心载体,构建起“数据可用不可见、用途可控可计量”的可信流通环境。但这一目标的实现,离不开配套的制度设计。比如,隐私计算解决了“怎么算”的问题,但“谁可以算、算的范围是什么”需要数据分类分级制度来划定边界;区块链解决了“怎么追溯”的问题,但“违规后如何问责、如何处罚”需要数据安全管理制度来明确红线;可信数据空间解决了“在哪流通”的问题,但“各方主体的权利义务如何配置”需要数据确权授权制度来提供依据。可以说,技术搭建基础设施的“骨架”,制度赋予流通规则的“灵魂”,二者缺一不可。

  从总体进度来看,《国家数据基础设施建设指引》明确了三阶段推进路径:到2026年完成顶层设计和先行先试,到2028年建成规模化流通设施体系,到2029年基本建成国家数据基础设施主体结构。与之同步,制度层面的立法修法、标准制定、规则细化也将分阶段推进。

  智能终端正从“工具”进化为“伙伴”

  新京报贝壳财经:2026年政府工作报告首次提出“打造智能经济新形态”,要促进新一代智能终端和智能体加快推广。有哪些新机遇?对数据基础设施建设提出了哪些新要求?

  袁军:新一代智能终端和智能体的加快推广,将带来三个层面的变革。一是产业形态的重构。从车载智能体到家庭服务机器人,智能终端正从“工具”进化为“伙伴”,带动硬件制造、软件服务、内容生态全产业链勃兴,形成万亿级市场增量。二是商业模式的变革。当智能体能主动理解并执行任务,“人找服务”将转向“服务找人”,Token作为结算单位使AI服务的价值可精确计量,催生全新的原生商业模式。三是生产关系的重塑。人机协作成为常态,智能体运营、模型训练等新兴岗位不断涌现。

  智能经济的蓬勃发展,对数据基础设施提出三个转变。一是从“集中处理”转向“云边端协同”。智能终端需要毫秒级响应,不能完全依赖云端,必须构建云边端一体化的数据流转体系。二是从“静态数据”转向“实时流式数据”。智能体持续与环境交互,产生海量高并发的动态数据,要求基础设施支撑低时延的数据流处理。三是从关注“数据所有权”转向“数据使用权”。智能体跨场景服务时,需在保护隐私前提下调用多方数据,可信数据空间、隐私计算等设施的作用将充分释放,成为智能经济的数据底座。

  新京报贝壳财经:从“东数西算”到如今的“算电一体”,数据基础设施的概念在不断外延。对地方政府而言,下一步的发力点是什么?

  袁军:当前大模型训练推理、智能体实时响应等场景对算力、网络、存力等资源的需求远未满足,适度超前布局是必要的。但“超前”不等于“盲目”,必须坚持需求牵引、梯次布局。尤其要在“算电一体”或者“算电协同”框架下,推动数据基础设施各要素协同规划,优先在绿电富集地区集约化布局,实现比特与瓦特的协同优化,避免“建而不用”。

  基础设施的效能能否充分释放,不仅取决于硬件投入,更取决于制度规则、标准规范、产业生态、市场环境等软条件的成熟度。与其碎片化点状发力,不如系统性构建一套让数据“供得出、流得动、用得好”的软环境:以清晰的制度规则降低交易成本,以统一的标准规范保障数据质量,以丰富的应用场景牵引产业集聚,以开放的市场环境激发主体活力。

  总结来说,硬件是“骨架”,生态是“血脉”。地方应聚焦产业特色、场景牵引,因地制宜,让硬件与软件协同演进。

  算电协同需要“深度融合、同频共振”

  新京报贝壳财经:你曾指出算电协同面临安全、绿色、经济的“不可能三角”。当前制约两者从“各自为战”走向“系统协同”的深层机制障碍是什么?

  袁军:算电协同从“各自为战”走向“系统协同”的核心挑战,本质上是比特世界与瓦特世界两套管理体系、两套运行逻辑、两套市场规则的碰撞。我们常说的“安全、绿色、经济”不可能三角,只是这些深层机制障碍的外在表现。

  算力设施迭代速度快,建设周期通常以月为单位,而电网发展规划以年为单位。算力需求爆发式增长与电力设施长建设周期形成明显错配,“电等算”容易导致过度配置和资源浪费,“算等电”则会制约产业发展。特别是智算中心已从传统的兆瓦级负荷跃升至吉瓦级,成为区域电网的关键负荷,但在电力规划中过去往往缺乏前瞻性考虑。

  算力中心对供电连续性和稳定性要求极高,大模型训练等任务需7×24小时刚性连续供电,而新能源发电受天气影响,波动性强。再加上现有的储能技术、算电协同调度技术成熟度不足,且成本高,因此,要兼顾绿色、稳定和经济的难度会加大。

  最后是“收益不明确”,也就是算、电、碳市场之间的价值链条没有打通。当前电力市场主要围绕传统“发 - 输 - 配 - 用”单向关系设计,算力中心作为可调节负荷的价值没有充分体现。 并且,电碳市场之间的衔接还不够充分,绿电环境溢价与碳减排收益难以有效转化为企业的成本优势,市场没有对绿色算力的差异化价值给出合理回报,企业主动投资绿电的动力也就削弱了。

  总而言之,我们要从发展智能经济新形态的高度和角度去看算电协同。算电协同不是简单的“凑一起”,而是要让两个不同节奏、不同特性的系统“深度融合、同频共振”。只有破解这些难题,才能让算力和电力真正拧成一股绳。

  新京报贝壳财经:国家数研院刚牵头成立了“算电协同”创新联合体。这个联合体将如何解决“西部绿电有价无市、东部算力有市无价”的一系列区域性错配问题?

  袁军:“算电协同”作为贯通数据基础设施与能源电力系统的关键纽带,当前仍面临跨领域协同不足、产业融合不畅等现实堵点。

  近期,国家数据发展研究院发起算电协同科技与产业融合创新联合体,目的是打造产学研协同、深耕一线的创新实践载体,打通算力与电力融合堵点。联合体将重点从政策、技术、标准、产业四个层面系统性破解区域等错配难题,打通“电算经络”,让西部的绿电不再“空转”,让东部的算力不再“等电”。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500