“能不能帮我精准预测一下明天的天气?”曾几何时,人们对气象预报还停留在“晴转多云”的粗颗粒度认知中。随着社会对精细化气象服务需求不断提升,公众也愈发期待更精准的数据支撑,不仅要知道“下不下雨”,更希望了解降雨的时段、强度和空间分布。
这种需求背后,需要高质量数据供给。近日,中科曙光旗下中科天机气象科技有限公司宣布实施“高分辨率气象数据共享计划”,面向全球科研机构、企业和公众免费提供两套高精度模式数据。
据了解,此次共享的数据包括全球12公里分辨率与中国区域3公里分辨率的高精度模式,时间尺度最长可延伸至15天,涵盖温度、风场、降水、湿度、气压等160余项气象要素,有助于商业气象大模型突破数据瓶颈,也将为新能源、低空经济等新兴产业提供公共数据基础。
“气象数据是应用最好的领域之一,许多大模型、大数据的开发都选中了气象作为突破口。”中国气象服务协会会长许小峰表示。
数据资源的开放与共享,不仅关乎单一领域的发展,更是整个AI产业前进的基石。根据《全国数据资源调查报告(2024年)》,2024年我国数据生产总量达41.06ZB,占全球总量26.67%,其中用于人工智能开发、训练和推理的数据量同比增幅高达40.95%。从通用数据向专业化、场景化、多模态数据的纵深拓展,正不断释放新的产业价值。
数据的价值释放离不开算力的支撑和算法的优化。数据显示,2024年,全国算力总规模达到280EFlops,其中智能算力规模占比提升至32%,为海量数据计算提供智能底座。与此同时,国内AI算力领域仍面临高端供给不足、国产加速卡性能存在差距、算力成本高、软硬件生态不成熟等挑战。
与此同时,算力资源和数据生态也面临挑战。部分高质量专业数据长期处于封闭状态,大模型在特定领域存在“盲区”;不同厂商的算力设施缺乏统一标准,跨区域、跨行业资源难以互联互通。IDC的研究显示,相较于封闭式模式,开放架构在技术标准统一、兼容性保障等方面难度至少高出30%。这意味着企业不仅需要付出更多资源成本,还要放弃部分短期技术收益。
据介绍,在此背景下,中科曙光于2025世界智能产业博览会上协同20多家上下游企业,共同发布了国内首个AI计算开放架构。这一架构以GPU为核心,推动部件级、系统层、基础设施层、软件层、数据集层的“五级开放”,旨在通过跨层协同优化实现算力资源的高效利用。
中科曙光高级副总裁李斌表示,过去十年,企业建设了20多个大规模算力集群,累计部署超50万张异构加速卡,作为国家先进计算产业创新中心牵头组建单位,有能力和责任推动AI计算领域的开放协作与生态构建。这一开放架构通过适配多品牌GPU、兼容主流软件,以跨层协同优化打破壁垒,推进产业链从“算、存、网、电、冷、管、软”单点突破走向集群创新。
大模型、AI算力、数据集是推动新一代人工智能快速发展的三大关键要素。我国拥有的海量数据资源、稳定能源供应、多元应用场景和完整产业链条,将为开放架构发展提供肥沃土壤。
业内分析认为,在大模型走向开源开放、AI算力实现普惠平权的同时,发展高质量数据集并促进开放共享与融合,已成为进一步发展人工智能技术与应用的创新要义。随着更多的企业加入开放生态,我国人工智能发展正从“单点创新”走向“协同发展”,为破解算力孤岛、补齐数据短板提供系统性方案。