近日,中科天机气象数据集在魔搭社区(ModelScope)下载量突破一万次。其中,首发的“华北区域公里级气象数据集”凭借高精度和良好的模型适配性,已成为 AI4S 与地球科学领域开发者常用的高精度数据底座。

为进一步补强区域及专项数据能力,中科天机现已正式上线“华中区域精细化气象数据集”和“全球高分辨率沙尘专题数据集”。本次更新旨在拓宽区域覆盖、提供微尺度气象特征,为气象 AI 模型训练、灾害预警及行业智能决策提供更完备的数据支撑。

 

数据集地址:

  • 华中气象数据集:https://www.modelscope.cn/datasets/tjweather1/tjweather_TJ-CN_2025_huazhong
  • 沙尘数据集:https://www.modelscope.cn/datasets/tjweather1/tjweather_dust_sample

数据集介绍

华中区域精细化气象数据集

本数据集依托中科天机“全球-区域一体化数值天气模式”生成,核心采用 “全球自由变焦”技术 对中国区域进行聚焦网格加密。在计算量可控的前提下,实现了 0.025°(约2.5公里) 的高分辨率输出。

  • 数据规格: 提供2025年华中区域历史模拟数据,涵盖辐射、温度、降水、风速、湿度、气压等 9 项核心要素。
  • 模拟能力: 支持 10 天逐小时连续模拟,满足新能源(风/光)、电力调度、精准农业对微尺度气象信息的需求。
  • 实战价值: 开发者可直接利用公里级样本训练时空序列预测模型,为场站级短期功率预测及电网韧性评估提供深度学习算法支撑。

数据要素清单

 

全球高分辨率沙尘数据集

全球 12 公里沙尘数据集是中科天机基于“全球-区域一体化数值模式”,将 iDust 沙尘方案与自主研发的 SD3 动力内核深度耦合 生成的高质量数据集。

  • 核心优势: 综合考量风速、地形、土壤湿度等因子,完整刻画沙尘排放、输送、干湿沉降全过程。通过与模式动力框架的深度耦合,有效降低了对边界层混合过程的依赖,生成数据更贴合真实观测。
  • 计算优化: 深度适配国产异构算力平台,实现高效并行加速,降低了传统独立运算带来的系统开销与数据交互损耗。
  • 数据规格: 提供地表沙尘浓度、光学厚度、累计沉降量、地表扬沙通量 4 个核心要素,支持长达 30 天 的连续模拟输出,覆盖沙尘全生命周期演变。

数据要素清单

 

OneScience科学大模型一站式开发平台

本次上新的数据集可深度适配 “OneScience 科学计算工具包”。该平台内置 Fuxi、GraphCast、FengWu 等主流气象 AI 模型,并配套标准化的数据转换流程、训练脚本及对比基线。开发者可在国产算力环境下高效完成模型复现、优化与训练。

github地址:https://github.com/hpccube/OneScience

 

未来展望

从华北到华中,从常规要素到沙尘专项监测,中科天机将持续在魔搭社区开放更多区域、更长时序的高质量数据集。我们期待与开发者一同探索气象数据与 AI 技术的融合,共建 AI4S 地球科学智能生态。

 

扫描下方二维码

加入“AI气象科研交流群”互动交流

 

 

 

点击直达魔搭社区“中科天机数据集”下载

https://www.modelscope.cn/organization/tjweather1

 

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐