中科天机开放华中2.5公里气象及全球12公里沙尘数据集:支持时空序列AI模型训练
近日,中科天机气象数据集在魔搭社区(ModelScope)下载量突破一万次。其中,首发的“华北区域公里级气象数据集”凭借高精度和良好的模型适配性,已成为 AI4S 与地球科学领域开发者常用的高精度数据底座。
为进一步补强区域及专项数据能力,中科天机现已正式上线“华中区域精细化气象数据集”和“全球高分辨率沙尘专题数据集”。本次更新旨在拓宽区域覆盖、提供微尺度气象特征,为气象 AI 模型训练、灾害预警及行业智能决策提供更完备的数据支撑。
数据集地址:
- 华中气象数据集:https://www.modelscope.cn/datasets/tjweather1/tjweather_TJ-CN_2025_huazhong
- 沙尘数据集:https://www.modelscope.cn/datasets/tjweather1/tjweather_dust_sample
数据集介绍
华中区域精细化气象数据集
本数据集依托中科天机“全球-区域一体化数值天气模式”生成,核心采用 “全球自由变焦”技术 对中国区域进行聚焦网格加密。在计算量可控的前提下,实现了 0.025°(约2.5公里) 的高分辨率输出。
- 数据规格: 提供2025年华中区域历史模拟数据,涵盖辐射、温度、降水、风速、湿度、气压等 9 项核心要素。
- 模拟能力: 支持 10 天逐小时连续模拟,满足新能源(风/光)、电力调度、精准农业对微尺度气象信息的需求。
- 实战价值: 开发者可直接利用公里级样本训练时空序列预测模型,为场站级短期功率预测及电网韧性评估提供深度学习算法支撑。
数据要素清单

全球高分辨率沙尘数据集
全球 12 公里沙尘数据集是中科天机基于“全球-区域一体化数值模式”,将 iDust 沙尘方案与自主研发的 SD3 动力内核深度耦合 生成的高质量数据集。
- 核心优势: 综合考量风速、地形、土壤湿度等因子,完整刻画沙尘排放、输送、干湿沉降全过程。通过与模式动力框架的深度耦合,有效降低了对边界层混合过程的依赖,生成数据更贴合真实观测。
- 计算优化: 深度适配国产异构算力平台,实现高效并行加速,降低了传统独立运算带来的系统开销与数据交互损耗。
- 数据规格: 提供地表沙尘浓度、光学厚度、累计沉降量、地表扬沙通量 4 个核心要素,支持长达 30 天 的连续模拟输出,覆盖沙尘全生命周期演变。
数据要素清单

OneScience科学大模型一站式开发平台
本次上新的数据集可深度适配 “OneScience 科学计算工具包”。该平台内置 Fuxi、GraphCast、FengWu 等主流气象 AI 模型,并配套标准化的数据转换流程、训练脚本及对比基线。开发者可在国产算力环境下高效完成模型复现、优化与训练。
github地址:https://github.com/hpccube/OneScience
未来展望
从华北到华中,从常规要素到沙尘专项监测,中科天机将持续在魔搭社区开放更多区域、更长时序的高质量数据集。我们期待与开发者一同探索气象数据与 AI 技术的融合,共建 AI4S 地球科学智能生态。
扫描下方二维码
加入“AI气象科研交流群”互动交流

点击直达魔搭社区“中科天机数据集”下载
https://www.modelscope.cn/organization/tjweather1
更多推荐




所有评论(0)