还记得今年春季的 “智算极速争锋 AMD 2025推理优化挑战赛“ 吗?在社区的大力推广下,我们集结了数百位开发者,在 AMD GPU 上展开算子性能的极限拉扯,排行榜刷新到最后一刻,开发者及社区热度持续飙升,涌现出一批在开源实现上突破极限的高手!

 

金秋时节,我们再次开启 AMD 2025 分布式推理算子优化挑战赛!本次赛事聚焦多GPU分布式推理算子的开发与优化,目标是在 AMD GPU 上实现 LLM 推理性能的突破。
 

💰 你没有看错,高额奖金池等你来战!

🥇 特等奖:100,000美元

🥈 第一名:25,000美元

🥉 第二名:15,000美元

🏅 第三名:10,000美元
 

部分优胜者将受邀前往旧金山,参加 AMD DevDay 及颁奖典礼,与全球顶尖开发者面对面交流!

🧠 技术挑战亮点 本次挑战赛将围绕三类分布式推理算子展开:

1. 单节点8GPU全互连算子(All-to-All):考验通信与计算融合的极限调度能力

2.单节点8GPU GEMM + Reducescatter:挑战跨GPU矩阵乘与通信融合的性能瓶颈

3.单节点8GPU Allgather + GEMM:聚合与计算并行优化,适配大模型推理场景

 

📊 每类题目将提供

  • 参考实现(baseline)
  • 性能理论上限(roofline)
  • 输入 shape 与配置
  • 自动化评测平台(KernelBot)
     

📅 时间节点(北京时间)

  • 报名时间:2025年8月24日上午3:00-9月21日下午14:59
  • 提交时间:2025年8月31日上午3:00-10月14日下午14:59
     

🛠️ 参赛方式

  • 个人或最多三人组队
  • 年满18岁,拥有有效 GitHub ID 和 Discord ID
  • 中国大陆参赛者可通过指定GitHub CLI 工具或Discord KernelBot提交算子,自动运行并上传结果
     

🤝 社区合作

本次挑战赛由 AMD 联合魔搭社区 与Datawhale 共同举办,依托中国开发者生态,提供技术支持、资源分享与社区交流。欢迎所有对 GPU 性能优化、分布式推理、开源算子挑战感兴趣的开发者参与!
 

📬 立即报名

扫码报名大赛

🙌 进群交流

只要对大赛感兴趣,就能进群。


 


 


 

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐