ModelScope魔搭25年8月发布月报

魔搭ModelScope社区

3人浏览 · 2025-08-18 13:31:31

魔搭ModelScope社区 · 2025-08-18 13:31:31 发布

🔥 这个夏天，开源热潮比气温更燃！Qwen3、GLM4.5、混元、Wan2.2、Qwen-Image等重磅模型密集发布，MoE、多模态、Agent、生图视频全爆发，ModelScope 全程 Day0 支持，生态持续进化中！

💻 从以图搜图、MCP升级到API兼容，魔搭持续优化全链路体验，线上线下联动开发者，一起共建更开放、更强大的AI未来！

这个炎热的夏日里，模型社区里开源的热情，更胜过盛夏的高温：过去一个月里开源的新模型，当真让人眼花缭乱，目不暇接。ModelScope也依旧保持了高速的功能迭代，来为这些来自不同领域的模型，提供全方位的支持。

最近在开源领域中最受大家瞩目的进展之一，当然是OpenAI重回“Open”的模型开源赛道，开放了120B和20B两个MoE模型。除此之外，在文本LLM领域，Qwen3更新了全系列的0725版本，全面提升了性能，并区分了Thinking和Instruct版本供不同场景使用，同时Qwen3-Coder以4800亿参数的规模，成为Qwen开源模型系列里的最大规格，展示了在代码编程以及Agentic能力上的巨大潜力。而智谱的GLM4.5系列，同样给了开源社区巨大的惊喜，作为一个面对Agent设计和训练的模型，GLM4.5在社区获得了广泛的好评。此外，腾讯的混元系列，本月在推出其世界模型HunyunWorld以外，也开源了其从0.5B到7B不同大小的dense模型。

在多模态理解模型领域里，更是风起云涌，从小红书新推出的dots.vlm1模型，到一直面向端侧发力MiniCPM-V4的发布，都为VL模型在端侧的使用提供了更丰富的选项。而Intern-S1、Step3、以及新鲜出炉的GLM-4.5V，则均为超大规格的多模态推理模型，并且展示了非常强大的视觉理解能力。视觉生成方面，则更是惊喜连连，Wan系列模型推出了Wan2.2系列，提供了电影级别的、具备精细控制能力的视频生成能力。在图片生成方面，Flux系列迎来了Flux.1-Krea这一开源新成员，支持对于人像更加逼真的展现，而来自Qwen团队的全新Qwen-Image模型，则更是给生图社区注入了全新的活力，迅速成为开源生图模型的最佳选择之一。

ModelScope的AIGC专区，上新以图搜图的图搜能力，以及图片标签分类等功能。同时针对Wan2.2视频生成，Flux.1-Krea，以及Qwen-Image，我们均提供了Day0的全方位的支持，尤其是Qwen-Image的图片生成和LoRA训练，受到了广大开发者的热烈欢迎。此外为了更好的支持ModelScope模型生态和MCP生态更好的结合与交互，我们全面升级了MCP实验场，提供更完整的使用体验。同时魔搭的MCP生态也继续进行着外拓，为Kimi Playground等平台提供了支持。在API调用生态上，一方面我们对于ModelScope的平台token体系做了整合，另一方面在接口上提供了与Anthropic API的兼容，并且对于文生图等模型API，新增了异步调用的支持。包括论文板块、研习社、数据集等板块，功能也持续在不断迭代中。同时在大家可能不能直接看到的地方，平台的后端也持续推进着各种优化的进行，为广大开发者提供更稳定和高效的模型服务。

魔搭开发者大会之后，这个月我们在WAIC以及Agent x MCP大赛等线下活动，和广大社区开发者进行了更多的交流，也收获了满满的开发者反馈，更多的更新还在路上，期望继续大家一起，建设更好的开源社区。

· 站点更新

1. 魔搭MCP实验场完成全面改版上新。基于开源项目ms-agent(https://github.com/modelscope/ms-agent)，新的MCP实验场打通了与ModelScope平台（包括MCP广场，API-Inference等诸多生态）的链接，提供了更完整有机结合的实验场体验：https://modelscope.cn/mcp/playground

2. AIGC专区

本月魔搭AIGC专区在第一时间提供了对于Wan2.2， Flux.1-Krea，Qwen-Image等热门开源模型的全方位支持，包括DiffSynth接入，AIGC专区图像生成以及LoRA模型训练能力等。

AIGC专区搜索升级：支持全局搜索与多模态图像搜索能力，轻松开启图片搜索🔍新体验！

上新模型可视化标签体系，让感兴趣的内容跃然眼前，查找心仪模型更轻松。

3. API-Inference支持了在模型详情页，提供对LLM/VL/文生图等模型的在线体验。

4. ModelScope 平台token 实现统一，合并SDK/API token 与 Git token。

5. API-Inference 对于LLM，提供了Anthropic API接口兼容。

6. 我们支持了来自月之暗面的Kimi Playground(https://platform.moonshot.cn/playground)，通过集成魔搭MCP广场，迅速接入MCP生态。

7. 模型详情页，针对Safetensors，GGUF等模型，提供了可视化信息展示。

8. 合集内容支持灵活排序，可根据综合热度或最近更新快速查找所需元素。

9. 我们上线了魔搭国际站 (modelscope.ai) 的全新版本，包括了样式更新，MCP广场以及AIGC专区的国际版的发布。国际版的内容还在建设完善中，希望马上以更加完整的内容与大家见面！

10. AIGC FlowBench客户端正式对外公测啦！欢迎大家试用反馈：https://www.modelscope.cn/learn/1426

11. MCP广场，以及勋章体系移动端对齐一轮PC端浏览体验。

12. 论文关联检索改为基于arxiv id实现，确保论文以及相关元素的双向关联。

13. 数据集支持申请制下载。

14. Paper板块支持论文认领引导的优化。

15. MCP服务支持删除。

16. 研习社内容支持在个人/组织主页展示。支持个人主页搜索以及后台添加单篇课程与组合课程的打通。

· 开源SDK与工具链更新

1. SWIFT 3.7.0 版本发布。

- 添加gpt-oss、Qwen3-0725版本一系列模型以及Qwen-Coder、GLM-4.5、混元dense模型、Devstral等LLM支持，以及MiniCPM-V-4等多模态模型支持。
- 在Megatron框架提供LoRA训练支持，包括CPT/SFT/DPO等，显著加速了MoE模型等训练速度；升级megatron_core到0.13版本，并提供了loss_scale以及bshd格式的支持；优化了模型加载以及转换速度。
- GRPO 添加了GSPO算法以及多轮算法DeepEyes的支持，在 server mode 支持多机 rollout，并兼容GYM环境规范。添加entropy_mask 支持，过滤低熵token损失
- 训练：支持Flash-Attention-3加速，对序列Packing模块进行了重构加速Packing速度。新增new_speical_tokens、cached_dataset等参数。embedding训练支持了liger_kernel，多模态模型训练支持了 loss_scale，并在Qwen VL训练中提供混合数据支持。
- RLHF：支持了MPO训练，并在多模态DPO中支持图片拒绝。
- 全链路：支持embedding系列模型的推理部署，包括pt/vllm/sglang等不同的infer_backend；InferEngine支持return_details参数，以输出prompt_token_ids和token_ids。 vLLM推理引擎兼容了更多多模态模型，并对输入参数进行重构。QLoRA支持Merge-LoRA，提供MoE/多模态模型的FP8/BNB量化支持

2. EvalScope更新到0.17.1：

- 模型压测支持随机生成图文数据，用于多模态模型压测。
- 支持τ-bench，用于评估 AI Agent在动态用户和工具交互的实际环境中的性能和可靠性。
- 支持“人类最后的考试”(Humanity's-Last-Exam)，这一高难度评测基准。

同时EvalScope整体框架1.0版本重构中，敬请期待。

3. ModelScope主库1.29版本发布。支持使用SDK与MCP广场的交互，并增加了通过SDK/命令行上传适配AIGC专区的模型对能力。提供创建repo的命令行支持。此外修复了一系列安全问题。

4. ms-agent: 1.0版本发布，Agentic框架重构整体，支持新版MCP Playground。发布DocResearch功能，并提供配套创空间。https://modelscope.cn/studios/ms-agent/DocResearch。

5. DiffSynth：全面接入Wan 2.2系列模型，Flux-Krea，以及Qwen-Image的支持，包括推理优化以及LoRA训练等能力。基于Qwen-Image进行了蒸馏加速、LoRA生成加速、可控生成以及ControlNet全方面的支持。GitHub Readme以及文档进行了整体重构+更新。