🔥 这个夏天,开源热潮比气温更燃!Qwen3、GLM4.5、混元、Wan2.2、Qwen-Image等重磅模型密集发布,MoE、多模态、Agent、生图视频全爆发,ModelScope 全程 Day0 支持,生态持续进化中!
 

💻 从以图搜图、MCP升级到API兼容,魔搭持续优化全链路体验,线上线下联动开发者,一起共建更开放、更强大的AI未来!
 

这个炎热的夏日里,模型社区里开源的热情,更胜过盛夏的高温:过去一个月里开源的新模型,当真让人眼花缭乱,目不暇接。ModelScope也依旧保持了高速的功能迭代,来为这些来自不同领域的模型,提供全方位的支持。

 

最近在开源领域中最受大家瞩目的进展之一,当然是OpenAI重回“Open”的模型开源赛道,开放了120B和20B两个MoE模型。除此之外,在文本LLM领域,Qwen3更新了全系列的0725版本,全面提升了性能,并区分了Thinking和Instruct版本供不同场景使用,同时Qwen3-Coder以4800亿参数的规模,成为Qwen开源模型系列里的最大规格,展示了在代码编程以及Agentic能力上的巨大潜力。而智谱的GLM4.5系列,同样给了开源社区巨大的惊喜,作为一个面对Agent设计和训练的模型,GLM4.5在社区获得了广泛的好评。此外,腾讯的混元系列,本月在推出其世界模型HunyunWorld以外,也开源了其从0.5B到7B不同大小的dense模型。
 

在多模态理解模型领域里,更是风起云涌,从小红书新推出的dots.vlm1模型,到一直面向端侧发力MiniCPM-V4的发布,都为VL模型在端侧的使用提供了更丰富的选项。而Intern-S1、Step3、以及新鲜出炉的GLM-4.5V,则均为超大规格的多模态推理模型,并且展示了非常强大的视觉理解能力。视觉生成方面,则更是惊喜连连,Wan系列模型推出了Wan2.2系列,提供了电影级别的、具备精细控制能力的视频生成能力。在图片生成方面,Flux系列迎来了Flux.1-Krea这一开源新成员,支持对于人像更加逼真的展现,而来自Qwen团队的全新Qwen-Image模型,则更是给生图社区注入了全新的活力,迅速成为开源生图模型的最佳选择之一。
 

ModelScope的AIGC专区,上新以图搜图的图搜能力,以及图片标签分类等功能。同时针对Wan2.2视频生成,Flux.1-Krea,以及Qwen-Image,我们均提供了Day0的全方位的支持,尤其是Qwen-Image的图片生成和LoRA训练,受到了广大开发者的热烈欢迎。此外为了更好的支持ModelScope模型生态和MCP生态更好的结合与交互,我们全面升级了MCP实验场,提供更完整的使用体验。同时魔搭的MCP生态也继续进行着外拓,为Kimi Playground等平台提供了支持。在API调用生态上,一方面我们对于ModelScope的平台token体系做了整合,另一方面在接口上提供了与Anthropic API的兼容,并且对于文生图等模型API,新增了异步调用的支持。包括论文板块、研习社、数据集等板块,功能也持续在不断迭代中。同时在大家可能不能直接看到的地方,平台的后端也持续推进着各种优化的进行,为广大开发者提供更稳定和高效的模型服务。
 

魔搭开发者大会之后,这个月我们在WAIC以及Agent x MCP大赛等线下活动,和广大社区开发者进行了更多的交流,也收获了满满的开发者反馈,更多的更新还在路上,期望继续大家一起,建设更好的开源社区。
 

· 站点更新

1. 魔搭MCP实验场完成全面改版上新。基于开源项目ms-agent(https://github.com/modelscope/ms-agent),新的MCP实验场打通了与ModelScope平台(包括MCP广场,API-Inference等诸多生态)的链接,提供了更完整有机结合的实验场体验:https://modelscope.cn/mcp/playground

2. AIGC专区

本月魔搭AIGC专区在第一时间提供了对于Wan2.2, Flux.1-Krea,Qwen-Image等热门开源模型的全方位支持,包括DiffSynth接入,AIGC专区图像生成以及LoRA模型训练能力等。

 

AIGC专区搜索升级:支持全局搜索与多模态图像搜索能力,轻松开启图片搜索🔍新体验!

 

上新模型可视化标签体系,让感兴趣的内容跃然眼前,查找心仪模型更轻松。


 


 

3. API-Inference支持了在模型详情页,提供对LLM/VL/文生图等模型的在线体验。

4. ModelScope 平台token 实现统一,合并SDK/API token 与 Git token。
 

5. API-Inference 对于LLM,提供了Anthropic API接口兼容。

6. 我们支持了来自月之暗面的Kimi Playground(https://platform.moonshot.cn/playground),通过集成魔搭MCP广场,迅速接入MCP生态。
 

7. 模型详情页,针对Safetensors,GGUF等模型,提供了可视化信息展示。
 

8. 合集内容支持灵活排序,可根据综合热度或最近更新快速查找所需元素。

 

9. 我们上线了魔搭国际站 (modelscope.ai) 的全新版本,包括了样式更新,MCP广场以及AIGC专区的国际版的发布。国际版的内容还在建设完善中,希望马上以更加完整的内容与大家见面!


 

10. AIGC FlowBench客户端正式对外公测啦!欢迎大家试用反馈:https://www.modelscope.cn/learn/1426

11. MCP广场,以及勋章体系移动端对齐一轮PC端浏览体验。


 

12. 论文关联检索改为基于arxiv id实现,确保论文以及相关元素的双向关联。
 

 

13. 数据集支持申请制下载。

14. Paper板块支持论文认领引导的优化。
 

 

15. MCP服务支持删除。

16. 研习社内容支持在个人/组织主页展示。支持个人主页搜索以及后台添加单篇课程与组合课程的打通。

· 开源SDK与工具链更新

1. SWIFT 3.7.0 版本发布。

    • 添加gpt-oss、Qwen3-0725版本一系列模型以及Qwen-Coder、GLM-4.5、混元dense模型、Devstral等LLM支持,以及MiniCPM-V-4等多模态模型支持。
    • 在Megatron框架提供LoRA训练支持,包括CPT/SFT/DPO等,显著加速了MoE模型等训练速度;升级megatron_core到0.13版本,并提供了loss_scale以及bshd格式的支持;优化了模型加载以及转换速度。
    • GRPO 添加了GSPO算法以及多轮算法DeepEyes的支持,在 server mode 支持多机 rollout,并兼容GYM环境规范。添加entropy_mask 支持,过滤低熵token损失
    • 训练:支持Flash-Attention-3加速,对序列Packing模块进行了重构加速Packing速度。新增new_speical_tokens、cached_dataset等参数。embedding训练支持了liger_kernel,多模态模型训练支持了 loss_scale,并在Qwen VL训练中提供混合数据支持。
    • RLHF:支持了MPO训练,并在多模态DPO中支持图片拒绝。
    • 全链路:支持embedding系列模型的推理部署,包括pt/vllm/sglang等不同的infer_backend;InferEngine支持return_details参数,以输出prompt_token_ids和token_ids。 vLLM推理引擎兼容了更多多模态模型,并对输入参数进行重构。QLoRA支持Merge-LoRA,提供MoE/多模态模型的FP8/BNB量化支持

2. EvalScope更新到0.17.1:

    • 模型压测支持随机生成图文数据,用于多模态模型压测。
    • 支持τ-bench,用于评估 AI Agent在动态用户和工具交互的实际环境中的性能和可靠性。
    • 支持“人类最后的考试”(Humanity's-Last-Exam),这一高难度评测基准。

同时EvalScope整体框架1.0版本重构中,敬请期待。

 

3. ModelScope主库1.29版本发布。支持使用SDK与MCP广场的交互,并增加了通过SDK/命令行上传适配AIGC专区的模型对能力。提供创建repo的命令行支持。此外修复了一系列安全问题。

 

4. ms-agent: 1.0版本发布,Agentic框架重构整体,支持新版MCP Playground。发布DocResearch功能,并提供配套创空间。https://modelscope.cn/studios/ms-agent/DocResearch。

 

5. DiffSynth:全面接入Wan 2.2系列模型,Flux-Krea,以及Qwen-Image的支持,包括推理优化以及LoRA训练等能力。基于Qwen-Image进行了蒸馏加速、LoRA生成加速、可控生成以及ControlNet全方面的支持。GitHub Readme以及文档进行了整体重构+更新。

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐