登录社区云,与社区用户共同成长
邀请您加入社区
MiniMax M2.7 正式开源权重。这是MiniMax M2 系列在 M2.5 之后的新一代旗舰!这一次的突破不只是跑分数字的提升,而是一个真正意义上参与迭代自身的模型的诞生。 资源链接: ModelScope:https://www.modelscope.cn/models/MiniMax/MiniMax-M2.7MiniMax Agent: https://agent.min
最新的MinerU2.5-Pro模型发布了。 但这次最想聊的,还不是它的排名。(预告下,文末还是会放成绩单) 这两年,大模型很热,OCR模型可能更热。 大家都在卷文档解析,具体卷什么呢? 卷架构,卷参数,卷谁又换了新的backbone,卷谁又把模型做得更复杂。但文档解析这件事,真还在“拼命改模型结构”这个阶段吗?团队认真研究了下,发现未必。 在最新的MinerU2.5-Pro这篇论文里讲得很直接:
让大模型真正走进现实世界,是当下最迫切的需求之一。但美好的愿景,在真实的物理环境面前却屡屡碰壁。那些在文本世界里对答如流的通用视觉语言模型(VLM),一旦装进机器人脑子里,常常显得笨手笨脚。 原因很简单——物理世界容不得半点含糊。通用模型平时看图“大差不差”就行,但具身智能需要的是极度精细的三维空间感知,以及涉及到真实物理交互的预测和规划。拿着“做题家”的脑子去干真实的体力活,自然水土不服。 面对
如果声音可以更改,你最想改变什么? 语言,声调,音色,情绪,甚至全凭想象,「无中生有」创造一个世界上完全不存在的声音……这是可能实现的目标吗? 当 VoxCPM 2 可以让《哆啦 A 梦》开始讲四川话,全过程 0 人类配音师,答案无需赘述—— 0bc3decfgaaeviaeojwr2nuvigodkmmqiuya.f10002.mp4 中国特色方言,音色设计、通用音色可控(尤其是
今天凌晨,智谱最新开源旗舰 GLM-5.1 发布,这次直接把 AI 编程推到了"8小时长程任务"时代。从早期3分钟的 Vibe Coding,到30分钟的 Agentic Engineering,再到如今能连续独立工作超过8小时的 Long-Horizon Task,GLM-5.1 堪称智谱迄今最强的旗舰模型,也是当前全球最能打的开源模型之一。 GLM-5.1在代码能力上大幅跃
当 Chinese FineWeb 系列数据集在通用中文 AI 领域持续发光发热时,OpenCSG 悄然完成了一次战略转身——从通用语料走向垂直行业,从语言模型基座延伸到产业智能底座。 2026 年 3 月,OpenCSG 正式开源 CIMD(Cross-Source Industry Corpus for Iron Ore, Mining, Metallurgy, Policy, and Mar
近日,Google 正式开源 Gemma 4 系列,基于与 Gemini 3 相同的技术底座构建,采用 Apache 2.0 许可。本次发布包含四个规格:E2B、E4B、26B MoE 和 31B Dense,覆盖从端侧到服务器的多种部署场景。核心亮点在于参数效率极高——31B 模型在 Arena AI 文本排行榜位列开放模型第 3,26B 位列第 6,性能超越多个 20 倍参数量级的模型。在边缘
近日,蚂蚁集团全模态代码算法团队研发的 Web 智能体—— OpAgent 正式亮相。无需预设脚本或人工干预,OpAgent 能够仅凭一条自然语言指令,在真实亚马逊网站上自主完成搜索、识别、加购等一系列复杂交互操作。 0b2e2qcmyaaeimamaqwkdzuvjvgdztkajtaa.f10002.mp4 目前,OpAgent 已登陆魔搭社区(ModelScope)创空间,并
FlagOS Skills 正式上线魔搭 Skills中 FlagOS Skills 1.0——首个面向异构 AI 芯片的 AI Agent 专业技能库——已发布到魔搭社区 Skills 中心,并在魔搭首页作为合集置顶首推,并同步上线众智FlagOS社区平台。FlagOS Skills覆盖模型迁移、算子开发、性能调优等场景,让 Claude Code、Cursor、Codex 等 AI 编程工具直
近日,中科天机气象数据集在魔搭社区(ModelScope)下载量突破一万次。其中,首发的“华北区域公里级气象数据集”凭借高精度和良好的模型适配性,已成为 AI4S 与地球科学领域开发者常用的高精度数据底座。 为进一步补强区域及专项数据能力,中科天机现已正式上线“华中区域精细化气象数据集”和“全球高分辨率沙尘专题数据集”。本次更新旨在拓宽区域覆盖、提供微尺度气象特征,为气象 AI 模型训练、灾害预警