登录社区云,与社区用户共同成长
邀请您加入社区
ModelScope 联合呜哩WULI团队重磅开源 Flowra —— FlowBench 背后的核心引擎! Flowra 是 FlowBench 的核心图执行引擎和节点包开发工具。它为开发者提供了一套完整的工具链,用于创建、测试、调试和发布自定义节点包。借助 Flowra,您可以轻松封装机器学习模型、图像处理算法。 开源地址: Github: https://github.com/model
阶跃星辰重磅开源 GELab-Zero ,首次将 GUI Agent 模型与完整配套基建同步开放,支持手搓党一键部署。其中 4B GUI Agent 模型在手机端、电脑端等多个 GUI 榜单上全面刷新同尺寸模型性能纪录,取得 SOTA 成绩。此外,阶跃此次还开源了基于真实业务场景的自建评测标准 AndroidDaily,以期推动 GUI 领域模型评测向消费级、规模化应用发展。 开源链接 GitHu
两个月前,我们发布了实验性的 DeepSeek-V3.2-Exp,并收到了众多热心用户反馈的对比测试结果。目前未发现 V3.2-Exp 在任何特定场景中显著差于 V3.1-Terminus,这验证了 DSA 稀疏注意力机制的有效性。也感谢广大用户一直以来的积极反馈与支持,为我们的持续创新注入了更多信心与动力。 今天,我们同时发布两个正式版模型: DeepSeek-V3.2 和 DeepSeek-
近日,国内规模最大的面向真实作业场景的全尺寸人形机器人真机数据集“LET数据集”正式发布!其首批开源60,000+分钟数据已在魔搭社区官网同步上线。 LET数据集由乐聚智能(深圳)股份有限公司、国家地方共建人形机器人创新中心、北京数聚通启运营管理有限公司和苏州吴江智训未来运营管理有限公司联合主导构建。该数据集不仅精准填补了具身智能领域对高质量真机数据的迫切需求,更为行业创新发展提供了关键的数据支
过去一年,AI 文生图赛道“卷”得风生水起。从 Stable Diffusion、Flux、Qwen-Image到闭源的Nano-Banana,大家都在追求一个目标——更快、更强、更丝滑的使用体验。 来自通义实验室的 Z-Image(造相)模型 正式亮相,引发了业内广泛关注。它不仅在性能上直接对标国际一线模型,还在 速度、显存占用、中文能力、编辑体验 上表现出了惊人的能力,被许多人评价为: “
在大模型时代,智能体(Agent)正成为连接 AI 与现实任务的关键桥梁。然而,“开发容易,评估难” 一直是智能体领域的痛点:你可能能写出一个会调用工具、会检索知识的 Agent,但如何知道它真的“靠谱”?如何让开发过程可度量、可比较、可复现? 如今,字节跳动推出的 VeAgentBench 数据集 与 veADK(Volcengine Agent Development Kit) 给出了一个完
混元自研的OCR模型,来了。 11月25日,腾讯混元推出全新开源模型 HunyuanOCR,参数仅为1B,依托于混元原生多模态架构打造,获得多项业界OCR应用榜单SOTA(最先进水平)成绩。 HunyuanOCR 具有高度易用性,不仅体积小,便于部署,得益于混元原生多模态大模型"端到端"的理念设计,各项功能仅需单次前向推理即可直达最优结果,较业界级联方案更高效和便捷,性价比高。
你有没有想过—— 当大模型回答一个问题时,它不仅能写出内容,还能自动生成一个完整的网页界面,里面带地图、图表、小游戏、甚至实时交互功能? 这不是科幻,而是 Google Research 最新发布的 Generative UI(生成式用户界面)带来的真实能力。 从“文字墙”到“交互网页”,体验升级 过去,我们和大模型对话,得到的往往是这样的结果: 一段 Markdown 格式的文字,可
今天,腾讯混元大模型团队正式开源HunyuanVideo 1.5,一款基于 Diffusion Transformer(DiT)架构、参数为8.3B的轻量级视频生成模型,支持生成5-10秒的高清视频。目前,腾讯元宝最新版已上线该模型能力。用户可通过两种方式即可体验:一是输入文字描述(Prompt),直接实现“文生视频”;二是上传图片配合Prompt,轻松将静态图片转化为动态视频。 在元宝中可以
AI加速发展的当下,智能体已成为强大的执行者,能够与环境交互、调用工具。但它们距离成为真正的学习者——能够持续成长与自我迭代的智能体——仍有一步之遥。 AgentEvolver 正是为迈出这关键一步而设计的自进化系统。它将「自我任务生成、自我经验导航、自我反思归因」三大支柱融于一身,系统性地解决了Agent RL训练中的任务稀缺、探索低效和学习信号模糊等关键难题。引导智能体从“被动接受训练”的模