登录社区云,与社区用户共同成长
邀请您加入社区
为遵守国家网络实名制规定,未绑定将限制内容发布与互动
中国科学院大学联合腾讯、新加坡国立大学等机构开源了 SCOPE,一个面向第一人称射击(FPS)游戏的交互式世界模型。该模型首次提出逐像素空间选择性动作调节机制,将离散事件(开火、换弹)的视觉效果精确约束在武器区域(scope 内),同时保持环境区域的稳定生成。基于 5B 参数视频扩散 Transformer 端到端训练,SCOPE 在 CrossFPS 测试集上 8 项指标中取得 7 项最优(JE
actAVA.ai 联合 Johns Hopkins、Wellstar、Yale、斯坦福、CMU、牛津、USC、UCSD 等 20 余家医疗机构与高校(Eric Xing、Sanmi Koyejo、Caiming Xiong、Philip S. Yu等)发布 CHI(χ)-Bench(Clinical Healthcare In-SituBenchmark),全球首个面向医疗长程工作流的 Agen
开发一个能“跑通 Demo 演示”的智能体并不难。 难的是,让它在真实场景里稳定地完成任务。 长链路任务中途断裂、工具调用缺乏安全边界、上下文越跑越臃肿、本地脚本难以接入生产环境……这些才是智能体走向落地时,开发者每天面对的硬骨头。 过去,AgentScope 1.0 以“透明开发”为核心,让开发者能清晰可见智能体的消息流转、工具调用和协作过程,从而降低理解与调试门槛。如今,面对更复杂的真实场景,
面壁智能联合清华大学、OpenBMB开源社区,在端侧大模型开源周中连续发布两款模型。MiniCPM5-1B仅1B参数,在AA-Index上超越所有2B以下模型(包括Qwen3.5-2B),INT4量化后权重仅0.5GB,可跑在手机、浏览器甚至纯CPU环境上。BitCPM-CANN是完全基于华为昇腾端到端训练的1.58-bit三值大模型,覆盖0.5B/1B/3B/8B四个规格,相比BF16释放约6倍
长上下文推理的瓶颈正在从计算量转向显存。每生成一个新token,系统都要反复访问越来越长的历史Key和Value,上下文拉长、batch放大后,KV Cache同时吞掉显存容量和带宽。Together AI开源了OSCAR(Offline Spectral Covariance-Aware Rotation),一套面向长上下文serving的近2-bit KV Cache量化方案,核心思路是:不只
在扩散模型(Diffusion Models)横扫图像与视频生成的今天,ControlNet、LoRA、IP-Adapter 等工具,早已成了创作者和开发者工作流里的标配。但繁荣背后,一个越来越让人头疼的问题浮出水面:模型生态,太“碎”了。 相信不少开发者都踩过这样的坑:好不容易跑通一个新模型,想加个控制功能,一看代码结构——完全不兼容;想一次性叠加多个控制条件,结果插件之间在底层“打架”,特征层
近日,LongCat-Video-Avatar 1.5正式开源 ,作为一款从开源 SOTA 迈向商业级应用的数字人视频模型。在唇形同步、物理合理性、长视频稳定性、多人互动和高效推理上实现了全面跃升。LongCat-Video-Avatar 1.5 即便在复杂商业场景里,也能稳定、自然地输出高质量内容,让数字人视频生成从彩排室的完美演练,走向千人千面的真实舞台。 为了让数字人“更稳定、更自然”地动起
随着大模型从"回答问题"走向"执行任务",Agent评测正在成为能力评估的关键方向。一个Agent可能给出看似合理的结果,却在执行过程中遗漏关键步骤、调用错误接口甚至违反任务约束——只看最终答案已经不够。Claw-Eval是一个面向自主Agent的端到端评测框架,关注的不只是任务有没有完成,更关注任务是如何被完成的:过程是否可追溯,行为是否合规,异常发生后能
5月21日,腾讯混元宣布开源全新翻译模型Hy-MT2,并上线翻译小程序「腾讯Hy翻译」。 Hy-MT2 是支持 33 种语言互译的多语言模型,其中7B 和 30B-A3B模型在各类翻译任务上达到了开源模型SoTA,超越了几十倍参数量的模型,轻量级的 1.8B 模型也超越了微软等主流商业 API,且得益于 AngelSlim 1.25-bit 极端量化,仅需 440MB 存储空间,可以轻松部署在主流
引言 HiDream.ai开源了HiDream-O1-Image,一个8B参数的像素级统一生成基础模型。彻底抛弃传统的VAE和分离式文本编码器,将原始图像像素、文本token和任务条件映射到单一共享token空间,通过Unified Transformer(UiT)架构实现端到端的上下文视觉生成。仅8B参数即在GenEval、DPG、CVTG-2K等多项基准上进一步刷新SOTA。本次开源包括未蒸馏