登录社区云,与社区用户共同成长
邀请您加入社区
魔搭DiffSynth-Studio 团队携手知名创作者麦橘MERJIC,正式开源全新 AI 图像生成模型——Face-to-Photo!该模型基于 Qwen-Image-Edit,采用 LoRA 的模型结构,专为人脸图像生成而优化,将一张普通的人脸照片转化为质感精美的高质量图像。这个模型目前已经可以在魔搭 AIGC 专区直接体验。 模型链接:https://modelscope.cn/model
国庆假期刚过,AI圈却一点没闲着 DeepSeek、GLM、百灵接连上新,万亿参数、Agentic能力、高效推理全都在卷 Qwen3-VL、Hunyuan-Image 3.0、Wan2.2 Animate 多模态齐发力,视觉理解&生成全面升级✨ 云栖大会魔搭三连发:国际站、科学智能专区、AIGC神器 FlowBench ,开发者工具箱直接拉满! 欄 还有超暖
00前言 凌晨,Qwen3-VL系列再添新成员——Dense架构的Qwen3-VL-8B、Qwen3-VL-4B 模型,本地部署友好,并完整保留了Qwen3-VL的全部表现,评测指标表现优秀。 至此,Qwen3-VL 家族已经覆盖了从轻量级到超大规模的多种需求:除了最新开源发布的小尺寸Dense模型外,还有旗舰版模型混合专家(MoE)架构的Qwen3-VL-235B-A22B,以及小的MoE模型
00前言 最近笔者的GPU服务器出了点故障,因此实验只能依靠一台小小的MacBook轻薄本。结果发现意外的能打,跑一些深度学习模型或者大模型居然也能正常运行。看来买Macbook不完全是法器同样也是生产力 :-)。 本篇教程将带大家了解下如何Macbook来进行Qwen3微调,并且利用苹果自家发的MLX深度学习框架,让Macbook的性能发挥到极致。 01MLX框架简介 MLX框架GitHub地址
前言 生成式多模态模型近年来一直是业界的研究热点。视觉语言模型(VLM)一直是多模态文本生成领域的核心路线,能够完成图像理解任务;扩散模型(Diffusion Model)则一直是图像和视频生成领域的核心方法。今年早期,同时支持图像理解和生成的统一模型如雨后春笋般浮现。统一模型受到青睐,不只是因为它同时支持理解和生成两种任务带来的通用性,更是因为大家看到了任务有机结合带来的多模态学习潜力。一方面,
Jina AI正式推出第三代重排器 Jina Reranker v3。它在多项多语言检索基准上刷新了当前最佳表现(SOTA)。 模型链接: https://modelscope.cn/models/jinaai/jina-reranker-v3 论文链接: https://arxiv.org/abs/2509.25085 这是一款仅有 6 亿参数的多语言重排模型。官方为其设计了名为 “l
今天,我们正式发布Ling 2.0系列的第一款旗舰非思考模型 - 拥有万亿参数的Ling-1T。 推理,是智能的核心表达,更是通用智能体的认知基石。因此,我们持续扩展Ling 2.0 系列模型的自然语言推理能力。Ling-1T沿用Ling 2.0 架构,如其模型代号所示,我们将其扩展至1T(Trillion,万亿)总参数,每个token激活其中约50B参数。Ling-1T-base在20T+ to
**导语**:阿里通义千问团队发布的Qwen3-0.6B-FP8模型,以0.6B参数实现推理能力跃升,支持双模式动态切换与多语言支持,重新定义轻量化AI的性能边界。## 行业现状:边缘计算的"效率革命"2025年,大模型行业正面临"算力饥渴"与"终端需求"的尖锐矛盾。据ModelScope数据显示,企业级AI部署中65%的算力浪费源于任务与模型能力错配——复杂推理任务需要深度思考,而80%...
2025年9月1日,腾讯混元正式开源业界首个翻译集成模型Hunyuan-MT-Chimera-7B,以70亿参数支持33种语言互译(含5种特定语言),并在WMT25国际翻译竞赛中斩获30项冠军,登顶Hugging Face开源热榜。这一突破标志着轻量级翻译模型正式进入"小参数量、大能量"的技术普惠时代。### 行业现状:从参数竞赛到效率革命当前AI翻译领域正面临"重参数依赖"与"落地成本...
还在为AI绘画的高显存门槛发愁?腾讯混元生图2.1 GGUF版本来了!通过模型量化技术,将显存需求降至6G级别,普通消费级显卡也能流畅生成2K分辨率图像,同时提供模块化部署和多版本选择,让AI绘画真正走向轻量化普及。## 行业现状:生图模型的"显存困境"与轻量化突围2025年AI图像生成领域正面临算力需求与普及性之间的尖锐矛盾。根据魔搭ModelScope社区数据,主流文生图模型平均需要12...