小红书图像编辑FireRed-Image-Edit v1.1重磅更新:OOTD元素融合、人像一致性大幅提升,社区友好拉满
图像编辑领域迎来重大升级,在 1.0 版本发布不到一个月的时间,小红书 Super Intelligence 团队推出 FireRed-Image-Edit-1.1 。
作为小红书 Super Intelligence Team 在图像生成与编辑领域的又一次重要探索,该模型在处理 ID 一致性编辑 、多元素融合 、人像美妆 、字体风格参考等方面展现出更强实力。同时,支持训练、部署优化全家桶,4.5s 耗时、30GB 显存。目前,该项目代码、技术报告、模型参数、训练蒸馏推理框架均已开源。
开源资源:
- GitHub:https://github.com/FireRedTeam/FireRed-Image-Edit
- 技术报告:https://arxiv.org/abs/2602.13344
- 模型:https://www.modelscope.cn/models/FireRedTeam/FireRed-Image-Edit-1.1
- 体验Demo:https://www.modelscope.cn/studios/FireRedTeam/FireRed-Image-Edit-1.1
1.1版本升级点
优秀的编辑性能
- 前沿的 ID 一致性:开源领域最优的角色身份保持技术,确保人物主体在经历复杂编辑后依然可识别。
- 多元素融合:自由组合 10 余种元素,配备 Agent 智能自动裁剪与拼接功能——告别短提示词的困扰。
- 全面的人像美妆:涵盖数十种风格,从专业级美颜精修、黄皮/橄榄皮提亮,到万圣节女巫妆等各类创意妆容。
- 字体风格参考:保持高保真排版与风格化文字渲染,效果媲美闭源解决方案。
- 专业级照片修复:高质量老照片修复与增强,具备卓越的细节还原能力。
极致的工程优化
- 开放的 LoRA 训练生态:开源完整训练代码,支持自定义风格创作;优化采样器在面对相同任务、尺寸和输入数量时最大化 GPU 效率。
- 极限速度优化:全套
- 加速方案,集成模型蒸馏、量化与静态编译技术——仅需 30GB 显存即可实现 4.5 秒端到端生成。
- 智能 Agent 工作流:自动多图处理流程,轻松应对虚拟试穿等复杂构图场景,无需繁琐的提示词工程。
- 全平台部署支持:原生 ComfyUI 节点支持与 GGUF 轻量级格式兼容,实现无缝生产环境集成。
- 高效的训练方式:提前离线抽取特征,仅调用 VLM 的生成结果(与训练完全隔离),大幅提升模型训练速度。
T2I骨干网络原生的编辑能力
骨干无关的架构设计:基于 Qwen-Image 的文生图模型通过完整的预训练→SFT→RL 流程注入编辑能力,可迁移至任意文生图(T2I)基础模型(Qwen-VL仅调用)。
Show Case
将图2的男人,穿着图2的黑色“New York Bears”棒球夹克和迷彩裤子和蓝黑配色的 AJ1 高帮球鞋,在图1的空旷的橄榄球场上。球场阳光明媚,他带着图2黑色的帽子,帽檐是红色,夹克上的白色条纹在暗光中格外醒目。他的左肩随意地挎着图3那只复古棕色皮质旅行包,包口微微敞开,露出里面图3那个磨损的棕色橄榄球。右手则轻松地拖着图3的白色滑板,板底那威武的黑色狮子图腾在草地映衬下如同猛兽。
图3那只壮实的深棕色斗牛犬安静地蹲坐在他脚边的阴影里,忠诚地望向主人。男人脖子上挂着图2那副黑色 Beats 耳机,地上放着图3那座复古的青铜奖杯,在阳光下下泛着胜利的光芒。整个场景融合了街头潮流与竞技体育的质感,空旷球场、皮革装备的温润光泽、以及滑板带来的街头气息,共同构成了一个关于青春、热爱与赛后孤独的静谧时刻。

将背景换为带自然光效的浅蓝色,身穿浅米色蕾丝领上衣,将发型改为右侧佩戴精致珍珠发夹,同时单手向前抬起握着一把宝剑,另一只手自然摆放。面部微笑。

替换背景为盛开的樱花树场景;更换衣服为黑色西装,为人物添加单肩蓝色书包,单手抓住包带。头发变为高马尾。色调明亮。蹲下。

改变背景为粉色,移除所有竹叶;将人物姿态改为趴在粉色毛绒篮子内,双手撑在下巴下,头部和身体正对镜头,人物位于画面中心,眼神看向前方;更换帽子为带有粉色花朵和粉色耳朵的发带;更换服装为米色毛绒衣物;移除熊猫玩偶;调整面部表情为张嘴笑。

将背景替换为室外湖泊和树木场景;人物身体正向镜头,头部略微偏向画面的左侧,双臂交叉并用右手以及左胳肢窝抱持一个红色小鼓;拉近相机视角。

替换背景为户外场景(包含现代建筑、绿树、水池、金属栏杆);调整人物为站姿,双手自然下垂

替换背景为带有白色墙面、镜子、木质装饰和红色袋子的室内环境;将人物穿着改为浅蓝色衬衫和条纹长裤;为人物添加红色肩带、白色帆布包(包上有红色标志);调整人物姿态使其身体侧向画面的右侧;头部略微向画面右侧倾斜;双手手持一束粉色和白色玫瑰(带有绿色叶子和白色丝带)以及一部手机;拉远相机视角

把图1中的模特换成图2里的长裙和高帮帆布鞋,保持原有姿态和配饰,整体风格统一。

把图1中的白色衬衫和棕色半裙,换成图2里的灰褐色连帽卫衣、黑色侧边条纹裤、卡其色工装靴和同色云朵包,保持模特姿态和背景不变。

把图1中的模特换成图2的红色露肩连衣裙,搭配图3中的卡其色棒球帽、猫眼眼镜、银色链条项链、白色厚底运动鞋和棕色绒面手提包,保持模特姿态和背景不变。

此外我们还提供了两类支持用户自主创作的 lora,一款是 makeuplora,支持自定义上妆功能,一款是 covercraftlora,支持根据参考封面创造自定义封面效果。showcase 如下。
使用象牙白哑光粉底均匀肤色,为眉毛填充浅棕色,眼部晕染浅棕色眼影并加深眼尾,画出自然黑色眼线,粘贴浓密假睫毛,用浅棕色眼影提亮卧蚕;涂抹豆沙色哑光口红并勾勒唇形,在两颊扫上浅粉色腮红,在鼻梁和颧骨处轻扫高光,在面部轮廓处轻扫阴影。

根据参考中的封面效果将用户图生成封面
请在图1添加主标题文本 “谁说我们丑了”,字体样式参考图2中主标题《人!给我开个罐罐》;主标题整体采用横向排版多行错落(非严格对齐),置于图片左下角;在狗狗右下方、贴近前爪附近添加一个手绘“爱心”涂鸦贴纸;增加鱼眼镜头效果

请在图1添加主标题文本 “崽子第一次玩冰”,副标题“坐标:东南休闲公园”,主标题和副标题的字体样式参考图2中主标题“无露营不冬天”,主标题整体采用横向排版多行,主标题添加在画面左侧上方;副标题添加在画面左侧下方,字的层级更小,避免修改和遮挡图1主体关键信息(人物/核心景物)和画面中心。

请在图1添加主标题文本 “暑假大理旅行穿什么☁️”,文字样式和排版参考图2中《冰镇式露营说明书》,主标题放置在图1画面中央区域,主标题环绕人物头部布局;在图1添加副标题文本“Vol.3 {穿搭灵感指南}”,文字样式和颜色参考图2中《Vol.5 {打水仗的夏天}》,层级明显低于主标题,位于主标题右下方。

请在图1添加主标题文本 “我的城里,灯火绚烂”,文本样式参考图2中主标题“邂逅一场夜樱盛宴”。

在各个榜单上达到SoTA

交流社区
欢迎通过以下社群与项目主创、更多社区小伙伴交流反馈 👇

点击直达模型详情:https://www.modelscope.cn/models/FireRedTeam/FireRed-Image-Edit-1.1
更多推荐




所有评论(0)