把“造应用的能力”给到亿万用户——魔搭对AI眼镜生态的5点观察
写在前面:2026年6月初,蚂蚁集团在杭州举办了”智能终端可信连接·生态闭门会暨开发者共创会”,正式发布GPASS。魔搭社区受邀参与了下午的圆桌讨论。这场会聚集了行业里几乎所有重要的AI眼镜玩家,信息密度极高——借这篇文章,魔搭把过去在AI智能硬件赛道上的几点观察分享给大家。
引言:一个所有人都在问的问题
闭门会从下午两点持续到晚上,蚂蚁GPASS、千问眼镜、Rokid、小米、雷鸟、科大讯飞,以及一批光机、芯片、整机ODM厂商,密集分享了各自在AI眼镜领域的最新动作。
而所有讨论最终都汇聚到一个共同的问题——”AI眼镜的iPhone时刻什么时候到?”
关于这个问题,会上听到了不少观点:硬件成熟度、killer app、操作系统之争、用户教育……每一个都是必要条件。
魔搭想补充一个角度——开发者生态:
AI眼镜真正的iPhone时刻,除了硬件、killer app、OS这些大家都在讨论的变量之外,可能还藏在一个更底层的变量里——”普通人能给自己眼镜做应用”成为日常的那一天。
这个判断背后,基于以下几点观察。
第一点观察:生态的”组成单元”变了
我们这个行业讨论”生态”大部分时候用的是同一个公式:
厂商 + 开发者 + 用户
这是手机时代的标准答案:苹果生态汇集了数百万开发者,开发者创造出数百万款 App,App 再触达十几亿用户。这套公式已经被验证成功,但它有一个隐含前提——应用供给是稀缺的。因为开发一款应用需要专业工程能力,需要经过审核,也需要投入推广资源,普通用户几乎被彻底挡在门外。
而AI眼镜时代的生态公式正在变成另一个版本:
厂商 + (开发者 & 用户)
当vibecoding成熟、当MCP/Skill协议把AI应用的开发标准化、当端侧模型门槛持续下降,每一个用户本身就是一个潜在的开发者。这种生态的规模上限不是”你能聚集多少开发者”,是”你有多少用户”。
魔搭社区在今年的一个有意思的观察是:
会写prompt+会拼MCP+会调用模型,已经能做出有用的小工具。做一个眼镜应用,未来会像发一条朋友圈一样简单。
这不是一个修辞。当vibecoding工具足够成熟、当应用从”几万行代码的工程”退化成”prompt + MCP + 模型选择的配方”,应用的创作主体会从专业开发者扩散到所有有想法的普通人。
我们的观点是:vibecoding会让”用户中能成为开发者”的比例发生一个数量级的提升。当这一刻到来,AI眼镜的应用数量会从”百万级”跃升到”数亿级”——那就是质变的临界点。
第二点观察:这不是空想,已经在发生
很多人听到”AI做眼镜应用”会本能怀疑——真的能用吗?真的能解决真需求吗?
讲一个魔搭社区的真实案例。
社区里一位叫”AI研究室帆哥”的独立开发者,100元成本手搓了一副给视障人群用的导航眼镜。硬件用ESP32开发板+摄像头+麦克风+扬声器+IMU;软件用Qwen-Omni-Turbo作为意图分发的大模型,配合YOLO分割模型做盲道实时识别、YOLO-E开放词汇检测+ByteTrack做物品追踪、MediaPipe做手部检测、DashScope Paraformer做语音识别——把这些异构能力组装成一个完整的盲人辅助系统。
功能覆盖盲道导航、过马路辅助(识别斑马线和红绿灯)、物品查找(”帮我找一下红牛”)、实时语音对话四大场景。作者本人蒙眼实测,可以完成上述全部任务。
项目数据:
- GitHub开源后获得1.3K star
- 演示视频全网播放过1000万
- 魔搭社区模型下载1000+(其他开发者在复刻)
- 评论区已经有大量用户在要3D打印文件、加微信、求复现指导
请注意——他不是任何眼镜厂商、不是任何巨头公司,他就是一个人。
这个项目对行业的意义远超出”一个公益项目”本身。它证明了:
- 第一,方法论已经跑通了。一个人通过组合开源模型、调用API、写少量代码,可以做出有真实社会价值、有真实用户的AI眼镜应用场景。这件事在三年前是不可想象的,今天却已经发生了。
- 第二,长尾需求第一次被解锁。”给视障人群做导航眼镜”在传统App Store经济里根本不会有人做——市场太小、ROI太低。但在AI的辅助下,一个有动力的人就能做。这意味着AI眼镜未来会涌现出大量传统商业逻辑下根本不存在的应用。
- 第三,社区飞轮已经开始转。1.3K star、1000次模型下载、评论区无数求复刻——这就是新生态里”应用孵化”的真实样貌。不靠App Store分发,靠社区扩散;不靠付费下载,靠社会价值积累影响力。
帆哥的个人主页:https://www.modelscope.cn/profile/archifancy,欢迎关注。
我们相信,未来3年,魔搭社区里会涌现出100个帆哥、1000个帆哥。这就是AI眼镜生态真正的样子。
这种”用户即开发者”的趋势,不只是魔搭社区的一厢情愿。这次闭门会上,闪猫科技CEO肖乔威分享时也讲了一句让我们印象深刻的话——
“GPASS让AI眼镜的应用开发门槛降到了比较低,让每一个有想法的人成为AI眼镜应用的创造者,不仅仅是使用者。”
第三点观察:未来的”应用”是什么形态?
AI+眼镜的真供需关系匹配,那么,在未来AI眼镜上的”应用”会长成什么样?我们的判断是三层结构——而且每一层都对应着一类生态主体的核心位置:
模型层 | 开源社区的主场
提供开源大模型 + 端侧小模型 + 多模态能力,是所有上层应用的能力底座。魔搭这类开源社区在这一层为开发者提供经过端侧适配评测的模型库——任何想做AI眼镜应用的人不用从零评估”哪个模型能跑在哪颗芯片上、哪个多模态能力够准够快”。
Agent层 | vibecoding平台的主场
开发者(包括普通用户)把模型 + 工具 + 知识封装成可被调用的能力单元——也就是Agent。这些Agent之间是可编排的乐高,不是手机时代各自孤立的App。GPASS这类vibecoding平台在这一层决定了开发体验有多顺、普通用户能不能参与进来——开发体验越好,Agent生态越繁荣。
编排层 | 眼镜厂商的主场
用户的意图被眼镜的OS路由到对应的Agent组合上执行。一个”帮我安排周末出游”的指令,可能同时调用天气Agent、订票Agent、餐厅Agent、地图Agent。眼镜厂商在这一层决定用户体验是丝滑还是卡顿、是聪明还是笨拙——这也是用户感知最强的一层。
三层各有主场、互为依赖:模型层撑起Agent的能力上限,Agent层撑起厂商的应用丰富度,厂商层撑起用户最终的感知。少了任何一层,整个生态都跑不起来。
在这个结构下,应用本身的分布也会发生根本变化:
- 80%是私人应用——用户给自己造的、不会分享、解决自己一个具体场景(比如”帮我记住每个客户的名字和喜好”、”实时把我看到的英文资料翻译成中文”)
- 15%是社交应用——做完觉得有意思,发到社区分享,像朋友圈一样被复制改造(比如一个有趣的拍照特效、一个出门旅行的小助手)
- 只有5%是商业应用——专业团队做的、有数据护城河、规模化分发(比如导航、支付、电商类的重型应用)
而今天的App Store只服务最后那5%。剩下95%的需求过去根本被压抑了。AI眼镜+vibecoding 就是把这95%释放出来。
这也意味着开发者的变现路径会发生根本变化——从手机时代的”App经济”(注意力变现:下载付费、应用内购、广告)转向AI眼镜时代的”API经济”(结果变现:调用计费、订阅分润、任务结算)。
对个人开发者(创作者),收入来自社区影响力、优质模板、定制服务;对专业开发者,收入来自模型分润、MCP/工具包分润、vibecoding工具本身。
第四点观察:厂商真正的胜负手——屋顶、门槛、地基
可能有人会反问:如果人人都是开发者,那厂商还有什么护城河?
我们的观点是:护城河还在,但维度变了。
应用稀缺时代,厂商靠养开发者赢;应用丰富时代,厂商靠让用户”造得爽”赢。胜负手从分发转向了创造。
具体来说,厂商真正要做的事其实只有三件:
- 突破硬件天花板——决定用户能造的应用上限
- 降低创作门槛——决定多少用户能成为创作者
- 守住信任基石——让用户敢把视觉、听觉、位置数据交给眼镜
举一个最直观的例子说明”屋顶”为什么决定一切:苹果手表能预测女生的经期,靠的是手腕温度+HRV+心率+睡眠的多模态融合——这种能力手机做不到,因为手机不持续贴身佩戴。
AI眼镜的硬件天花板比手表更高:第一视角摄像头能持续捕捉面部微表情、麦克风阵列能感知对话的声纹和情绪、眼动追踪能反映认知和情感状态。这意味着AI眼镜可能解锁手机和手表都完全做不到的能力——比如帮直男实时读懂女朋友的真实情绪(一种新形态的”读心术”)、比如通过微表情早期识别抑郁倾向、比如让自闭症儿童看懂他人的社交信号。
硬件天花板每升高一寸,就为开发者打开一类全新的应用可能。这就是为什么”举高屋顶”是厂商最硬的护城河——它不只是参数升级,它是在不断扩大应用想象力的边界。
这三件事中最容易被忽视、但最关键的关系是:门槛可以一直降低,但永远不能穿透地基——便利永远不能以信任为代价。在AI眼镜上,用户造的每一个应用都可能涉及家人人脸、私人对话、生活轨迹。用户不信任你,就不会在你的眼镜上做应用,门槛降到再低也没意义。
第五点观察:魔搭的位置——做AI眼镜生态的”基础设施”
打一个更通俗的比方:魔搭和GPASS这样的平台(类AI眼镜的Cursor),更像是”食材批发市场”和”餐厅”的关系——魔搭把模型、MCP、Skill这些”AI食材”准备好,餐厅(也就是各家工具链平台)用这些食材做出菜来给用户使用。
具体到这次闭门会:GPASS作为面向眼镜厂商和开发者的工具链平台,把”做应用的体验”做到极致;魔搭作为GPASS(以及行业里其他类似工具链)的能力供给方,把”可用的原子能力”做到最丰富。这是一种”工具用魔搭的模型、魔搭通过工具触达更多开发者”的双赢关系。
具体来说,魔搭面向AI眼镜生态会持续输出四类核心能力:
1. 端侧模型库
专门面向AI眼镜场景的小尺寸(0.5B-7B)、低功耗、多模态模型的优选、评测、一键部署能力。让任何vibecoding工具都能从魔搭快速拿到适合眼镜的模型——不用每家都从零开始评测哪些模型能跑在哪些芯片上。
2. MCP工具
把各类硬件能力、服务能力封装成标准MCP工具,让开发者像拼乐高一样组合。MCP是AI时代的”HTTP协议”,魔搭希望成为最丰富的MCP库。这一层做得好,所有面向AI眼镜的工具都能受益。
3. Skill中心
开发者把模型+工具+知识封装成可被调用的Agent技能,在魔搭上发布、被复刻、被分润。这是创作者经济的真正承载体——也是帆哥这样的开发者把作品扩散出去的核心通道。
4. 开发者社区与联合运营
魔搭 2700 万活跃用户,是整个 AI 生态中非常重要的核心资产。我们愿意与 GPASS 这样的工具链平台、与各家眼镜厂商共同举办开发者活动、创作大赛与应用孵化计划,让更多创作者进入 AI 眼镜赛道——这件事任何一家单独推动都很难形成规模,但当产业各方协同起来,效率会提升一个数量级。
魔搭社区作为开放的开源模型社区和平台,汇聚了国内外领先的开源模型与模型服务工具链,也因此成为开发者寻找模型、工具与生态资源时的重要入口。
同样的逻辑也会延续到 AI 眼镜领域:我们不会局限于某一家工具链,也不会只服务于某一家眼镜厂商,而是希望成为所有开发者、工具平台与硬件厂商都能接入和使用的能力底座,持续沉淀最丰富的模型、工具与应用生态。
结语
以手机app驱动的移动互联网时代的伟大,在于把“专业开发者的能力”分发给了亿万用户。下一代生态的伟大,可能会走向另一个方向——把“创造应用的能力”交还给亿万用户本身。
因为 AI 眼镜与手机最大的不同在于:手机上的应用需求相对收敛,聊天、刷视频、打车、外卖等高频场景,少数成熟产品就能覆盖;而眼镜的应用需求天然是发散的,每个人的工作、生活、习惯与即时场景都不一样,少数大厂永远无法穷尽。只有让用户自己参与创造应用,AI 眼镜才能真正解锁“千人千面”的价值。
过去我们把这类人称为“开发者”,而在 AI 眼镜时代,他们也许会被称为“创作者”;甚至不需要一个专门的名字——他们就是每一个希望自己的眼镜更懂自己的普通人。
这背后还有一个更深层的价值:自己创造出来的应用,最贴近自己的真实需求,也最有机会守住自己的隐私边界。到了 AI 时代,这件事会变得越来越珍贵。
期待与所有相信“用户即开发者”的同行者一起,把这一天加速到来。
而这件事不只停留在判断里,也可以从一次真实创作开始。GPASS AI 眼镜智能体开发者大赛已经启动:蚂蚁集团联合 Rokid、雷鸟创新,面向广大开发者征集 AI 眼镜智能体作品。开发者可以在「百宝箱」平台的 GPASS 智能眼镜应用模板上,用工作流从 0 搭建专属智能体,并有机会将作品同步上架 GPASS 智能体商店、进入 Rokid Spatial Joy 26 系列赛候选池。
GPASS 赛道总奖金 15 万元,雷鸟赛道另设专项奖金和眼镜奖励。欢迎每一个对 AI 眼镜有想法的开发者、创作者和普通用户参与,让自己的第一个眼镜智能体真正跑在可穿戴场景里。
大赛详情与报名入口:https://modelscope.cn/events/272
更多推荐




所有评论(0)