登录社区云,与社区用户共同成长
邀请您加入社区
暂无图片
具身智能蓬勃发展的当下,具有泛化性的具身能力至关重要。为了追求这个终极目标,业界发展出了两条技术路线。一条路线从机器人末端动作输出入手,发展出可以直接操作物理世界的VLA模型。但是VLA模型由于其数据稀缺性无法实现泛化。因此有了第二条路线,从本身拥有泛化能力的VLM入手,加速VLM从数字世界迈向物理世界。团队将在此路线上探索的模型称之为具身基础模型。 诚然,已经有一些研究开始了对具身基础模型的初步
本文介绍了如何在星图GPU平台自动化部署Qwen2-VL-2B-Instruct镜像,实现电商商品图片的智能匹配与管理。该多模态模型能够将图片和文本转化为语义向量,高效完成商品图片去重、视觉搜索等任务,提升电商平台的运营效率和用户体验。
本文介绍了如何在星图GPU平台上一键自动化部署AI头像生成器镜像,快速搭建无需代码的AI绘图辅助环境。该工具能将用户简单的文字描述转化为专业、详细的图像生成指令(Prompt),显著降低使用Midjourney、Stable Diffusion等AI绘画工具的门槛,轻松应用于创建个性化头像、角色设计等场景。
本文介绍了如何在星图GPU平台上自动化部署【ollama】LFM2.5-1.2B-Thinking镜像,实现本地轻量级大语言模型的快速应用。该平台简化了部署流程,用户可轻松调用该模型进行智能对话、代码生成等任务,适用于个人学习、辅助编程等轻量级AI应用场景。
本文介绍了如何在星图GPU平台自动化部署Qwen3-TTS-12Hz-1.7B-CustomVoice镜像,实现多语言语音搜索功能。该方案可为跨境电商独立站添加10种语言的语音交互能力,用户通过语音输入即可快速搜索商品,显著提升搜索体验和转化率。
本文介绍了如何在星图GPU平台上自动化部署⚡ Qwen-Image-Lightning镜像,快速生成高质量赛博朋克风格壁纸。依托其4步闪电推理与原生中文理解能力,用户仅需输入中文提示词,即可在RTX 3090/4090上一键产出1024×1024高清壁纸,适用于个性化桌面、创意设计与AI内容生产等场景。
本文介绍了如何在星图GPU平台上自动化部署造相 Z-Image 文生图模型(内置模型版)v2镜像,实现稳定高效的中文文生图能力。依托24GB显存优化与bfloat16全链路支持,用户可在5分钟内完成部署,并快速生成768×768高清水墨风格图像,适用于AI绘画教学、电商配图及提示词工程测试等典型场景。
本文介绍了如何在星图GPU平台上自动化部署🎙️ Qwen3-ASR-0.6B智能语音识别镜像,快速搭建本地语音转文字工具。该工具支持会议录音、语音笔记等音频文件的本地化智能识别,保障数据隐私安全,大幅提升音频内容处理效率。
本文介绍了如何在星图GPU平台上自动化部署🎤Qwen3-ASR-1.7B镜像,实现高效的语音转录功能。通过Python调用API,用户可以批量处理音频文件,自动转换为文本,适用于会议记录、访谈整理等场景,提升工作效率并确保数据隐私安全。
本文介绍了如何在星图GPU平台上自动化部署SmallThinker-3B-Preview镜像,实现高效的AI文本生成与链式推理。该镜像专为国产昇腾910B和寒武纪MLU芯片优化,适用于边缘设备部署,能快速处理需要多步逻辑推理的复杂问题,提升AI推理效率。