腾讯混元开源手机端离线翻译模型，仅0.4G，支持33种语言

魔搭ModelScope社区

166人浏览 · 2026-04-30 16:44:06

魔搭ModelScope社区 · 2026-04-30 16:44:06 发布

本文转自腾讯混元

五一黄金周马上到了，不少朋友会有出国旅游的计划。然而，出国首要的问题就是语言，你可能用过各种翻译工具，但是大部分的应用，如果要实现好的翻译效果都有一个共同的条件：必须联网。

设想一下：

你在异国自驾，警笛声骤然响起。还没回过神，警察就在窗边用陌生的语言严厉发问。你心跳漏了半拍：是我违章了？还是前面出了什么大事？你手忙脚乱地掏出手机想翻译询问一下，偏偏此时没信号，屏幕上转圈的界面简直让人绝望。到底发生了什么？我应该挪车，下车还是掉头？

在这关键时刻，翻译软件掉链子真的让人绝望。

针对这些难题，腾讯混元团队带来了一份硬核解决方案。

4月29日，腾讯混元推出极致量化压缩版本翻译模型 Hy-MT1.5-1.8B-1.25bit，把支持 33 种语言的翻译大模型压缩至 440MB，无需联网，下载即可直接在手机本地运行，翻译质量优于谷歌翻译。

来看看这个演示，翻译速度真的很快，质量也很好：

演示设备：高通骁龙 865，8GB内存

基于混元翻译大模型Hy-MT1.5打造，翻译效果比肩商用翻译模型

Hy-MT1.5 是腾讯混元团队打造的专业翻译大模型，原生支持 33 种语言、5 种方言/民汉及 1056 个翻译方向。从常见的中英互译，到法语、日语、阿拉伯语、俄语，甚至藏语、蒙古语等少数民族语言，它都能游刃有余地处理。

仅以 1.8B 参数量，Hy-MT1.5 实现了比肩商业翻译 API 和 235B 级大模型的翻译效果。在严格的评测基准中，其翻译质量不仅超越了谷歌翻译等主流系统，更证明了在高效优化下，轻量级模型能够迸发出令人印象深刻的翻译能力。

Hy-MT1.5-1.8B翻译效果评分，详情见文末链接「Hy-MT1.5技术报告」

但问题来了：原始的 1.8B 模型即使在 FP16 精度下，依然占用 3.3GB 内存。对于手机上金子般的内存来说，依然太大、太慢，所以需要量化压缩。

最极致的量化压缩，把模型装进手机

量化压缩，简单来说就是：把模型里原本用16位数字(16-bit)表示的参数转用更低位数字储存。这就像把一幅高清照片压缩成缩略图，文件小了很多，但你还是能看清楚里面的内容。针对不同的手机用户，腾讯特别推出了2-bit 与 1.25-bit 两种极致的量化压缩方案。

不同大小的模型在FLORES-200中外互译的效果评分

2-bit模型：性能与质量的平衡（适用：中高端机型）

2-bit 模型采用了业内顶尖的拉伸弹性量化（SEQ），将模型参数量化至{-1.5，-0.5，0.5，1.5}，并结合量化感知蒸馏，在将模型体积压缩至 574MB 的同时，实现了几乎无损的翻译质量，效果超越上百GB的大模型。在支持 Arm SME2 技术的移动设备上，2-bit 模型能够实现更快速、更高效的推理。