可以正常推理,但推理速度很慢。排查发现问题:torch auto-gptq 版本不对应。

查看官方推荐的版本:

auto-gptq 0.7.1

CUDA 12.1

torch 2.2.1

重新安装:

pip install torch==2.2.1

pip install torchvision==0.17.1

pip install auto-gptq==0.7.1

亲测该版本可正常使用gptq,推理速度恢复正常。
 

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐