有可能出一个70B的AWQ或者GPTQ-INT4的量化版本吗?

#4
by weiminw - opened

非常感谢你的工作,在一个80G的H100上,70B的int4 的性价比相对比较好,是否可以出一个呢?

求个8bit的版本

FP8 已经有了

Sign up or log in to comment