cczhong
/

internlm-chat-7b-4bit-gptq-safetensor

Feature Extraction

Model card Files Files and versions Community

cczhong commited on Jul 7, 2023

Commit

1a8db19

·

1 Parent(s): c42a287

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -1,9 +1,10 @@
 # how to use
 need install "pip install git+https://github.com/cczhong11/AutoGPTQ" before https://github.com/PanQiWei/AutoGPTQ/pull/189 got merged
 ```
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from auto_gptq import AutoGPTQForCausalLM, BaseQuantizeConfig
-quantized_model_dir = "cczhong/internlm-chat-7b-4bit-gptq"
 tokenizer = AutoTokenizer.from_pretrained(quantized_model_dir, trust_remote_code=True)
 model = AutoGPTQForCausalLM.from_quantized(quantized_model_dir, device="cuda:0",trust_remote_code=True)
 response, history = model.chat(tokenizer, "你好", history=[])

+please use cczhong/internlm-chat-7b-4bit-gptq before I figure out why it did not work
 # how to use
 need install "pip install git+https://github.com/cczhong11/AutoGPTQ" before https://github.com/PanQiWei/AutoGPTQ/pull/189 got merged
 ```
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from auto_gptq import AutoGPTQForCausalLM, BaseQuantizeConfig
+quantized_model_dir = "cczhong/internlm-chat-7b-4bit-gptq-safetensor"
 tokenizer = AutoTokenizer.from_pretrained(quantized_model_dir, trust_remote_code=True)
 model = AutoGPTQForCausalLM.from_quantized(quantized_model_dir, device="cuda:0",trust_remote_code=True)
 response, history = model.chat(tokenizer, "你好", history=[])