TheBloke
/

bloomz-176B-GPTQ

Text Generation

Model card Files Files and versions Community

TheBloke commited on Jul 6, 2023

Commit

9ad39a2

•

1 Parent(s): a83467e

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -797,9 +797,9 @@ tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True)
 model = AutoGPTQForCausalLM.from_quantized(model_name_or_path,
         model_basename=model_basename,
         use_safetensors=True,
         trust_remote_code=False,
-        device="cuda:0",
         use_triton=use_triton,
         quantize_config=None)

 model = AutoGPTQForCausalLM.from_quantized(model_name_or_path,
         model_basename=model_basename,
+        max_memory={0: '60GiB', 1: '79GiB'} # max_memory is for 2 x 80GB GPUs; adjust if your config is different!
         use_safetensors=True,
         trust_remote_code=False,
         use_triton=use_triton,
         quantize_config=None)