samadeniyi
/

lora_lesson_plan_model

@@ -28,7 +28,6 @@ class EndpointHandler:
         self.model = AutoModelForCausalLM.from_pretrained(
             config.base_model_name_or_path,
             return_dict=True,
-            load_in_4bit=True,
             device_map={"": 0},  # Map to CUDA device 0
             trust_remote_code=True,
             quantization_config=bnb_config,

         self.model = AutoModelForCausalLM.from_pretrained(
             config.base_model_name_or_path,
             return_dict=True,
             device_map={"": 0},  # Map to CUDA device 0
             trust_remote_code=True,
             quantization_config=bnb_config,