Spaces:

sasan
/

KITT

Build error

sasan commited on Jun 21, 2024

Commit

a3debde

1 Parent(s): 491a509

Refactor model.py and requirements.txt for better code organization and remove flash-attn dependency

Files changed (2) hide show

kitt/core/model.py CHANGED Viewed

@@ -347,7 +347,6 @@ def run_inference_ollama(prompt):
 def load_gpu_model():
     import bitsandbytes
-    import flash_attn
     from transformers import AutoModelForCausalLM, AutoTokenizer, LlamaForCausalLM
     tokenizer = AutoTokenizer.from_pretrained(

 def load_gpu_model():
     import bitsandbytes
     from transformers import AutoModelForCausalLM, AutoTokenizer, LlamaForCausalLM
     tokenizer = AutoTokenizer.from_pretrained(

requirements.txt CHANGED Viewed

@@ -6,7 +6,6 @@ wurlitzer
 accelerate
 bitsandbytes
 optimum
-flash-attn
 # auto-gptq
 gradio
 TTS

 accelerate
 bitsandbytes
 optimum
 # auto-gptq
 gradio
 TTS