Spaces:

Tabish009
/

rekt2.0

Runtime error

Tabish009 commited on Mar 26

Commit

57381b0

•

1 Parent(s): 51b78f1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,13 +1,13 @@
 import streamlit as st
 from transformers import AutoModelForCausalLM, AutoTokenizer
-import subprocess
-subprocess.run(["pip", "install", "accelerate"])
 # Load the model and tokenizer
 @st.cache_resource
 def load_model_and_tokenizer():
-    model_name_or_path = "mistralai/Mistral-7B-Instruct-v0.2"
-    model = AutoModelForCausalLM.from_pretrained(model_name_or_path, device_map="auto")
     tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
     return model, tokenizer
@@ -15,21 +15,21 @@ def load_model_and_tokenizer():
 @st.cache_data
 def generate_response(prompt):
     prompt_template = f'''
-    <|system|>: You are a helpful medical assistant created by M42 Health in the UAE.
     <|prompter|>:{prompt}
     <|assistant|>:
     '''
-    input_ids = tokenizer(prompt_template, return_tensors='pt').input_ids.cuda()
-    output = model.generate(inputs=input_ids, temperature=0.7, do_sample=True, eos_token_id=tokenizer.eos_token_id, pad_token_id=tokenizer.pad_token_id, max_new_tokens=512)
     response = tokenizer.decode(output[0], skip_special_tokens=True)
     return response
 # Streamlit app
 def main():
-    st.title("Med42 - Clinical Large Language Model")
     model, tokenizer = load_model_and_tokenizer()
-    prompt = st.text_area("Enter your medical query:")
     if st.button("Submit"):
         with st.spinner("Generating response..."):
             response = generate_response(prompt)

 import streamlit as st
 from transformers import AutoModelForCausalLM, AutoTokenizer
+import accelerate
 # Load the model and tokenizer
 @st.cache_resource
 def load_model_and_tokenizer():
+    model_name_or_path = "anthropic/mistral-7b"
+    accelerator = accelerate.Accelerator(device_map="auto")
+    model = AutoModelForCausalLM.from_pretrained(model_name_or_path, device_map=accelerator.device_map)
     tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
     return model, tokenizer
 @st.cache_data
 def generate_response(prompt):
     prompt_template = f'''
     <|prompter|>:{prompt}
     <|assistant|>:
     '''
+    input_ids = tokenizer(prompt_template, return_tensors='pt').input_ids
+    with accelerator.autocast():
+        output = model.generate(inputs=input_ids, temperature=0.7, do_sample=True, eos_token_id=tokenizer.eos_token_id, pad_token_id=tokenizer.pad_token_id, max_new_tokens=512)
     response = tokenizer.decode(output[0], skip_special_tokens=True)
     return response
 # Streamlit app
 def main():
+    st.title("Mistral 7B Language Model")
     model, tokenizer = load_model_and_tokenizer()
+    prompt = st.text_area("Enter your query:")
     if st.button("Submit"):
         with st.spinner("Generating response..."):
             response = generate_response(prompt)