Spaces:

Navid-AI
/

Yehia-7B-preview

Running on Zero

App Files Files Community

MohamedRashad commited on about 5 hours ago

Commit

99fe653

verified ·

1 Parent(s): 4c4d967

Update app.py

Browse files

Files changed (1) hide show

app.py +2 -12

app.py CHANGED Viewed

@@ -24,7 +24,6 @@ HEADER = """<div style="text-align: center; margin-bottom: 20px;">
 def respond(
     message,
     history: list[tuple[str, str]],
-    enable_reasoning,
     system_message,
     max_tokens,
     temperature,
@@ -40,7 +39,7 @@ def respond(
     messages.append({"role": "user", "content": message})
     print(messages)
-    inputs = tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True, enable_reasoning=enable_reasoning, return_dict=True).to(device)
     generation_kwargs = dict(inputs, streamer=streamer, max_new_tokens=max_tokens, temperature=temperature, repetition_penalty=repetition_penalty)
     thread = Thread(target=model.generate, kwargs=generation_kwargs)
@@ -54,23 +53,14 @@ chat_interface = gr.ChatInterface(
     respond,
     textbox=gr.Textbox(text_align="right", rtl=True, submit_btn=True, stop_btn=True),
     additional_inputs=[
-        gr.Checkbox(label="Enable reasoning", value=False),
         gr.Textbox(value="أنت يحيى، ذكاءٌ اصطناعيٌّ طورته شركة 'نفيد'، متخصصٌ في التفكير المنطقي والتحليل الدقيق. مهمتك إلهام المستخدمين ودعمهم في رحلتهم نحو التعلّم، النمو، وتحقيق أهدافهم من خلال تقديم حلولٍ ذكيةٍ ومدروسة.", label="System message"),
         gr.Slider(minimum=1, maximum=8192, value=4096, step=1, label="Max new tokens"),
         gr.Slider(minimum=0.0, maximum=1.0, value=0.6, step=0.1, label="Temperature"),
         gr.Slider(minimum=0.0, maximum=2.0, value=1.1, step=0.05, label="Repetition penalty"),
     ],
-    examples=[["من الذى أكل الجبنة ؟"]],
     example_icons=[["💡"]],
     cache_examples=False,
-    # head="<h1 style='text-align:center;'>Yehia 7B Preview</h1>",
-    # head="Yehia 7B Preview",
-    # css="""
-    # .chat-message {
-    #     text-align: right;
-    #     direction: rtl;
-    # }
-    # """,
     theme="JohnSmith9982/small_and_pretty",
 )

 def respond(
     message,
     history: list[tuple[str, str]],
     system_message,
     max_tokens,
     temperature,
     messages.append({"role": "user", "content": message})
     print(messages)
+    inputs = tokenizer.apply_chat_template(messages, return_tensors="pt", add_generation_prompt=True, return_dict=True).to(device)
     generation_kwargs = dict(inputs, streamer=streamer, max_new_tokens=max_tokens, temperature=temperature, repetition_penalty=repetition_penalty)
     thread = Thread(target=model.generate, kwargs=generation_kwargs)
     respond,
     textbox=gr.Textbox(text_align="right", rtl=True, submit_btn=True, stop_btn=True),
     additional_inputs=[
         gr.Textbox(value="أنت يحيى، ذكاءٌ اصطناعيٌّ طورته شركة 'نفيد'، متخصصٌ في التفكير المنطقي والتحليل الدقيق. مهمتك إلهام المستخدمين ودعمهم في رحلتهم نحو التعلّم، النمو، وتحقيق أهدافهم من خلال تقديم حلولٍ ذكيةٍ ومدروسة.", label="System message"),
         gr.Slider(minimum=1, maximum=8192, value=4096, step=1, label="Max new tokens"),
         gr.Slider(minimum=0.0, maximum=1.0, value=0.6, step=0.1, label="Temperature"),
         gr.Slider(minimum=0.0, maximum=2.0, value=1.1, step=0.05, label="Repetition penalty"),
     ],
+    examples=[["ما هى عاصمة فلسطين ؟"]],
     example_icons=[["💡"]],
     cache_examples=False,
     theme="JohnSmith9982/small_and_pretty",
 )