Spaces:

huggingface
/

keras-chatbot-arena

Running on TPU v5e

martin-gorner commited on Nov 20, 2024

Commit

285adea

1 Parent(s): a2b7758

more bug fixes

Files changed (2) hide show

app.py CHANGED Viewed

@@ -24,7 +24,7 @@ for preset in model_presets:
     chat_template = get_appropriate_chat_template(preset)
     chat_state = ChatState(model, "", chat_template)
     prompt, response = chat_state.send_message("Hello")
-    print("model " + preset + "loaded and initialized.")
     print("The model responded: " + response)
     models.append(model)

     chat_template = get_appropriate_chat_template(preset)
     chat_state = ChatState(model, "", chat_template)
     prompt, response = chat_state.send_message("Hello")
+    print("model " + preset + " loaded and initialized.")
     print("The model responded: " + response)
     models.append(model)

models.py CHANGED Viewed

@@ -41,10 +41,8 @@ def get_default_layout_map(preset_name, device_mesh):
 def log_applied_layout_map(model):
     if "Gemma" in type(model).__name__:
         transformer_decoder_block_name = "decoder_block_1"
-    elif "Llama3" in type(model).__name__ or "Mistral" in type(model).__name__:
         transformer_decoder_block_name = "transformer_layer_1"
-    else:
-        assert (0, "Model type not recognized. Cannot display model layout.")
     # See how layer sharding was applied
     embedding_layer = model.backbone.get_layer("token_embedding")

 def log_applied_layout_map(model):
     if "Gemma" in type(model).__name__:
         transformer_decoder_block_name = "decoder_block_1"
+    else:  # works for Llama, Mistral, Vicuna
         transformer_decoder_block_name = "transformer_layer_1"
     # See how layer sharding was applied
     embedding_layer = model.backbone.get_layer("token_embedding")