Spaces:

sthenno
/

llm-ppls

Paused

sthenno commited on 1 day ago

Commit

5f5be0b

1 Parent(s): 4388d47

chore(misc): minor improvements

Files changed (3) hide show

README.md CHANGED Viewed

@@ -8,7 +8,7 @@ sdk_version: 5.19.0
 app_file: app.py
 pinned: false
 license: gpl-3.0
-short_description: Perplexity calculations
 ---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 app_file: app.py
 pinned: false
 license: gpl-3.0
+short_description: PPL calculations
 ---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py CHANGED Viewed

@@ -41,11 +41,10 @@ def create_interface() -> gr.Blocks:
     manager = ModelManager()
     with gr.Blocks() as demo:
-        gr.Markdown("# Language Model Perplexity Calculator (Sequential Version)")
-        gr.Markdown("Enter Hugging Face model checkpoint names (comma-separated).")
         checkpoint_input = gr.Textbox(
-            label="Checkpoints (e.g. Qwen/Qwen2.5-14B-Instruct)",
             value=", ".join(checkpoints),
         )
@@ -53,7 +52,7 @@ def create_interface() -> gr.Blocks:
         perplexity_btn = gr.Button("Calculate Perplexity")
         load_output = gr.Textbox(label="Model Loading Status", interactive=False)
-        perplexity_output = gr.JSON(label="Perplexity Results")
         # Connect event handlers
         load_btn.click(

     manager = ModelManager()
     with gr.Blocks() as demo:
+        gr.Markdown("# LLM Perplexity")
         checkpoint_input = gr.Textbox(
+            label="Checkpoints",
             value=", ".join(checkpoints),
         )
         perplexity_btn = gr.Button("Calculate Perplexity")
         load_output = gr.Textbox(label="Model Loading Status", interactive=False)
+        perplexity_output = gr.JSON(label="PPL Results")
         # Connect event handlers
         load_btn.click(

utils.py CHANGED Viewed

@@ -43,8 +43,8 @@ def _perplexity(model, tokenizer, text):
     return torch.exp(torch.tensor(loss)).item()
-num_samples: Final[int] = 1500  # Sample size for perplexity calculation
-sample_length: Final[int] = 128  # Maximum length of text to consider for perplexity
 loaded = load_model(checkpoints)

     return torch.exp(torch.tensor(loss)).item()
+num_samples: Final[int] = 500  # Sample size for perplexity calculation
+sample_length: Final[int] = 100  # Maximum length of text to consider for perplexity
 loaded = load_model(checkpoints)