Spaces:

AlirezaF138
/

Hazm

Sleeping

App Files Files Community

AlirezaF138 commited on 28 days ago

Commit

5c9ffe3

verified ·

1 Parent(s): 33901fb

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -18

app.py CHANGED Viewed

@@ -1,25 +1,22 @@
 import gradio as gr
 from hazm import Normalizer, word_tokenize, Lemmatizer, Chunker
-# Define the normalization parameters and their default values
-normalization_params = {
-    'correct_spacing': True,
-    'remove_diacritics': True,
-    'remove_specials_chars': True,
-    'decrease_repeated_chars': True,
-    'persian_style': True,
-    'persian_numbers': True,
-    'unicodes_replacement': True,
-    'seperate_mi': True
-}
 # Initialize Hazm components
 lemmatizer = Lemmatizer()
 chunker = Chunker(model='resources/chunker.model')
-def process_text(text, operations, **kwargs):
     # Initialize the Normalizer with user-selected parameters
-    normalizer = Normalizer(**kwargs)
     result = {}
     if 'normalize' in operations:
         text = normalizer.normalize(text)
@@ -43,10 +40,14 @@ iface = gr.Interface(
     inputs=[
         gr.Textbox(lines=10, label="Input Text"),
         gr.CheckboxGroup(operations, label="Operations"),
-        *[
-            gr.Checkbox(value=default, label=param.replace('_', ' ').capitalize())
-            for param, default in normalization_params.items()
-        ]
     ],
     outputs="json",
     title="Persian Text Processor with Hazm",

 import gradio as gr
 from hazm import Normalizer, word_tokenize, Lemmatizer, Chunker
 # Initialize Hazm components
 lemmatizer = Lemmatizer()
 chunker = Chunker(model='resources/chunker.model')
+def process_text(text, operations, correct_spacing, remove_diacritics, remove_specials_chars, decrease_repeated_chars, persian_style, persian_numbers, unicodes_replacement, seperate_mi):
     # Initialize the Normalizer with user-selected parameters
+    normalizer = Normalizer(
+        correct_spacing=correct_spacing,
+        remove_diacritics=remove_diacritics,
+        remove_specials_chars=remove_specials_chars,
+        decrease_repeated_chars=decrease_repeated_chars,
+        persian_style=persian_style,
+        persian_numbers=persian_numbers,
+        unicodes_replacement=unicodes_replacement,
+        seperate_mi=seperate_mi
+    )
     result = {}
     if 'normalize' in operations:
         text = normalizer.normalize(text)
     inputs=[
         gr.Textbox(lines=10, label="Input Text"),
         gr.CheckboxGroup(operations, label="Operations"),
+        gr.Checkbox(value=True, label="Correct Spacing", interactive=True),
+        gr.Checkbox(value=True, label="Remove Diacritics", interactive=True),
+        gr.Checkbox(value=True, label="Remove Special Characters", interactive=True),
+        gr.Checkbox(value=True, label="Decrease Repeated Characters", interactive=True),
+        gr.Checkbox(value=True, label="Persian Style", interactive=True),
+        gr.Checkbox(value=True, label="Persian Numbers", interactive=True),
+        gr.Checkbox(value=True, label="Unicodes Replacement", interactive=True),
+        gr.Checkbox(value=True, label="Separate 'می'", interactive=True)
     ],
     outputs="json",
     title="Persian Text Processor with Hazm",