denis-gordeev
/

rured2-ner-microsoft-mdeberta-v3-base

Token Classification

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

denis-gordeev commited on Nov 15, 2023

Commit

b700fd2

•

1 Parent(s): 8e998c8

Update README.md

Files changed (1) hide show

README.md +52 -1

README.md CHANGED Viewed

@@ -20,7 +20,58 @@ should probably proofread and complete it, then remove this comment. -->
 Russian NER model fine-tuned on RURED2.
 https://github.com/denis-gordeev/rured2
-# multilabel_ner
 This model is a fine-tuned version of [microsoft/mdeberta-v3-base](https://huggingface.co/microsoft/mdeberta-v3-base) on the None dataset.
 It achieves the following results on the evaluation set:

 Russian NER model fine-tuned on RURED2.
 https://github.com/denis-gordeev/rured2
+This model outputs multiple possible labels for a single token. So for proper usage you can use it like in the following code:
+```
+import torch
+from torch import nn
+from transformers import (AutoTokenizer, AutoModelForTokenClassification,
+                          TrainingArguments, Trainer)
+model_name = "denis-gordeev/rured2-ner-microsoft-mdeberta-v3-base"
+model = AutoModelForTokenClassification.from_pretrained(
+    model_name).to('cuda')
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+def predict(text:str, glue_tokens=False, output_together=True, glue_words=True):
+    sigmoid = nn.Sigmoid()
+    tokenized = tokenizer(text)
+    input_ids = torch.tensor(
+            [tokenized["input_ids"]], dtype=torch.long
+        ).to("cuda")
+    token_type_ids = torch.tensor(
+            [tokenized["token_type_ids"]], dtype=torch.long
+        ).to("cuda")
+    attention_mask = torch.tensor(
+            [tokenized["attention_mask"]], dtype=torch.long
+        ).to("cuda")
+    preds = model(**{"input_ids": input_ids, "token_type_ids": token_type_ids, "attention_mask": attention_mask})
+    logits = sigmoid(preds.logits)
+    output_tokens = []
+    output_preds = []
+    for i, token in enumerate(input_ids[0]):
+        if token > 3:
+            class_ids = (logits[0][i] > 0.5).nonzero()
+            if class_ids.shape[0] >= 1:
+                class_names = [id_to_label[int(cl)] for cl in class_ids]
+            else:
+                class_names = [id_to_label[int(logits[0][i].argmax())]]
+            converted_token = tokenizer.convert_ids_to_tokens([token])[0]
+            new_word_bool = converted_token.startswith("▁")
+            converted_token = converted_token.replace("▁", "")
+            if glue_words and not(new_word_bool) and output_tokens:
+                output_tokens[-1] += converted_token
+            else:
+                output_tokens.append(converted_token)
+                output_preds.append(class_names)
+        else:
+            class_names = []
+    if output_together:
+        return [[output_tokens[t_i], output_preds[t_i]] for t_i in range(len(output_tokens))]
+    return output_tokens, output_preds
+```
+# denis-gordeev/rured2-ner-microsoft-mdeberta-v3-base
 This model is a fine-tuned version of [microsoft/mdeberta-v3-base](https://huggingface.co/microsoft/mdeberta-v3-base) on the None dataset.
 It achieves the following results on the evaluation set: