Commit From AutoNLP

Browse files

Files changed (9) hide show

.gitattributes +2 -0
README.md +60 -0
config.json +31 -0
pytorch_model.bin +3 -0
sample_input.pkl +3 -0
sentencepiece.bpe.model +3 -0
special_tokens_map.json +1 -0
tokenizer.json +0 -0
tokenizer_config.json +1 -0

.gitattributes CHANGED Viewed

@@ -25,3 +25,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.tar.gz filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,60 @@

+---
+tags:
+- autonlp
+- question-answering
+language: unk
+widget:
+- text: "Who loves AutoNLP?"
+  context: "Everyone loves AutoNLP"
+datasets:
+- abhishek/autonlp-data-hindi-question-answering
+co2_eq_emissions: 39.76330395590446
+---
+# Model Trained Using AutoNLP
+- Problem type: Extractive Question Answering
+- Model ID: 23865268
+- CO2 Emissions (in grams): 39.76330395590446
+## Validation Metrics
+- Loss: 0.2826281785964966
+## Usage
+You can use cURL to access this model:
+```
+$ curl -X POST -H "Authorization: Bearer YOUR_API_KEY" -H "Content-Type: application/json" -d '{"question": "Who loves AutoNLP?", "context": "Everyone loves AutoNLP"}' https://api-inference.huggingface.co/models/abhishek/autonlp-hindi-question-answering-23865268
+```
+Or Python API:
+```
+import torch
+from transformers import AutoModelForQuestionAnswering, AutoTokenizer
+model = AutoModelForQuestionAnswering.from_pretrained("abhishek/autonlp-hindi-question-answering-23865268", use_auth_token=True)
+tokenizer = AutoTokenizer.from_pretrained("abhishek/autonlp-hindi-question-answering-23865268", use_auth_token=True)
+from transformers import BertTokenizer, BertForQuestionAnswering
+question, text = "Who loves AutoNLP?", "Everyone loves AutoNLP"
+inputs = tokenizer(question, text, return_tensors='pt')
+start_positions = torch.tensor([1])
+end_positions = torch.tensor([3])
+outputs = model(**inputs, start_positions=start_positions, end_positions=end_positions)
+loss = outputs.loss
+start_scores = outputs.start_logits
+end_scores = outputs.end_logits
+```

config.json ADDED Viewed

	@@ -0,0 +1,31 @@

+{
+  "_name_or_path": "AutoNLP",
+  "architectures": [
+    "XLMRobertaForQuestionAnswering"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "eos_token_id": 2,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "language": "english",
+  "layer_norm_eps": 1e-05,
+  "max_length": 384,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "name": "XLMRoberta",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 24,
+  "output_past": true,
+  "pad_token_id": 1,
+  "padding": "max_length",
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.8.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4389646440fc9cc76317a0d0814db0b58ecfb4bf95f9e483f5251c26abad7f1c
+size 2235534897

sample_input.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:704d1fae4b9a668fba7a46eb5897518ece5cdeb90dab4c9c7abf42e2fe608f7a
+size 2083

sentencepiece.bpe.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
+size 5069051

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "<unk>", "sep_token": "</s>", "pad_token": "<pad>", "cls_token": "<s>", "mask_token": "<mask>"}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"bos_token": "<s>", "eos_token": "</s>", "sep_token": "</s>", "cls_token": "<s>", "unk_token": "<unk>", "pad_token": "<pad>", "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "do_lower_case": false, "model_max_length": 512, "special_tokens_map_file": "germanQA/saved_models/xlm-roberta-large-squad2/special_tokens_map.json", "full_tokenizer_file": null, "name_or_path": "AutoNLP", "sp_model_kwargs": {}, "tokenizer_class": "XLMRobertaTokenizer"}