zstanjj
/

SlimPLM-Retrieval-Necessity-Judgment

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

zstanjj commited on Feb 22

Commit

5dd20ff

•

1 Parent(s): e906eb8

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -11,7 +11,7 @@ license: llama2
 </div>
 <p align="center">
-📝 <a href="https://arxiv.org/abs/2402.12052" target="_blank">Paper</a> • 🤗 <a href="https://huggingface.co/zstanjj/SlimPLM-Query-Rewriting/" target="_blank">Hugging Face</a> • 🧩 <a href="https://github.com/plageon/SlimPLM" target="_blank">Github</a>
 </p>
 <div align="center">
@@ -38,10 +38,10 @@ params_query_rewrite = {"repetition_penalty": 1.05, "temperature": 0.01, "top_k"
                         "max_new_tokens": 512, "do_sample": False, "seed": 2023}
 # deploy model
-model = AutoModelForCausalLM.from_pretrained("zstanjj/SlimPLM-Search-Necessity-Judgment").eval()
 if torch.cuda.is_available():
     model.cuda()
-tokenizer = AutoTokenizer.from_pretrained("zstanjj/SlimPLM-Search-Necessity-Judgment")
 # run inference
 input_ids = tokenizer.encode(question, return_tensors="pt")

 </div>
 <p align="center">
+📝 <a href="https://arxiv.org/abs/2402.12052" target="_blank">Paper</a> • 🤗 <a href="https://huggingface.co/zstanjj/SlimPLM-Retrieval-Necessity-Judgment/" target="_blank">Hugging Face</a> • 🧩 <a href="https://github.com/plageon/SlimPLM" target="_blank">Github</a>
 </p>
 <div align="center">
                         "max_new_tokens": 512, "do_sample": False, "seed": 2023}
 # deploy model
+model = AutoModelForCausalLM.from_pretrained("zstanjj/SlimPLM-Retrieval-Necessity-Judgment").eval()
 if torch.cuda.is_available():
     model.cuda()
+tokenizer = AutoTokenizer.from_pretrained("zstanjj/SlimPLM-Retrieval-Necessity-Judgment")
 # run inference
 input_ids = tokenizer.encode(question, return_tensors="pt")