--- language: - ja license: apache-2.0 library_name: transformers datasets: - llm-book/JGLUE --- # bert-base-japanese-v3-jsts 「[大規模言語モデル入門](https://www.amazon.co.jp/dp/4297136333)」の第5章で紹介している(意味類似度計算)のモデルです。 [cl-tohoku/bert-base-japanese-v3](https://huggingface.co./cl-tohoku/bert-base-japanese-v3)を[JGLUE](https://huggingface.co./datasets/llm-book/JGLUE)のJSTSデータセットでファインチューニングして構築されています。 ## 関連リンク * [GitHubリポジトリ](https://github.com/ghmagazine/llm-book) * [Colabノートブック(訓練)](https://colab.research.google.com/github/ghmagazine/llm-book/blob/main/chapter5/5-4-sts-finetuning.ipynb) * [Colabノートブック(推論)](https://colab.research.google.com/github/ghmagazine/llm-book/blob/main/chapter5/5-4-sts-analysis.ipynb) * [データセット](https://huggingface.co./datasets/llm-book/JGLUE) * [大規模言語モデル入門(Amazon.co.jp)](https://www.amazon.co.jp/dp/4297136333/) * [大規模言語モデル入門(gihyo.jp)](https://gihyo.jp/book/2023/978-4-297-13633-8) ## 使い方 ```python from transformers import pipeline text_sim_pipeline = pipeline( model="llm-book/bert-base-japanese-v3-jsts", function_to_apply="none", ) text = "川べりでサーフボードを持った人たちがいます" sim_text = "サーファーたちが川べりに立っています" # textとsim_textの類似度を計算 result = text_sim_pipeline({"text": text, "text_pair": sim_text}) print(result["score"]) # 3.5703558921813965 ``` ## ライセンス [Apache License 2.0](https://www.apache.org/licenses/LICENSE-2.0)