initial commit

Browse files

Files changed (9) hide show

README.md +60 -1
config.json +26 -0
emoji.json +0 -0
generation_config.json +6 -0
pytorch_model.bin +3 -0
special_tokens_map.json +6 -0
tokenizer_config.json +10 -0
training_args.bin +3 -0
vocab.txt +0 -0

README.md CHANGED Viewed

@@ -1,3 +1,62 @@
 ---
-license: mit
 ---

 ---
+language:
+- ja
+datasets:
+- ebisuke/liz-nojaloli-ja-ds
 ---
+# ebisuke/liz-nojaloli-nxja-ja
+## License
+[MIT](https://opensource.org/licenses/MIT)
+ベースとして[abeja/gpt-neox-japanese-2.7b](https://huggingface.co/abeja/gpt-neox-japanese-2.7b)を使用しています。
+## Description
+のじゃロリ風味チャットモデルです。
+[ebisuke/liz-nojaloli-ja](ebisuke/liz-nojaloli-ja)のバリアントです。
+[abeja/gpt-neox-japanese-2.7b](https://huggingface.co/abeja/gpt-neox-japanese-2.7b)をベースとしてファインチューンしています。
+開発者の趣味と個人的な勉強用の為に作成しました。
+いろいろと不足しているのであまり会話は通じません。
+__本モデルは開発中のため、データセットの更新により逐次アップデートされる可能性があります。__
+## Datasets
+ファインチューンでは以下のデータセットのみ使用しています。
+[ebisuke/liz-nojaloli-ja-ds](https://huggingface.co/datasets/ebisuke/liz-nojaloli-ja-ds)
+## Usage
+ユーザーの入力を"`相手は言いました。「（内容）」\n`"で括ってください。
+モデルは"`あなたは言いました。「`"以降の文脈を生成します。
+それ以降も続く場合があるので必要に応じて"`」`"の文字までで打ち切ってください。
+```python
+import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("ebisuke/liz-nojaloli-nxja-ja", use_fast=True)
+model = AutoModelForCausalLM.from_pretrained("ebisuke/liz-nojaloli-nxja-ja", load_in_8bit=True, device_map='auto')
+text = "相手は言いました。「眠いにゃ・・・」 \nあなたは言いました。「"
+token_ids = tokenizer.encode(text, add_special_tokens=False, return_tensors="pt")
+with torch.no_grad():
+    output_ids = model.generate(
+        input_ids=token_ids.to(model.device),
+        max_new_tokens=1000,
+        do_sample=True,
+        temperature=0.7,
+        pad_token_id=tokenizer.pad_token_id,
+        bos_token_id=tokenizer.bos_token_id,
+        eos_token_id=tokenizer.eos_token_id,
+    )
+output = tokenizer.decode(output_ids.tolist()[0],skip_special_tokens=True)
+print(output)
+```
+## Plan
+- RLHFとかに挑戦してみる。
+- プロンプトの記述方法を、既存のチャットモデルのフォーマットに合わせるか検討中。
+- 指示をあまり受け付けない・物を知らない方が好みなので、そういうチューニングは限定的です。

config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "_name_or_path": "abeja/gpt-neox-japanese-2.7b",
+  "architectures": [
+    "GPTNeoXJapaneseForCausalLM"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 31999,
+  "eos_token_id": 31999,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.0,
+  "hidden_size": 2560,
+  "initializer_range": 0.02,
+  "intermediate_multiple_size": 4,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 2048,
+  "model_type": "gpt_neox_japanese",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "rotary_emb_base": 10000,
+  "rotary_pct": 1.0,
+  "tokenizer_class": "GPTNeoXJapaneseTokenizer",
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.29.2",
+  "use_cache": false,
+  "vocab_size": 32000
+}

emoji.json ADDED Viewed

The diff for this file is too large to render. See raw diff

generation_config.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 31999,
+  "eos_token_id": 31999,
+  "transformers_version": "4.29.2"
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0e15d1d42af14e6c4693768b63f738c0cec0f05a1484c622688d8af3bec3e729
+size 5197782249

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "bos_token": "<|startoftext|>",
+  "eos_token": "<|endoftext|>",
+  "pad_token": "<|endoftext|>",
+  "unk_token": "<|endoftext|>"
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "bos_token": "<|startoftext|>",
+  "clean_up_tokenization_spaces": true,
+  "do_clean_text": false,
+  "eos_token": "<|endoftext|>",
+  "model_max_length": 2048,
+  "pad_token": "<|endoftext|>",
+  "tokenizer_class": "GPTNeoXJapaneseTokenizer",
+  "unk_token": "<|endoftext|>"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ac67086803289b2d9688cd5aad0b4c3d7220b506be19228cfa7a288651d85bf
+size 3899

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff