makiart
/

jp-ModernBert-base-preview

Model card Files Files and versions Community

makiart commited on 24 days ago

Commit

f9c3b60

·

verified ·

1 Parent(s): 9d07c8f

Update README.md

Files changed (1) hide show

README.md +8 -5

README.md CHANGED Viewed

@@ -15,6 +15,7 @@ pipeline_tag: fill-mask
 - 総学習トークン数：約300B Tokens
 - パラメータ数：150M
 - 埋め込み抜きパラメータ数：110M
 ## How to Use
@@ -62,13 +63,15 @@ for result in results:
     - マスキングレートは30%
     - 1024のコンテキスト長で約150B Tokens
     - 8192のコンテキスト長で約150B Tokens
-- トークナイザーはtohoku-nlp/bert-base-japanese-v3をベースとしています
-    - 語彙数は50,368です
 - データセット
-  - fineweb2の日本語データのみを利用して学習しました
 ## Evaluation
-ちゃんとした評価はできていません。
 総合学習トークン数的に既存のモデルよりも劣ることが予想されます。

 - 総学習トークン数：約300B Tokens
 - パラメータ数：150M
 - 埋め込み抜きパラメータ数：110M
+- fineweb2 日本語データを利用
 ## How to Use
     - マスキングレートは30%
     - 1024のコンテキスト長で約150B Tokens
     - 8192のコンテキスト長で約150B Tokens
+- トークナイザーはtohoku-nlp/bert-base-japanese-v3をベース
+    - 語彙数は50,368
 - データセット
+    - fineweb2の日本語データのみを利用
+- 計算資源
+    - ABCIから提供いただいた計算資源のうち1ノード(H200 x 8)を利用し、2日間の間で学習
 ## Evaluation
+ちゃんとした評価はできていません😭
 総合学習トークン数的に既存のモデルよりも劣ることが予想されます。