Descriptions

SSMモデルにより、LLMの厳しいハードウェア要求を引き下げることを目的にトレーニングしたモデル。 特に日本語への応答を滑らかにすることが主眼。

Result

モデルサイズのためか、学習ステップ数のためかあまりよい応答を返すようにならなかった。

Downloads last month
24
Safetensors
Model size
1.37B params
Tensor type
F32
·
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.

Model tree for chatblanc-ciel/mamba-1.4b

Finetuned
(1)
this model

Datasets used to train chatblanc-ciel/mamba-1.4b