metadata
language:
- ja
base_model:
- weblab-GENIAC/Tanuki-8B-dpo-v1.0
pipeline_tag: text-generation
tags:
- unsloth
- trl
- sft
weblab-GENIAC/Tanuki-8B-dpo-v1.0をファインチューニングして作成した長考モデルです。
language:
- ja
base_model:
- weblab-GENIAC/Tanuki-8B-dpo-v1.0
pipeline_tag: text-generation
tags:
- unsloth
- trl
- sft
weblab-GENIAC/Tanuki-8B-dpo-v1.0をファインチューニングして作成した長考モデルです。