--- language: - ja base_model: - weblab-GENIAC/Tanuki-8B-dpo-v1.0 pipeline_tag: text-generation tags: - unsloth - trl - sft --- weblab-GENIAC/Tanuki-8B-dpo-v1.0をファインチューニングして作成した長考モデルです。