Model Card for Model ID
Model Details
KT-AI/midm-bitext-S-7B-inst-v1๋ฅผ ๋ฏธ์ธํ๋ํ์ฌ ๊ธ์ ๊ธ์ ๊ณผ ๋ถ์ ์ ๊ตฌ๋ถํ๋ ๋ชจ๋ธ
Model Description
- Developed by: ์ฑ์ ์ฌ์๋ํ๊ต 20211421 ํฉ๊ท์
- Finetuned from model: KT-AI/midm-bitext-S-7B-inst-v1
Uses
- NSMC ๋ฐ์ดํฐ์ ์ผ๋ก ๊ธ์ ๊ธ์ ๊ณผ ๋ถ์ ์ ๊ตฌ๋ถํ๋ ๋ชจ๋ธ์ ๋ฏธ์ธํ๋ํจ์ด ๋ชฉ์
- ๋ฌธ์ฅ์ ๊ฐ์ ์ด ๊ธ์ ์ด๋ฉด '1'๋ก, ๊ทธ ์ธ๋ '0'์ผ๋ก ๋ ์ด๋ธ์ ํจ
Training Details
Training Data
- NSMC ๋ฐ์ดํฐ์ ์ train ์คํ๋ฆฟ ์์ชฝ 3,000๊ฐ์ ์ํ์ ํ์ต์ ์ฌ์ฉ
Training Procedure
- 384 ์ํ์ค ๊ธธ์ด
- 300 step์ ํ์ต
Testing Data, Factors & Metrics
Testing Data
- NSMC ๋ฐ์ดํฐ์ ์ test ์คํ๋ฆฟ ์์ชฝ 1,000๊ฐ์ ์ํ์ ํ์ต์ ์ฌ์ฉ
Metrics
Midm ์ ํ๋ | Llama2 ์ ํ๋ | ์ ๋ฐ๋ | ์ฌํ์จ |
---|---|---|---|
0.9 | 0.874 | 0.938 | 0.860 |
- ๋ฏฟ์ ๋ชจ๋ธ์ ๋ฏธ์ธํ๋ํ ๊ฒ์ด ๋ ๋์ ์ ํ๋๋ฅผ ๋ณด์ฌ์ค
Results
Summary
- ์ ๋ต๋ฅ ์ ์ฌ๋ฆฌ๊ธฐ ์ํด 2,000๊ฐ์ ๋ฐ์ดํฐ์ ์ด ์๋ 3,000๊ฐ์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ๋ฃ์ด๋ด
- steps์๋ ์ฌ๋ ค ๋ ๋ฎ์ loss๊ฐ์ด ๋์ค๊ธธ ๊ธฐ๋ํ์
Training procedure
The following bitsandbytes
quantization config was used during training:
- quant_method: bitsandbytes
- load_in_8bit: False
- load_in_4bit: True
- llm_int8_threshold: 6.0
- llm_int8_skip_modules: None
- llm_int8_enable_fp32_cpu_offload: False
- llm_int8_has_fp16_weight: False
- bnb_4bit_quant_type: nf4
- bnb_4bit_use_double_quant: False
- bnb_4bit_compute_dtype: bfloat16
Framework versions
- PEFT 0.7.0
- Downloads last month
- 0
Model tree for guguwon/hw-midm-7B-nsmc
Base model
KT-AI/midm-bitext-S-7B-inst-v1