lora-midm-7b-nsmc-understanding

This model is a fine-tuned version of KT-AI/midm-bitext-S-7B-inst-v1 on an unknown dataset.

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

kt-ai-midm

llama-2

데이터로딩
- prepare_sample_text() : 시스템 메시지 변경 및 프롬프트 포멧 설정
- create_datasets() : train 데이터 상위 2000개 선택
미세튜닝용 모델 로딩
- script_args : 사용 데이터명 nsmc 설정 및 모델명 KT-AI/midm-bitext-S-7B-inst-v1 설정
- max_steps : 최대 훈련 단계 1500 설정 (300->1000->1500 수정결과 높은 정확도)
- save : 체크포인트 세이브를 위한 파라미터 지정
허깅페이스 push_to_hub 로 push
추론테스트
- 프롬프트 템플릿 수정 및 시스템 메시지 변경
- valid_dataset : test 데이터 상위 1000개 선택
미세튜닝된 모델 로딩 후 테스트
- eval_dic : valid_dataset 학습한 결과 출력
정확도
- valid_dataset 과 모델 훈련 결과 true_labels 를 이용한 정확도 분석