Remek
/

Llama-3-8B-Omnibus-1-PL-v01-INSTRUCT-GGUF

Text Generation

Inference Endpoints

Model card Files Files and versions Community

Remek commited on Apr 22

Commit

e2b9343

•

1 Parent(s): 86bb45b

Update README.md

Files changed (1) hide show

README.md +1 -0

README.md CHANGED Viewed

@@ -37,6 +37,7 @@ Repozytorium zawiera model Meta Llama-3-8B-Omnibus-1-PL-v01 w wersji polskojęzy
 <img src="Llama-3-8B-PL-small.jpg" width="420" />
 Uwaga!
 * Model będzie dalej rozwijany ponieważ eksperymentuję z a. kolejnymi wersjami datasetu, b. model jest świetną bazą do testowania różnych technik finetunowania (LoRA, QLoRA; DPO, ORPO itd.)
 * Udostępniłem go spontanicznie by użytkownicy mogli go używać i sprawdzać jakość Llama 3 ale w kontekście języka polskiego.
 * Po informacji, że baza była trenowana na 15T tokenów (tylko 5% nie angielskich) uznałem, że to świetna baza do finetuningu. Być może lekkie dotrenowanie modelu za pomocą contingued-pretraining da jeszcze większy uzysk.

 <img src="Llama-3-8B-PL-small.jpg" width="420" />
 Uwaga!
+* Model NIE jest CENZUROWANY. To wersja do zabawy. Nie została ujarzmiona.
 * Model będzie dalej rozwijany ponieważ eksperymentuję z a. kolejnymi wersjami datasetu, b. model jest świetną bazą do testowania różnych technik finetunowania (LoRA, QLoRA; DPO, ORPO itd.)
 * Udostępniłem go spontanicznie by użytkownicy mogli go używać i sprawdzać jakość Llama 3 ale w kontekście języka polskiego.
 * Po informacji, że baza była trenowana na 15T tokenów (tylko 5% nie angielskich) uznałem, że to świetna baza do finetuningu. Być może lekkie dotrenowanie modelu za pomocą contingued-pretraining da jeszcze większy uzysk.