altomek
/

CodeRosa-70B-AB1

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

altomek commited on Mar 16

Commit

ec5158b

•

1 Parent(s): 2ca2901

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -39,13 +39,14 @@ This model is for personal use, made for myself as experiment. I would like to m
 Setting from Midnight-Rose should work in SillyTavern. This is almost same what I use for testing.
-I use max_seq_len 8K with alpha_value 2,65.
 ### Quants
 - [3.92bpw](https://huggingface.co/altomek/CodeRosa-70B-AB1-3.92bpw-EXL2) --> 40GB VRAM
 - [3.5bpw](https://huggingface.co/altomek/CodeRosa-70B-AB1-3.5bpw-EXL2)
 - [3bpw](https://huggingface.co/altomek/CodeRosa-70B-AB1-3bpw-EXL2)
 - [measurements](https://huggingface.co/altomek/measurements/resolve/main/CodeRosa-AB1_measurement.json) --> ExLlamav2 measurments
 ### PS

 Setting from Midnight-Rose should work in SillyTavern. This is almost same what I use for testing.
+I use max_seq_len 8K with alpha_value 2.65.
 ### Quants
 - [3.92bpw](https://huggingface.co/altomek/CodeRosa-70B-AB1-3.92bpw-EXL2) --> 40GB VRAM
 - [3.5bpw](https://huggingface.co/altomek/CodeRosa-70B-AB1-3.5bpw-EXL2)
 - [3bpw](https://huggingface.co/altomek/CodeRosa-70B-AB1-3bpw-EXL2)
+- [2.4bpw](https://huggingface.co/altomek/CodeRosa-70B-AB1-2.4bpw-EXL2) --> 24GB VRAM
 - [measurements](https://huggingface.co/altomek/measurements/resolve/main/CodeRosa-AB1_measurement.json) --> ExLlamav2 measurments
 ### PS