Ray2333
/

Gemma-2B-rewardmodel-ft

Model card Files Files and versions Community

Ray2333 commited on Sep 13

Commit

0727bdb

•

1 Parent(s): 688084f

Update README.md

Files changed (1) hide show

README.md +1 -0

README.md CHANGED Viewed

@@ -19,6 +19,7 @@ The Skywork preference dataset demonstrates that a small high-quality dataset ca
 ## Evaluation
 We evaluate Gemma-2B-rewardmodel-ft on the [reward model benchmark](https://huggingface.co/spaces/allenai/reward-bench), where it achieves a score of 80.5.
 |       Model               | Average       |  Chat     |     Chat Hard      |     Safety      |     Reasoning     |
 |:-------------------------:|:-------------:|:---------:|:---------:|:--------:|:-----------:|

 ## Evaluation
 We evaluate Gemma-2B-rewardmodel-ft on the [reward model benchmark](https://huggingface.co/spaces/allenai/reward-bench), where it achieves a score of 80.5.
+**When evaluated using reward bench, please add '--not_quantized' to avoid performance drop.**
 |       Model               | Average       |  Chat     |     Chat Hard      |     Safety      |     Reasoning     |
 |:-------------------------:|:-------------:|:---------:|:---------:|:--------:|:-----------:|