nicolinho
/

QRM-Llama3.1-8B-v2

Model card Files Files and versions Community

nicolinho commited on 21 days ago

Commit

d862cde

·

verified ·

1 Parent(s): 6d326f3

Update modeling_custom.py

Files changed (1) hide show

modeling_custom.py +1 -1

modeling_custom.py CHANGED Viewed

@@ -166,7 +166,7 @@ class LlamaForRewardModelWithGating(LlamaPreTrainedModel):
         with torch.autocast(device_type=rewards.device.type, dtype=torch.float32):
             # [B, num_quantiles, num_objectives]
             reward_quantiles = torch.mean(
-                gating_output.unsqueeze(-1).repeat(1, 1, self.num_objectives) * rewards,
                 dim=1
             )

         with torch.autocast(device_type=rewards.device.type, dtype=torch.float32):
             # [B, num_quantiles, num_objectives]
             reward_quantiles = torch.mean(
+                gating_output.unsqueeze(-1).repeat(1, 1, self.num_quantiles) * rewards,
                 dim=1
             )