nomic-ai
/

nomic-bert-2048

Model card Files Files and versions Community

zpn commited on 3 days ago

Commit

f69b8d1

·

1 Parent(s): c93435c

fix: load_return

Files changed (1) hide show

modeling_hf_nomic_bert.py +3 -1

modeling_hf_nomic_bert.py CHANGED Viewed

@@ -458,7 +458,9 @@ class NomicBertPreTrainedModel(PreTrainedModel):
                 state_dict = filter_shapes(state_dict, model)
             load_return = model.load_state_dict(state_dict, strict=strict)
-        logger.warning(load_return)
         return model
     def _set_gradient_checkpointing(self, module, value=False):

                 state_dict = filter_shapes(state_dict, model)
             load_return = model.load_state_dict(state_dict, strict=strict)
+        # moe models load new weights
+        if getattr(config, "moe_top_k", 0) == 0:
+            logger.warning(load_return)
         return model
     def _set_gradient_checkpointing(self, module, value=False):