Add fields to `config.json` needed to be supported by HF TEI server

HuggingFace's [text-embeddings-inference](https://github.com/huggingface/text-embeddings-inference) server expects a certain [format](https://github.com/huggingface/text-embeddings-inference/blob/a059696a33f3b2cd28ce5e69d3195d5b03189d96/router/src/lib.rs#L326) for the `config.json`.
This PR adds the 2 fields missing from the expected config:
- `pad_token_id` (0 because of bert tokenizer)
- `max_position_embeddings` (768)
Any suggestions and corrections are welcome :)

Files changed (1) hide show

config.json +7 -5

config.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
   "activation_function": "swiglu",
   "architectures": [
-    "NomicBertModel"
   ],
-  "attn_pdrop": 0.0,
   "auto_map": {
-    "AutoConfig": "nomic-ai/nomic-embed-text-v1-unsupervised--configuration_hf_nomic_bert.NomicBertConfig",
-    "AutoModel": "nomic-ai/nomic-embed-text-v1-unsupervised--modeling_hf_nomic_bert.NomicBertModel"
   },
   "bos_token_id": null,
   "causal": false,
@@ -17,6 +17,7 @@
   "fused_dropout_add_ln": true,
   "initializer_range": 0.02,
   "layer_norm_epsilon": 1e-12,
   "max_trained_positions": 2048,
   "mlp_fc1_bias": false,
   "mlp_fc2_bias": false,
@@ -26,6 +27,7 @@
   "n_inner": 3072,
   "n_layer": 12,
   "n_positions": 8192,
   "pad_vocab_size_multiple": 64,
   "parallel_block": false,
   "parallel_block_tied_norm": false,
@@ -34,7 +36,7 @@
   "reorder_and_upcast_attn": false,
   "resid_pdrop": 0.1,
   "rotary_emb_base": 1000,
-  "rotary_emb_fraction": 1.0,
   "rotary_emb_interleaved": false,
   "rotary_emb_scale_base": null,
   "rotary_scaling_factor": null,

 {
   "activation_function": "swiglu",
   "architectures": [
+  "NomicBertModel"
   ],
+  "attn_pdrop": 0,
   "auto_map": {
+  "AutoConfig": "nomic-ai/nomic-embed-text-v1-unsupervised--configuration_hf_nomic_bert.NomicBertConfig",
+  "AutoModel": "nomic-ai/nomic-embed-text-v1-unsupervised--modeling_hf_nomic_bert.NomicBertModel"
   },
   "bos_token_id": null,
   "causal": false,
   "fused_dropout_add_ln": true,
   "initializer_range": 0.02,
   "layer_norm_epsilon": 1e-12,
+  "max_position_embeddings": 768,
   "max_trained_positions": 2048,
   "mlp_fc1_bias": false,
   "mlp_fc2_bias": false,
   "n_inner": 3072,
   "n_layer": 12,
   "n_positions": 8192,
+  "pad_token_id": 0,
   "pad_vocab_size_multiple": 64,
   "parallel_block": false,
   "parallel_block_tied_norm": false,
   "reorder_and_upcast_attn": false,
   "resid_pdrop": 0.1,
   "rotary_emb_base": 1000,
+  "rotary_emb_fraction": 1,
   "rotary_emb_interleaved": false,
   "rotary_emb_scale_base": null,
   "rotary_scaling_factor": null,