metadata
base_model: PlanTL-GOB-ES/roberta-base-bne
datasets: []
language: []
library_name: sentence-transformers
pipeline_tag: sentence-similarity
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:512
- loss:TripletLoss
widget:
- source_sentence: >-
Quin és el requisit per a la potència instal·lada de les instal·lacions de
plaques solars en sòl urbà?
sentences:
- >-
Permet comunicar les intervencions necessàries per executar una
instal·lació/remodelació d’autoconsum amb energia solar fotovoltaica amb
una potència instal·lada inferior a 100 kWp en sòl urbà consolidat.
- Inferior a 100 kWp.
- >-
Aquesta bonificació tindrà caràcter pregat i s’aplicarà a la quota total
si la resolució de la sol•licitud es realitza abans de la liquidació, en
cas contrari es gestionarà la devolució de l’import pagat i bonificat.
- source_sentence: Quins són els exemples d'obres que requereixen una llicència TIPUS B?
sentences:
- >-
Ubicada al carrer de Port Alegre (Platja de Sant Sebastià), els artistes
(dibuix, pintura, gravat i escultura) poden exposar i vendre les seves
obres.
- >-
Col·locació de bastides, arrebossat, estucat i pintat de façanes, noves
obertures, etc.
- >-
TIPUS B Col·locació de bastides a una alçada superior a PB + 1 PP o a
més de 6,00 m Arrebossat, estucat i pintat de façanes que necessiten una
bastida amb una alçada superior a PB + 1 PP o a més de 6,00 m.
- source_sentence: >-
Quin és el propòsit principal del tràmit de canvi de titular de la
llicència de gual?
sentences:
- >-
L'Ajuntament de Sitges atorga subvencions per a les activitats que
realitzen les entitats del municipi que tinguin com a finalitat fomentar
l’activitat física i esportiva al llarg de l’exercici pel qual es
sol·licita la subvenció.
- >-
Aquest tràmit permet a la nova persona titular sol·licitar el canvi de
nom d'una llicència de gual, sempre que no variïn la utilització ni les
característiques de la llicència concedida prèviament, i s’acompleixen
les ordenances vigents.
- >-
Permet el canvi de nom d'una llicència de gual sense variar la
utilització ni les característiques.
- source_sentence: Quin és el propòsit dels ajuts econòmics?
sentences:
- >-
Aquest tràmit permet a la nova persona titular sol·licitar el canvi de
nom d'una llicència de gual, sempre que no variïn la utilització ni les
característiques de la llicència concedida prèviament, i s’acompleixen
les ordenances vigents.
- >-
Ajuts econòmics destinats a reforçar les activitats econòmiques amb
suspensió o limitació d’obertura al públic i per finançar les despeses
de lloguer o hipoteca per empreses i/o establiments comercials
- >-
Reforçar les activitats econòmiques i finançar les despeses de lloguer o
hipoteca.
- source_sentence: Quin és el propòsit del Directori de la Vila?
sentences:
- >-
Consulteu les dades i els horaris de funcionament de la instal·lació al
Directori de la Vila.
- >-
Per consultar les dades i els horaris de funcionament de la
instal·lació.
- >-
Aquelles persones que s'hagin inscrit a les estades esportives
organitzades per l'Ajuntament de Sitges i que formin part d'una unitat
familiar amb uns ingressos bruts mensuals, que una vegada dividits pel
nombre de membres, siguin inferiors entre una i dues terceres parts de
l'IPREM, poden sol·licitar una reducció de la quota d'aquestes
activitats o l'aplicació de la corresponent tarifa bonificada establerta
en les ordenances dels preus públics.
SentenceTransformer based on PlanTL-GOB-ES/roberta-base-bne
This is a sentence-transformers model finetuned from PlanTL-GOB-ES/roberta-base-bne. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: PlanTL-GOB-ES/roberta-base-bne
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 768 tokens
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: RobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("adriansanz/SITGES_robertav1")
# Run inference
sentences = [
'Quin és el propòsit del Directori de la Vila?',
'Consulteu les dades i els horaris de funcionament de la instal·lació al Directori de la Vila.',
'Per consultar les dades i els horaris de funcionament de la instal·lació.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Training Details
Training Dataset
Unnamed Dataset
- Size: 512 training samples
- Columns:
sentence_0
,sentence_1
, andsentence_2
- Approximate statistics based on the first 1000 samples:
sentence_0 sentence_1 sentence_2 type string string string details - min: 12 tokens
- mean: 25.79 tokens
- max: 56 tokens
- min: 11 tokens
- mean: 64.52 tokens
- max: 143 tokens
- min: 4 tokens
- mean: 19.73 tokens
- max: 79 tokens
- Samples:
sentence_0 sentence_1 sentence_2 Quin és el requisit de duració mínima per a obtenir la bonificació de la taxa?
Es concedirà una bonificació del 50 per cent de la quota de la Taxa quan es duguin a terme obres a les vies públiques, que tinguin una duració igual o superior a 1 mes i afectin directament als locals en que es realitzin activitats econòmiques.
1 mes
Quin és el document que cal aportar per a rebre els ajuts?
Aportació de documentació. Ajuts per la reactivació de petites empreses i persones autònomes donades d’alta al règim especial de treballadors autònoms (RETA) amb una antiguitat superior als cinc anys (COVID19)
La documentació.
Quin és el benefici de la inscripció en el Padró Municipal d'Habitants?
La inscripció en el Padró municipal conté com a obligatories les dades personals de Nom i Cognoms, Sexe, Nacionalitat, Lloc i data de naixement, Número de document d'identidad (DNI, NIE, Passaport), i Certificat o títol escolar o académic.
Té una informació actualitzada i correcta.
- Loss:
TripletLoss
with these parameters:{ "distance_metric": "TripletDistanceMetric.EUCLIDEAN", "triplet_margin": 5 }
Training Hyperparameters
Non-Default Hyperparameters
per_device_train_batch_size
: 16per_device_eval_batch_size
: 16num_train_epochs
: 10fp16
: Truemulti_dataset_batch_sampler
: round_robin
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: noprediction_loss_only
: Trueper_device_train_batch_size
: 16per_device_eval_batch_size
: 16per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonelearning_rate
: 5e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1num_train_epochs
: 10max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.0warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Falseignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Falsehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseeval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falsebatch_sampler
: batch_samplermulti_dataset_batch_sampler
: round_robin
Framework Versions
- Python: 3.10.12
- Sentence Transformers: 3.0.1
- Transformers: 4.42.4
- PyTorch: 2.4.0+cu121
- Accelerate: 0.32.1
- Datasets: 2.21.0
- Tokenizers: 0.19.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
TripletLoss
@misc{hermans2017defense,
title={In Defense of the Triplet Loss for Person Re-Identification},
author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
year={2017},
eprint={1703.07737},
archivePrefix={arXiv},
primaryClass={cs.CV}
}