SentenceTransformer based on tanbinh2210/mlm_finetuned_2_phobert
This is a sentence-transformers model finetuned from tanbinh2210/mlm_finetuned_2_phobert on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: tanbinh2210/mlm_finetuned_2_phobert
- Maximum Sequence Length: 256 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Cosine Similarity
- Training Dataset:
- json
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("tanbinh2210/mlm_finetuned_3_phobert")
# Run inference
sentences = [
'hồ_sơ xin thôi quốc_tịch việt_nam bao_gồm những gì ?',
'điều 28 . hồ_sơ xin thôi quốc_tịch việt_nam 1 . hồ_sơ xin thôi quốc_tịch việt_nam bao_gồm : a ) đơn xin thôi quốc_tịch việt_nam ; b ) bản khai_lý_lịch ; c ) bản_sao hộ_chiếu việt_nam , giấy_chứng_minh nhân_dân hoặc giấy_tờ khác quy_định tại điều 11 của luật này ; d ) phiếu lý_lịch tư_pháp do cơ_quan có thẩm_quyền của việt_nam cấp . phiếu lý_lịch tư_pháp phải là phiếu được cấp không quá 90 ngày tính đến ngày nộp hồ_sơ ; đ ) giấy_tờ xác_nhận về việc người đó đang làm thủ_tục nhập quốc_tịch nước_ngoài , trừ trường_hợp pháp_luật nước đó không quy_định về việc cấp giấy này ; e ) giấy xác_nhận không nợ thuế do cục thuế nơi người xin thôi quốc_tịch việt_nam cư_trú cấp ; g ) đối_với người trước_đây là cán_bộ , công_chức , viên_chức hoặc phục_vụ trong lực_lượng_vũ_trang nhân_dân việt_nam đã nghỉ hưu , thôi_việc , bị miễn_nhiệm , bãi_nhiệm , cách_chức hoặc giải_ngũ , phục_viên chưa quá 5 năm thì còn phải nộp giấy của cơ_quan , tổ_chức , đơn_vị đã ra quyết_định cho nghỉ hưu , cho thôi_việc , miễn_nhiệm , bãi_nhiệm , cách_chức hoặc giải_ngũ , phục_viên xác_nhận việc thôi quốc_tịch việt_nam của người đó không phương_hại đến lợi_ích quốc_gia của việt_nam .',
'3 . bản_sao giấy khai_sinh của người con chưa thành_niên cùng thôi quốc_tịch việt_nam theo cha_mẹ hoặc giấy_tờ hợp_lệ khác chứng_minh quan_hệ cha_con , mẹ_con . trường_hợp chỉ người cha hoặc người mẹ thôi quốc_tịch việt_nam mà con chưa thành_niên sinh_sống cùng người đó thôi quốc_tịch việt_nam theo cha hoặc mẹ thì phải nộp văn_bản thỏa_thuận có đủ chữ_ký của cha_mẹ về việc xin thôi quốc_tịch việt_nam cho con . văn_bản thỏa_thuận không phải chứng_thực chữ_ký ; người đứng đơn xin thôi quốc_tịch việt_nam cho con phải chịu trách_nhiệm về tính chính_xác chữ_ký của người kia . trường_hợp cha , mẹ đã chết , bị mất năng_lực hành_vi dân_sự hoặc hạn_chế năng_lực hành_vi dân_sự thì văn_bản thỏa_thuận được thay_thế bằng giấy_tờ chứng_minh cha , mẹ đã chết , bị mất hoặc hạn_chế năng_lực hành_vi dân_sự . 4 . hồ_sơ xin thôi quốc_tịch việt_nam phải lập thành 3 bộ , được lưu_trữ tại văn_phòng chủ_tịch nước , bộ_tư_pháp và cơ_quan thụ_lý hồ_sơ .',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Training Details
Training Dataset
json
- Dataset: json
- Size: 357,018 training samples
- Columns:
query
,pos
, andneg
- Approximate statistics based on the first 1000 samples:
query pos neg type string string string details - min: 5 tokens
- mean: 16.98 tokens
- max: 37 tokens
- min: 17 tokens
- mean: 151.14 tokens
- max: 256 tokens
- min: 3 tokens
- mean: 114.34 tokens
- max: 256 tokens
- Samples:
query pos neg thủ_tục hưởng bảo_hiểm_xã_hội một lần gồm bao_nhiêu bước thực_hiện ?
bước 1 . lập , nộp hồ_sơ nlđ lập hồ_sơ theo quy_định tại mục_9.3 ( thành_phần hồ_sơ ) và nộp cho cơ_quan bhxh nơi cư_trú . bước 2 . cơ_quan bhxh tiếp_nhận hồ_sơ và giải_quyết theo quy_định . bước 3 . nhận kết_quả nlđ nhận kết_quả giải_quyết , gồm : quyết_định về việc hưởng bhxh một lần ; bản quá_trình đóng bhxh ; tiền trợ_cấp .
3 . giải_quyết hưởng bảo_hiểm_xã_hội một lần trong thời_hạn 10 ngày tính đến thời_điểm chấm_dứt hợp_đồng lao_động hoặc thời_điểm giấy_phép lao_động , chứng_chỉ hành_nghề , giấy_phép hành_nghề hết hiệu_lực ( tùy thuộc điều_kiện nào đến trước ) mà người lao_động không tiếp_tục làm_việc theo hợp_đồng lao_động hoặc không được gia_hạn giấy_phép , người lao_động có yêu_cầu hưởng bảo_hiểm_xã_hội một lần nộp hồ_sơ theo quy_định cho cơ_quan bảo_hiểm_xã_hội . trong thời_hạn 05 ngày làm_việc kể từ ngày nhận đủ hồ_sơ theo quy_định , cơ_quan bảo_hiểm_xã_hội có trách_nhiệm giải_quyết và tổ_chức chi_trả cho người lao_động , trường_hợp không giải_quyết thì phải trả_lời bằng văn_bản và nêu rõ lý_do . "
vụ đất_đai thuộc bộ tài_nguyên và môi_trường có những chức_danh lãnh_đạo nào ?
lãnh_đạo vụ 1 . vụ đất_đai có vụ trưởng và không quá 03 phó vụ trưởng . 2 . vụ trưởng vụ đất_đai chịu trách_nhiệm trước bộ_trưởng và trước pháp_luật về mọi hoạt_động của vụ ; ban_hành quy_chế làm_việc của vụ ; ký các văn_bản về chuyên_môn , nghiệp_vụ theo chức_năng , nhiệm_vụ được giao và các văn_bản khác theo phân_công , ủy_quyền của bộ_trưởng . 3 . phó vụ trưởng vụ đất_đai giúp vụ trưởng , chịu trách_nhiệm trước vụ trưởng và trước pháp_luật về lĩnh_vực công_tác được phân_công .
cơ_cấu tổ_chức 1 . lãnh_đạo vụ : a ) lãnh_đạo vụ có vụ trưởng và các phó vụ trưởng do bộ_trưởng bộ nông_nghiệp và phát_triển nông_thôn bổ_nhiệm , miễn_nhiệm theo quy_định ; ...
lãnh_đạo báo pháp_luật việt_nam gồm có những_ai ?
cơ_cấu tổ_chức , biên_chế 1 . cơ_cấu tổ_chức của báo , gồm : a ) lãnh_đạo báo : lãnh_đạo báo gồm tổng_biên_tập và không quá 03 ( ba ) phó tổng_biên_tập . tổng_biên_tập chịu trách_nhiệm trước bộ_trưởng và trước pháp_luật về việc thực_hiện các chức_năng , nhiệm_vụ , quyền_hạn của báo . các phó tổng_biên_tập giúp tổng_biên_tập quản_lý , điều_hành hoạt_động của báo ; được tổng_biên_tập phân_công trực_tiếp quản_lý , điều_hành một_số lĩnh_vực hoạt_động của báo ; chịu trách_nhiệm trước tổng_biên_tập và trước pháp_luật về việc quản_lý , điều_hành những lĩnh_vực công_tác được phân_công . b ) các đơn_vị trực_thuộc báo - ban thư_ký tòa_soạn ; - ban thời_sự chính_trị ; - ban kinh_tế ; - ban nội_chính ; - ban văn_hóa - xã_hội ; - ban bạn_đọc ; - ban doanh_nhân và pháp_luật ; - ban báo pháp_luật điện_tử ; - ban chuyên_đề báo in ; - ban chuyên_đề báo_điện_tử ; - ban trị_sự ; - phòng kế_hoạch - tài_chính . việc thành_lập , tổ_chức lại , giải_thể các đơn_vị trực_thuộc báo tại điểm này do bộ_trưởng quyế...
cơ_cấu tổ_chức , biên_chế 1 . cơ_cấu tổ_chức a ) lãnh_đạo tạp_chí : lãnh_đạo tạp_chí gồm tổng_biên_tập và không quá 03 ( ba ) phó tổng_biên_tập . tổng_biên_tập chịu trách_nhiệm trước bộ_trưởng và trước pháp_luật về việc thực_hiện chức_năng , nhiệm_vụ , quyền_hạn của tạp_chí . các phó tổng_biên_tập giúp tổng_biên_tập quản_lý , điều_hành hoạt_động của tạp_chí ; được tổng_biên_tập phân_công trực_tiếp quản_lý , điều_hành một_số lĩnh_vực hoạt_động của tạp_chí ; chịu trách_nhiệm trước tổng_biên_tập và trước pháp_luật về việc quản_lý , điều_hành các lĩnh_vực đã được phân_công . ...
- Loss:
MultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Evaluation Dataset
json
- Dataset: json
- Size: 357,018 evaluation samples
- Columns:
query
,pos
, andneg
- Approximate statistics based on the first 1000 samples:
query pos neg type string string string details - min: 6 tokens
- mean: 17.15 tokens
- max: 43 tokens
- min: 15 tokens
- mean: 153.03 tokens
- max: 256 tokens
- min: 3 tokens
- mean: 114.34 tokens
- max: 256 tokens
- Samples:
query pos neg kỳ thi tốt_nghiệp thpt quốc_gia được tổ_chức nhằm mục_đích gì ?
“ điều 2 . mục_đích , yêu_cầu 1 . thi tốt_nghiệp thpt nhằm mục_đích : đánh_giá kết_quả học_tập của người học theo mục_tiêu giáo_dục của chương_trình giáo_dục_phổ_thông cấp thpt , chương_trình gdtx cấp thpt ( gọi chung là chương_trình thpt ) ; lấy kết_quả thi để xét công_nhận tốt_nghiệp thpt ; làm cơ_sở đánh_giá chất_lượng dạy , học của trường phổ_thông và công_tác chỉ_đạo của các cơ_quan quản_lý giáo_dục . các cơ_sở giáo_dục đại_học , giáo_dục nghề_nghiệp có_thể sử_dụng kết_quả thi tốt_nghiệp thpt để tuyển_sinh . 2 . kỳ thi tốt_nghiệp thpt ( gọi tắt là kỳ thi ) phải bảo_đảm yêu_cầu nghiêm_túc , trung_thực , khách_quan , công_bằng . ”
" điều 12 . đối_tượng , điều_kiện dự thi 1 . đối_tượng dự thi gồm : a ) người đã học xong chương_trình thpt trong năm tổ_chức kỳ_thi ; b ) người đã học xong chương_trình thpt nhưng chưa thi tốt_nghiệp thpt hoặc đã thi nhưng chưa tốt_nghiệp thpt ở những năm trước ; c ) người đã có bằng tốt_nghiệp thpt , người đã có bằng tốt_nghiệp trung_cấp dự thi để lấy kết_quả làm cơ_sở đăng_ký xét tuyển_sinh ; d ) một_số trường_hợp đặc_biệt khác do bộ_trưởng bộ gdđt quyết_định . "
chánh_án tòa_án quân_sự trung_ương không được hưởng chế_độ phụ_cấp đặc_thù trong trường_hợp nào ?
iii . cách tính trả . 1 . đối_tượng quy_định tại điều 1 thông_tư này được bổ_nhiệm từ tháng nào thì được hưởng chế_độ phụ_cấp đặc_thù từ tháng đó . khi bị miễn_nhiệm , cách_chức , từ trần hoặc thôi giữ chức_danh quy_định tại điều 1 thông_tư này từ tháng nào thì thôi_hưởng chế_độ phụ_cấp đặc_thù từ tháng tiếp_theo . các trường_hợp sau không được hưởng phụ đặc_thù : - thời_gian được cử đi công_tác , làm_việc , học_tập ở nước_ngoài được hưởng 40 % tiền_lương theo quy_định tại khoản 4 , điều 8 nghị_định số 204 / 2004 / nđ-cp ngày 14/12/2004 của chính_phủ ; - thời_gian đi công_tác , học_tập ở trong nước không trực_tiếp làm công_tác chuyên_môn từ 3 tháng trở lên ; - thời_gian bị ốm_đau , thai_sản nghỉ vượt quá thời_hạn quy_định của luật bảo_hiểm_xã_hội ; - thời_gian nghỉ_việc riêng không hưởng lương từ 1 tháng trở lên ; - thời_gian bị đình_chỉ công_tác . 2 . phụ_cấp đặc_thù đối_với một_số chức_danh tư_pháp và thanh_tra trong quân_đội không được tính để hưởng các chế_độ bảo_hiểm_xã_hội , bảo_...
cách tính hưởng phụ_cấp 1 . mức phụ_cấp đặc_thù quy_định tại điều 2 quyết_định này được tính trên mức lương cấp_bậc quân_hàm , ngạch bậc hiện_hưởng hoặc phụ_cấp quân_hàm_cộng phụ_cấp chức_vụ lãnh_đạo và phụ_cấp thâm_niên vượt khung ( nếu có ) . 2 . khi chuyển công_tác khác mà không giữ các chức_vụ , chức_danh quy_định cho các đối_tượng tại điều 2 quyết_định này hoặc nghỉ chuẩn_bị hưu hoặc thôi phục_vụ trong quân_đội thì thôi_hưởng phụ_cấp đặc_thù từ tháng tiếp_theo . 3 . thời_gian không được tính hưởng phụ_cấp đặc_thù , bao_gồm : a ) thời_gian đi công_tác , làm_việc học_tập ở nước_ngoài được hưởng tiền_lương theo quy_định tại khoản 4 điều 8 nghị_định số 204 / 2004 / nđ-cp ngày 14 tháng 12 năm 2004 của chính_phủ về chế_độ tiền_lương đối_với cán_bộ , công_chức , viên_chức và lực_lượng_vũ_trang ; b ) thời_gian nghỉ_việc không hưởng lương liên_tục từ 1 tháng trở lên ; c ) thời_gian nghỉ_việc hưởng bảo_hiểm_xã_hội theo quy_định của pháp_luật về bảo_hiểm_xã_hội ; d ) thời_gian bị đình_chỉ cô...
nhân_viên hải_quan có thuộc đối_tượng được hưởng phụ_cấp ưu_đãi theo nghề đối_với công_chức hải_quan không ?
đối_tượng và phạm_vi áp_dụng tổng_cục trưởng tổng_cục hải_quan và công_chức đã được xếp lương theo các ngạch công_chức hải_quan , gồm : kiểm_tra_viên cao_cấp hải_quan , kiểm_tra_viên chính hải_quan , kiểm_tra_viên hải_quan , kiểm_tra_viên hải_quan ( cao_đẳng ) , kiểm_tra_viên trung_cấp hải_quan , nhân_viên hải_quan . 2 . nguyên_tắc áp_dụng a ) đối_tượng được hưởng phụ_cấp ưu_đãi theo nghề hải_quan quy_định tại khoản 1 mục i thông_tư này là những người được cấp có thẩm_quyền quyết_định bổ_nhiệm vào_ngạch hoặc chức_danh theo quy_định của pháp_luật . b ) công_chức được bổ_nhiệm vào_ngạch hoặc chức_danh nào thì được hưởng phụ_cấp ưu_đãi quy_định đối_với ngạch hoặc chức_danh đó . c ) công_chức được bổ_nhiệm vào ngạch công_chức hải_quan cao hơn ( nâng_ngạch ) mà tổng mức tiền_lương cộng phụ_cấp ưu_đãi theo nghề hải_quan ở ngạch được bổ_nhiệm thấp hơn tổng mức tiền_lương cộng phụ_cấp ưu_đãi theo nghề hải_quan đã hưởng ở ngạch cũ thì được bảo_lưu phần chênh_lệch giữa tổng mức tiền_lương cộng p...
đối_tượng và phạm_vi áp_dụng tổng_cục trưởng tổng_cục hải_quan và công_chức đã được xếp lương theo các ngạch công_chức hải_quan , gồm : kiểm_tra_viên cao_cấp hải_quan , kiểm_tra_viên chính hải_quan , kiểm_tra_viên hải_quan , kiểm_tra_viên hải_quan ( cao_đẳng ) , kiểm_tra_viên trung_cấp hải_quan , nhân_viên hải_quan .
- Loss:
MultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Training Hyperparameters
Non-Default Hyperparameters
overwrite_output_dir
: Trueper_device_train_batch_size
: 48per_device_eval_batch_size
: 48learning_rate
: 1e-05num_train_epochs
: 2warmup_ratio
: 0.1fp16
: Truebatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Truedo_predict
: Falseeval_strategy
: noprediction_loss_only
: Trueper_device_train_batch_size
: 48per_device_eval_batch_size
: 48per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 1e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 2max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Falseignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Falsehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseeval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falseprompts
: Nonebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Click to expand
Epoch | Step | Training Loss |
---|---|---|
0.0168 | 100 | 0.1849 |
0.0336 | 200 | 0.1852 |
0.0504 | 300 | 0.187 |
0.0672 | 400 | 0.1831 |
0.0840 | 500 | 0.175 |
0.1008 | 600 | 0.1703 |
0.1176 | 700 | 0.1671 |
0.1344 | 800 | 0.1687 |
0.1512 | 900 | 0.1567 |
0.1680 | 1000 | 0.1581 |
0.1848 | 1100 | 0.1646 |
0.2016 | 1200 | 0.1489 |
0.2185 | 1300 | 0.1405 |
0.2353 | 1400 | 0.1479 |
0.2521 | 1500 | 0.1442 |
0.2689 | 1600 | 0.137 |
0.2857 | 1700 | 0.1294 |
0.3025 | 1800 | 0.1369 |
0.3193 | 1900 | 0.1362 |
0.3361 | 2000 | 0.1275 |
0.3529 | 2100 | 0.1257 |
0.3697 | 2200 | 0.1228 |
0.3865 | 2300 | 0.1325 |
0.4033 | 2400 | 0.1294 |
0.4201 | 2500 | 0.1277 |
0.4369 | 2600 | 0.125 |
0.4537 | 2700 | 0.1359 |
0.4705 | 2800 | 0.1304 |
0.4873 | 2900 | 0.1225 |
0.5041 | 3000 | 0.1251 |
0.5209 | 3100 | 0.126 |
0.5377 | 3200 | 0.1376 |
0.5545 | 3300 | 0.1307 |
0.5713 | 3400 | 0.1276 |
0.5881 | 3500 | 0.1321 |
0.6049 | 3600 | 0.1297 |
0.6217 | 3700 | 0.1256 |
0.6385 | 3800 | 0.1303 |
0.6554 | 3900 | 0.1184 |
0.6722 | 4000 | 0.1245 |
0.6890 | 4100 | 0.1217 |
0.7058 | 4200 | 0.1326 |
0.7226 | 4300 | 0.1311 |
0.7394 | 4400 | 0.1298 |
0.7562 | 4500 | 0.1328 |
0.7730 | 4600 | 0.1265 |
0.7898 | 4700 | 0.1353 |
0.8066 | 4800 | 0.1328 |
0.8234 | 4900 | 0.1361 |
0.8402 | 5000 | 0.1235 |
0.8570 | 5100 | 0.1429 |
0.8738 | 5200 | 0.1319 |
0.8906 | 5300 | 0.1301 |
0.9074 | 5400 | 0.1337 |
0.9242 | 5500 | 0.1417 |
0.9410 | 5600 | 0.1338 |
0.9578 | 5700 | 0.1384 |
0.9746 | 5800 | 0.1347 |
0.9914 | 5900 | 0.1345 |
1.0082 | 6000 | 0.1422 |
1.0250 | 6100 | 0.1258 |
1.0418 | 6200 | 0.1322 |
1.0586 | 6300 | 0.1189 |
1.0754 | 6400 | 0.1221 |
1.0923 | 6500 | 0.118 |
1.1091 | 6600 | 0.1065 |
1.1259 | 6700 | 0.1102 |
1.1427 | 6800 | 0.0991 |
1.1595 | 6900 | 0.0955 |
1.1763 | 7000 | 0.1042 |
1.1931 | 7100 | 0.0894 |
1.2099 | 7200 | 0.0901 |
1.2267 | 7300 | 0.0901 |
1.2435 | 7400 | 0.0861 |
1.2603 | 7500 | 0.0953 |
1.2771 | 7600 | 0.0872 |
1.2939 | 7700 | 0.0887 |
1.3107 | 7800 | 0.087 |
1.3275 | 7900 | 0.0945 |
1.3443 | 8000 | 0.0843 |
1.3611 | 8100 | 0.0848 |
1.3779 | 8200 | 0.0884 |
1.3947 | 8300 | 0.0945 |
1.4115 | 8400 | 0.0847 |
1.4283 | 8500 | 0.0902 |
1.4451 | 8600 | 0.0945 |
1.4619 | 8700 | 0.0877 |
1.4787 | 8800 | 0.0936 |
1.4955 | 8900 | 0.0906 |
1.5124 | 9000 | 0.0887 |
1.5292 | 9100 | 0.0959 |
1.5460 | 9200 | 0.0927 |
1.5628 | 9300 | 0.0941 |
1.5796 | 9400 | 0.0939 |
1.5964 | 9500 | 0.0995 |
1.6132 | 9600 | 0.0944 |
1.6300 | 9700 | 0.0949 |
1.6468 | 9800 | 0.0966 |
1.6636 | 9900 | 0.0902 |
1.6804 | 10000 | 0.099 |
1.6972 | 10100 | 0.0915 |
1.7140 | 10200 | 0.1024 |
1.7308 | 10300 | 0.1011 |
1.7476 | 10400 | 0.0989 |
1.7644 | 10500 | 0.1017 |
1.7812 | 10600 | 0.1026 |
1.7980 | 10700 | 0.1062 |
1.8148 | 10800 | 0.1094 |
1.8316 | 10900 | 0.0917 |
1.8484 | 11000 | 0.1074 |
1.8652 | 11100 | 0.113 |
1.8820 | 11200 | 0.1066 |
1.8988 | 11300 | 0.1113 |
1.9156 | 11400 | 0.1134 |
1.9324 | 11500 | 0.1175 |
1.9493 | 11600 | 0.1136 |
1.9661 | 11700 | 0.1223 |
1.9829 | 11800 | 0.1088 |
1.9997 | 11900 | 0.1233 |
Framework Versions
- Python: 3.10.14
- Sentence Transformers: 3.3.1
- Transformers: 4.45.1
- PyTorch: 2.4.0
- Accelerate: 0.34.2
- Datasets: 3.0.1
- Tokenizers: 0.20.0
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
- Downloads last month
- 4
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social
visibility and check back later, or deploy to Inference Endpoints (dedicated)
instead.
Model tree for tanbinh2210/mlm_finetuned_3_phobert
Base model
tanbinh2210/mlm_trained_phobert
Finetuned
tanbinh2210/mlm_finetuned_phobert
Finetuned
tanbinh2210/mlm_finetuned_2_phobert