metadata
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:19689
- loss:MatryoshkaLoss
- loss:MultipleNegativesRankingLoss
base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
widget:
- source_sentence: Энэ хэсэг ер нь юуны тухай өгүүлж байна вэ?
sentences:
- "news: “Hi-FI Records”-ын хөгжмийн сүлжээ дэлгүүр долоо хоног бүр борлуулалтаараа тэргүүлж буй шилдэг 10\_ цомгийн жагсаалтыг гаргадаг уламжлалтай. Өнгөрсөн долоо хоногт борлуулалтаараа тэргүүлсэн шилдэг 10 цомгийн жагсаалтыг танилцуулж байна. Дэлгэрэнгүй мэдээллийг www.hi-fi.mn сайтаас авч болно. 1.\_\_ \_Х.Лхагвасүрэн “Харангын Лхагваа” цомог. Үнэ: 15000 төгрөг 2.\_\_ \_Х.Лхагвасүрэн “Тэнгэрлэг андууд” цомог. Үнэ: 15000 төгрөг 3.\_\_ \_“Алтан Ураг” хамтлаг “Made in AltanUrag” цомог. Үнэ: 8000 төгрөг 4.\_\_ \_Д.Болд “Монгол поп” цомог. ҮНэ: 9999 төгрөг 5.\_\_ \_“Никитон” хамтлаг “Нандин шүтээн” цомог. Үнэ: 15000 төгрөг 6.\_\_ \_Л.Балхжав “Миний дуунууд-2011” цомог. Үнэ: 18000 төгрөг 7.\_\_ \_“A Sound”хамтлаг “Зуун наст” цомог. Үнэ: 12000 төгрөг 8.\_\_ \_Д.Ука “I’m in Love”цомог. Үнэ: 15000 төгрөг 9.\_\_ \_н.Азхишиг “Азтай хүүхдийн дуу” цомог. Үнэ: 10000 төгрөг 10.\_\_ \_Г.Тэнүүн “Picnic”цомог. Үнэ: 10000 төгрөг тус тус жагссан байна. М.Дөл"
- >-
Перс хэлт уран зохиолд Рудаки хэмээх нэрийг ихэд эрхэмлэн дуудах болой.
Түүний залуугийн шүлгүүд нь ордныхонд шижир алтаар үнэлэгдэж асан гэдэг
билээ. Рудаки Арарат нутгаас олзлогдсон үзэсгэлэнт боол бүсгүйтэй
холбоотой байсныхаа төлөө, сангийн нэгэн сайдыг “цатгаландаа бүү
галзуур, цагаа болохоор чи ч өлсөнө” гэж шүлэглэн дайрсныхаа төлөө нүдээ
сохлуулан хөөгдсөн гэх домогтой. Нүдгүй болсон найрагч зовлон бэрхийг
ханатал амсч нэгэн шавийнхаа ачаар төрөлх Рудак тосгондоо эргэн иржээ.
Тэрбээр тууль, газээл, рубай, магтаал гунигийн дуулал зэрэг мянга орчим
шүлэг, “Камила Димна хоёр”, “Синдбадын ном” хэмээх хоёр том найраглал
туурвижээ. *** Шанхны чинь сайхан үнэрийг үнэрлээд ч ханашгүй нь Шагнаач
дээ, намайгаа мэлрэгийн уяхан уруулаараа Гишгэж өнгөрсөн элсний чинь
ширхэг бүрд нь мөргөе Гэгээн өлмийн тоосноос магнайдаан адис авья
Бэлзэгний чинь хээний мөр нь хүрсэн болгоныг Бичиг захиа шиг үнсэж,
аминаас харам энрхийлье Ганцхан өдөр л хэрвээ биенд чинь шүргэж чадаагүй
бол Гараан тас
- >-
news: “Бумбардай аргалд явсан нь”. Ийм нэртэй зурган номыг Ерөнхий сайд
Н.Алтанхуяг дэмжин бүтээж, хүүхэд багачуудад бэлэг барьжээ. Номын нээлт
өнөөдөр Төрийн ордонд болж байна. Хүүхдийн номын “хурим”-ыг Төрийн
ордонд хийж буй анхны тохиолдол энэ биз ээ. Ерөнхий сайдын
дэмжлэгтэйгээр Хүүхдийн төлөө үндэсний газраас эрхлэн гаргаж буй
“Бумбардай аргалд явсан нь” хэмээх энэхүү зурган ном 108 цуврал байх
ажээ. Б.ЭНХ
- source_sentence: '"Зөөлөн ай" цомогт багтсан бусад шүлгүүдийн талаар юу мэдэх вэ?'
sentences:
- "news: Яруу найрагч Г.Мэнд-Ооёогийн ӨӨРИЙН ЭГШИГ шүлгийг хүргэж байна. Тэрбээр \"Өөрийн эгшиг\" шүлгээ 2010 онд гаргасан \"Зөөлөн ай\" цомогтоо уншсаныг дүрслүүлжээ. \_ ӨӨРИЙН ЭГШИГ Хээр тал минь үес үесхэн чагнархана Хэн нэгнийг хүлээж, хэзээх цагийг анирлана Гэрэл сүүдэр хоёр уулзаад хагацахын зуурханд Гэтэлгэгч аялгууг хүлээж гэнэ гэнэхэн шүүрс алдана. Тандаа намайг ирэхийн таатай нэгэн мөчлөгт Талын уяхан эгшиг ингэ буйлж байсан, Хэцийн салхин шувуудын жиргээг над руу илгээсэн Хээр талын хамгийн зөөлөн аялгуунд би мэндэлсэн. Өвгөн буурал талынхаа уя туяхан ургамал, би Өвс бүхний шилбэнд салхин үлээж лимбэдэхэд Үүрийн бялзуухай өглөөн удиртгал дуулж жиргэхэд Үүлэн хөшигний цаанаас миний хүлэг янцгаахад Хос чавхдаст морин хуур шигээ хөглөгдөж Хорвоогийн дуут нэгэн биеэ гэдгээ мэдэрсэн Хоршин дуулах гэж тал минь намайг дуудсан, Хонгорхон дэрс бид хоёрыг та л хөг оруулсан. Нуурын хөвөөгөөр адуун туурай бөмбөрдөн өнгөрөхөд Нууцхан сэтгэлд морин хуурын хос чавхдас хөвчирч Гадсаа тойрох өнчин"
- "Вээдийн судраас үндэслэж “Махаабаарата”, “Раамаяна” хэмээх агуу туульсын бүтээлүүд зохиогджээ. Орчлон ертөнцийн ухамсарт тэмүүлэл хэзээ анх үүссэн, тэр цаг үед Вээд үүссэн гэж бичсэн байх нь тааралдана. Вээд гэдэг бол “мэдлэг” хэмээсэн утгатай үг. Аричууд Энэтхэгийн Инд мөрний хөндийд ирж, Энэтхэг-Ари үндэстний шинэ соёл иргэншил бий болсон цаг үеэс Энэтхэгийн соёл дахин сэргэж яруу найраг, ёс заншил, гүн ухаан, дотоод ертөнцийн үлэмж баян сан хөмрөгийг агуулсан хүн төрөлхтний түүх соёлын хамгийн эртний утга зохиол цогцолсон юм. Их арш Вьяасагийн найруулсан “Махаабхаарата” туульсын хэсэг болох “Бхагавата-гийта” дахь яруу найргаас нь төлөөлөл болгон хүн төрөлхтний яруу найргийн ууган дурсгалынх нь хувьд Вээдээс цөөн шадыг толилуулбай. *** Ухаант дээдэс гэдэг маань Угаасаа миний урьдах дүр юм Мэргэн ухаан, итгэл сүжиг нь Миний зүрхнээ бат оршсон юм. орчуулсан Ж.Гэндэндарам Хүннү дуу\_ НТӨ II зуун Хүннү гүрэн хүчирхэгжин мандаж ахуй цагтаа үлэмж их соёлыг цогцлоож буй болгосны ул мөр"
- >-
ажиллагаанд урилгаар оролцлоо. Сонирхуулахад, Монголын "Үндэсний Төв
Архив"-т “Цогт тайж” кино нь негатив, контратив, лаванд, дуу дүрсний
гэсэн таван төрлөөр хадгалагддаг бөгөөд ямар ч тохиолдолд анхны хувилбар
болох негатив хальсыг гадагш гаргахыг хориглодог юм байна. Тиймээс хоёр
улсын хамтын ажиллагааны гэрээний дагуу "Цогт тайж" киног сэргээн
засварлаж, тоон системд хувиргах ажлыг гүйцэтгүүлэхээр киноны хоёр дахь
хувилбарыг Франц руу илгээсэн байна. Францын “Кино Урлагийн Үндэсний
Төв” нэг ангийн 8, хоёр ангийн 7 бүлэг нийт 15 бүлгийг Full HD, LCD
зурагтаар гаргахад шаардлага хангахуйц болгон засварлажээ. 1945 онд
"Цогт тайж" киног бүтээхэд тэр үеийн Монгол улсын жилийн төсвийн гуравны
нэгтэй тэнцэх хөрөнгийг зарцуулсан байна. "Цогт тайж" кино нь Монголын
кино урлагийн түүхэнд "Алтан үеийнхэн" хэмээн мөнхөрсөн мэргэжлийн уран
бүтээлчдийн ур чадварыг сорьсон, нөр их хүч хөдөлмөр, хөрөнгө мөнгө
зарцуулсан гайхамшигт бүтээл юм. Эрхэм уншигч, үзэгч та "Цогт тайж"
киног "Full HD"
- source_sentence: >-
Бор өнгийн Penny Loafer гуталтай өмсөх оймсын өнгө, хээтэй холбоотой
зөвлөгөө өгнө үү
sentences:
- "news: Хувцсыг зохицуулан өмсөж мэддэг залуу бол оймсыг хүртэл загварлаг хослуулан өмсөхөө мэдэх ёстой. Хэдий үнэтэй сайн гутал өмссөн ч оймстой тань зохицохгүй байвал ямар ч үнэ цэнэгүй муухай харагдана. Иймээс эрчүүд оймсоо хэрхэн яаж сонгож ѳмсѳх тухай хүргэж байна. Oxford Эрэгтэй хүнд болгонд байдаг Oxford гутланд хээтэй оймсыг өмсвөл илүү зохимжтой. Гэвч ажилдаа явахдаа хэтэрхий өнгөлөг биш бараандуу өнгийн хээтэй оймсыг өмсөөрэй. Хар өнгийн Oxford өмсөхдөө дан өнгийн оймс ѳмсвѳл илүү тохирожтой. Тод өнгийн оймсыг сонгон өмсвөл энгийн хувцаслалтанд илүү их өнгө нэмэн харагдуулна. \_ Penny Loafer Бор өнгийн Penny Loafer-той хамгийн их зохицох оймс нь судалтай оймс юм. Өнгөлөг өнгийн судалтай оймстой хослуулан өмссөн тохиолдолд өмдөө бага зэрэг нугалвал илүү зохимжтой. Усан цэнхэр өнгийн Penny Loafer гутланд өнгө холилдсон оймс өмсвөл илүү хээнцэр харагдана. \_ Sneakers пүүз (кэт) Цагаан өнгийн пүүзтэй ямарч өнгийн оймс зохицоно. Пиджакан хослолын доор цагаан өнгийн пүүз өмсөхдөө"
- >-
news: Соёлын гавьяат зүтгэлтэн, яруу найрагч С.Оюуны “Цахим болор цом”
яруу найргийн наадмын талаар мэдээлэл хийлээ. Тэрээр энэ үеэр “Энэ жил
цахимаар буюу интернэт хэлбэрээр яруу найргийн наадмыг хийхээр болсон.
учир нь цахим орчинд бол ханаа ч шүлгүүдээ явуулах боломжтой бөгөөд тус
наадам хоёр жилд нэг удаа зохион байгуулж байхаар болсон. Шүүгч дээр нь
бүх яруу найрагчид ажиллана. Энэ онд бид 20 шилдэг шүлгийг шалгаруулна.
Шүлгүүдийг арванхоёрдугаар сарын 25-ыг хүртэл бүртгэж авна. Нэг хүн
гурван шүлэг явуулах боломжтой бөгөөд шүлгийн сэдэв чөлөөтэй байна” гэв.
Н.БАТ
- >-
news: Баз Лурманы бүтээж байгаа “The Get Down” хөгжмийн олон ангит
кинонд Уилл Смитийн хүү Жейден тоглож байгаа тухай Variety мэдээлжээ.
М.Найт Шьямаланы “Манай эриний дараа” (2013) кинонд тоглосон бага-Смит
Өмнөд Бронкс дүүрэгт өссөн граффит зураач Маркус “Диззи” Киплингийн
дүрийг бүтээх юм. Түүний дүрийн сонголтыг маш зөв хийсэн гэж найруулагч
Лурман онцолжээ. “Үзэгчид Жейденийг багаас нь мэднэ. Жейден сүүлийн үед
ажил их шаардсан ноцтой дүр бүтээх эрмэлзлэлтэй байгаа. Энэ дүр нь
түүнийг мэргэжлийн жүжигчин болоход нь шалгуур болно” хэмээн Лурман
ярьжээ. Олон ангит киноны үйл явдал 70-аад онд Нью-Йоркт өрнөх бөгөөд
хип-хоп сонирхсон өнгөт арьстан өсвөр насныхны дүрүүдийг залуу жүжигчид
бүтээх аж. “Sony Pictures Television”-ы “The Get Down” киног цувралуудыг
Netflix үзүүлэх төлөвлөгөөтэй байгаа ажээ. Бэлтгэсэн Ш.МЯГМАР
- source_sentence: Та энэ мэдээнээс өөр юу мэдэж авсан бэ?
sentences:
- "news: Канадын зохиолч Алис Мунро Нобелийн уран зохиолын шагналын эзэн боллоо. Канадын нэгэн жижиг хотын 82 настай, буурал үстэй зохиолчийг Нобелийн шагналын хороо “Орчин цагийн богино өгүүллэгийн мастер” хэмээн нэрлэжээ.\_ Амьдралдаа алдсан ч үл сөхрөх бүсгүйчүүдийн хайр дурлал, амьдрал, итгэлийн тухай “нарийн ширхэгтэй” өгүүллэгүүд бичсэн Алис Мунрог XIX-р зууны Оросын богино өгүүллэгийн нэрт мастер А.П.Чеховтой зүйрлэж, Канадын Чехов гэх хүмүүс ч байгаа юм. Канадын Онтарио хотын Клинтон хэмээх жижиг сууринд нам гүмхэн амьдардаг Алис Мунро нэгэн өдөр унтаад сэрэхдээ Нобелийн шагналтан болсон байжээ. Охин нь түүнийг сэрээхдээ “Та шагнал авчихаж” гэсэн мэдээ дуулгажээ. \_ Салахын аргагүй богино өгүүллэгүүд XIX-XX-р зууны эхээр ид дэлгэрч байсан богиго өгүүллэгийн төрөл тууж, үргэлжилсэн үгийн зохиолд байр сууриа алдаж, арын суудалд удаан суусан билээ. Алис Мунрогийн ачаар маш сонирхолтой өрнөлтэй, өвөрмөц дүрүүдтэй богино өгүүллэгүүд эргэн ирж байгаа аж. Түүний"
- >-
суут А.С.Пушкин, сонгодог яруу найрагч Тютчев, Америкийн Эмерсон, Эдгар
По нартай үе чацуутан төдийгүй, сэтгэлгээгээр ч, яруу найргаараа ч, соён
гэгээрүлэх үйлсээрээ ч дутуугүй. Ийм л учраас би дэлхийн яруу найргийн
цэцэрлэгт хүрээлэнд өөрийн үндэстний яруу найргийг нилээд томоор гарган
тавих мөрөөдлөө биелүүлж буй нь энэ юм. Зөв бурууг хойч үе шүүх буй заа.
-Та яагаад антологио “Гурван зуун шүлэгт” гэж нэрлэсэн бэ? Монголчуудын
цоморлиг бүтээж цогцлоох уламжлалд иймэрхүү нэр байдаг л даа. Миний
антологид “Бүх цаг үеэс сонгосон яруу найргийн дээж” гэж тодотгосон
байгаа. Миний хувьд анхны оролдлого тул энэ удаа 300 хүргэлээ. Дараа нь
500 шүлэгт, 1000 шүлэгт хэмээн нэмэгдэх магадлалыг бас бодолцсон юм.
-“Гурван зуун шүлэгт” антологийг манайд буй дэлхийн яруу найргийн бүхий
л сор дээж гэж үзэж болох уу? -Бололгүй яахав. Өдгөө хүртэлх монгол
хэлнээ орчуулагдсан яруу найргаас дээжлэн сонгосон. Орчуулгын олон дуу
хоолой, ур чадварыг харсан. Гэхдээ энэ бол зөвхөн миний л сонголт
гэдгийг
- >-
news: Алдарт “Цогт тайж” киноны сэргээн засварласан эх хувь болон
дижитал хувилбарыг хүлээн авах ёслолын ажиллагаа ДБЭТ-т өнөөдөр боллоо.
Энэ үйл явдал Монгол Улсад кино урлаг үүсч хөгжсөний 80 жил, “Цогт тайж”
киноны 70 жил, Монгол-Францын хооронд дипломат харилцаа тогтоосны 65
жилийн ойтой давхцаж байгаагаараа онцлог юм. Францын “CNC” кино урлагийн
төв нь хоёр улсын Засгийн Газрын хамтын ажиллагааны гэрээний дагуу “Цогт
тайж” киноны эх хувилбарыг сэргээн засварлах ажлыг хэрэгжүүлж, киноны
контратив хувийг сэргээн засварласан хувилбарыг 2011 онд манай талд
хүлээлгэн өгсөн юм. Энэ удаа сэргээн засварлалт хийж, хуулбарласан 15
бүлэг, тоон хэлбэрт шилжүүлсэн хоёр хувь бүтээлийг өнөөдөр БСШУЯ-нд
хүлээлгэн өгч байна. Энэ талаар БНФУ-аас Монгол Улсад суугаа Онц бөгөөд
Бүрэн эрхт Элчин сайд Ив Дэлунэ “Цогт тайж та бүхний мэдэж байгаачлан
Монголын эртний киноны нэг. Франц улс кино урлагийн орон гэдэг утгаараа
их онцлог. Манай улсад Кино урлагийн үндэсний төв хэмээх байгууллага
бий. Энэхүү
- source_sentence: Энэ нийтлэлээс та юу ойлгож авсан бэ?
sentences:
- "news: Нобелийн уран зохиолын шагналтан Элис Мунро \"Чи чинь ингэхэд хэн сэн билээ?\" Уран зохиолын Нобелийн шагнал ухаарал төрүүлсэн, энгийн, уянгын\_ өгүүллэгүүдэд очлоо. Тэр нь өдөөн хатгалт уу эсвэл хүний ердийн амьдралыг сануулсан хэрэг үү? хэмээн РИА Новости агентлагийн улс төрийн тоймч Дмитрий Косырев бичжээ. Фото: AFP 2013/ Peter Muhly РИА Новости агентлагийн улс төрийн тоймч Дмитрий Косырев Нобелийн уран зохиолын шагналтан болон шагналын хорооны талаар бичжээ. \"Чи чинь ингэхэд хэн сэн билээ?\"\_ Дөнгөж сая 2013 оны уран зохиолын Нобелийн шагналын эзэн болсон Канадын зохиолч эмэгтэй Элис Мунрогийн өгүүллэгийн нэр юм л даа. Зураглалаа номын дэлгүүрээс үргэлжлүүлье. Уран зохиолд хамаатай Нобелийн хорооны мэдээг тэндээс өөр хаанаас авах билээ? Мэдээж, номын дэлгүүрт. Энэ бол дэлхийн аваргын ямар нэгэн тэмцээний шигшээг спорт-бааранд үзэхтэй адил зүйл билээ. Хөөрөл, хүлээлт, ялагчийг зарласны дараах агшин... Тийм зохиолч гэж байхгүй Ингээд, Москвагийн шилдэг хоёр номын дэлгүүрийн нэгээр"
- "өнгийн пүүзтэй ямарч өнгийн оймс зохицоно. Пиджакан хослолын доор цагаан өнгийн пүүз өмсөхдөө саарал, хар өнгийн болон саармаг өнгийн оймс өмсвөл илүү зохимжтой. Тод өнгийн өмдөн доор цагаан өнгийн пүүз өмсөхдөө өмднөөсөө илүү тод өнгийн оймсыг өмсөөрэй. Өнгөлөг өнгийн пүүзэнд адилхан өнгийн оймс эсвэл өмсөж буй өмднийхөө өнгөтэй оймс илүү зохино. Ингэхдээ өмднийхөө түрүүг тойгныхоо яс хүртэл нугалж өмсөөрэй. Бүх гутлын оймстой өмсдөг биш бөгөөд зарим нэг гутал оймсгүй өмсвөл илүү гоё харагддаг. \_ Slip On Үдээс болон товч байхгүй Slip On гутлыг оймсгүй өмсөхгүйгээр хөлнийхөө ясыг хагадуулж өмсвөл илүү өндөр, зохимжтой харагдуулна. \_ Boat Shoes Boat Shoes ч бас оймс өмсөхгүй өмсөөрэй. Дээрээ баантаглаж үдсэн арьсаар хийсэн энэхүү гуталны загвар өөрөө өвөрмөц тул заавал оймс өмсөх шаардлагагүй. Б.СОНИНБИЛЭГ"
- >-
энэ хоёрыг сэдвийг холбон бичсэнээрээ ихээхэн ач холбогдолтой,
сонирхолтой болсон ” хэмээн орчуулагчид номынхоо гол санааг тайлбарлав.
Нээлтийн үеэр мөн Монголын бизнесийн хөгжлийн холбооны зүгээс хэлэхдээ:
“Ирээдүйд дасан зохицож, өөртөө хөрөнгө оруулж, карьераа ахиулах нь гэх
дэд гарчигтай нэн шинэлэг уг номыг орчин цагийн мэргэжилтнүүд, бизнес
эрхлэгчид маань шимтэн уншаасай, дэлхийн шилдэг мэргэжилтнүүд,
компаниудаас бидэнд сурах юм их байгааг олж харна гэдэгт итгэлтэй байна”
хэмээв. “Та өөрөө старт-ап компани” ном өнөөдрөөс эхлэн номын
дэлгүүрүүдээр 19,900 төгрөгийн үнэтэйгээр зарагдаж байна. Ч.БОЛ
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- cosine_accuracy@1
- cosine_accuracy@3
- cosine_accuracy@5
- cosine_accuracy@10
- cosine_precision@1
- cosine_precision@3
- cosine_precision@5
- cosine_precision@10
- cosine_recall@1
- cosine_recall@3
- cosine_recall@5
- cosine_recall@10
- cosine_ndcg@10
- cosine_mrr@10
- cosine_map@100
model-index:
- name: >-
SentenceTransformer based on
sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
results:
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: Unknown
type: unknown
metrics:
- type: cosine_accuracy@1
value: 0.3077984817115252
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.5127674258109041
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.6031746031746031
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.7329192546583851
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.3077984817115252
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.17092247527030136
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.12063492063492062
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.0732919254658385
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.3077984817115252
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.5127674258109041
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.6031746031746031
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.7329192546583851
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.5057985789244407
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.4349061202580869
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.44616931572794133
name: Cosine Map@100
SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
This is a sentence-transformers model finetuned from sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
- Maximum Sequence Length: 128 tokens
- Output Dimensionality: 384 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("gmunkhtur/finetuned_paraphrase-multilingual")
# Run inference
sentences = [
'Энэ нийтлэлээс та юу ойлгож авсан бэ?',
'news: Нобелийн уран зохиолын шагналтан Элис Мунро "Чи чинь ингэхэд хэн сэн билээ?" Уран зохиолын Нобелийн шагнал ухаарал төрүүлсэн, энгийн, уянгын\xa0 өгүүллэгүүдэд очлоо. Тэр нь өдөөн хатгалт уу эсвэл хүний ердийн амьдралыг сануулсан хэрэг үү? хэмээн РИА Новости агентлагийн улс төрийн тоймч Дмитрий Косырев бичжээ. Фото: AFP 2013/ Peter Muhly РИА Новости агентлагийн улс төрийн тоймч Дмитрий Косырев Нобелийн уран зохиолын шагналтан болон шагналын хорооны талаар бичжээ. "Чи чинь ингэхэд хэн сэн билээ?"\xa0 Дөнгөж сая 2013 оны уран зохиолын Нобелийн шагналын эзэн болсон Канадын зохиолч эмэгтэй Элис Мунрогийн өгүүллэгийн нэр юм л даа. Зураглалаа номын дэлгүүрээс үргэлжлүүлье. Уран зохиолд хамаатай Нобелийн хорооны мэдээг тэндээс өөр хаанаас авах билээ? Мэдээж, номын дэлгүүрт. Энэ бол дэлхийн аваргын ямар нэгэн тэмцээний шигшээг спорт-бааранд үзэхтэй адил зүйл билээ. Хөөрөл, хүлээлт, ялагчийг зарласны дараах агшин... Тийм зохиолч гэж байхгүй Ингээд, Москвагийн шилдэг хоёр номын дэлгүүрийн нэгээр',
'өнгийн пүүзтэй ямарч өнгийн оймс зохицоно. Пиджакан хослолын доор цагаан өнгийн пүүз өмсөхдөө саарал, хар өнгийн болон саармаг өнгийн оймс өмсвөл илүү зохимжтой. Тод өнгийн өмдөн доор цагаан өнгийн пүүз өмсөхдөө өмднөөсөө илүү тод өнгийн оймсыг өмсөөрэй. Өнгөлөг өнгийн пүүзэнд адилхан өнгийн оймс эсвэл өмсөж буй өмднийхөө өнгөтэй оймс илүү зохино. Ингэхдээ өмднийхөө түрүүг тойгныхоо яс хүртэл нугалж өмсөөрэй. Бүх гутлын оймстой өмсдөг биш бөгөөд зарим нэг гутал оймсгүй өмсвөл илүү гоё харагддаг. \xa0 Slip On Үдээс болон товч байхгүй Slip On гутлыг оймсгүй өмсөхгүйгээр хөлнийхөө ясыг хагадуулж өмсвөл илүү өндөр, зохимжтой харагдуулна. \xa0 Boat Shoes Boat Shoes ч бас оймс өмсөхгүй өмсөөрэй. Дээрээ баантаглаж үдсэн арьсаар хийсэн энэхүү гуталны загвар өөрөө өвөрмөц тул заавал оймс өмсөх шаардлагагүй. Б.СОНИНБИЛЭГ',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 384]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Information Retrieval
- Evaluated with
InformationRetrievalEvaluator
Metric | Value |
---|---|
cosine_accuracy@1 | 0.3078 |
cosine_accuracy@3 | 0.5128 |
cosine_accuracy@5 | 0.6032 |
cosine_accuracy@10 | 0.7329 |
cosine_precision@1 | 0.3078 |
cosine_precision@3 | 0.1709 |
cosine_precision@5 | 0.1206 |
cosine_precision@10 | 0.0733 |
cosine_recall@1 | 0.3078 |
cosine_recall@3 | 0.5128 |
cosine_recall@5 | 0.6032 |
cosine_recall@10 | 0.7329 |
cosine_ndcg@10 | 0.5058 |
cosine_mrr@10 | 0.4349 |
cosine_map@100 | 0.4462 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 19,689 training samples
- Columns:
sentence_0
andsentence_1
- Approximate statistics based on the first 1000 samples:
sentence_0 sentence_1 type string string details - min: 8 tokens
- mean: 17.93 tokens
- max: 43 tokens
- min: 41 tokens
- mean: 124.86 tokens
- max: 128 tokens
- Samples:
sentence_0 sentence_1 "Юрийн галавын үе" киноны амжилтыг юугаар тайлбарлах вэ?
news: Киноны кадраас «Юрийн галавын үе» кино прокатад тавигдсныхаа дараах эхний амралтын өдрөөр хамгийн их орлого оллоо гэж Business Insider хэвлэл мэдээлэв. Хойд Америкт л гэхэд эхний амралтын өдрүүдэд 204,6 сая доллар цуглуулж чадлаа. Гадаад орнуудын үзүүлэлт нь 307,2 сая ам.доллар байв. Нийт кассын орлого 511,8 сая ам.доллар болжээ. Энэхүү үзүүлэлт нь Universal кино компанийн дээд амжилт төдийгүй дэлхийн кино аж үйлдвэрийн томоохон үсрэлт боллоо. Үүнээс өмнө амралтын эхний өдрүүдэд 500 сая долларын босго давсан их мөнгө цуглуулж байсан түүх байхгүй. «Гарри Поттер ба үхлийн тахил: II хэсэг» 483 сая долларын орлого олсноороо хоёрдугаарт явж байна. Universal компанийн дөрөвдүгээр сард гаргасан «Галзуу хурд 7» кино харин эхний амралтын өдрүүдэд 147 сая доллар цуглуулсан юм. Эхний амралтын өдрүүдийн орлого нь кино бизнесийн чухал үзүүлэлт бөгөөд тэр үзүүлэлтээр киноны прокатын хувь заяа шалтгаалдаг. Бэлтгэсэн Ш.МЯГМАР
Энэ киноны амжилт дэлхийн кино үйлдвэрт ямар нөлөө үзүүлэх вэ?
news: Киноны кадраас «Юрийн галавын үе» кино прокатад тавигдсныхаа дараах эхний амралтын өдрөөр хамгийн их орлого оллоо гэж Business Insider хэвлэл мэдээлэв. Хойд Америкт л гэхэд эхний амралтын өдрүүдэд 204,6 сая доллар цуглуулж чадлаа. Гадаад орнуудын үзүүлэлт нь 307,2 сая ам.доллар байв. Нийт кассын орлого 511,8 сая ам.доллар болжээ. Энэхүү үзүүлэлт нь Universal кино компанийн дээд амжилт төдийгүй дэлхийн кино аж үйлдвэрийн томоохон үсрэлт боллоо. Үүнээс өмнө амралтын эхний өдрүүдэд 500 сая долларын босго давсан их мөнгө цуглуулж байсан түүх байхгүй. «Гарри Поттер ба үхлийн тахил: II хэсэг» 483 сая долларын орлого олсноороо хоёрдугаарт явж байна. Universal компанийн дөрөвдүгээр сард гаргасан «Галзуу хурд 7» кино харин эхний амралтын өдрүүдэд 147 сая доллар цуглуулсан юм. Эхний амралтын өдрүүдийн орлого нь кино бизнесийн чухал үзүүлэлт бөгөөд тэр үзүүлэлтээр киноны прокатын хувь заяа шалтгаалдаг. Бэлтгэсэн Ш.МЯГМАР
Киноны эхний амралтын өдрүүдийн орлого яагаад ийм чухал вэ?
news: Киноны кадраас «Юрийн галавын үе» кино прокатад тавигдсныхаа дараах эхний амралтын өдрөөр хамгийн их орлого оллоо гэж Business Insider хэвлэл мэдээлэв. Хойд Америкт л гэхэд эхний амралтын өдрүүдэд 204,6 сая доллар цуглуулж чадлаа. Гадаад орнуудын үзүүлэлт нь 307,2 сая ам.доллар байв. Нийт кассын орлого 511,8 сая ам.доллар болжээ. Энэхүү үзүүлэлт нь Universal кино компанийн дээд амжилт төдийгүй дэлхийн кино аж үйлдвэрийн томоохон үсрэлт боллоо. Үүнээс өмнө амралтын эхний өдрүүдэд 500 сая долларын босго давсан их мөнгө цуглуулж байсан түүх байхгүй. «Гарри Поттер ба үхлийн тахил: II хэсэг» 483 сая долларын орлого олсноороо хоёрдугаарт явж байна. Universal компанийн дөрөвдүгээр сард гаргасан «Галзуу хурд 7» кино харин эхний амралтын өдрүүдэд 147 сая доллар цуглуулсан юм. Эхний амралтын өдрүүдийн орлого нь кино бизнесийн чухал үзүүлэлт бөгөөд тэр үзүүлэлтээр киноны прокатын хувь заяа шалтгаалдаг. Бэлтгэсэн Ш.МЯГМАР
- Loss:
MatryoshkaLoss
with these parameters:{ "loss": "MultipleNegativesRankingLoss", "matryoshka_dims": [ 384, 256, 128, 64, 32 ], "matryoshka_weights": [ 1, 1, 1, 1, 1 ], "n_dims_per_step": -1 }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: stepsper_device_train_batch_size
: 20per_device_eval_batch_size
: 20num_train_epochs
: 5multi_dataset_batch_sampler
: round_robin
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 20per_device_eval_batch_size
: 20per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 5e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1num_train_epochs
: 5max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.0warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Falsefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Falseignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: batch_samplermulti_dataset_batch_sampler
: round_robin
Training Logs
Epoch | Step | Training Loss | cosine_ndcg@10 |
---|---|---|---|
0.0508 | 50 | - | 0.4036 |
0.1015 | 100 | - | 0.4184 |
0.1523 | 150 | - | 0.4351 |
0.2030 | 200 | - | 0.4522 |
0.2538 | 250 | - | 0.4655 |
0.3046 | 300 | - | 0.4765 |
0.3553 | 350 | - | 0.4813 |
0.4061 | 400 | - | 0.4846 |
0.4569 | 450 | - | 0.4891 |
0.5076 | 500 | 9.2182 | 0.4889 |
0.5584 | 550 | - | 0.4849 |
0.6091 | 600 | - | 0.4872 |
0.6599 | 650 | - | 0.4968 |
0.7107 | 700 | - | 0.4918 |
0.7614 | 750 | - | 0.4893 |
0.8122 | 800 | - | 0.4887 |
0.8629 | 850 | - | 0.4872 |
0.9137 | 900 | - | 0.4915 |
0.9645 | 950 | - | 0.4894 |
1.0 | 985 | - | 0.4954 |
1.0152 | 1000 | 5.9875 | 0.4943 |
1.0660 | 1050 | - | 0.4911 |
1.1168 | 1100 | - | 0.4919 |
1.1675 | 1150 | - | 0.4973 |
1.2183 | 1200 | - | 0.4885 |
1.2690 | 1250 | - | 0.4876 |
1.3198 | 1300 | - | 0.4865 |
1.3706 | 1350 | - | 0.4936 |
1.4213 | 1400 | - | 0.4917 |
1.4721 | 1450 | - | 0.4981 |
1.5228 | 1500 | 4.5015 | 0.5006 |
1.5736 | 1550 | - | 0.4925 |
1.6244 | 1600 | - | 0.4956 |
1.6751 | 1650 | - | 0.4944 |
1.7259 | 1700 | - | 0.4978 |
1.7766 | 1750 | - | 0.4936 |
1.8274 | 1800 | - | 0.4967 |
1.8782 | 1850 | - | 0.4946 |
1.9289 | 1900 | - | 0.4971 |
1.9797 | 1950 | - | 0.4933 |
2.0 | 1970 | - | 0.4950 |
2.0305 | 2000 | 4.1506 | 0.4998 |
2.0812 | 2050 | - | 0.4998 |
2.1320 | 2100 | - | 0.4945 |
2.1827 | 2150 | - | 0.4972 |
2.2335 | 2200 | - | 0.4964 |
2.2843 | 2250 | - | 0.4906 |
2.3350 | 2300 | - | 0.4938 |
2.3858 | 2350 | - | 0.4955 |
2.4365 | 2400 | - | 0.4940 |
2.4873 | 2450 | - | 0.4956 |
2.5381 | 2500 | 3.2896 | 0.4964 |
2.5888 | 2550 | - | 0.4965 |
2.6396 | 2600 | - | 0.5000 |
2.6904 | 2650 | - | 0.4979 |
2.7411 | 2700 | - | 0.5002 |
2.7919 | 2750 | - | 0.4992 |
2.8426 | 2800 | - | 0.5000 |
2.8934 | 2850 | - | 0.5001 |
2.9442 | 2900 | - | 0.5058 |
Framework Versions
- Python: 3.10.12
- Sentence Transformers: 3.3.1
- Transformers: 4.47.1
- PyTorch: 2.5.1+cu121
- Accelerate: 1.2.1
- Datasets: 3.2.0
- Tokenizers: 0.21.0
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MatryoshkaLoss
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}