denis-gordeev commited on
Commit
c6b5236
·
verified ·
1 Parent(s): 940158d

Add new SentenceTransformer model

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 312,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": false,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,725 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:48599
8
+ - loss:ContrastiveLoss
9
+ base_model: sergeyzh/rubert-tiny-turbo
10
+ widget:
11
+ - source_sentence: 'можешь рассказать о https://megamarket.ru
12
+
13
+ можешь рассказать о https://megamarket.ru/catalog/details/smartfon-apple-iphone-15-plus-128-gb-green-100060926449_40440/#?related_search=iphone%2015'
14
+ sentences:
15
+ - '{''long_web_name'': ''Эндоскоп Гибкая камера USB для Android и PC 2 метра (для
16
+ смартфона)'', ''price'': 635.0, ''url'': ''https://megamarket.ru/catalog/details/endoskop-gibkaya-kamera-usb-dlya-android-i-pc-2-metra-dlya-smartfona-600005508703/'',
17
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/150/006/250/119/144/6/600005508703b0.jpeg'',
18
+ ''id'': ''600005508703'', ''description'': ''Эндоскоп Гибкая камера USB для Android
19
+ и PC 2 метра (для смартфона).Модель делает моментальные снимки на камеру 0,3 Мп
20
+ при фотографировании с телефона и 1,3 Мп, если снимки с ноутбука. Записывает видео
21
+ с разрешением 640х480 с частотой кадра в секунду – 30 fps. Сохраняет файлы в отдельной
22
+ папке приложения на смартфоне и создает новую папку на ноутбуке автоматически.Камера
23
+ обладает настраиваемой подсветкой с шестью диодными лампочками белого холодного
24
+ света. Показатель водонепроницаемости камеры IP67 – полностью пылезащищенная,
25
+ выдерживает короткое погружение в воду до 1 минуты на глубину до 1 метра. Работает
26
+ от micro-USB для соединения с Android-устройствами и от USB для работы с ноутбука.
27
+ Как подключить камеру-эндоскоп. Для подключения эндоскопа необходимо мобильное
28
+ устройство с поддержкой функции USB OTG. Для корректной работы необходимо скачать
29
+ мобильное приложение «CameraFi» в магазине Google Play.'', ''rating'': 4.37, ''review_count'':
30
+ 74}'
31
+ - '{''long_web_name'': ''DVB-T2 приставка Denn DDT135'', ''price'': 1799.0, ''description'':
32
+ ''<p>Телевизионный приемник DVB-T2 Denn DDT135 — устройство в корпусе черного
33
+ цвета, обладающее компактными размерами, которые составляют 2,5х6х9 см. Служит
34
+ для приема сигнала цифрового (VHF, UHF, FM) ТВ и аналогового (DVB-T/DVB-T2/DVB-C),
35
+ что позволяет насладиться просмотром любимых телепередач. Максимально поддерживаемое
36
+ разрешение — 1080р. Устройство поддерживает запись с ТВ на USB-накопитель. Возможно
37
+ подключение к Сети беспроводным способом через Wi-Fi. Доступно воспроизведение
38
+ медиаконтента с цифровых носителей. Можно настроить родительский контроль, чтобы
39
+ закрыть доступ к определенному контенту для детей. Для управления используется
40
+ пульт ДУ — питается от двух батареек типа ААА, которые входят в комплект. Набор
41
+ интерфейсов представлен портами USB 2.0 Тип A и выходами HDMI, RCA аудио/видео,
42
+ 3,5 мм аудио/видео.</p>'', ''rating'': 4.5, ''review_count'': 16}'
43
+ - '{''long_web_name'': ''Редуктор для блендера Braun 7322111294'', ''price'': 1250.0,
44
+ ''url'': ''https://megamarket.ru/catalog/details/reduktor-dlya-blendera-braun-7322111294-600017387282/'',
45
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/202/100/617/141/817/52/600017387282b0.jpg'',
46
+ ''id'': ''600017387282'', ''description'': ''Подходит к блендерам Braun типов/моделей:
47
+ 4130 - Multiquick 7, Minipimer 7 4191 - Multiquick 5, Minipimer 5, Multiquick
48
+ 7, Minipimer 7, Multiquick professional, Minipimer professional, Multiquick fresh,
49
+ Minipimer fresh 4196 - Multiquick 5, Minipimer 5, Multiquick 7, Minipimer 7, Multiquick
50
+ professional, Minipimer professional, Multiquick fresh, Minipimer fresh Подходит
51
+ к моделям: MR 5550 M/FP MR 6550 MR 5550 M/CA/MB MR 560 MR 6550 M/FP/HC/K MR 570
52
+ MR 5550 M/BC white/grey MQ5007WH MQ5037WH MQ525 ...'', ''rating'': 0.0, ''review_count'':
53
+ 0}'
54
+ - source_sentence: хочу внешний аккумулятор, чтобы брать везде с собой
55
+ sentences:
56
+ - '{''long_web_name'': ''Экран для проектора CACTUS CS-PSW-120X160 (стационарный,
57
+ 1:1, 78.7")'', ''price'': 4999.0, ''url'': ''https://megamarket.ru/catalog/details/cactus-cs-psw-120x160-100062415955/'',
58
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/168/691/825/031/115/50/100062415955b0.png'',
59
+ ''id'': ''100062415955'', ''description'': '''', ''rating'': 0.0, ''review_count'':
60
+ 0}'
61
+ - '{''long_web_name'': ''Портативная колонка Kict MK-B Black, Black Edition'', ''price'':
62
+ 237.0, ''url'': ''https://megamarket.ru/catalog/details/portativnaya-kolonka-kict-mk-b-black-black-edition-600012994019/'',
63
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/611/515/718/221/51/600012994019b0.jpeg'',
64
+ ''id'': ''600012994019'', ''description'': ''<p></p><ul><li><p><strong>Многофункциональный
65
+ динамик Портативный светодиодный Bluetooth мини-динамик.</strong></p></li><li><p><strong>С
66
+ микрофоном громкой связи, синим светодиодом.</strong></p></li><li><p><strong>С
67
+ помощью слота для карт Micro SD (карта Micro SD не входит в комплект) вы можете
68
+ воспроизводить файлы формата MP3 / MP4 на карте TF.3. Встроенная аккумуляторная
69
+ батарея, может заряжаться через USB-порт компьютера.</strong></p></li><li><p><strong>Портативный,
70
+ удобный для переноски.</strong></p></li></ul><p><br></p>'', ''rating'': 3.88,
71
+ ''review_count'': 41}'
72
+ - '{''long_web_name'': ''Hi-Fi плеер Mrobo A8 черный'', ''price'': 3135.0, ''url'':
73
+ ''https://megamarket.ru/catalog/details/hi-fi-pleer-mrobo-a8-chernyy-600012511761/'',
74
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/176/816/528/661/619/47/600012511761b0.jpeg'',
75
+ ''id'': ''600012511761'', ''description'': "Mrobo A8 – Hi-Fi ультра-компактный
76
+ плеер с сенсорным IPS экраном 2,5'''', модулем Bluetooth 5.0 и поддержкой всех
77
+ популярных форматов аудио. Помимо воспроизведения музыки в устройство встроены
78
+ функции радио, будильника, диктофона, просмотра текстовых и видео-файлов. Также
79
+ есть функция эквалайзера с пользовательскими и встроенными настройками. 16 Гб
80
+ памяти будет достаточно для большого количества музыки, помимо этого память можно
81
+ расширить с помощью карты microSD до 128Гб. Небольшой размер 50х70х10 мм позволяют
82
+ брать плеер в дорогу и поездки - положив его просто в карман. Корпус Mrobo A8
83
+ выполнен из приятного на ощупь пластика, за счет чего вес устройства составляет
84
+ всего 30 грамм. Управление осуществляется с помощью сенсорного экрана. Интерфейс
85
+ специально разработан для маленьких экранов, все функции отображаются в главном
86
+ меню, которое доступно на русском, английском и других языках. Несмотря на компактный
87
+ размер Mrobo A8 может воспроизводить все популярные форматы аудиофайлов. Он поддерживает
88
+ MP3, WMA, WAV, APE, FLAC. Также есть видеопроигрователь и диктофон. Характеристики:
89
+ Бренд: Mrobo Модель: А8 Тип: мультимедийный плеер Материал корпуса: пластик Экран
90
+ IPS: 2,5 дюйма (320 x 240) Аккумулятор: 500 мАч Bluetooth: 5.0 Поддержка радио:
91
+ да Динамик: да Время работы: до 50 часов Встроенная память: 16 Гб Расширение памяти:
92
+ microSD до 128Гб Аудио форматы: APE, AAC, FLAC, MP3, WMA Видео форматы: AVI, MP4,
93
+ MKV, MPG Поддержка электронных книг: TXT Интерфейсы: разъем 3,5-мм, microUSB Ра��мер:
94
+ 50 x 70 x 10 мм Вес: 30 г", ''rating'': 4.55, ''review_count'': 11}'
95
+ - source_sentence: 'Привет помоги найти наушники с шумоподавлением 30-40 дБ и выше
96
+
97
+ 1-е выглядят ненадёжно как-то
98
+
99
+ А покажи побольше похожих на 2-ые наушники 1More SonoFlow ANC
100
+
101
+ расскжи, чем Haylou T15 Black отичается от Haylou GT1 Pro Black
102
+
103
+ сравни Беспроводные наушники Haylou GT1 Pro Black и Беспроводные наушники Haylou
104
+ T15 Black
105
+
106
+ Привет!
107
+
108
+ Помоги подобрать холодиьник домой
109
+
110
+ Объём камеры средний, пусть будет от 300 л
111
+
112
+
113
+ Количество камер - 2
114
+
115
+ Нужна отдельнвя морозилка'
116
+ sentences:
117
+ - '{''long_web_name'': ''Холодильник Haier HB18FGWAAARU белый'', ''price'': 272000.0,
118
+ ''description'': ''<p>Холодильник Haier HB18FGWAAARU — это вместительная модель
119
+ объемом 508 л. Она оснащена двумя камерами: холодильной и морозильной.</p>\n<h2>Продуманная
120
+ конструкция</h2>\n<p>Среди особенностей устройства:</p>\n<ul>\n<li>класс энергоэффективности
121
+ А++ — низкое потребление электричества;</li>\n<li>система охлаждения Total No
122
+ Frost — предотвращает образование льда и инея;</li>\n<li>функция суперзаморозки
123
+ — позволяет быстро заморозить большое количество продуктов.</li>\n</ul>\n<p>В
124
+ холодильнике есть зона свежести, где поддерживается температура около 0°C. Это
125
+ оптимальные условия для хранения овощей и фруктов. На дверце расположены 6 полок,
126
+ которые можно регулировать по высоте. Также предусмотрены 2 выдвижных ящика в
127
+ морозильной камере и 4 полки в холодильной.</p>'', ''rating'': 4.9, ''review_count'':
128
+ 37, ''extra_info'': ''''}'
129
+ - '{''long_web_name'': ''Пылесос Karcher VC 4 myHome желтый'', ''price'': 26688.0,
130
+ ''url'': ''https://megamarket.ru/catalog/details/pylesos-vertikalnyy-karcher-vc-4-cordless-600005887117/'',
131
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-44/057/182/747/127/600005887117b0.jpg'',
132
+ ''id'': ''600005887117'', ''description'': ''Малый вес для легкой уборки: пылесос
133
+ VC 4 Cordless myHome позволяет быстро навести чистоту в квартире небольшой площади.'',
134
+ ''rating'': 4.75, ''review_count'': 83}'
135
+ - '{''long_web_name'': ''Швейная машина Karingbee FHSM-505G белая, фиолетовая'',
136
+ ''price'': 3490.0, ''url'': ''https://megamarket.ru/catalog/details/shveynaya-mashina-karingbee-fhsm-505g-belaya-fioletovaya-600014855855/'',
137
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-15/428/183/251/222/224/8/600014855855b0.jpeg'',
138
+ ''id'': ''600014855855_92925'', ''description'': ''<p>Швейная машина KaringBee
139
+ FHSM-505G</p><p>ТЕХНИЧЕСКИЕ ХАРАКТЕРИСТИКИ</p><p>Питание: от адаптера DC 6V 1200
140
+ mA</p><p>Входное напряжение адаптера: АС 220-240В 50-60Гц</p><p>Мощность: 264W</p><p>Цвет:
141
+ фиолетовый</p><p>ФУНКЦИОНАЛЬНЫЕ ОСОБЕННОСТИ</p><p>Две скорости работы</p><p>12
142
+ видов строчки</p><p>Прямой и обратный ход при шитье</p><p>Обработка петли</p><p>Удобная
143
+ система заправки нити</p><p>Автоматическая намотка нити</p><p>Регулируемая длина
144
+ стежка</p><p>Отсек для аксессуаровВозможность работы от адаптера DC 6V 1200 mA</p><p>При
145
+ эксплуатации швейной машины следует всегда соблюдать перечисленные ниже основные
146
+ меры безопасности.</p><p>Прочтите все инструкции перед использованием.</p><p>ВНИМАНИЕ!</p><p>Для
147
+ предотвращения возможности поражения электрическим током:</p><p>1. Никогда не
148
+ оставляйте швейную машину без присмотра при вставленной в розетку вилке сетевого
149
+ шнура. Сразу же посл�� использования швейной машины или перед ее чисткой всегда
150
+ вынимайте вилку сетевого шнура из розетки.</p><p>2. Всегда отключайте сетевой
151
+ шнур перед заменой лампы подсветки. Заменяйте лампы на однотипные, мощностью 15
152
+ Вт.</p>'', ''rating'': 4.7, ''review_count'': 20}'
153
+ - source_sentence: Здравствуйте! Я ищу воду для утюга, которую можно использовать
154
+ для отпаривания одежды. Подскажите, есть ли у вас такая в продаже? Меня интересует
155
+ недорогой вариант. Спасибо!
156
+ sentences:
157
+ - '{''long_web_name'': ''Кабель Windigo 3 в 1 Micro USB/Lightning/Type-C - USB нейлон,
158
+ магнитный, 3 А, 1 м, черный'', ''price'': 648.0, ''url'': ''https://megamarket.ru/catalog/details/kabel-windigo-3-v-1-micro-usb-lightning-type-c-usb-neylon-magnitnyy-3-a-1-m-chernyy-100045719678/'',
159
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/199/782/138/233/020/16/100045719678b0.jpg'',
160
+ ''id'': ''100045719678'', ''description'': ''Кабель Windigo, 3 в 1, microUSB/Lightning/Type-C
161
+ - USB, магнитный, 3 А, нейлон, 1 м, черный. Вид: Круглый. Длина кабеля, см: 100.
162
+ Материал оплётки: Нейлон. Особенности: Съёмный магнитный разъём, 3 в 1. Размер:
163
+ 1 см x 1 см x 1 см. Размер упаковки: 13 см x 6 см x 3 см. Разъём внешнего устройства:
164
+ USB. Разъём мобильного устройства: lightning, micro USB, USB Type-C. Сила тока,
165
+ А: 3. Страна производителя: Китай. Цвет: Чёрный. ---.(7108445)'', ''rating'':
166
+ 0.0, ''review_count'': 0}'
167
+ - '{''long_web_name'': ''Посудомоечная машина Comfee CDWC421BL-i белый, голубой'',
168
+ ''price'': 20390.0, ''description'': ''<p><strong>Компактная посудомоечная машина
169
+ Comfee CDWC421BL-i</strong> - это современное и функциональное устройство большой
170
+ вместимости, которое станет незаменимым помощником на вашей кухне.</p><p><strong>КОМПАКТНЫЙ
171
+ РАЗМЕР И БОЛЬШАЯ ВМЕСТИМОСТЬ</strong></p><p>Посудомоечная машина имеет компактные
172
+ размеры (ширина 42 см, высота 43,5 см и глубина 43,5 см), ее можно установить
173
+ в нишу как с, так и без подключения к водопроводу, что возможно благодаря встроенному
174
+ резервуару для воды объемом 5 литров.</p><p><strong>Wi-Fi УПРАВЛЕНИЕ</strong></p><p>Comfee
175
+ CDWC421BL-i - подключается к Wi-Fi и управляется через приложение SmartHome. В
176
+ приложении Вы можете не только запустить мойку из любой точки мира, но и отслеживать
177
+ уровень соли, регулировать интенсивность дозации, следить за состоянием фильтра
178
+ и запускать эксклюзивные программы мытья.</p><p><strong>ФУНКЦИОНАЛЬНОСТЬ</strong></p><p>Посудомоечная
179
+ машина оснащена 5 программами мойки: программа ECO, программа мытья детской посуды,
180
+ фруктов, быстрая и мойка длительностью 1 час.</p><p>Программа ECO обеспечивает
181
+ качественную мойку с минимальным уровнем шума и экономией электроэнергии.</p><p>Программа
182
+ мытья детской посуды станет любимой программой молодых родителей для гигиенического
183
+ мытья детской посуды; в комплекте есть держатель для детских бутылочек.</p><p>Мойка
184
+ фруктов - уникальная программа с 2 режимами мойки - 6 минут в холодной воде и
185
+ 12 минут в теплой воде для разных фруктов; в комплекте находится специальная корзина
186
+ для фруктов.</p><p>Мойка длительностью 1 час (программу можно включить в приложении
187
+ SmartHome) предназначена для ежедневного мытья посуды, однако с помощью нее также
188
+ можно избавляться и от сложных загрязнений.</p><p>Быстрая мойка (программу можно
189
+ включить в приложении SmartHome) предназначена для незначительно загрязненной
190
+ посуды, требующей легкого полоскания.</p><p>Модель оснащена турбосушкой, которая
191
+ обеспечивает быстрое и эффективное удаление влаги с посуды. При этом вы можете
192
+ запустить дополнительную сушку с помощью функции "Хранение". </p><p><strong>УДОБСТВО
193
+ УПРАВЛЕНИЯ И ОЧИСТКИ</strong></p><p>Управление посудомоечной машиной осуществляется
194
+ посредством сенсорного дисплея легкой очистки, который позволяет выбрать и запустить
195
+ нужную программу одним касанием.</p><p>Comfee CDWC421BL-i - доверьте мытье посуды
196
+ технологиям!</p>'', ''rating'': 4.75, ''review_count'': 12}'
197
+ - '{''long_web_name'': ''Охлаждающая подставка для ноутбука KS-IS KS-740 до 19"'',
198
+ ''price'': 3290.0, ''url'': ''https://megamarket.ru/catalog/details/ohlazhdayushaya-podstavka-dlya-noutbuka-ks-is-ks-740-do-19-600010906101/'',
199
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/806/641/346/181/21/600010906101b0.jpeg'',
200
+ ''id'': ''600010906101'', ''description'': ''Охлаждающая подставка для ноутбука
201
+ с монолитной конструкцией и тремя вентиляторами (80 мм), вращающимся со скоростью
202
+ 2000об/мин, значительно рассеивает тепло от ноутбука, обеспечивает его хорошее
203
+ рабочее состояние и продлевает срок службы. вашего ноутбука. Прочная охлаждающая
204
+ подставка для ноутбука Поверхность охлаждающей подставки изготовлена из алюминиевого
205
+ сплава, который может отводить тепло от ноутбука, улучшать рассеивание тепла и
206
+ обеспечивает вашему ноутбуку износостойкую и прочную поверхность для переноски,
207
+ что позволяет перевозить, положив его в сумку для ноутбука. Охлаждающая подставка
208
+ для ноутбука с 3 регулировками по высоте Три регулируемых настройки высоты, чтобы
209
+ поставить подставку в вертикальное или плоское положение и удерживать ноутбук
210
+ в подходящем положении. Специальная перегородка на подставке предотвращает скольжение
211
+ или падение вашего ноутбука. Два USB-порта Просто подключите подставку в USB-порт
212
+ вашего ноутбука, чтобы использовать. Оборудована двумя портами USB 2.0 для передачи
213
+ данных или подключения других устройств, в комплект входит один USB-кабель. Сверхтихие
214
+ кулеры для ноутбука Конструкция подставки для охлаждения ноутбука с шумоподавлением
215
+ делает ее не беспокоящей вас даже при максимальной мощности, позволяя вам сосредоточиться
216
+ на просмотре видео или работе, обеспечивая комфортную рабочую среду. Скорость
217
+ вентиляторов регулируется, Вы можете подобрать оптимальный режим для работы. Подготовка
218
+ подставки к работе 1) подключите кабель USB из комплекта поставки одним концом
219
+ в USB порт подставки (на тыльной ее части), другим концом в порт USB (рекомендуется
220
+ порт стандарта не ниже USB 3.2 Gen 1) ноутбука 2) включите подставку (кнопка
221
+ включения на тыльной стороне) 3) выберите оптимальный цвет подсветки RGB (переключается
222
+ кнопкой на тыльной ст��роне подставки) и скорость вращения вентиляторов (регулятор-колесико
223
+ расположен на правой стороне подставки) Характеристики Подсветка RGB (8 режимов) Материал
224
+ корпуса- ABS пластик, металл Количество вентиляторов - 3 Размер вентиляторов
225
+ - 80 х 80 мм, воздушный поток: 76м3/ч Скорость вращения вентиляторов 2000 - 2500
226
+ об/мин (+-10%) Низкий уровень шума 20 дБА Совместима с ноутбуками с размером
227
+ экрана До 19 дюймов Регулируется по высоте , 3 уровня регулировки положений USB
228
+ - 2 порта USB 1.1. Один порт для питания подставки, второй для подключения переферийного
229
+ USB устройства. Размер без упаковки - 42x27x3 см'', ''rating'': 4.6, ''review_count'':
230
+ 49}'
231
+ - source_sentence: Подбери моющий пылесос
232
+ sentences:
233
+ - '{''long_web_name'': ''Холодильник LIEBHERR CUEL 2331 серебристый, серый'', ''price'':
234
+ 63918.0, ''description'': '''', ''rating'': 4.67, ''review_count'': 6}'
235
+ - '{''long_web_name'': ''Видеокамера Sony HDR-CX405'', ''price'': 60219.0, ''url'':
236
+ ''https://megamarket.ru/catalog/details/videokamera-cifrovaya-full-hd-sony-hdr-cx405-black-100000032906/'',
237
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/1484948/100000032906b0.jpg'',
238
+ ''id'': ''100000032906'', ''description'': ''<p>Цифровая видеокамера Sony HDR-CX405
239
+ Black оснащена широкоугольным объективом, который дает большие возможности для
240
+ съемки пейзажей и в условиях стесненного пространства. Функция распознавания лиц
241
+ используется для автоматической оптимизации фокуса, цветопередачи и выдержки:
242
+ при прикосновении к жидкокристаллическому дисплею производится определение центрального
243
+ объекта, и даже если он покинет сцену, то все равно будет занесен в память устройства,
244
+ а при повторном появлении в кадре снова станет приоритетным.</p><h2>Особенности
245
+ и преимущества</h2><ul><li> Встроенный кабель USB. Уложен в наручный ремешок.
246
+ Благодаря ему отпадает необходимость носить с собой громоздкое зарядное устройство.</li><li>
247
+ Motion Shot Video. Режим обеспечивает воспроизведение серии наложенных изображений
248
+ и позволяет проследить перемещение объекта, при этом можно регулировать интервал,
249
+ а также остановить показ, чтобы сделать снимок.</li><li> Двухформатная запись.
250
+ Видеоконтент записывается одновременно в двух форматах XAVC S и AVCHD.</li><li>
251
+ Интеллектуальный автоматический режим. Опция автоматически определяет тип сюжета
252
+ и оптимизирует настройки. </li><li> Продолжительность работы. Съемный аккумулятор
253
+ обеспечивает до 2,5 часа непрерывной съемки.</li></ul>'', ''rating'': 5.0, ''review_count'':
254
+ 21}'
255
+ - '{''long_web_name'': ''Powerline-адаптер TP-Link TL-WPA4220KIT(EU)'', ''price'':
256
+ 6169.0, ''url'': ''https://megamarket.ru/catalog/details/powerline-adapter-tp-link-tl-wpa4220kit-eu--100000031379/'',
257
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/1696368/100000031379b0.jpg'',
258
+ ''id'': ''100000031379'', ''description'': ''<p>TP-Link TL-WPA4220KIT — Powerline-адаптер,
259
+ с помощью которого можно расширить зону охвата интернет-сети в доме или офисе.
260
+ Устройство использует для этого электропроводку. Все, что от вас требуется:</p><ul><li>вставить
261
+ адаптер, подключенный к интернету, в ближайшую розетку;</li><li>подключить дополнительный
262
+ адаптер к компьютеру, телевизору, игровой при��тавке с помощью кабеля Ethernet
263
+ либо по Wi-Fi.</li></ul><p>Устройство обеспечивает передачу данных на расстояние
264
+ до 300 метров. Скорость при этом достигает 500 Мбит/с: этого достаточно не только
265
+ для проверки электронного почтового ящика или веб-серфинга, но и для просмотра
266
+ HD-видео по сети.</p><h2>Расширяйте сеть простым нажатием кнопки</h2><p>На корпусе
267
+ адаптера находится кнопка Wi-Fi Clone. Нажмите ее, и устройство автоматически
268
+ скопирует имя сети, а также пароль основного роутера. При дальнейшем использовании
269
+ адаптера вам не нужно будет вводить эти данные, он установит соединение с сетью
270
+ автоматически.</p><h2>Быстрый Wi-Fi</h2><p>Адаптер можно использовать для обеспечения
271
+ соединения по Wi-Fi в удаленных от роутера частях дома или офиса. Скорость передачи
272
+ данных при этом может достигать 300 Мбит/с.</p>'', ''rating'': 4.68, ''review_count'':
273
+ 28}'
274
+ pipeline_tag: sentence-similarity
275
+ library_name: sentence-transformers
276
+ metrics:
277
+ - cosine_accuracy
278
+ - cosine_accuracy_threshold
279
+ - cosine_f1
280
+ - cosine_f1_threshold
281
+ - cosine_precision
282
+ - cosine_recall
283
+ - cosine_ap
284
+ model-index:
285
+ - name: SentenceTransformer based on sergeyzh/rubert-tiny-turbo
286
+ results:
287
+ - task:
288
+ type: binary-classification
289
+ name: Binary Classification
290
+ dataset:
291
+ name: item classification
292
+ type: item-classification
293
+ metrics:
294
+ - type: cosine_accuracy
295
+ value: 0.9710288065843622
296
+ name: Cosine Accuracy
297
+ - type: cosine_accuracy_threshold
298
+ value: 0.7607331275939941
299
+ name: Cosine Accuracy Threshold
300
+ - type: cosine_f1
301
+ value: 0.9072708113804004
302
+ name: Cosine F1
303
+ - type: cosine_f1_threshold
304
+ value: 0.7601832151412964
305
+ name: Cosine F1 Threshold
306
+ - type: cosine_precision
307
+ value: 0.8524752475247525
308
+ name: Cosine Precision
309
+ - type: cosine_recall
310
+ value: 0.9695945945945946
311
+ name: Cosine Recall
312
+ - type: cosine_ap
313
+ value: 0.9635955376688807
314
+ name: Cosine Ap
315
+ ---
316
+
317
+ # SentenceTransformer based on sergeyzh/rubert-tiny-turbo
318
+
319
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sergeyzh/rubert-tiny-turbo](https://huggingface.co/sergeyzh/rubert-tiny-turbo). It maps sentences & paragraphs to a 312-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
320
+
321
+ ## Model Details
322
+
323
+ ### Model Description
324
+ - **Model Type:** Sentence Transformer
325
+ - **Base model:** [sergeyzh/rubert-tiny-turbo](https://huggingface.co/sergeyzh/rubert-tiny-turbo) <!-- at revision 93769a3baad2b037e5c2e4312fccf6bcfe082bf1 -->
326
+ - **Maximum Sequence Length:** 2048 tokens
327
+ - **Output Dimensionality:** 312 dimensions
328
+ - **Similarity Function:** Cosine Similarity
329
+ <!-- - **Training Dataset:** Unknown -->
330
+ <!-- - **Language:** Unknown -->
331
+ <!-- - **License:** Unknown -->
332
+
333
+ ### Model Sources
334
+
335
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
336
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
337
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
338
+
339
+ ### Full Model Architecture
340
+
341
+ ```
342
+ SentenceTransformer(
343
+ (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: BertModel
344
+ (1): Pooling({'word_embedding_dimension': 312, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
345
+ (2): Normalize()
346
+ )
347
+ ```
348
+
349
+ ## Usage
350
+
351
+ ### Direct Usage (Sentence Transformers)
352
+
353
+ First install the Sentence Transformers library:
354
+
355
+ ```bash
356
+ pip install -U sentence-transformers
357
+ ```
358
+
359
+ Then you can load this model and run inference.
360
+ ```python
361
+ from sentence_transformers import SentenceTransformer
362
+
363
+ # Download from the 🤗 Hub
364
+ model = SentenceTransformer("denis-gordeev/reranker_dialog_items_biencoder_rubert-tiny-turbo-6")
365
+ # Run inference
366
+ sentences = [
367
+ 'Подбери моющий пылесос',
368
+ "{'long_web_name': 'Видеокамера Sony HDR-CX405', 'price': 60219.0, 'url': 'https://megamarket.ru/catalog/details/videokamera-cifrovaya-full-hd-sony-hdr-cx405-black-100000032906/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/1484948/100000032906b0.jpg', 'id': '100000032906', 'description': '<p>Цифровая видеокамера Sony HDR-CX405 Black оснащена широкоугольным объективом, который дает большие возможности для съемки пейзажей и в условиях стесненного пространства. Функция распознавания лиц используется для автоматической оптимизации фокуса, цветопередачи и выдержки: при прикосновении к жидкокристаллическому дисплею производится определение центрального объекта, и даже если он покинет сцену, то все равно будет занесен в память устройства, а при повторном появлении в кадре снова станет приоритетным.</p><h2>Особенности и преимущества</h2><ul><li> Встроенный кабель USB. Уложен в наручный ремешок. Благодаря ему отпадает необходимость носить с собой громоздкое зарядное устройство.</li><li> Motion Shot Video. Режим обеспечивает воспроизведение серии наложенных изображений и позволяет проследить перемещение объекта, при этом можно регулировать интервал, а также остановить показ, чтобы сделать снимок.</li><li> Двухформатная запись. Видеоконтент записывается одновременно в двух форматах XAVC S и AVCHD.</li><li> Интеллектуальный автоматический режим. Опция автоматически определяет тип сюжета и оптимизирует настройки. </li><li> Продолжительность работы. Съемный аккумулятор обеспечивает до 2,5 часа непрерывной съемки.</li></ul>', 'rating': 5.0, 'review_count': 21}",
369
+ "{'long_web_name': 'Холодильник LIEBHERR CUEL 2331 серебристый, серый', 'price': 63918.0, 'description': '', 'rating': 4.67, 'review_count': 6}",
370
+ ]
371
+ embeddings = model.encode(sentences)
372
+ print(embeddings.shape)
373
+ # [3, 312]
374
+
375
+ # Get the similarity scores for the embeddings
376
+ similarities = model.similarity(embeddings, embeddings)
377
+ print(similarities.shape)
378
+ # [3, 3]
379
+ ```
380
+
381
+ <!--
382
+ ### Direct Usage (Transformers)
383
+
384
+ <details><summary>Click to see the direct usage in Transformers</summary>
385
+
386
+ </details>
387
+ -->
388
+
389
+ <!--
390
+ ### Downstream Usage (Sentence Transformers)
391
+
392
+ You can finetune this model on your own dataset.
393
+
394
+ <details><summary>Click to expand</summary>
395
+
396
+ </details>
397
+ -->
398
+
399
+ <!--
400
+ ### Out-of-Scope Use
401
+
402
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
403
+ -->
404
+
405
+ ## Evaluation
406
+
407
+ ### Metrics
408
+
409
+ #### Binary Classification
410
+
411
+ * Dataset: `item-classification`
412
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
413
+
414
+ | Metric | Value |
415
+ |:--------------------------|:-----------|
416
+ | cosine_accuracy | 0.971 |
417
+ | cosine_accuracy_threshold | 0.7607 |
418
+ | cosine_f1 | 0.9073 |
419
+ | cosine_f1_threshold | 0.7602 |
420
+ | cosine_precision | 0.8525 |
421
+ | cosine_recall | 0.9696 |
422
+ | **cosine_ap** | **0.9636** |
423
+
424
+ <!--
425
+ ## Bias, Risks and Limitations
426
+
427
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
428
+ -->
429
+
430
+ <!--
431
+ ### Recommendations
432
+
433
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
434
+ -->
435
+
436
+ ## Training Details
437
+
438
+ ### Training Dataset
439
+
440
+ #### Unnamed Dataset
441
+
442
+
443
+ * Size: 48,599 training samples
444
+ * Columns: <code>anchor</code>, <code>text</code>, and <code>label</code>
445
+ * Approximate statistics based on the first 1000 samples:
446
+ | | anchor | text | label |
447
+ |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:------------------------------------------------|
448
+ | type | string | string | int |
449
+ | details | <ul><li>min: 5 tokens</li><li>mean: 18.58 tokens</li><li>max: 170 tokens</li></ul> | <ul><li>min: 52 tokens</li><li>mean: 320.76 tokens</li><li>max: 1158 tokens</li></ul> | <ul><li>0: ~82.70%</li><li>1: ~17.30%</li></ul> |
450
+ * Samples:
451
+ | anchor | text | label |
452
+ |:-------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
453
+ | <code>расскажи про умную колонку SberBoom</code> | <code>{'long_web_name': 'Колонка умная Sber Sberboom Home туманная', 'price': 5990.0, 'description': 'Умная колонка Sber Sberboom Home «Туманная» поддерживает голосовое управление благодаря виртуальному ассистенту «Салют» с интеграцией искусственного интеллекта GigaChat. LED-дисплей показывает время, информацию о погоде и дорожном трафике. Яркость можно регулировать автоматически. Модуль Zigbee объединяет устройства в умный дом и может управлять ими. Технология Magnetic Sound позволяет добиться насыщенного чистого звука с глубокими басами. Реализован режим совместной работы с телевизорами Sber и медиацентрами SberBox. Есть универсальный разъем USB Type C. Корпус с фактурным переплетением нитей выполнен из приятного на ощупь матового пластика — обладает высокой стойкостью к царапинам и выцветанию. Водоотталкивающая пропитка защищает от влаги. Просто ухаживать — достаточно протереть салфеткой.', 'rating': 4.5, 'review_count': 76, 'extra_info': ''}</code> | <code>0</code> |
454
+ | <code>расскажи об айфоне https://megamarket.ru/catalog/details/smartfon-a</code> | <code>{'long_web_name': 'Охлаждающая подставка для ноутбука KS-IS KS-740 до 19"', 'price': 3290.0, 'url': 'https://megamarket.ru/catalog/details/ohlazhdayushaya-podstavka-dlya-noutbuka-ks-is-ks-740-do-19-600010906101/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/806/641/346/181/21/600010906101b0.jpeg', 'id': '600010906101', 'description': 'Охлаждающая подставка для ноутбука с монолитной конструкцией и тремя вентиляторами (80 мм), вращающимся со скоростью 2000об/мин, значительно рассеивает тепло от ноутбука, обеспечивает его хорошее рабочее состояние и продлевает срок службы. вашего ноутбука. Прочная охлаждающая подставка для ноутбука Поверхность охлаждающей подставки изготовлена из алюминиевого сплава, который может отводить тепло от ноутбука, улучшать рассеивание тепла и обеспечивает вашему ноутбуку износостойкую и прочную поверхность для переноски, что позволяет перевозить, положив его в сумку для ноутбука. Охлаждающая подставка для ноутбука с 3 регулировками по ...</code> | <code>0</code> |
455
+ | <code>помоги подобрать бытовую технику<br>холодильник до 80 тысяч<br>Расскажи, что умеешь</code> | <code>{'long_web_name': 'Холодильник Beko B5RCNK403ZW белый', 'price': 43990.0, 'description': '<p>Холодильник Beko B5RCNK403ZW - идеальное решение для хранения продуктов с максимальным комфортом и минимальным энергопотреблением.</p>\n<h2>Суперэкономичный и функциональный</h2>\n<p>Благодаря классу энергоэффективности A+++, этот холодильник поможет вам снизить затраты на электричество, экономя ваше время и деньги. С инверторным компрессором он обеспечивает бесшумную работу и долгий срок службы. Большая вместительность холодильника позволяет удобно разместить все необходимые продукты, сохраняя их свежесть.</p>\n<ol>\n<li>Объемная морозильная камера позволяет хранить большое количество замороженных продуктов без проблем.</li>\n<li>No Frost система автоматически размораживает холодильник, освобождая вас от необходимости регулярной процедуры размораживания.</li>\n<li>Электронное управление делает настройку температуры и режимов работы максимально простой и удобной.</li>\n<li>Перенавешиваемые двер...</code> | <code>1</code> |
456
+ * Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
457
+ ```json
458
+ {
459
+ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
460
+ "margin": 0.5,
461
+ "size_average": true
462
+ }
463
+ ```
464
+
465
+ ### Evaluation Dataset
466
+
467
+ #### Unnamed Dataset
468
+
469
+
470
+ * Size: 6,075 evaluation samples
471
+ * Columns: <code>anchor</code>, <code>text</code>, and <code>label</code>
472
+ * Approximate statistics based on the first 1000 samples:
473
+ | | anchor | text | label |
474
+ |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:------------------------------------------------|
475
+ | type | string | string | int |
476
+ | details | <ul><li>min: 5 tokens</li><li>mean: 19.09 tokens</li><li>max: 319 tokens</li></ul> | <ul><li>min: 52 tokens</li><li>mean: 321.31 tokens</li><li>max: 1464 tokens</li></ul> | <ul><li>0: ~84.20%</li><li>1: ~15.80%</li></ul> |
477
+ * Samples:
478
+ | anchor | text | label |
479
+ |:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
480
+ | <code>помоги подобрать игровой смартфон<br>частота обновления дисплея от 100 герц, высокий рейтинг, цена до 40 тысяч</code> | <code>{'long_web_name': 'Вспышка Godox TT350S для Sony', 'price': 10790.0, 'url': 'https://megamarket.ru/catalog/details/fotovspyshka-godox-thinklite-tt350s-dlya-sony-600005626620/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-68/526/847/329/183/4/600005626620b0.jpeg', 'id': '600005626620', 'description': 'Компактная фотовспышка, предназначенная для использования с камерами Sony.Производитель утверждает, что устройство совместимо с камерами Sony a7R II, a7R, а также А58 и a77ll. Некоторые модели RX также способны выполнить сопряжение со вспышкой.Радиоуправляемая система позволяет TT350S работать вместе с другими радио фотовспышками GODOX и студийными головками. Устройство может работать в качестве ведущего или ведомого света в нескольких наборах. Три группы запрограммированы в систему управления вместе с 16 каналами, в то время как максимальный рабочий диапазон составляет 30м. Высокая скорость синхронизации обеспечивается через режим HSS, который может работать с выдер...</code> | <code>0</code> |
481
+ | <code>хочу купить кофеварку с учетом сбербонусов</code> | <code>{'long_web_name': 'Кофеварка капельного типа Bosch TKA 6A043', 'price': 8999.0, 'description': 'Коротко о товаретип используемого кофе: молотыйтип напитка: американонастройки: крепость кофе, жесткость водыдоп. функции: автоотключение при неиспользовании, автоматическая декальцинация, противокапельная системаособенности конструкции: индикатор уровня воды, отсек для шнура, плита автоподогрева, вращающийся фильтродержатель, индикатор включенияфильтр: одноразовыйматериал корпуса: п��астик', 'rating': 4.9, 'review_count': 13, 'extra_info': ''}</code> | <code>1</code> |
482
+ | <code>помоги подобрать смартфон<br>андроид, встроенная память от 128гб, цена от 30 до 37 тысяч<br>покажи еще<br>Расскажи, что умеешь<br>покажи еще<br>а если все гуд то в реди ту мерж или реди ту деплой? деплой это уже последний статус перед продом видимо<br>сравни все предложенные товары</code> | <code>{'long_web_name': 'Кухонный комбайн Bosch MUMS2EW40 white', 'price': 32319.0, 'url': 'https://megamarket.ru/catalog/details/kuhonnyy-kombayn-bosch-mums2ew40-white-600005246990/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-15/835/560/551/210/143/3/600005246990b0.jpeg', 'id': '600005246990', 'description': '<p>Мощный кухонный комбайн Bosch MUMS2EW40 white - идеальный помощник для приготовления различных блюд в домашних условиях. С его помощью ты сможешь быстро и легко приготовить все необходимые ингредиенты для любимых рецептов.</p>\n<h2>Безупречное качество работы</h2>\n<p>Сочетание функциональности и надежности делает данный комбайн незаменимым инструментом на кухне. Благодаря индикатору работы, ты можешь контролировать процесс приготовления, не отвлекаясь на постоянную проверку. Блендер в комплекте позволяет легко приготовить пюре, смузи или другие жидкие блюда.</p>\n<ol>\n<li>Поворотное управление обеспечивает удобство использования и позволяет изменять скорос...</code> | <code>0</code> |
483
+ * Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
484
+ ```json
485
+ {
486
+ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
487
+ "margin": 0.5,
488
+ "size_average": true
489
+ }
490
+ ```
491
+
492
+ ### Training Hyperparameters
493
+ #### Non-Default Hyperparameters
494
+
495
+ - `eval_strategy`: steps
496
+ - `per_device_train_batch_size`: 16
497
+ - `per_device_eval_batch_size`: 16
498
+ - `num_train_epochs`: 1
499
+ - `warmup_ratio`: 0.1
500
+ - `fp16`: True
501
+ - `load_best_model_at_end`: True
502
+ - `batch_sampler`: no_duplicates
503
+
504
+ #### All Hyperparameters
505
+ <details><summary>Click to expand</summary>
506
+
507
+ - `overwrite_output_dir`: False
508
+ - `do_predict`: False
509
+ - `eval_strategy`: steps
510
+ - `prediction_loss_only`: True
511
+ - `per_device_train_batch_size`: 16
512
+ - `per_device_eval_batch_size`: 16
513
+ - `per_gpu_train_batch_size`: None
514
+ - `per_gpu_eval_batch_size`: None
515
+ - `gradient_accumulation_steps`: 1
516
+ - `eval_accumulation_steps`: None
517
+ - `torch_empty_cache_steps`: None
518
+ - `learning_rate`: 5e-05
519
+ - `weight_decay`: 0.0
520
+ - `adam_beta1`: 0.9
521
+ - `adam_beta2`: 0.999
522
+ - `adam_epsilon`: 1e-08
523
+ - `max_grad_norm`: 1.0
524
+ - `num_train_epochs`: 1
525
+ - `max_steps`: -1
526
+ - `lr_scheduler_type`: linear
527
+ - `lr_scheduler_kwargs`: {}
528
+ - `warmup_ratio`: 0.1
529
+ - `warmup_steps`: 0
530
+ - `log_level`: passive
531
+ - `log_level_replica`: warning
532
+ - `log_on_each_node`: True
533
+ - `logging_nan_inf_filter`: True
534
+ - `save_safetensors`: True
535
+ - `save_on_each_node`: False
536
+ - `save_only_model`: False
537
+ - `restore_callback_states_from_checkpoint`: False
538
+ - `no_cuda`: False
539
+ - `use_cpu`: False
540
+ - `use_mps_device`: False
541
+ - `seed`: 42
542
+ - `data_seed`: None
543
+ - `jit_mode_eval`: False
544
+ - `use_ipex`: False
545
+ - `bf16`: False
546
+ - `fp16`: True
547
+ - `fp16_opt_level`: O1
548
+ - `half_precision_backend`: auto
549
+ - `bf16_full_eval`: False
550
+ - `fp16_full_eval`: False
551
+ - `tf32`: None
552
+ - `local_rank`: 0
553
+ - `ddp_backend`: None
554
+ - `tpu_num_cores`: None
555
+ - `tpu_metrics_debug`: False
556
+ - `debug`: []
557
+ - `dataloader_drop_last`: False
558
+ - `dataloader_num_workers`: 0
559
+ - `dataloader_prefetch_factor`: None
560
+ - `past_index`: -1
561
+ - `disable_tqdm`: False
562
+ - `remove_unused_columns`: True
563
+ - `label_names`: None
564
+ - `load_best_model_at_end`: True
565
+ - `ignore_data_skip`: False
566
+ - `fsdp`: []
567
+ - `fsdp_min_num_params`: 0
568
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
569
+ - `fsdp_transformer_layer_cls_to_wrap`: None
570
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
571
+ - `deepspeed`: None
572
+ - `label_smoothing_factor`: 0.0
573
+ - `optim`: adamw_torch
574
+ - `optim_args`: None
575
+ - `adafactor`: False
576
+ - `group_by_length`: False
577
+ - `length_column_name`: length
578
+ - `ddp_find_unused_parameters`: None
579
+ - `ddp_bucket_cap_mb`: None
580
+ - `ddp_broadcast_buffers`: False
581
+ - `dataloader_pin_memory`: True
582
+ - `dataloader_persistent_workers`: False
583
+ - `skip_memory_metrics`: True
584
+ - `use_legacy_prediction_loop`: False
585
+ - `push_to_hub`: False
586
+ - `resume_from_checkpoint`: None
587
+ - `hub_model_id`: None
588
+ - `hub_strategy`: every_save
589
+ - `hub_private_repo`: None
590
+ - `hub_always_push`: False
591
+ - `gradient_checkpointing`: False
592
+ - `gradient_checkpointing_kwargs`: None
593
+ - `include_inputs_for_metrics`: False
594
+ - `include_for_metrics`: []
595
+ - `eval_do_concat_batches`: True
596
+ - `fp16_backend`: auto
597
+ - `push_to_hub_model_id`: None
598
+ - `push_to_hub_organization`: None
599
+ - `mp_parameters`:
600
+ - `auto_find_batch_size`: False
601
+ - `full_determinism`: False
602
+ - `torchdynamo`: None
603
+ - `ray_scope`: last
604
+ - `ddp_timeout`: 1800
605
+ - `torch_compile`: False
606
+ - `torch_compile_backend`: None
607
+ - `torch_compile_mode`: None
608
+ - `dispatch_batches`: None
609
+ - `split_batches`: None
610
+ - `include_tokens_per_second`: False
611
+ - `include_num_input_tokens_seen`: False
612
+ - `neftune_noise_alpha`: None
613
+ - `optim_target_modules`: None
614
+ - `batch_eval_metrics`: False
615
+ - `eval_on_start`: False
616
+ - `use_liger_kernel`: False
617
+ - `eval_use_gather_object`: False
618
+ - `average_tokens_across_devices`: False
619
+ - `prompts`: None
620
+ - `batch_sampler`: no_duplicates
621
+ - `multi_dataset_batch_sampler`: proportional
622
+
623
+ </details>
624
+
625
+ ### Training Logs
626
+ | Epoch | Step | Training Loss | Validation Loss | item-classification_cosine_ap |
627
+ |:----------:|:--------:|:-------------:|:---------------:|:-----------------------------:|
628
+ | 0 | 0 | - | 0.0243 | 0.3310 |
629
+ | 0.0329 | 100 | 0.0158 | - | - |
630
+ | 0.0658 | 200 | 0.0097 | - | - |
631
+ | 0.0823 | 250 | - | 0.0057 | 0.7787 |
632
+ | 0.0987 | 300 | 0.0058 | - | - |
633
+ | 0.1317 | 400 | 0.0051 | - | - |
634
+ | 0.1646 | 500 | 0.0046 | 0.0047 | 0.8786 |
635
+ | 0.1975 | 600 | 0.0041 | - | - |
636
+ | 0.2304 | 700 | 0.0043 | - | - |
637
+ | 0.2469 | 750 | - | 0.0041 | 0.9098 |
638
+ | 0.2633 | 800 | 0.0046 | - | - |
639
+ | 0.2962 | 900 | 0.0042 | - | - |
640
+ | 0.3292 | 1000 | 0.0043 | 0.0036 | 0.9235 |
641
+ | 0.3621 | 1100 | 0.0038 | - | - |
642
+ | 0.3950 | 1200 | 0.0041 | - | - |
643
+ | 0.4115 | 1250 | - | 0.0037 | 0.9334 |
644
+ | 0.4279 | 1300 | 0.0034 | - | - |
645
+ | 0.4608 | 1400 | 0.004 | - | - |
646
+ | 0.4937 | 1500 | 0.0037 | 0.0033 | 0.9408 |
647
+ | 0.5267 | 1600 | 0.0036 | - | - |
648
+ | 0.5596 | 1700 | 0.0035 | - | - |
649
+ | 0.5760 | 1750 | - | 0.0030 | 0.9517 |
650
+ | 0.5925 | 1800 | 0.0035 | - | - |
651
+ | 0.6254 | 1900 | 0.0035 | - | - |
652
+ | 0.6583 | 2000 | 0.0037 | 0.0029 | 0.9558 |
653
+ | 0.6912 | 2100 | 0.0029 | - | - |
654
+ | 0.7242 | 2200 | 0.0033 | - | - |
655
+ | 0.7406 | 2250 | - | 0.0028 | 0.9580 |
656
+ | 0.7571 | 2300 | 0.0031 | - | - |
657
+ | 0.7900 | 2400 | 0.0032 | - | - |
658
+ | 0.8229 | 2500 | 0.0031 | 0.0027 | 0.9629 |
659
+ | 0.8558 | 2600 | 0.0029 | - | - |
660
+ | 0.8887 | 2700 | 0.0029 | - | - |
661
+ | 0.9052 | 2750 | - | 0.0027 | 0.9632 |
662
+ | 0.9217 | 2800 | 0.0033 | - | - |
663
+ | 0.9546 | 2900 | 0.0028 | - | - |
664
+ | **0.9875** | **3000** | **0.0031** | **0.0026** | **0.9636** |
665
+ | 1.0 | 3038 | - | 0.0026 | 0.9636 |
666
+
667
+ * The bold row denotes the saved checkpoint.
668
+
669
+ ### Framework Versions
670
+ - Python: 3.10.13
671
+ - Sentence Transformers: 3.3.1
672
+ - Transformers: 4.47.1
673
+ - PyTorch: 2.2.1
674
+ - Accelerate: 1.2.1
675
+ - Datasets: 3.2.0
676
+ - Tokenizers: 0.21.0
677
+
678
+ ## Citation
679
+
680
+ ### BibTeX
681
+
682
+ #### Sentence Transformers
683
+ ```bibtex
684
+ @inproceedings{reimers-2019-sentence-bert,
685
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
686
+ author = "Reimers, Nils and Gurevych, Iryna",
687
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
688
+ month = "11",
689
+ year = "2019",
690
+ publisher = "Association for Computational Linguistics",
691
+ url = "https://arxiv.org/abs/1908.10084",
692
+ }
693
+ ```
694
+
695
+ #### ContrastiveLoss
696
+ ```bibtex
697
+ @inproceedings{hadsell2006dimensionality,
698
+ author={Hadsell, R. and Chopra, S. and LeCun, Y.},
699
+ booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
700
+ title={Dimensionality Reduction by Learning an Invariant Mapping},
701
+ year={2006},
702
+ volume={2},
703
+ number={},
704
+ pages={1735-1742},
705
+ doi={10.1109/CVPR.2006.100}
706
+ }
707
+ ```
708
+
709
+ <!--
710
+ ## Glossary
711
+
712
+ *Clearly define terms in order to be accessible across audiences.*
713
+ -->
714
+
715
+ <!--
716
+ ## Model Card Authors
717
+
718
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
719
+ -->
720
+
721
+ <!--
722
+ ## Model Card Contact
723
+
724
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
725
+ -->
config.json ADDED
@@ -0,0 +1,27 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "sergeyzh/rubert-tiny-turbo",
3
+ "architectures": [
4
+ "BertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "emb_size": 312,
9
+ "gradient_checkpointing": false,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 312,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 600,
15
+ "layer_norm_eps": 1e-12,
16
+ "max_position_embeddings": 2048,
17
+ "model_type": "bert",
18
+ "num_attention_heads": 12,
19
+ "num_hidden_layers": 3,
20
+ "pad_token_id": 0,
21
+ "position_embedding_type": "absolute",
22
+ "torch_dtype": "float32",
23
+ "transformers_version": "4.47.1",
24
+ "type_vocab_size": 2,
25
+ "use_cache": true,
26
+ "vocab_size": 83828
27
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.1",
4
+ "transformers": "4.47.1",
5
+ "pytorch": "2.2.1"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:44384565cf009e392671eb7b8236be43fb799928ced721c5984329945a264671
3
+ size 116781184
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 2048,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": {
3
+ "content": "[CLS]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "mask_token": {
10
+ "content": "[MASK]",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "[PAD]",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "sep_token": {
24
+ "content": "[SEP]",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "unk_token": {
31
+ "content": "[UNK]",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ }
37
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "4": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": true,
45
+ "cls_token": "[CLS]",
46
+ "do_basic_tokenize": true,
47
+ "do_lower_case": false,
48
+ "extra_special_tokens": {},
49
+ "mask_token": "[MASK]",
50
+ "max_length": 512,
51
+ "model_max_length": 2048,
52
+ "never_split": null,
53
+ "pad_to_multiple_of": null,
54
+ "pad_token": "[PAD]",
55
+ "pad_token_type_id": 0,
56
+ "padding_side": "right",
57
+ "sep_token": "[SEP]",
58
+ "stride": 0,
59
+ "strip_accents": null,
60
+ "tokenize_chinese_chars": true,
61
+ "tokenizer_class": "BertTokenizer",
62
+ "truncation_side": "right",
63
+ "truncation_strategy": "longest_first",
64
+ "unk_token": "[UNK]"
65
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff