tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:3136
- loss:ContrastiveLoss
base_model: sergeyzh/rubert-tiny-turbo
widget:
- source_sentence: >-
Здравствуйте! Я ищу узкую посудомоечную машину шириной 45 см. Какие модели
вы можете порекомендовать?
sentences:
- >-
{'long_web_name': 'Microsoft Office Home and Student 2019 Rus Only
Medialess P6 79G-05207', 'price': 3000.0, 'url':
'https://megamarket.ru/catalog/details/microsoft-office-home-and-student-2019-rus-only-medialess-p6-79g-05207-600005002855/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-14/481/134/111/161/848/600005002855b0.jpeg',
'id': '600005002855_78577', 'description': 'Артикул № 764312
Microsoft Office 2019 для дома и учёбы – это пакет самых популярных
офисных продуктов от Microsoft. Неважно, пользуетесь вы Windows или Mac
OS, эти программы обязательно пригодятся вам для учебных или домашних
задач. В комплект Microsoft Office 2019 для дома и учёбы входят: Word –
текстовый редактор с широкими возможностями форматирования текста; Excel
– инструмент для работы с таблицами и формулами; Power Point –
приложение для создания презентаций.', 'rating': 4.5, 'review_count':
16}
- >-
{'long_web_name': 'Увлажнитель воздуха Timberk T-HU4-A16M-W', 'price':
13990.0, 'url':
'https://megamarket.ru/catalog/details/uvlazhnitel-vozduha-timberk-t-hu4-a16m-w-100029966849/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/949/265/041/114/131/8/100029966849b0.jpg',
'id': '100029966849', 'description': '<p>Увлажнитель воздуха Timberk
T-HU4-A16M-W использует технологию распыления при помощи ультразвуковой
мембраны. Это помогает получить чрезвычайно мелкие капли. Мощности
достаточно для обслуживания помещения вплоть до 30 м?. Отсек для воды на
4 л обеспечивает работу до 14 часов.</p>\n <h2>Легкое дыхание с пользой
для здоровья</h2>\n <p>Производитель предусмотрел такие опции, которые
положительно сказались на комфорте при эксплуатации:</p>\n <ul>\n
<li>удобное механическое управление при помощи поворотного регулятора на
корпусе устройства;</li>\n <li>наличие ароматического режима работы,
который обогащает воздух смесями с антибактериальными свойствами;</li>\n
<li>верхний залив жидкости, что позволяет быстро производить дозаправку,
не изымая полностью резервуар.</li>\n </ul>\n <p>Прибор можно
использовать и в ночное время суток, так как уровень шума не превышает
35 дБ. Для безопасной работы предусмотрена функция автоматического
отключения при опустошении резервуара.</p>', 'rating': 4.74,
'review_count': 331}
- >-
{'long_web_name': 'Зарядное утсройство блок кабель для телефона 3A USB
Type-C 25W', 'price': 890.0, 'url':
'https://megamarket.ru/catalog/details/zaryadnoe-utsroystvo-blok-kabel-dlya-telefona-3a-usb-type-c-25w-600015086154/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/231/789/941/100/19/600015086154b0.png',
'id': '600015086154', 'description': '<p>Зарядное устройство 25W PD –
это компактное и удобное устройство, предназначенное для быстрой и
эффективной зарядки вашего устройства. С ним сможете зарядить ваше
устройство до 50% всего за 30 минут благодаря его высокой мощности 25W.
Технология PD ( Power Delivery ) обеспечивает умную и оптимальную
зарядку, которая автоматически адаптируется к вашему устройству для
максимальной производительности. Кабель и блок имеет универсальный USB-C
порт, что позволяет вам заряжать различные совместимые устройства,
включая смартфоны, планшеты, наушники и другие гаджеты. Компактный
дизайн делают зарядник, идеальным для путешествий и использования на
ходу. Блок зарядки также обладает многоуровневой защитой от перегрузки,
короткого замыкания, перегрева и других повреждений, обеспечивая
безопасность и долговечность вашего устройства. Будьте уверены, что ваше
устройство будет заряжаться быстро, эффективно и безопасно с помощью
сетевого адаптера. Это надежное и удобное устройство, которое поможет
вам всегда оставаться подключенным и готовым к действию.</p>', 'rating':
0.0, 'review_count': 0}
- source_sentence: >-
Здравствуйте! Мне нужны редукторы для моего блендера. Это те детали,
которые помогают передавать вращение от мотора к ножам. Не подскажете,
есть ли у вас такие в наличии?
sentences:
- >-
{'long_web_name': 'Цифро-аналоговый преобразователь Hiby Hiby W5',
'price': 9005.0, 'url':
'https://megamarket.ru/catalog/details/cifro-analogovyy-preobrazovatel-hiby-hiby-w5-600004460473/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/101/310/993/491/164/600004460473b0.jpeg',
'id': '600004460473', 'description': 'Hiby W5 – современный
Bluetooth-адаптер с ЦАП и усилителем для наушников. Девайс оснащён
продвинутым чипом ЦАП ES9218P от ESS Technology в сочетании с
микросхемой CSR8675 от Quallcomm, отвечающей за работу по
Bluetooth.Адаптер поддерживает Bluetooth спецификации 5.0 и абсолютное
большинство современных кодеков, включая UAT, LDAC, aptX, aptX HD, aptX
LL, SBC и AAC. \xa0Разработка Hiby – кодек UAT позволяет обрабатывать
аудио с частотой дискретизации до 192 кГц и битрейтом 1,2 Мбит/c, что
превышает показатели даже всемирно известного LDAC от Sony. UAT
совместим с мобильными телефонами и Hi-Fi-плеерами на базе Android.
Например, поддержку имеют все плееры HiBy, Hidizs AP80, Cayin N8 и
другие устройства с ОС HiBy. Пользователям Android необходимо будет
установить приложение HiByMusic.Корпус W5 имеет компактный размер, он
выполнен из нержавеющей стали и защищён от влаги и пыли по стандарту
IP67. Адаптер поставляется с карманным зажимом, благодаря чему его можно
легко разместить на одежде.Hiby W5 оснащен встроенным микрофоном и
пультом. Одним щелчком мыши вы можете переключаться между
воспроизведением музыки и ответом на звонок.Благодаря встроенному
аккумулятору и зарядному чехлу, который может полностью зарядить W5 не
менее пяти раз, устройство способно обеспечить до 20 часов
воспроизведения.', 'rating': 5.0, 'review_count': 3}
- >-
{'long_web_name': 'Охлаждающая подставка для ноутбука KS-IS KS-740 до
19"', 'price': 3290.0, 'url':
'https://megamarket.ru/catalog/details/ohlazhdayushaya-podstavka-dlya-noutbuka-ks-is-ks-740-do-19-600010906101/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/806/641/346/181/21/600010906101b0.jpeg',
'id': '600010906101', 'description': 'Охлаждающая подставка для ноутбука
с монолитной конструкцией и тремя вентиляторами (80 мм), вращающимся со
скоростью 2000об/мин, значительно рассеивает тепло от ноутбука,
обеспечивает его хорошее рабочее состояние и продлевает срок службы.
вашего ноутбука. Прочная охлаждающая подставка для ноутбука Поверхность
охлаждающей подставки изготовлена из алюминиевого сплава, который может
отводить тепло от ноутбука, улучшать рассеивание тепла и обеспечивает
вашему ноутбуку износостойкую и прочную поверхность для переноски, что
позволяет перевозить, положив его в сумку для ноутбука. Охлаждающая
подставка для ноутбука с 3 регулировками по высоте Три регулируемых
настройки высоты, чтобы поставить подставку в вертикальное или плоское
положение и удерживать ноутбук в подходящем положении. Специальная
перегородка на подставке предотвращает скольжение или падение вашего
ноутбука. Два USB-порта Просто подключите подставку в USB-порт вашего
ноутбука, чтобы использовать. Оборудована двумя портами USB 2.0 для
передачи данных или подключения других устройств, в комплект входит один
USB-кабель. Сверхтихие кулеры для ноутбука Конструкция подставки для
охлаждения ноутбука с шумоподавлением делает ее не беспокоящей вас даже
при максимальной мощности, позволяя вам сосредоточиться на просмотре
видео или работе, обеспечивая комфортную рабочую среду. Скорость
вентиляторов регулируется, Вы можете подобрать оптимальный режим для
работы. Подготовка подставки к работе 1) подключите кабель USB из
комплекта поставки одним концом в USB порт подставки (на тыльной ее
части), другим концом в порт USB (рекомендуется порт стандарта не ниже
USB 3.2 Gen 1) ноутбука 2) включите подставку (кнопка включения на
тыльной стороне) 3) выберите оптимальный цвет подсветки RGB
(переключается кнопкой на тыльной стороне подставки) и скорость вращения
вентиляторов (регулятор-колесико расположен на правой стороне подставки)
Характеристики Подсветка RGB (8 режимов) Материал корпуса- ABS пластик,
металл Количество вентиляторов - 3 Размер вентиляторов - 80 х 80 мм,
воздушный поток: 76м3/ч Скорость вращения вентиляторов 2000 - 2500
об/мин (+-10%) Низкий уровень шума 20 дБА Совместима с ноутбуками с
размером экрана До 19 дюймов Регулируется по высоте , 3 уровня
регулировки положений USB - 2 порта USB 1.1. Один порт для питания
подставки, второй для подключения переферийного USB устройства. Размер
без упаковки - 42x27x3 см', 'rating': 4.6, 'review_count': 49}
- >-
{'long_web_name': 'Аксессуар для видеокарты NVIDIA RTX LOW PROFILE
BRACKET A2000', 'price': 783.0, 'url':
'https://megamarket.ru/catalog/details/planka-dlya-videokarty-rtx-low-profile-bracket-a2000-12gb-nvidia-100046937787/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/109/972/170/425/191/5/100046937787b0.jpg',
'id': '100046937787', 'description': '', 'rating': 0.0, 'review_count':
0}
- source_sentence: >-
Здравствуйте! Мне нужно купить карты памяти MicroSD, чтобы использовать их
в моём телефоне и планшете. Хотелось бы что-то надёжное и с хорошей
скоростью записи. Можете помочь выбрать?
sentences:
- >-
{'long_web_name': 'Сетевое зарядное устройство Apple MHJE3ZM/A 20W Power
Adapter, 1xUSB Type-C, 2.2A, white', 'price': 990.0, 'description':
'<div><p>Сетевое зарядное устройство Apple MHJE3ZM/A 20W Power Adapter,
1xUSB Type-C, 2.2A, white — универсальная модель, совместимая со всеми
современными гаджетами.</p>\n<h2>Продуманная конструкция</h2>\n<p>Корпус
выполнен из качественного пластика — прочный материал, устойчивый к
механическим повреждениям. Дополнительные технические
параметры:</p>\n<ul>\n<li>Подходит для зарядки смартфонов, планшетов,
ноутбуков, наушников и других устройств.</li>\n<li>Стандарт быстрой
зарядки Power Delivery обеспечивает высокую скорость передачи
энергии.</li>\n<li>Защита от короткого замыкания и перегрева продлевают
срок службы.</li>\n</ul>\n<p>Мощность 20 Вт позволяет быстро зарядить
аккумулятор практически любого современного гаджета. Для удобства
использования предусмотрен съемный кабель.</p></div>', 'rating': 4.8,
'review_count': 8132}
- >-
{'long_web_name': 'Охлаждающая подставка для ноутбука KS-IS KS-740 до
19"', 'price': 3290.0, 'url':
'https://megamarket.ru/catalog/details/ohlazhdayushaya-podstavka-dlya-noutbuka-ks-is-ks-740-do-19-600010906101/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/806/641/346/181/21/600010906101b0.jpeg',
'id': '600010906101', 'description': 'Охлаждающая подставка для ноутбука
с монолитной конструкцией и тремя вентиляторами (80 мм), вращающимся со
скоростью 2000об/мин, значительно рассеивает тепло от ноутбука,
обеспечивает его хорошее рабочее состояние и продлевает срок службы.
вашего ноутбука. Прочная охлаждающая подставка для ноутбука Поверхность
охлаждающей подставки изготовлена из алюминиевого сплава, который может
отводить тепло от ноутбука, улучшать рассеивание тепла и обеспечивает
вашему ноутбуку износостойкую и прочную поверхность для переноски, что
позволяет перевозить, положив его в сумку для ноутбука. Охлаждающая
подставка для ноутбука с 3 регулировками по высоте Три регулируемых
настройки высоты, чтобы поставить подставку в вертикальное или плоское
положение и удерживать ноутбук в подходящем положении. Специальная
перегородка на подставке предотвращает скольжение или падение вашего
ноутбука. Два USB-порта Просто подключите подставку в USB-порт вашего
ноутбука, чтобы использовать. Оборудована двумя портами USB 2.0 для
передачи данных или подключения других устройств, в комплект входит один
USB-кабель. Сверхтихие кулеры для ноутбука Конструкция подставки для
охлаждения ноутбука с шумоподавлением делает ее не беспокоящей вас даже
при максимальной мощности, позволяя вам сосредоточиться на просмотре
видео или работе, обеспечивая комфортную рабочую среду. Скорость
вентиляторов регулируется, Вы можете подобрать оптимальный режим для
работы. Подготовка подставки к работе 1) подключите кабель USB из
комплекта поставки одним концом в USB порт подставки (на тыльной ее
части), другим концом в порт USB (рекомендуется порт стандарта не ниже
USB 3.2 Gen 1) ноутбука 2) включите подставку (кнопка включения на
тыльной стороне) 3) выберите оптимальный цвет подсветки RGB
(переключается кнопкой на тыльной стороне подставки) и скорость вращения
вентиляторов (регулятор-колесико расположен на правой стороне подставки)
Характеристики Подсветка RGB (8 режимов) Материал корпуса- ABS пластик,
металл Количество вентиляторов - 3 Размер вентиляторов - 80 х 80 мм,
воздушный поток: 76м3/ч Скорость вращения вентиляторов 2000 - 2500
об/мин (+-10%) Низкий уровень шума 20 дБА Совместима с ноутбуками с
размером экрана До 19 дюймов Регулируется по высоте , 3 уровня
регулировки положений USB - 2 порта USB 1.1. Один порт для питания
подставки, второй для подключения переферийного USB устройства. Размер
без упаковки - 42x27x3 см', 'rating': 4.6, 'review_count': 49}
- >-
{'long_web_name': 'Швейная машина Janome Excellent Stitch 300', 'price':
50509.0, 'url':
'https://megamarket.ru/catalog/details/shveynaya-mashina-janome-excellent-stitch-300-600005235554/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/179/146/900/512/815/46/600005235554b0.jpeg',
'id': '600005235554_87239', 'description': '<div><p>Швейная машина
Janome Excellent Stitch 300 – это устройство, которое поможет создать
красивую вещь даже начинающему пользователю.</p>\n<h2>Современная
техника</h2>\n<p>Машина оснащена компьютерным управлением, что позволяет
ей самостоятельно выбирать оптимальную длину и ширину стежка, а также
регулировать давление лапки на ткань. Пользователь может выбрать одну из
300 встроенных программ, среди которых есть как самые простые строчки,
так и сложные декоративные элементы. Также есть возможность создания
собственных рисунков. К особенностям модели
относятся:</p>\n<ul>\n<li>ротационный горизонтальный челнок обеспечивает
ровную и гладкую строчку;</li>\n<li>максимальная скорость шитья
составляет 820 стежков в минуту;</li>\n<li>есть функция реверса,
позволяющая распустить неправильно сделанный шов.</li>\n</ul>\n<p>Помимо
этого, предусмотрены дополнительные аксессуары, которые входят в
комплект поставки. Это позволит сразу приступить к работе после
приобретения устройства.</p></div>', 'rating': 5.0, 'review_count': 3}
- source_sentence: >-
Здравствуйте! Я хочу купить пылесос, который небольшой и удобный, чтобы им
можно было быстро убирать мусор с пола. Подскажите, пожалуйста, у вас есть
такие вертикальные пылесосы?
sentences:
- >-
{'long_web_name': 'Пылесос Gorenje SVC252FMWT белый', 'price': 17099.0,
'description': '', 'rating': 4.61, 'review_count': 23}
- >-
{'long_web_name': 'Встраиваемая посудомоечная машина KUPPERSBERG GSM
6074', 'price': 47699.0, 'url':
'https://megamarket.ru/catalog/details/posudomoechnaya-mashina-kuppersberg-gsm-6074-600005006810/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/106/877/513/742/316/30/600005006810b0.jpg',
'id': '600005006810', 'description': 'Встраиваемая посудомоечная машина
GSM 6074 шириной 60 см один из незаменимых кухонных бытовых приборов на
любой кухне. Удобство данного агрегата заключается в выполнении ряда
функций:способность вместить 14 комплектов посуды;программирование по 7
режимам;3 регулируемых корзины для столовых приборов;специальная полка
для чашек.Aquastop - функция Аква Стоп обезопасит вас от протечекРежим
«Все в 1» автоматически подберет программу, исходя из особенностей
моющего средства.Решитесь приобрести посудомоечную машину GSM 6074 для
того, чтобы наслаждаться безупречной чистотой вымытой посуды.',
'rating': 4.7, 'review_count': 123}
- >-
{'long_web_name': 'Бокс внешний для жесткого диска UGREEN US221 30847
2.5 Inch Hard Drive Box с кабелем USB', 'price': 1520.0, 'url':
'https://megamarket.ru/catalog/details/boks-vneshniy-dlya-zhestkogo-diska-ugreen-us221-30847-25-inch-hard-drive-box-s-kabelem-usb-600010907194/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/517/639/817/785/8/600010907194b0.png',
'id': '600010907194', 'description': '<p>Вход: USB A 3.0 Male. Выход:
(7+15)Pin SATA 3.0 порт. Чипсет: VL711F0. SATA 3.0, скорость до 6
Гбит/с, совместимость с SATA 2.0/1.0 *USB 3.0, скорость до 5 Гбит/с,
совместимость с USB 2.0 и 1.1 *Для 9,5 мм 7,5 мм 2,5 дюйма SATA I II
III, HDD, SSD до 6 ТБ. Поддержка UASP. Не нужны дополнительные
инструменты для установки. Поддерживает операционные системы Windows
2000 / XP / Vista / 7/8 / 8.1 / 10, LINUX, Mac OS 8.0 и выше. Размер:
Д128,5 x Ш82 x В14 (мм). Длина кабеля: 30 см.</p>', 'rating': 5.0,
'review_count': 18}
- source_sentence: >-
Здравствуйте! Я хочу купить внешний диск для хранения данных, желательно
SSD. Нужно, чтобы он был надёжным и быстрым, для переноса больших файлов.
Можете помочь подобрать подходящий?
sentences:
- >-
{'long_web_name': 'Сумка унисекс K&F Concept Storage Bag черная,
26х16х10 см', 'price': 3259.0, 'description': '<p>Поместится все <p>В
сумке предусмотрено 23 отделения для хранения самых разных вещей:
смартфон, зарядное устройство, кабели для передачи данных,
usb-накопители, ключи от машины, банковские карты и прочие ценности </p>
Полный или частичный доступ <p>Удобная функция открытия и закрытия на
120° позволяет использовать несколько комбинаций внутренних отсеков,
обеспечивая высокую степень свободы в адаптации к различным сценариям
использования, делая организацию вещей еще более удобной </p> Для
путешествий и работы <p>Компактная и легкая сумка весом всего 250 г -
идеальный выбор для деловых встреч или путешествий. Она не занимает
много места в чемодане или рюкзаке, но при этом обладает внушительной
вместимостью </p> Прочные и надежные материалы изготовления <p>Модель
изготовлена из водонепроницаемого нейлона, с высокопрочной строчкой и
противоугонной молнией, гарантирующей износостойкость и долговечность.
Она надежно защищает хранящиеся внутри вещи от каких либо повреждений
</p> Водонепроницаемый нейлон <p>Благодаря водонепроницаемому нейлону
сумка не пропускает влагу внутрь, а также обеспечивает легкий уход за
внешней поверхностью. Внутри модель оснащена эластичной тканью,
отличающейся особой мягкостью и безопасностью для хрупких предметов или
гаджетов </p></p>', 'rating': 0.0, 'review_count': 0}
- >-
{'long_web_name': 'Внешний SSD диск KingSpec 240 ГБ Z3-240', 'price':
4129.0, 'description': '', 'rating': 0.0, 'review_count': 0}
- >-
{'long_web_name': 'Моноблок MSI AM272P 12M-400RU White
(9S6-AF8212-498)', 'price': 122661.0, 'url':
'https://megamarket.ru/catalog/details/monoblok-msi-am272p-12m-400ru-white-9s6-af8212-498-100068211829/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/125/947/036/513/181/4/100068211829b0.webp',
'id': '100068211829', 'description': '', 'rating': 0.0, 'review_count':
0}
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- cosine_accuracy
- cosine_accuracy_threshold
- cosine_f1
- cosine_f1_threshold
- cosine_precision
- cosine_recall
- cosine_ap
model-index:
- name: SentenceTransformer based on sergeyzh/rubert-tiny-turbo
results:
- task:
type: binary-classification
name: Binary Classification
dataset:
name: item classification
type: item-classification
metrics:
- type: cosine_accuracy
value: 0.9617346938775511
name: Cosine Accuracy
- type: cosine_accuracy_threshold
value: 0.8327065110206604
name: Cosine Accuracy Threshold
- type: cosine_f1
value: 0.88
name: Cosine F1
- type: cosine_f1_threshold
value: 0.8327065110206604
name: Cosine F1 Threshold
- type: cosine_precision
value: 0.873015873015873
name: Cosine Precision
- type: cosine_recall
value: 0.8870967741935484
name: Cosine Recall
- type: cosine_ap
value: 0.9106157533671668
name: Cosine Ap
SentenceTransformer based on sergeyzh/rubert-tiny-turbo
This is a sentence-transformers model finetuned from sergeyzh/rubert-tiny-turbo. It maps sentences & paragraphs to a 312-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: sergeyzh/rubert-tiny-turbo
- Maximum Sequence Length: 2048 tokens
- Output Dimensionality: 312 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 312, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("denis-gordeev/reranker_dialog_items_biencoder_rubert-tiny-turbo-4")
# Run inference
sentences = [
'Здравствуйте! Я хочу купить внешний диск для хранения данных, желательно SSD. Нужно, чтобы он был надёжным и быстрым, для переноса больших файлов. Можете помочь подобрать подходящий?',
"{'long_web_name': 'Внешний SSD диск KingSpec 240 ГБ Z3-240', 'price': 4129.0, 'description': '', 'rating': 0.0, 'review_count': 0}",
"{'long_web_name': 'Моноблок MSI AM272P 12M-400RU White (9S6-AF8212-498)', 'price': 122661.0, 'url': 'https://megamarket.ru/catalog/details/monoblok-msi-am272p-12m-400ru-white-9s6-af8212-498-100068211829/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/125/947/036/513/181/4/100068211829b0.webp', 'id': '100068211829', 'description': '', 'rating': 0.0, 'review_count': 0}",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 312]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Binary Classification
- Dataset:
item-classification
- Evaluated with
BinaryClassificationEvaluator
Metric | Value |
---|---|
cosine_accuracy | 0.9617 |
cosine_accuracy_threshold | 0.8327 |
cosine_f1 | 0.88 |
cosine_f1_threshold | 0.8327 |
cosine_precision | 0.873 |
cosine_recall | 0.8871 |
cosine_ap | 0.9106 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 3,136 training samples
- Columns:
anchor
,text
, andlabel
- Approximate statistics based on the first 1000 samples:
anchor text label type string string int details - min: 23 tokens
- mean: 43.03 tokens
- max: 91 tokens
- min: 52 tokens
- mean: 313.24 tokens
- max: 1009 tokens
- 0: ~81.90%
- 1: ~18.10%
- Samples:
anchor text label Привет! Подскажите, пожалуйста, у вас есть средства для чистки и ухода за холодильником? Ищу что-то недорогое, но эффективное.
{'long_web_name': 'Смартфон Huawei nova 10 8/128Gb Starry Silver', 'price': 29590.0, 'url': 'https://megamarket.ru/catalog/details/pda-huawei-nco-lx1-8-128gb-s-100057069468/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-98/769/723/010/212/31/100057069468b0.jpg', 'id': '100057069468', 'description': '
Смартфон Huawei nova 10 8/128Gb Starry Silver — это современный гаджет, который позволяет общаться, работать и развлекаться.
\nПомогает оставаться на связи
\nУстройство оснащено большим экраном с высоким разрешением. На нем удобно смотреть фильмы, играть в игры и читать книги. Есть встроенные динамики, которые обеспечивают качественный звук. Другие параметры смартфона:
\n- \n
- основная камера состоит из трех модулей — они делают яркие и детализированные снимки; \n
- встроенный сканер отпечатков пальцев — для быстрого доступа к устройству; \n
- поддерживает функцию бесконтактной оплаты через Google Pay. \n
Смартфон работае...
0
Здравствуйте! Я Андрей, мне 38 лет, я покупаю у вас товары для своего бизнеса по ремонту бытовой техники в Воронеже. Мне нужны моноблоки — это такие настольные компьютеры, где всё встроено в монитор. Интересуют недорогие модели для тестирования программного обеспечения и проведения диагностики. Можете порекомендовать что-то подходящее?
{'long_web_name': 'Моноблок MSI PRO AP242 12M-450RU белый', 'price': 78299.0, 'description': '
Моноблок MSI Pro AP242 12M-450RU — это производительная рабочая станция для офисных задач.
\nКомфортная работа
\nКорпус выполнен в белом цвете. Матовое покрытие дисплея защищает от бликов. Другие технические параметры:
\n- \n
- мощный процессор Intel Core i5 12400; \n
- графический чип UHD Graphics 730; \n
- оперативная память объемом 16 Гб с возможностью расширения до 64 Гб; \n
- встроенная веб-камера для общения через Skype и Zoom; \n
- внутренний накопитель SSD на 512 Гб обеспечивает быстрый доступ к файлам; \n
- поддерживается беспроводная сеть стандарта 802.11ax. \n
Предусмотрены два порта USB 3.2 Type-C и два USB 2.0 Type-A. Есть выход HDMI для подключения монитора или телевизора. Для воспроизведения звука есть встроенные динамики и микрофон.
', 'rating': 5.0, 'review_count': 18}0
Здравствуйте! Мне нужно купить карты памяти MicroSD, чтобы использовать их в моём телефоне и планшете. Хотелось бы что-то надёжное и с хорошей скоростью записи. Можете помочь выбрать?
{'long_web_name': 'Флэш карта Kingston Canvas Select Plus SDCS2/32GB microSDHC Class10, 32 Gb, adapter', 'price': 740.0, 'description': '', 'rating': 4.93, 'review_count': 587}
1
- Loss:
ContrastiveLoss
with these parameters:{ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE", "margin": 0.5, "size_average": true }
Evaluation Dataset
Unnamed Dataset
- Size: 392 evaluation samples
- Columns:
anchor
,text
, andlabel
- Approximate statistics based on the first 392 samples:
anchor text label type string string int details - min: 23 tokens
- mean: 42.23 tokens
- max: 91 tokens
- min: 53 tokens
- mean: 322.99 tokens
- max: 1058 tokens
- 0: ~84.18%
- 1: ~15.82%
- Samples:
anchor text label Здравствуйте! Мне нужны магнитные кабели для зарядки моих устройств в походах. Хочу заказать несколько штук, можно с разными разъёмами (USB-C, Micro USB, и Lightning). Желательно, чтобы они были качественными и прочными. Можете помочь с этим?
{'long_web_name': 'Смартфон Samsung Galaxy Z Flip 6 SM-F741B, 256 Гб, Yellow', 'price': 81990.0, 'url': 'https://megamarket.ru/catalog/details/smartfon-samsung-galaxy-z-flip-6-sm-f741b-256-gb-yellow-1-sht-100069687356/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-12/153/984/177/231/36/100069687356b0.png', 'id': '100069687356', 'description': 'Смартфон Samsung Galaxy Z Flip6 Yellow с раскладным экраном. Гибкий безрамочный дисплей 6.7" с матрицей Dynamic AMOLED 2X FHD+, частотой обновления 120 Гц и плотностью пикселей 426 ppi — передает четкое детализированное изображение с яркими и насыщенными цветами. Покрытие Corning® Gorilla® Glass Victus® защищает дисплей от механических повреждений. Процессор Qualcomm Snapdragon 8 Gen 3 с графическим ускорителем Qualcomm Adreno 750 — обеспечивает высокую производительность и плавную работу системы. Внутренняя память объемом 256 ГБ — предоставляет достаточно места для хранения большого количества данных, фотографий и видео. А...
0
Здравствуйте! Мне нужны сумки и рюкзаки для фототехники. Что-то удобное и вместительное, чтобы можно было безопасно носить зеркальный фотоаппарат и несколько объективов. Можно посмотреть варианты?
{'long_web_name': 'Фильтр ZUMMAN FHR2', 'price': 14.0, 'url': 'https://megamarket.ru/catalog/details/filtr-zumman-fhr2-100026967888/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-13/878/305/792/603/9/100026967888b0.jpg', 'id': '100026967888_7', 'description': '', 'rating': 0.0, 'review_count': 0}
0
Здравствуйте! Ищу умные часы Apple Watch Series 2. Скажите, пожалуйста, есть ли у вас в наличии?
{'long_web_name': 'Смарт-часы Apple Watch Series 9 45 мм Midnight размер ML', 'price': 58373.0, 'description': 'Смарт-часы Apple Watch. Материал корпуса — алюминий. Время работы в активном режиме — до 18 часов. Функция Double Tap активируется посредством двух быстрых касаний указательного и большого пальцев — можно ответить на звонок, выключить будильник и управлять воспроизведением музыки. Объем встроенной памяти — 64 Гб. В комплекте — кабель USB?C с магнитным креплением для быстрой зарядки', 'rating': 4.97, 'review_count': 114}
0
- Loss:
ContrastiveLoss
with these parameters:{ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE", "margin": 0.5, "size_average": true }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: stepsnum_train_epochs
: 5warmup_ratio
: 0.1fp16
: Trueload_best_model_at_end
: Truebatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 8per_device_eval_batch_size
: 8per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 5e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 5max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Trueignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Epoch | Step | Training Loss | Validation Loss | item-classification_cosine_ap |
---|---|---|---|---|
0 | 0 | - | 0.0298 | 0.3925 |
0.2551 | 100 | 0.0162 | - | - |
0.5102 | 200 | 0.0081 | - | - |
0.6378 | 250 | - | 0.0070 | 0.7305 |
0.7653 | 300 | 0.0064 | - | - |
1.0179 | 400 | 0.0049 | - | - |
1.2730 | 500 | 0.0046 | 0.0051 | 0.8504 |
1.5281 | 600 | 0.0038 | - | - |
1.7832 | 700 | 0.0037 | - | - |
1.9107 | 750 | - | 0.0049 | 0.8791 |
2.0357 | 800 | 0.0032 | - | - |
2.2908 | 900 | 0.0032 | - | - |
2.5459 | 1000 | 0.0025 | 0.0046 | 0.9016 |
2.8010 | 1100 | 0.0024 | - | - |
3.0536 | 1200 | 0.0026 | - | - |
3.1811 | 1250 | - | 0.0044 | 0.8947 |
3.3087 | 1300 | 0.0022 | - | - |
3.5638 | 1400 | 0.0019 | - | - |
3.8189 | 1500 | 0.002 | 0.0045 | 0.9053 |
4.0714 | 1600 | 0.002 | - | - |
4.3265 | 1700 | 0.0018 | - | - |
4.4541 | 1750 | - | 0.0044 | 0.9106 |
4.5816 | 1800 | 0.0014 | - | - |
4.8367 | 1900 | 0.0017 | - | - |
4.9898 | 1960 | - | 0.0044 | 0.9106 |
- The bold row denotes the saved checkpoint.
Framework Versions
- Python: 3.10.13
- Sentence Transformers: 3.3.1
- Transformers: 4.47.1
- PyTorch: 2.2.1
- Accelerate: 1.2.1
- Datasets: 3.2.0
- Tokenizers: 0.21.0
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
ContrastiveLoss
@inproceedings{hadsell2006dimensionality,
author={Hadsell, R. and Chopra, S. and LeCun, Y.},
booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
title={Dimensionality Reduction by Learning an Invariant Mapping},
year={2006},
volume={2},
number={},
pages={1735-1742},
doi={10.1109/CVPR.2006.100}
}