Edit model card

RUAccent-stressed-encoder

Эта модель представляет собой дистиллированную версию StressCDLM, специально обученную char level модель для экспериментов, когда модели нужно видеть символы и отфайнтюненую на корпусе ударений.

Описание модели

RUAccent-stressed-encoder - это энкодер, оптимизированный для обработки русского текста с ударениями. Предназначен для интеграции в качестве текстового энкодера в TTS системы.

Использование

import torch
from transformers import AutoModel
import chartk

tokenizer = chartk.CharacterTokenizer.from_pretrained('ruaccent/RUAccent-stressed-encoder')
model = AutoModel.from_pretrained('ruaccent/RUAccent-stressed-encoder')

text = "На гор+е сто+ит з+амок"

inputs = tokenizer(text, return_tensors='pt', padding=True, truncation=True, max_length=512)

with torch.no_grad():
    outputs = model(**inputs)

last_hidden_state = outputs.last_hidden_state
Downloads last month
5
Safetensors
Model size
28.7M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Collection including ruaccent/RUAccent-stressed-encoder