metadata
license: apache-2.0
language:
- aa
- ae
- ak
- ba
- ru
- zh
- fr
- fy
- en
- el
- pl
- be
- dv
- de
- bg
metrics:
- charcut_mt
- code_eval
base_model:
- Felguk/felguk-audio-edit
pipeline_tag: zero-shot-classification
library_name: allennlp
tags:
- audio edit
- audio
Felguk Audio Edit Model
Это модель для редактирования аудио, разработанная Felguk. Она позволяет выполнять различные задачи, такие как обрезка, наложение эффектов и другие манипуляции с аудиофайлами.
Поддерживаемые языки
Модель поддерживает работу с аудио на следующих языках:
- Афарский (aa)
- Авестийский (ae)
- Акан (ak)
- Башкирский (ba)
- Русский (ru)
- Китайский (zh)
- Французский (fr)
- Фризский (fy)
- Английский (en)
- Греческий (el)
- Польский (pl)
- Белорусский (be)
- Мальдивский (dv)
- Немецкий (de)
- Болгарский (bg)
Результаты обрезки аудио
Ниже приведен пример работы модели для обрезки аудио:
Оригинал
Оригинальный аудиофайл:
Обрезанный результат
Пример обрезанного аудио:
Инструменты для работы с Felguk Audio Edit
Модель Felguk/felguk-audio-edit
поддерживает следующие инструменты для редактирования аудио:
№ | Название инструмента | Описание |
---|---|---|
1 | Изменение громкости | Увеличение или уменьшение громкости аудио. |
2 | Изменение скорости | Ускорение или замедление воспроизведения аудио. |
3 | Изменение высоты тона | Повышение или понижение тональности аудио (pitch). |
4 | Обрезка аудио | Удаление ненужных частей аудиофайла. |
5 | Фильтр низких частот | Удаление высоких частот для создания эффекта "приглушенного" звука. |
6 | Добавление фонового шума | Наложение фонового шума для создания атмосферы. |
7 | Нормализация аудио | Выравнивание громкости аудио до оптимального уровня. |
8 | Реверс аудио | Воспроизведение аудио в обратном направлении. |
9 | Добавление эхо | Наложение эффекта эхо для создания пространственного звучания. |
Примечание: Демо-приложение уже добавлено! 🥳
Завершение примечания.
Использование
Пример использования модели для редактирования аудио:
import torch
from transformers import AutoModelForAudioEditing, AutoProcessor
# Загрузка модели и процессора
model_name = "Felguk/felguk-audio-edit"
model = AutoModelForAudioEditing.from_pretrained(model_name)
processor = AutoProcessor.from_pretrained(model_name)
# Загрузка аудиофайла
audio_input, sample_rate = processor.load_audio("path_to_your_audio_file.wav")
# Обработка аудио
with torch.no_grad():
edited_audio = model(audio_input)
# Сохранение результата
processor.save_audio("edited_audio.wav", edited_audio, sample_rate)