felguk-audio-edit / README.md
Felguk's picture
Update README.md
3c8f91b verified
metadata
license: apache-2.0
language:
  - aa
  - ae
  - ak
  - ba
  - ru
  - zh
  - fr
  - fy
  - en
  - el
  - pl
  - be
  - dv
  - de
  - bg
metrics:
  - charcut_mt
  - code_eval
base_model:
  - Felguk/felguk-audio-edit
pipeline_tag: zero-shot-classification
library_name: allennlp
tags:
  - audio edit
  - audio

Felguk Audio Edit Model

Header Image Angry Cat GIF

Это модель для редактирования аудио, разработанная Felguk. Она позволяет выполнять различные задачи, такие как обрезка, наложение эффектов и другие манипуляции с аудиофайлами.

Demo App

Поддерживаемые языки

Модель поддерживает работу с аудио на следующих языках:

  • Афарский (aa)
  • Авестийский (ae)
  • Акан (ak)
  • Башкирский (ba)
  • Русский (ru)
  • Китайский (zh)
  • Французский (fr)
  • Фризский (fy)
  • Английский (en)
  • Греческий (el)
  • Польский (pl)
  • Белорусский (be)
  • Мальдивский (dv)
  • Немецкий (de)
  • Болгарский (bg)

Результаты обрезки аудио

Ниже приведен пример работы модели для обрезки аудио:

Оригинал

Оригинальный аудиофайл:

Обрезанный результат

Пример обрезанного аудио:

Инструменты для работы с Felguk Audio Edit

Модель Felguk/felguk-audio-edit поддерживает следующие инструменты для редактирования аудио:

Название инструмента Описание
1 Изменение громкости Увеличение или уменьшение громкости аудио.
2 Изменение скорости Ускорение или замедление воспроизведения аудио.
3 Изменение высоты тона Повышение или понижение тональности аудио (pitch).
4 Обрезка аудио Удаление ненужных частей аудиофайла.
5 Фильтр низких частот Удаление высоких частот для создания эффекта "приглушенного" звука.
6 Добавление фонового шума Наложение фонового шума для создания атмосферы.
7 Нормализация аудио Выравнивание громкости аудио до оптимального уровня.
8 Реверс аудио Воспроизведение аудио в обратном направлении.
9 Добавление эхо Наложение эффекта эхо для создания пространственного звучания.

Примечание: Демо-приложение уже добавлено! 🥳
Завершение примечания.

Использование

Пример использования модели для редактирования аудио:

import torch
from transformers import AutoModelForAudioEditing, AutoProcessor

# Загрузка модели и процессора
model_name = "Felguk/felguk-audio-edit"
model = AutoModelForAudioEditing.from_pretrained(model_name)
processor = AutoProcessor.from_pretrained(model_name)

# Загрузка аудиофайла
audio_input, sample_rate = processor.load_audio("path_to_your_audio_file.wav")

# Обработка аудио
with torch.no_grad():
    edited_audio = model(audio_input)

# Сохранение результата
processor.save_audio("edited_audio.wav", edited_audio, sample_rate)