Раздел 7. Собираем все воедино 🪢

Молодцы, что добрались до 7-го раздела 7 🥳 Вы находитесь всего в нескольких шагах от завершения курса и приобретения нескольких последних навыков, необходимых для работы в области Аудио ML. Что касается понимания, то вы уже знаете все, что нужно знать! Вместе мы всесторонне рассмотрели основные темы, составляющие аудио домен, и сопутствующую им теорию (аудио данные, классификацию аудиоданных, распознавание речи и преобразование текста в речь). Целью данного раздела является создание основы для сочетания всего этого вместе: теперь, когда вы знаете, как работает каждая из этих задач в отдельности, мы рассмотрим, как вы можете объединить их вместе для создания некоторых реальных приложений.

Чему вы научитесь и что создадите

В этом разделе мы рассмотрим следующие три темы:

Перевод речи в речь: перевод речи с одного языка в речь на другом языке
Создание голосового ассистента: создание собственного голосового помощника, работающего аналогично Alexa или Siri
Транскрибирование встреч: транскрибация встречи и маркировка транскрипции с указанием того, кто когда выступал

< > Update on GitHub

Audio Course

Раздел 7. Собираем все воедино 🪢

Чему вы научитесь и что создадите