Раздел 7. Собираем все воедино 🪢
Молодцы, что добрались до 7-го раздела 7 🥳 Вы находитесь всего в нескольких шагах от завершения курса и приобретения нескольких последних навыков, необходимых для работы в области Аудио ML. Что касается понимания, то вы уже знаете все, что нужно знать! Вместе мы всесторонне рассмотрели основные темы, составляющие аудио домен, и сопутствующую им теорию (аудио данные, классификацию аудиоданных, распознавание речи и преобразование текста в речь). Целью данного раздела является создание основы для сочетания всего этого вместе: теперь, когда вы знаете, как работает каждая из этих задач в отдельности, мы рассмотрим, как вы можете объединить их вместе для создания некоторых реальных приложений.
Чему вы научитесь и что создадите
В этом разделе мы рассмотрим следующие три темы:
- Перевод речи в речь: перевод речи с одного языка в речь на другом языке
- Создание голосового ассистента: создание собственного голосового помощника, работающего аналогично Alexa или Siri
- Транскрибирование встреч: транскрибация встречи и маркировка транскрипции с указанием того, кто когда выступал