Models
Datasets
Spaces
Posts
Docs
Pricing
Log In
Sign Up

Audio Course documentation

Kurs materyalini anladığınızı kontrol edin

Audio Course

0.Ünite Kursumuza hoş geldiniz!

1.Ünite Ses verileriyle çalışma

Tanıtım Ses verilerine giriş Bir ses veri kümesini yükleyin ve keşfedin Ses verilerinin ön işlenmesi Ses verileri akışı Quiz Daha fazla bilgi

2.Ünite Ses uygulamalarına nazik bir giriş

Join the Hugging Face community

and get access to the augmented documentation experience

Collaborate on models, datasets and Spaces

Faster examples with accelerated inference

Switch between documentation themes

to get started

Kurs materyalini anladığınızı kontrol edin

1. Örnekleme hızı hangi birimlerle ölçülür?

dB Hz bit

2. Büyük bir ses veri kümesini aktarırken, onu ne kadar sürede kullanmaya başlayabilirsiniz?

Veri kümesinin tamamı indirilir indirilmez. 16 örnek indirilir indirilmez İlk örnek indirildiği anda.

3. Spektrogram nedir?

İlk olarak bir mikrofon tarafından yakalanan sesi dijitalleştiren bir cihaz, ses dalgalarını elektriksel bir sinyale dönüştürür. Ses sinyalinin zaman içindeki genlik değişimini gösteren bir grafik. Ayrıca sesin zaman *etki alanı* temsili olarak da bilinir. Zamanla değişen bir sinyalin frekans spektrumunun görsel temsili.

4. Ham ses verilerini Whisper’ın beklediği log-mel spektrogramına dönüştürmenin en kolay yolu nedir?

A.

librosa.feature.melspectrogram(audio["array"])

B.

feature_extractor = WhisperFeatureExtractor.from_pretrained("openai/whisper-small")
feature_extractor(audio["array"])

C.

dataset.feature(audio["array"], model="whisper")

A B C

5. 🤗 Hub’dan veri kümesini nasıl yüklersiniz?

A.

from datasets import load_dataset

dataset = load_dataset(DATASET_NAME_ON_HUB)

B.

import librosa

dataset = librosa.load(PATH_TO_DATASET)

C.

from transformers import load_dataset

dataset = load_dataset(DATASET_NAME_ON_HUB)

A B C

6. Özel veri kümeniz 32 kHz örnekleme hızına sahip yüksek kaliteli ses içerir. Ses örneklerinin 16 kHz örnekleme hızına sahip olmasını bekleyen bir konuşma tanıma modeli eğitmek istiyorsunuz. Ne yapmalısın?

Örnekleri olduğu gibi kullanın; model kolaylıkla daha yüksek kaliteli ses örneklerine genelleştirilecektir. Özel veri kümesindeki örnekleri alt örneklemek için 🤗 Veri Kümeleri kitaplığından Ses modülünü kullanın Diğer tüm numuneleri atarak 2 kat alt numune alın.

7. Makine öğrenimi modeli tarafından oluşturulan bir spektrogramı dalga biçimine nasıl dönüştürebilirsiniz?

Spektrogramdan bir dalga biçimini yeniden oluşturmak için ses kodlayıcı adı verilen bir sinir ağını kullanabiliriz. Oluşturulan spektrogramı dalga biçimine dönüştürmek için ters STFT'yi kullanabiliriz. Makine öğrenimi modeli tarafından oluşturulan bir spektrogramı dalga biçimine dönüştüremezsiniz.

←Ses verileri akışı

Kurs materyalini anladığınızı kontrol edin 1. Örnekleme hızı hangi birimlerle ölçülür? 2. Büyük bir ses veri kümesini aktarırken, onu ne kadar sürede kullanmaya başlayabilirsiniz? 3. Spektrogram nedir? 4. Ham ses verilerini Whisper’ın beklediği log-mel spektrogramına dönüştürmenin en kolay yolu nedir? 5. 🤗 Hub’dan veri kümesini nasıl yüklersiniz? 6. Özel veri kümeniz 32 kHz örnekleme hızına sahip yüksek kaliteli ses içerir. Ses örneklerinin 16 kHz örnekleme hızına sahip olmasını bekleyen bir konuşma tanıma modeli eğitmek istiyorsunuz. Ne yapmalısın? 7. Makine öğrenimi modeli tarafından oluşturulan bir spektrogramı dalga biçimine nasıl dönüştürebilirsiniz?