Tarih  ·  21 Mart 2026

Vocoding Nedir? Vocoder Nasıl Çalışır?

Yazar: Mirza Kasap

İnsan sesinin nasıl oluştuğu ve yapay olarak nasıl üretilebileceği oldukça merak uyandırıcı bir konudur. Nitekim konuşma işlemenin tarihi 200 yıldan daha eskiye dayanır. Bu alandaki ilk büyük adımı atan Macar mucit W. Von Kempelen, insan konuşmasının çeşitli seslerini, her ne kadar basit bir şekilde olsa da taklit edebilen mekanik bir konuşma cihazı inşa eden ilk kişi olmuştur.

W. Von Kempelen'nin mekanik konuşma cihazının çizimi Mekanik konuşma cihazının detay fotoğrafı

Kempelen'in ilk konuşan mekanik cihazından sonra telekomünikasyon alanındaki bir sonraki büyük sıçrama şüphesiz Alexander Graham Bell'in telefonu icat etmesiydi. Aslında Bell'in birincil mesleği insan vokal aygıtının çalışma prensiplerini araştıran bir konuşma bilimcisiydi. Bu sayede "spektral zarf"ın (sesin karakteristiğinin) temellerini anlamıştı. Ancak icadı temelde dalga formlarını ileten bir vericiydi; konuşmayı işlemek ve modellemek ikincil planda kalmıştı.

1930'lar: Modern Konuşma İşlemenin Başlangıcı

Modern konuşma işlemenin serüveni 1930'larda ivme kazandı. Bu dönemin parlayan yıldızı, bugün müzik dünyasında dilimizden düşürmediğimiz vocoder terimini de ortaya atan bilim insanı ve mucit Homer Dudley'di. Dudley öncülüğünde geliştirilen iki devrim niteliğinde cihaz bu teknolojinin temelini attı: Voder (sesle çalışan gösterici) ve Vocoder (kanal ses kodlayıcı).

Dudley, 1928 yılında telefon hatlarında ses verisini sıkıştırarak kıtalar arası iletişimi daha verimli hale getirmek amacıyla Vocoder (ses kodlayıcı) sistemini geliştirdi. Vocoder, bir konuşma dalgasındaki belirli parametreleri analiz ediyor ve bu parametreleri daha sonra konuşmayı yeniden üreten bir sentezleyiciyi kontrol etmek için kullanılıyordu.

Vocoder sistem şeması — fikir, mesaj, taşıyıcı, modülatörler ve hoparlör

Voder ise 1939 yılında New York ve San Francisco'daki dünya fuarında ilk kez sahneye çıktığında insanlarda yoğun bir merak uyandırdı. Sistemi devasa bir müzik aleti gibi düşünebilirsiniz. Cihaz, piyano klavyesine benzer bir konsolun başında duran eğitimli bir insan tarafından kontrol ediliyordu.

Voder operatörü konsolun başında

Operatörün parmakları klavyedeki tuşlara basarak o an hangi frekans bantlarının duyulacağını seçiyordu; bir başka deyişle sesi filtreliyordu. Operatörün hemen bileğinin altında, bileği ile kontrol ettiği bir çubuk (wrist bar) vardı. Eğer "A", "E" gibi ünlü harfleri veya genizden gelen nazal sesleri çıkaracaksa bu çubuğu vızıltı (buzz) yani sesli konuma getiriyordu. Eğer "S", "Ş", "F" gibi sürtünmeli sessiz harfler gerekiyorsa çubuğu tıslama (hiss) konumuna itiyordu. Operatör, ayağı ile kontrol edebildiği bir pedala da sahipti. Pitch Pedal olarak adı geçen bu pedal, makine ile üretilen kelimelerin entonasyonunu değiştirerek insansı bir duygu katmak için kullanılıyordu.

Peki Vocoder Nasıl Analiz Yapar?

Vocoder'ın bir insan sesini analiz edebilmesinin ve bu sesi elektronik olarak yeniden üretebilmesinin temelinde, insan ses yolunun anatomisini matematiksel verilere dönüştürebilmesi yatar. Bu noktada karşımıza spektral zarf (spectral envelope) adında bir kavram çıkar. Spektral zarf, insanın konuşma sinyalindeki filtreleme özelliklerini temsil eden ve zamanla değişen dinamiklere verilen addır. Konuştuğumuzda veya şarkı söylediğimizde, ses tellerimizden çıkan ham ses dalgası ağız ve boğaz boşluğumuzda şekillenir.

Ses yolu anatomisi ve farklı ünlüler için frekans grafikleri

Formantlar

Bu zarfın içinde, sesin güçlü olduğu tepe noktaları vardır. Formantlar, vokal ses yolunun rezonansları olarak tanımlanır. Örneğin farklı ünlü harfleri çıkardığımızda boğazımızın ve ağzımızın şekli değiştiği için tınlama noktaları da değişir. Sinyalin zaman alanındaki genlik değişimlerini bu tınlama noktalarını tespit etmek için yeterli değildir. Dolayısıyla sesin karakteristiğini belirleyen frekans içeriğini analiz etmede Fourier dönüşümleri kritik bir rol oynar. Bu matematiksel dönüşüm, zaman alanındaki sinyali frekans alanındaki genlik spektrumuna çevirir.

Zaman alanından frekans alanına dönüşüm — Fourier dönüşümü

Sonuç

İnsan konuşmasını taklit etme serüveni, Macar mucit W. Von Kempelen'nin 200 yıldan daha uzun süre önce yaptığı basit mekanik cihazla başlamıştır. Zaman içinde telekomünikasyonun gelişmesiyle birlikte bu çaba, sadece sesi iletmenin ötesine geçmiş ve sesin fiziksel doğasını matematiksel olarak çözümleyen gelişmiş bir analiz sistemine dönüşmüştür.

Homer Dudley'in 1930'larda öncülük ettiği bu teknolojik evrim, ilk elektronik sentezleyici olan Voder ve ilk analiz-sentez sistemi olan kanal Vocoder ile somutlaşmıştır. Tüm bu tarihsel ve matematiksel altyapı müziğin ve prodüksiyonun sınırlarını genişletmiş ve sinyal işleme teknolojilerinin kapılarını aralamıştır.

Kaynakça

"The Voder, the First Electronic Speech Synthesizer": historyofinformation.com

"The ‘Voder’ & ‘Vocoder’ Homer Dudley, USA, 1940": 120years.net

"The Voder: First Human Speech Synthesizer": whatisthevoder.com

Görsel 1-6: Arşiv Görüntüleri / Kamu Malı (Public Domain)

M
Mirza Kasap