Další články‎ > ‎

Vzorkovací frekvence, aneb 44,1kHz; 48kHz; 96kHz nebo 192kHz?

přidáno: 7. 11. 2014 14:10, autor: Martin Jirsák
Tento příspěvek se netýká přímo Cubase samotné, spíše obecně digitalizace zvuku. Ale vzhledem k tomu, že na tento dotaz často narážím (a Cubase se týká také), není důvod jej nezmínit.

Vzorkovací frekvence je parametr, který udává, jak často bude vyhodnocován aktuální stav zvukové křivky. Zvuk je v reálném prostředí analogový, tedy spojitý. Počítače ale tímto způsobem pracovat nemohou, musejí nějakým způsobem škálovat, tedy odečítat hodnotu v nějaké časové posloupnosti, periodě. Vzorkovací frekvence 44,1kHz říká, že zvuk bude za 1 vteřinu vyhodnocen 44100krát. Logicky, 48kHz bude zvuk za 1 vteřinu vyhodnocovat 48000krát, atd. Teoreticky a logicky by tedy vyšší vzorkovací frekvence měla být lepší, bližší realitě. Ne vždy je to ale nutné a dokonce ne vždy vhodné.

Nejnižší vzorkovací frekvence, která se dnes běžně pro hudbu a zvuk používá, je 44,1kHz. Tato vzorkovací frekvence se také používá na klasických audio-CD (kde je standardem a odkud se vzala). Proč právě 44,1kHz? Není to náhoda. Lidské ucho je schopné vnímat zvuk maximálně do 20kHz (někde se uvádí jen maximálně 16kHz; je pravda, že se zvyšujícím se věkem se tato hranice navíc ještě postupně snižuje; berme tedy ale to maximum: 20kHz). Vyšší zvuky lidské ucho prostě neslyší. Pro to, abychom mohli určit stav, je potřeba udělat alespoň dvě měření, tedy zvuk sejmout dvakrát. Jsme tedy náhle u 40000 měření za vteřinu. K tomu přidáme bezpečnostních 10% navíc a máme tu hodnotu 44kHz.

Standardizovaná frekvence 44,1kHz je tedy nejnižší možná taková, abychom o nějaké zvukové informace (v této výšce jde už jen o barvu zvuku; hudba už zde neprobíhá, leda jen ve velmi výjimečných a extravagantních případech, kdy se jedná o záměr) nepřišli.

Má tedy smysl natáčet na vyšší vzorkovací frekvenci, když data zabírají více místa (při použití 96kHz je stejně dlouhý zvukový soubor více než dvakrát větší, při použití 192kHz dokonce více než čtyřikrát větší, než při použití 44,1kHz) na pevném disku? Někteří lidé říkají, že rozdíl poznají. Rozdíl ale musejí spíše cítit než vyloženě slyšet. Jak jsem psal výše, lidské ucho to prostě není schopno slyšet. V takovém případě tedy má smysl pracovat ve vyšším rozlišení, s vyšší vzorkovací frekvencí, než je 44,1kHz. Navíc, pokud má výsledkem být DVD s vzorkovací frekvencí 96 nebo 192kHz a nebo i pokud má být hudba/zvuk vysílán v televizi, kde systém PAL počítá se vzorkovací frekvencí 48kHz, je to v podstatě nutnost. Pokud budeme nahrávat data ve 44,1kHz a na závěr resamplovat (převzorkovávat, v tomto případě by šlo o méně známý tzv. upsampling), máme jistotu, že zvukové barvy, které bychom zachytili rovnou při záznamu do 96 nebo 192kHz již jednoduše nikdy nezískáme. Navíc tu ještě vznikne chyba při samotném procesu převzorkovávání.

Není tedy lepší nahrávat a pracovat v co nejvyšší vzorkovací frekvenci a na závěr vždy převzorkovat (v tomto případě půjde o směr dolů, tedy tzv. downsampling) na vzorkovací frekvenci, kterou budeme potřebovat? Bohužel nikoliv. V závěrečném procesu downsamplingu totiž opět můžeme přijít o nějaké informace že zvukového obrazu. A to v případě, že původní frekvence nebude s výslednou frekvencí dělitelná celým číslem. Tedy například downsamplin ze 192kHz na 96kHz nebo 48kHz je bezproblémový (192:96=2; 192:48=4), stejně jako převzorkování z 88,2kHz na 44,1kHz. Problém je ale jakékoliv převzorkování napříč těmito dvěma "světy", například ze 192kHz na 44,1kHz (192:44,1=44,3537415...). To znamená, že při převzorkování nebude proces tak jednoduchý – vezmeme například pouze každý druhý vzorek (jako je tomu ze 192kHz na 96kHz; nebo z 88,2kHz na 44,1kHz). Proces je výrazně složitější, je potřeba dopočítávat nové hodnoty v časech, které reálně nebyly sejmuty. A tak si počítač vlastně trošku "vymýšlí" a může dojít k chybám.


Z těchto důvodů se doporučuje vědět už během záznamu, jaké bude finální medium a znat tedy finální vzorkovací frekvenci. Potom je dobré natáčet a dále pracovat se stejnou vzorkovací frekvencí, jaká bude na výstupu a nebo s celočíselným násobkem této frekvence. Na CD lze tedy točit ve 44,1kHz a nebo 88,2kHz. Pokud půjde výsledek do televize se systémem PAL, počítáme s výsledkem 48kHz a tedy lze točit do 48; 96 a nebo 192kHz.
Comments