A hangrögzítés és a hangformátumok alapjai

2016. július 02. - -Thingol-

A megszólalt hang elképesztően sok kompetenstől függhet: ugyanaz a fülhallgató szólhat egy rendszerben jól és rosszul is: egy HD650 is szarul szól egy régi telefon kontaktos jack csatlakozójában, ha száz éves rádiófelvételeket hallgatunk... Én azt szoktam mondani, hogy a hangmegszólaltatás egy igazi lánc, ami annyira szól szépen, mint a leggyengébb láncszem. Az egyik ilyen potenciális láncszem pedig a felvett hang maga, ahogy rögzítve, tárolva és tömörítve van. Én személy szerint azért preferálom a jobb minőségű zenék hallgatását, mert egyébként bennem van a félsz, hogy emiatt nem szól valami úgy, ahogy kéne.

A hangfelvétel alapjai

Sajnos nehezen tudunk a témában tovább haladni, ha nem vagyunk tisztában a digitális hangrögzítésnek legalább az alapjaival (tényleg csak nagyon az alapokkal, nyugi!) – ezért először azt mutatnám be nektek.

Egy adott hangfájlnál általában kettő fő paraméter van, amire érdemes figyelni: ez az, hogy hány bit-es a felvétel, hány Hertzes (természetesen van más technológián/elgondoláson alapuló hangfelvevés is, de most az egyszerűség kedvéért ezt vettem alapértelmezettnek). De menjünk szépen sorrendben: a hangrögzítést úgy képzeljétek el, mintha hirtelen megállítanánk az időt és abban a megállított pillanatban vennénk mintát, majd később ezeket a pillanatokat összekötve kapnánk meg digitálisan is magát a felvett anyagot.

A Hertz azt mutatja meg, hogy hányszor vettünk egy másodpercben mintát az adott zenéből: a 96 kHz azt jelenti, hogy egy másodpercben 96000-szer vettünk mintát (hányszor állítottuk meg az időt). Az, hogy hány bites egy zene (2-4-16-24 stb) azt mutatja meg, hogy ebben az adott pillanatban hányfajta minta közül tudjuk kiválasztani azt, hogy melyik áll a legközelebb az analóg jelhez. Egy 16 bites mintánál a lehetőségek száma 2^16-on, azaz 65.536. Egy 24 bites mintánál már 16.777.216 (2^24) a lehetőségek száma, ami a 256 szorosa az előző számnak. Elképesztő, mi? Arról, hogy a minél jobb minőség elérésnek érdekében inkább a Hz-t vagy a bitet érdemes növelni komoly szakmai viták folynak a mai napig – ebbe most inkább nem mennék bele.

Itt tenném még hozzá, hogy jelenleg a 44,1 kHz a legelterjedtebb frekvencia azért, mert az audio CD-k is ezt használták.

Természetesen a fájlok méretét a tömörítés is nagyban befolyásolja (méretet lehet csökkenteni több módon, van veszteségmentes, veszteséges és kicsit veszteséges megoldás is), de erről egy külön posztban fogunk majd beszélni – és természetesen a digitális hangrögzítés sem csak ennyiből áll, de nekünk most tényleg elegek voltak az alapok.

Egyelőre maradjunk a nagy részletsségű hangormátumoknál inkább.

Tömörítetlen zene, vagy az ún. „Studio Masterek”:

Amikor a zenét felveszik egy studióban, akkor egy relatív nagy fájlokban tárolják őket teljesen tömörítetlenül, ezek a „Studio Masterek”. Ezek a fájlok (ahol külön fájlban van rögzítve a hangszerek, vagy a hangszerek kicsi kombinációja) a legtisztább, legrészletesebb, legvalósághűbb lenyomata annak, amit a zenész ténylegesen játszott a stúdióban. Sajnos az extrém méretük miatt a terjesztésen nem elterjedtek – egy perc tömörítetlen zene (44.1 kHz-val és 24bittel) kb. ~10 MB méretű.

Itt két elterjedt fájlformátum van, az egyik az AIFF, amit az Apple fejlesztett ki illetve a WAV, amit a Microsoft és az IBM.

Tömörített, de veszteségmentes zene

Hogy a terjesztést megkönnyítsék, megpróbáltak a fájlok méretét csökkenteni, így jött létre a tömörített, de veszteségmentes hangformátum. Hogy igazán veszteségmentes legyen, ezért csak a „fölösleges” adatokat törlik ki a sutdio masterekből, azokat, ahol hangot tárolnak azokat nem, így maga a zene teljesen érintetlen marad. A veszteségmentes tömörítés egy járható kompromisszum a az eredeti hangfelvételek és a veszteségesen tömörített mp3 között.

Ahogy az előbb is, itt is két formátum terjedt el, az Apple féle ALAC és az elterjedtebb FLAC.

Veszteséges tömörítés

A zeneterjesztés érdekében még tovább akarták csökkenteni a fájlméretet, de ezt már csak úgy tudták elérni, ha effektív a zenéből is veszítünk el elemeket, ezt hívják veszteséges tömörítésnek. Ez azt jelenti, hogy a zene néhány része effektív elveszik.

Természetesen, ahogy a technika fejlődött úgy fejlődött ez a fajta tömörítés is, próbálják a legkevésbé fontos részeket lehagyni a zeneminőség szempontjából. Az erre kiépült iparágat „pszichoakusztikának” hívják és azzal foglalkozik, hogy a tömörítés során azokat a részeket vágják ki, amiket amúgy is a legnehezebb az emberi fülnek észlelni vagy, amiket egy olcsó/közepes minőségű hangszóró amúgy sem tud annyira visszaadni. Manapság már egy jól tömörített kicsit veszteséges zenét alig lehet megkülönböztetni egy tömörítetlen CD minőségtől – főleg, a telefonhoz/mp3 lejátszóhoz járó, jellemzően rossz minőségű fülhallgatókkal.

Természetesen itt is többfajta codec terjedt el, az egyik az Advanceed Audio Coding (AAC), amit az Apple és a Windows is használ a videókhoz, de természetesen a legelterjedtebb az mp3 – ami annyira elterjedt, hogy ma már sok helyen egyet jelent a zenével magával.

A bitráta nagyon leegyszerűsítve annyit mond meg, hogy másodpercenként hány bitet szükséges feldolgozni a lejátszáshoz (nem nehéz belátni, hogy a bitrátánál a minél több, annál jobb elv érvényesül). Youtubeon a HD videóknak van általában 192 kbprs-es bitrátájuk, ami nem számít a legjobbnak (bár az AAC-nél a 256kbit/s az elterjedt – az mp3nál a 320 kbprs az elméleti maximum). A Spotify akkor használ ekkora bitrátát, ha 3G-n keresztül streamelsz, egyébként ha premium vagy, akkor wifin vagy ha letöltötted akkor 320 kbps-t használ. Egy rendes audio CD bitrátája egyébként 1411 kbps, ezt szokás a standardnak használni.

Néhány számnál változott bitráta van megadva: ez azt jelenti, hogy a szám azon részeinél, ahol nem annyira nincs szükség annyi adatra, ott kisebb a bitráta, míg néhány részénél nagyobb. Az Amazon zeneboltja ilyen pl.

spotify telefon	Ogg Vorbis	96-128 kbps
spotify premium	Ogg Vorbis	320 kbps
youtube HD	AAC	192 kbps
audio CD	Wav	1411 kbps
letöltött mp3	mp3	128-320 kbps
iTunes	AAC	256 kbps

4 kbit/s – szükséges minimum a beszédfelismeréshez
8 kbit/s – telefon minőség
32 kbit/s – AM rádió minőség
96 kbit/s – FM rádió minőség

forrás: wikipedia

Mint láthatjátok, azért ez egy eléggé szerteágazó téma, amiről nehéz egyről a kettőre jutni: én most egy alapszintű betekintést próbáltam adni a különböző részletességű hangformátumok világába: így talán kicsit jobban érthető.

Ha kérdésetek van, vagy valamit rosszul írtam, akkor szóljatok!

Szólj hozzá!

egy kezdő audiophile naplója

A hangrögzítés és a hangformátumok alapjai

A bejegyzés trackback címe:

Kommentek:

egy kezdő audiophile naplója

A hangrögzítés és a hangformátumok alapjai

Ajánlott bejegyzések:

A bejegyzés trackback címe:

Kommentek: