Komprese zvuku
Komprese zvuku
bakalářská práce (OBHÁJENO)
![Náhled dokumentu](/bitstream/handle/20.500.11956/26760/thumbnail.png?sequence=7&isAllowed=y)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/26760Identifikátory
SIS: 64899
Kolekce
- Kvalifikační práce [11264]
Autor
Vedoucí práce
Oponent práce
Obdržálek, Jan
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Programování
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
22. 6. 2009
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
V posledních dvou desetiletích se multimédia staly součástí života každého z nás. Často ale musíme čelit dvěma sporným požadavkům - omezené kapacitě fyzického úložiště nebo kapacitě připojení k síti a požadavku na rozumnou kvalitu našich médií. Komprese zvyšuje kompatibilitu těchto dvou požadavků tím, že zmenšuje objem dat, který je potřebný na reprezentaci originálu. Tato práce se zaměřuje na kompresi zvuku, specificky na ztrátovou kompresi. Na rozdíl od bezztrátových kompresních algoritmů, ztrátové zavádějí do originálu šum. Výhodou bývá vysoký kompresní poměr, který mnohé tyto kodéry poskytují. Součástí navrhování ztrátového kodeku je snaha učinit ztráty vzniklé při kompresi méně slyšitelnými. Toho se dosahuje pomocí psychoakustiky (využívaní nedostatků lidského sluchu), konkrétně prostřednictvím maskování, vněmové entropie, prahů slyšitelnosti a mnoha dalších jevů. Tato práce vysvětluje některé z těchto jevů a popisuje jejich praktickou implementaci v moderních ztrátových kodérech. Na konec se práce zabývá porovnáním některých zvukových kodeků, jejich principů a schopností.
In the last two decades multimedia have become an integral part of our lives. However, we often face the two clashing requirements - limited storage space or internet connection capacity and the demand for reasonable quality of the media. Compression makes these two requirements more compatible by reducing the amount of data neccessary to store the media. This thesis concentrates on sound, particularly lossy or perceptual compression of audio. As opposed to lossless compression schemes, perceptual coders introduce some noise to the signal to make it better compressible by lossless methods. The tradeoff is an impressive coding efficiency provided by most of these coders. The point of interest in designig a lossy audio coder is to make that damage as imperceptible as possible. This is achieved with knowledge of psychoacoustics (exploiting the imperfections of human auditory system), specifically masking thresholds, perceptual entropy, quiet thresholds and many more. This thesis explains some of these phenomena and their practical implementations in modern audio coders. Finally an overview of select modern audio coders is given, including some technical details about their operation and capabilities.