Komprese zvuku
Komprese zvuku
bachelor thesis (DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/26760/thumbnail.png?sequence=7&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/26760Identifiers
Study Information System: 64899
Collections
- Kvalifikační práce [11264]
Author
Advisor
Referee
Obdržálek, Jan
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Programming
Department
Department of Software Engineering
Date of defense
22. 6. 2009
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
V posledních dvou desetiletích se multimédia staly součástí života každého z nás. Často ale musíme čelit dvěma sporným požadavkům - omezené kapacitě fyzického úložiště nebo kapacitě připojení k síti a požadavku na rozumnou kvalitu našich médií. Komprese zvyšuje kompatibilitu těchto dvou požadavků tím, že zmenšuje objem dat, který je potřebný na reprezentaci originálu. Tato práce se zaměřuje na kompresi zvuku, specificky na ztrátovou kompresi. Na rozdíl od bezztrátových kompresních algoritmů, ztrátové zavádějí do originálu šum. Výhodou bývá vysoký kompresní poměr, který mnohé tyto kodéry poskytují. Součástí navrhování ztrátového kodeku je snaha učinit ztráty vzniklé při kompresi méně slyšitelnými. Toho se dosahuje pomocí psychoakustiky (využívaní nedostatků lidského sluchu), konkrétně prostřednictvím maskování, vněmové entropie, prahů slyšitelnosti a mnoha dalších jevů. Tato práce vysvětluje některé z těchto jevů a popisuje jejich praktickou implementaci v moderních ztrátových kodérech. Na konec se práce zabývá porovnáním některých zvukových kodeků, jejich principů a schopností.
In the last two decades multimedia have become an integral part of our lives. However, we often face the two clashing requirements - limited storage space or internet connection capacity and the demand for reasonable quality of the media. Compression makes these two requirements more compatible by reducing the amount of data neccessary to store the media. This thesis concentrates on sound, particularly lossy or perceptual compression of audio. As opposed to lossless compression schemes, perceptual coders introduce some noise to the signal to make it better compressible by lossless methods. The tradeoff is an impressive coding efficiency provided by most of these coders. The point of interest in designig a lossy audio coder is to make that damage as imperceptible as possible. This is achieved with knowledge of psychoacoustics (exploiting the imperfections of human auditory system), specifically masking thresholds, perceptual entropy, quiet thresholds and many more. This thesis explains some of these phenomena and their practical implementations in modern audio coders. Finally an overview of select modern audio coders is given, including some technical details about their operation and capabilities.