This is an old revision of the document!
Multimédia tömörítési módszerek
Jellemzően tömörítetlen formában a multimédia adatok igen nagy tárterületet igényelnek. A multimédia tömörítési eljárások általában a veszteséges eljárások csoportjába tartoznak, azaz nem állítják vissza az eredeti adatot, hanem úgy csalnak, hogy az emberi érzékszervek ne érzékeljék.
Példa
pl. Mikrofonnal 1 másodperc sztereó felvétel CD minőségben:
44100 * 16 bit * 2 ~ 1,4 [MegaBit]
És ez csak 1 másodperc volt!
Példa
Full HD képkocka (1080p): 1920-1080 mérete (elméleti mérete)
1920 * 1080 * 24 bit ~ 6 MByte
Vegyük figyelembe, hogy ez csak egyetlen képkocka, a modern multimédia rendszerek másodpercenként 30-60 (újabban akár 100) képkockát szoktak megjeleníteni.
Veszteséges tömörítés alapelve: Olyan módon kell átalakítani a bitfolyamokat, hogy az emberi szem és fül számára fontos információ megmaradjon. A tapasztalat szerint a szemünk érzéketlenebb a nagyobb térbeli frekvenciájú képösszetevőkre, azaz egy halvány sűrű mintázatot nehezebben veszünk észre, mint egy ritkább mintázatot. Mozgó kép esetén is az alacsony frekvenciákra érzékeny a szemünk.
A kétdimenziós Fourier transzformáció abban segít, hogy a kép pixeleit átalakítja frekvencia értékekre.
megjegyzés: adott egy mikrofonfelvétel, ami mintavételezett időpillanatokban az érzékelt hangerőértékeket (amplitúdókat) ábrázolja. Tegyük fel, hogy zongorán valaki a 'Boci-boci tarka' c. dalt vette fel. A Fourier transzformációt úgy kell elképzelni, hogy a transzformáció meg tudja állapítani, hogy egy adott időintervallumban pl. egy C szólt, máshol egy E. Ez olyan, mintha a kottát próbálnánk előállítani hallás után. Ha csak a kottafejeket kódolnánk és megadnánk hogy zongorát használtunk, akkor nagyon nagy tömörítést kapnánk. A valóságban az összes felhangot is megkapjuk csökkenő intenzitással.
JPEG tömörítés elve
A világon a legismertebb veszteséges tömörítéses módszer a JPG vagy JPEG.
Nem célunk a precíz matematikáját bemutatni. Viszont megmutatjuk, hogy milyen lépésekből áll: JPEG eljárás
1.) A képet 8×8-as mátrixokra osztjuk és egyesével haladunk mátrixonként
2.) Elvégezzük az un. diszkrét koszinusz transzformációt a mátrixon, ez alakítja át frekvencia tartományba az adatot, ez teszi lehetővé, hogy úgy tudjunk elhagyni értékeket (információt), hogy ez észrevehető lenne szemmel.
3.) Kvantáljuk az eredmény mátrixot előre meghatározott szabályok alapján. Ez a lépés jelenti az adatvesztést. Ezt úgy lehet elképzelni, mint egy kerekítést. Tegyük fel, hogy az eredmény 16.345 volt egy adott mátix pozícióban, de e helyett 16-ot írunk.
4.) Mátrixot cikk-cakk elrendezésben tekintjük és alkalmazzuk az értékekre az RLE kódolást.