User:Beginner 25/video
A Wikipédiából, a szabad lexikonból.
Kép- és videotömörítés az az eljárás, amivel a digitális formára alakított vagy keletkezett képek vagy videok - ami valójában egymás utáni képek sorozata - méretét (tárolás vagy továbbítás céljából) a lehető legkissebbé alakítják. Kép- és videotömörítést vagy egyértelműen kódolható (veszteségmentes) vagy valamilyen hűségkritériumon alapuló (veszteséges) eljárással hajthatunk végre.
[szerkesztés] A tömörítés mértéke
A veszteséges eljárások a veszteségmenteshez képest akár nagyságrendekkel is jobb tömörítést érnek el, észrevehető minőségromlás nélkül. Amennyiben a minőségből további engedményeket teszünk, akkor még ennél is jobb eredmények érhetők el. Viszont ahhoz, hogy tömörítés mértékét és minőség romlását egyértelműen össze tudjuk hasonlítani, szükséges e két kvantitatív jellemző mérése. Elméletileg a tömörítés mértékének meghatározásához elegendő a tömörített és a tömörítetlen információk mennyiségének hányadosát venni. A tömörített információ jellemzően egy bitfolyam, ennek mérete a benne lévő bitek mennyisége. A tömörítetlen információ mérése már nehézségekbe ütközhet: különösen a folyamatos értékkészlet és értelmezési tartomány esetén. Ilyen esetben a tömörítetlen információ mennyiségét a kódoló bemenetén megjelenő jel – ami szintén egy bitfolyam – méretének tekinthetjük. Ez a bementi bitfolyam valójában az eredeti jellel azonos vizuális információt adó, de már mintavételezett és kvantálással véges értékkészletűvé alakított jel bináris megfelelője. A tömörítetlen információ mennyiségének becsléshez kulcsfontosságú a mintavételezés és kvantálás kiválasztása. Ezt szabványok írják elő, a felbontást és a színmélységet, valamint a képfrekvenciát. Képtömörítés esetében gyakorlatilag bármilyen felbontás használható, videotömörítés esetén a nemzetközi szabványok szerint 720 x 480 (NTSC) illetve 768 x 576 (PAL) a szokásos felbontás. A képfrissítési frekvencia pedig 29,97 Hz illetve 25 Hz. A színtérbeli kvantálást a színmélység, azaz az egy képpontra jutó bitek száma jellemzi: általánosan ez 8 illetve 24 bit.
Hűségkritériummal való kódolás esetén meg kell először határozni egy adott minőséget, amit alapnak tekintünk. Sajnos, itt csak szubjektív érzékelésre hagyatkozhatunk egy adott kép vagy video minőségének megítélése során. Az értékeléskor egy adott tesztadaton végrehajtjuk a tömörítést, majd ennek inverzét, és az így kapott képet vagy videot egy testcsoporttal kiértékeltetünk.
[szerkesztés] Az emberi látás
A használatos veszteséges kép- és videotömörítési eljárásokat az emberi látásról meglévő ismereteink felhasználásával alakították ki. Az információmennyiség csökkentése érdekében a kép azon részeit kódoljuk kis pontossággal, amelyekre a szemünk kevéssé érzékeny, és azokat a részeket kódoljuk csaknem eredeti minőségben, amelyekre a szemünk igen érzékeny. A színeket és a fényességet a szemben lévő két receptor, a csapok és pálcikák érzékelik. A pálcikák azonban csak a perifériális tartományban, illetve igen kis fényességek esetében játszanak szerepet, ezért jelenlétüktől most eltekintünk. Háromféle, különböző spektrális érzékenységű csap található a szemünkben, amelyek a rájuk eső fényre lineárisan reagálnak. A spektrális érzékenységeiket jelöljük 
-val, 
-val, 
-val (az angol short, medium és long szavak alapján.). Ezek a függvények a látható spektrumtartományon (380nm – 780nm) kívül 0 értéket, míg ezen belül nemnegatív értéket vesznek fel. Az 
csúcsa a kisebb hullámhosszak tartományában, az 
csúcsa a közepes hullámhossz tartományba és az 
csúcsa a hosszú hullámhossztartományba esik.
Egy L
spektrális energiasűrűséggel rendelkező fénysugár által kiváltott ingert az alábbi vektorral jellemezhetjük:
Az integrálást itt a látható spektrumra kell elvégezni. L
semmilyen λ-re nem lehet negatív, ugyanis negatív spektrális energiasűrűségnek nincsen fizikai értelme. Így nyilvánvalóan S, L, M értéke is nemnegatív.
Ebből az ingerhármasból alakul ki idegrendszerünkben nemlineáris feldolgozása során a színérzet. Fontos következménye ennek, hogy a két különböző spektrummal rendelkező fényt nem tudunk egymástól megkülönböztetni, ha a hozzájuk tartozó S, M,L értékek megegyeznek. Ez a jelenség a metamer színérzet. Azonos S,M,L ingert kiváltó (vagyis azonos fényesség- és színérzetet keltő, emberi szem által megkülönböztethetelen) spektrumot nevezzük metamer színeknek.
Mivel szemünk érzékenysége a fényességre jóvel nagyobb, mint a színre, ezért érdemes azeket az adatokat elkülöníteni egymástól, amit egy, az ingereken végrehajtott lineáris transzformációval tehetünk meg:
Ebben a transzformált térben Y a fényességérzet, X és Z a színérzet. Természetesen egy L
spektrumú fény
koordinátái egy lépésben (S,M, és L kiszámítása nélkül) is kiszámíthatóak:
Az integrálást most is a látható spektrumra kell elvégezni, de most a
súlyfüggvényt kell alkalmazni. Fontos, hogy az
-et úgy választották meg, hogy minden nemnegatív értékkészletű L
-hoz tartozó X,Y,Z értékek nemnegatívak legyenek.
A gyakorlatban a fényesség leírására Y megfelelő, a színérzetet pedig az x és y koordinátákkal adják meg - vagyis x és y az adott spektrumhoz tartozó
[szerkesztés] GIF- Graphics Interchange Format
A GIF formátumot a Compuserve Information Service foglalta szabványba. Grafikus képek veszteségmentes tömörítésére lehet használni. A tömörítő algoritmus LZW alapon működik, lényegében egy dinamikusan növekvő szótárral dolgozó megoldás.
A GIF formátumban a képpontok színét úgynevezett indexelt formában tárolják. Amikor minden képpont színét a színkoordináta-rendszerek valamelyikében adjuk meg, akkor folyamatos tónusú tárolásról beszélünk. Megtehetjük viszont, hogy a képen használt színek valamilyen leírását egy palettába gyűjtjük ki, és a képpontok megadásakor a szinekre a palettabeli indexükre hivatkozunk. Ez az indexelt tárolás.
Ezzel a módszerrel igen nagy tömörítést érhetünk el. Ha egy képet az RGB színkoordinátákkal, koordinátánként 8-8 bitet felhasználva tárolunk, akkor minden képponthoz 24 bitet kell megadni. Ha ugyanezt a képet egy 256 színű palettával indexelten tároljuk, akkor a palettán kívül képpontonként csak egy 8 bites indexet kell megadni. Ha a kép nem túl kicsi, akkor hozzávetőleg 1:3 tömörítés érhető el.






Based on work by