Analýza hlavních komponent
Z Wikipedie, otevřené encyklopedie
Analýza hlavních komponent (Principal Component Analysis) se v teorii signálu transformace používá k dekorelaci dat. Často se používá ke snížení dimenze dat s co nejmenší ztrátou informace. PCA je možno najít také jako Karhunen-Loèveho transformaci nebo Hotellingovu transformaci.
Z následujícího vzorce je vidět, že PCA je jen přepsáním vstupu do jiné souřadné soustavy:
Y = XP
kde X je centrovaná matice nxd se vstupními d-rozměrnými daty v n řádcích, Y obdobná matice výstupních dat, P je dxd matice vlastních vektorů kovarianční matice CX splňující vztah CX = PΛPT, kde Λ je diagonální matice obsahující na diagonále vlastní čísla CX a matice vlastních vektorů P je ortonormální, tj. PTP = Id, kde Id je jednotková matice dimenze d.
Vlastní vektory (sloupce matice P) tvoří onu novou souřadnou soustavu. Centrování matice X dosáhneme odečtením příslušného výběrového průměru od každého sloupce.
Obsah |
[editovat] Odvození
Matice Y je zřejmě také centrovaná, t.j., aritmetický průměr každého jejího sloupce je 0.
Spočítáme, jak musí vypadat kovarianční matice nových dat Y:
CY = E(YTY) = E[(XP)T(XP)] = E(PTXTXP) = PTE(XTX)P = PTCXP = PTPΛPTP = Λ.
Vzhledem k tomu, že matice Λ je diagonální,

vidíme, že sloupce matice Y jsou nekorelované a výběrový rozptyl každého sloupce se rovná příslušnému vlastnímu číslu.
[editovat] Použití
Seřadíme-li vlastní vektory v P podle velikosti vlastních čísel λi, budeme dostávat složky v Y setříděné podle rozptylu. Pokud chceme snížit dimenzi dat, stačí z Y vzít jen tolik prvních složek kolik uznáme za vhodné. Vybírání komponenty s největším rozptylem nemusí být vždy nejlepší. Například pokud máme rozpoznávat třídy, které se liší právě ve složkách s malým rozptylem, které tímto postupem zahodíme.
[editovat] Rozpoznávání
V rozpoznávání slouží PCA jako jedna z tzv. Feature Extraction metod. Používají ji například kriminalisté pro rozpoznávání obličejů.
[editovat] Komprese
Jednoduchá komprese barevného nebo multispektrálního obrazu. Využívá vysoké korelace mezi jednotlivými spektrálními kanály a převede obrázek pomocí PCA na jednu nebo několik málo složek s většinou informace.
[editovat] Viz také
- singulární dekompozice
- neuronová síť
[editovat] Externí odkazy
- http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf — jednoduché vysvětlení PCA spolu s matematickým základem
- http://robotics.eecs.berkeley.edu/~rvidal/cvpr03-gpca-final.pdf — vysvětlení pokročilejší zobecněné PCA
- Příklady využití analýzy hlavních komponent na zřetelnější zobrazení struktur u grafických souborů (anglicky)

