Korelace

Z Wikipedie, otevřené encyklopedie

Korelace je ve statistice vzájemný vztah mezi znaky či veličinami. Korelační koeficient může nabývat hodnot od −1 až po +1.

Hodnota korelačního koeficintu −1 značí zcela nepřímou závislost, tedy čím více se zvětší hodnoty v první skupině znaků, tím více se změnší hodnoty v druhé skupině znaků, např. vztah mezi uplynulým a zbývajícím časem. Hodnota korelačního koeficientu +1 značí zcela přímou závislost, např. vztah mezi rychlostí bicyklu a frekvencí otáček kola bicyklu. Pokud je korelační koeficient roven 0, pak mezi znaky není žádná statisticky zjistitelná závislost, např. vztah mezi hodnotami porodnosti v Křemílkově a počtem čápů v Křemílkově.

[editovat] Výpočet Pearsonova korelačního koeficientu

Vypočteme aritmetické průměry souborů X a Y, vynásobíme sumy čtverců odchylek od těchto průměrů obou souborů – tím jsme spočetli tzv. kovarianci, což je však absolutní veličina, pro výpočet relativní veličiny pak kovarianci dělíme odmocninou násobku rozptylu souboru X a souboru Y.

\rho_{X,Y}={\mathrm{cov}(X,Y) \over \sigma_X \sigma_Y} ={E((X-\mu_X)(Y-\mu_Y)) \over \sigma_X\sigma_Y},

Protože μX = E(X), σX2 = E(X2) − E2(X) a obdobně pro Y, můžeme psát:

\rho_{X,Y}=\frac{E(XY)-E(X)E(Y)}{\sqrt{E(X^2)-E^2(X)}~\sqrt{E(Y^2)-E^2(Y)}}

[editovat] Podívejte se také na

[editovat] Externí odkazy