Koreláciou rozumieme závislosť a môžeme ju hľadať medzi znakmi prvkov štatistického súboru – či medzi hodnotami skúmaných premenných existuje závislosť. Napríklad, môžeme hľadať závislosť medzi telesnou výškou a váhou, alebo medzi známkami z matematiky a chémie. V týchto prípadoch bude zrejme existovať tesná súvislosť, ale napr. medzi výškou žiaka a jeho prospechom taká úzka súvislosť nebude.
Presný matematický postup, výsledkom ktorého sú číselné údaje hovoriace o závislosti dvoch alebo viacerých znakov voláme korelačný počet.
Korelačný koeficient r(x, y)vyjadruje súvislosť pre dvojicu veličín x a y. Vyžaduje vyjadrenie spojenia strednej hodnoty a rozptylu, ktorými je charakterizované správanie každej z premenných. Túto súvislosť vyjadruje štatistická kovariancia – k(x, y), cov(x, y):
Ak poznáme k(x, y), potom korelačný koeficient počítame:
Hodnota korelačného koeficientu vyjadruje lineárnu mieru závislosti x a y. Jeho hodnota nadobúda hodnoty od -1 po 1.
Ak sú znaky x a y nezávislé, korelačný koeficient je nulový.
Ak je miera lineárnej závislosti znakov x a y:
-
malá, potom
-
mierna
-
silná
Nesmieme však zabudnúť, že ak aj zistíme, že medzi znakmi je súvislosť, nič to nehovorí o vzťahu príčiny a dôsledku, môže byť aj náhodná, alebo aj bezvýznamná, môže byť nami precenené, alebo nedocenená. Zdanlivú koreláciu môže spôsobiť nejaký tretí faktor. Tiež si musíme zapamätať, že korelácia je platná iba v oblasti, do ktorej patria namerané hodnoty
Príklad: Urč korelačný koeficient výšky (cm)/váhy (kg) desiatich študentov:
-
150/51
-
170/65
-
171/67
-
180/55
-
155/86
-
170/70
-
204/94
-
190/90
-
165/58
-
185/80
Riešenie:
Pre prehľadnosť si zostavíme tabuľku:
Pre výpočet korelačného koeficientu potrebujeme vypočítať aj priemerné hodnoty:
Vidíme, že ručný výpočet je zdĺhavý a náročný i pre malý počet dvojíc hodnôt. Navyše, ľahko môže vzniknúť chyba či nepresnosti pri výpočte. Preto je výhodnejšie použiť program Excel. Ako príklad použijeme našu tabuľku – skopírujeme ju do Excelu:
Vyberieme funkciu CORREL: vzorce ⟶ ďalšie funkcie ⟶ štatistické ⟶ CORREL
Pole 1: je rozsah buniek s hodnotami; Pole 2: je druhý rozsah buniek s hodnotami. Dostaneme výsledok:
Zopakujte si:
1. Charakterizuj korelačný koeficient.2. Aké hodnoty nadobúda?
3. Aká hodnota korelačného koeficientu svedčí o tom že medzi dvoma premennými je silná súvislosť?
4. Čo je to korelačný počet?
Použitá literatúra:
http://office.microsoft.com/sk-sk/excel-help/correl-funkcia-HP005209023.aspxwww.pedf.cuni.cz/kpsp/skalouda/korelace.doc
vlastné poznámky
http://umv.science.upjs.sk/efm/sites/default/files/Ucebnica_statistiky.pdf
http://fstroj.uniza.sk/kam/orsansky/pdf/zakladystatistiky.pdf




