Koreláciou rozumieme závislosť a môžeme ju hľadať medzi znakmi prvkov štatistického súboru – či medzi hodnotami skúmaných premenných existuje závislosť. Napríklad, môžeme hľadať závislosť medzi telesnou výškou a váhou, alebo medzi známkami z matematiky a chémie. V týchto prípadoch bude zrejme existovať tesná súvislosť, ale napr. medzi výškou žiaka a jeho prospechom taká úzka súvislosť nebude.

Presný matematický postup, výsledkom ktorého sú číselné údaje hovoriace o závislosti dvoch alebo viacerých znakov voláme korelačný počet.

Korelačný koeficient r(x, y)vyjadruje súvislosť pre dvojicu veličín xy. Vyžaduje vyjadrenie spojenia strednej hodnoty a rozptylu, ktorými je charakterizované správanie každej z premenných. Túto súvislosť vyjadruje štatistická kovariancia – k(x, y), cov(x, y):


martinkovicova

 

Ak poznáme k(x, y), potom korelačný koeficient počítame:

martinkovicova

 

Hodnota korelačného koeficientu vyjadruje lineárnu mieru závislosti x y. Jeho hodnota nadobúda hodnoty od -1 po 1.


Ak sú znaky x y nezávislé, korelačný koeficient je nulový.

Ak je miera lineárnej závislosti znakov x y:

  • malá, potom

martinkovicvoa

 

  • mierna

martinkovicova

 

  • silná

martinkovicova

 

Nesmieme však zabudnúť, že ak aj zistíme, že medzi znakmi je súvislosť, nič to nehovorí o vzťahu príčiny a dôsledku, môže byť aj náhodná, alebo aj bezvýznamná, môže byť nami precenené, alebo nedocenená. Zdanlivú koreláciu môže spôsobiť nejaký tretí faktor. Tiež si musíme zapamätať, že korelácia je platná iba v oblasti, do ktorej patria namerané hodnoty


 

Príklad: Urč korelačný koeficient výšky (cm)/váhy (kg) desiatich študentov:

  1. 150/51

  2. 170/65

  3. 171/67

  4. 180/55

  5. 155/86

  6. 170/70

  7. 204/94

  8. 190/90

  9. 165/58

  10. 185/80


Riešenie:

Pre prehľadnosť si zostavíme tabuľku:

 

martinkovcova


 

Pre výpočet korelačného koeficientu potrebujeme vypočítať aj priemerné hodnoty:

martinkcovicova

 


Vidíme, že ručný výpočet je zdĺhavý a náročný i pre malý počet dvojíc hodnôt. Navyše, ľahko môže vzniknúť chyba či nepresnosti pri výpočte. Preto je výhodnejšie použiť program Excel. Ako príklad použijeme našu tabuľku – skopírujeme ju do Excelu:


martinkovicova

 

 

Vyberieme funkciu CORREL: vzorce ⟶ ďalšie funkcie ⟶ štatistické ⟶ CORREL


martinkovicova

 

 

Pole 1: je rozsah buniek s hodnotami; Pole 2: je druhý rozsah buniek s hodnotami. Dostaneme výsledok:


martinkovicova



Zopakujte si:
1. Charakterizuj korelačný koeficient.
2. Aké hodnoty nadobúda?
3. Aká hodnota korelačného koeficientu svedčí o tom že medzi dvoma premennými je silná súvislosť?
4. Čo je to korelačný počet?

Použitá literatúra:
http://office.microsoft.com/sk-sk/excel-help/correl-funkcia-HP005209023.aspx
www.pedf.cuni.cz/kpsp/skalouda/korelace.doc
vlastné poznámky
http://umv.science.upjs.sk/efm/sites/default/files/Ucebnica_statistiky.pdf
http://fstroj.uniza.sk/kam/orsansky/pdf/zakladystatistiky.pdf