Vieme už, že mieru sily závislosti dvoch pozorovaných znakov vyjadruje korelačný koeficient. Okrem korelačného koeficientu však môžeme závislosť dvoch znakov charakterizovať aj regresnými krivkami. Regresné krivky vyjadrujú kvantitatívny trend závislosti.
Jednoduchá lineárna regresia
Pri jednoduchej lineárnej regresii sú regresné krivky vlastne priamky, ktorých význam spočíva v tom, že miera závislosti (t.j. korelačný koeficient) dvoch sledovaných znakov x a y môžeme zistiť aj pomocou veľkosti uhla, ktorý tieto priamky zvierajú.
Ide o dve závislosti:
-
závislosť prvého znaku na druhom
-
závislosť druhého znaku na prvom
Vravíme teda o jediných dvoch priamkach.
Platí, že čím je uhol, ktorý tieto dve priamky zvierajú, menší, tým je korelácia vyššia, a naopak, čím je uhol zvieraný regresnými priamkami väčší, tým je korelácia menšia. Ak veľkosť uhla zvieraného týmito dvoma priamkami je rovný 90°(t.j. pravý uhol), medzi danými dvoma znakmi neexistuje korelácia, je nulová ⟹ znaky sú lineárne nezávislé.
Ak regresné priamky splývajú, vtedy každej hodnote x odpovedá presne vypočítaná hodnota y ⟹ charakterizované znaky sú lineárne závislé.
Reálne sa však takéto krajné prípady často, resp. takmer vôbec, nevyskytujú.
Metóda najmenších štvorcov
Používame ju pri určovaní parametrov regresnej priamky, ktorá musí spĺňať podmienku, že súčet štvorcov (druhých mocnín) vzdialenosti bodov [x, y] od tejto priamky – v smere zvislej osi – je minimálny.
Obr.: Korelačné pole: Grafické zobrazenie dvojrozmernej náhodnej veličiny; štatistický súbor s dvoma štatistickými znakmi (x, y)
Ak v závislosti znaku x od y má regresná priamka tvar
ax + b = y,
tak potrebujeme nájsť minimum súčtu všetkých týchto vzdialeností:
Minimum nastane v jednom prípad, a to keď
Regresná priamka závislosti x na y má tak tvar
Keďže minimum nastane v jedinom prípade, aj regresná priamka závislosti x na y je jediná.
Zapamätáme si:
-
nezávislosť ⟹ korelačný koeficient je nulový ALE nulový korelačný koeficient nezaručuje nezávislosť
-
ak znaky lineárne závisle nie sú, neznamená to, že sú nezávislé
-
v prípade, že nameranými hodnotami vieme preložiť parabolu, nevyplýva z toho, že závislosť týchto znakov je zaručene parabolická
-
s istotou nevieme povedať nič o tom, čo je mimo pozorovaného intervalu
Príklad:
Údaje v tabuľke vyrovnajte regresnou priamkou, určte koeficienty a, b v rovnici y = ax + b a index korelácie.
|
x |
0 |
5 |
10 |
15 |
20 |
25 |
30 |
35 |
40 |
|
y |
1,2 |
3,5 |
4,2 |
5,4 |
5,5 |
5,6 |
5,9 |
6,3 |
5,9 |
Riešenie:
Pre riešenie použijeme Excel, kde skopírujeme tabuľku.
a)
1.) označíme tabuľku ⟶ vložiť graf – XY závislosť
2.)
3.) V menu rozloženie klikneme na „trendová čiara“, kde zvolíme „lineárna“ a „ďalšie možnosti trendovej čiary“. Tam zaklikneme „zobraziť v grafe rovnicu“ a R2 (√(R2)⟹index korelácie):
4. Po kliknutí na „zavrieť“ sa nám zobrazí konečná podoba riešenia:
Z grafu vidíme, že rovnica regresie je y = 0,102x + 2,78, t.j. koeficient a = 0,102; b = 2,78. Index korelácie vypočítame ako druhú odmocninu R2, t.j. √0,747 = 0,864.
b) Koeficienty a a b v rovnici regresie a index korelácie môžeme vypočítať i pomocou preddefinovanej funkcie LINEST(v Excely) – nájdeme ju v kategórii štatistické:
1.) V programe EXCEL otvoríme nový list a tabuľku hodnotami prepíšeme/skopírujeme.
2.)Kurzorom vyznačíme oblasť buniek 2x2 (v našom prípade C5:D6) a do nej „prilepíme“ funkciu LINEST (viď obr.)
3.) Vyznačíme oblasti buniek pre hodnoty x a y; do okienok Const a Stats napíšeme logické hodnoty 1.
4.) Súčasným stlačením kláves CTRL + SHIFT + ENTER potvrdíme vloženie (do oblasti vyznačenej oblasti 2x2) – pozor – nestačí potvrdiť kliknutím „OK“.
Hodnota bunky C5 je rovná konštante b a hodnota z okienka D5 konštante a z rovnice y = a + bx. Hodnoty v bunkách C6 a D6 zodpovedajú hodnotám smerodajných odchýlok.
V tomto prípade je index korelácie zhodný s korelačným koeficientom – ktorý vypočítame pomocou preddefinovanej funkcie CORREL.
Zopakujte si:
1. Čo vyjadrujú regresné krivky?2. Charakterizuj lineárnu regresiu.
Použitá literatúra:
vlastné poznámkyhttp://people.tuke.sk/ladislav.sevcovic/xlsLabCvic1.html
http://homen.vsb.cz/~oti73/cdpast1/
http://umv.science.upjs.sk/efm/sites/default/files/Ucebnica_statistiky.pdf
Zdroje obrazkov:
http://homen.vsb.cz/~oti73/cdpast1/vlastné









.jpg)