Štatistickou hypotézou nazývame každý predpoklad, alebo výrok, ktorý sa týka celého základného súboru. Overovanie hypotéz na základe výsledkov pokusu je dôležitou súčasťou matematiky.
Overovanie štatistickej hypotézy spočíva v testovaní správnosti nášho predpokladu na základe náhodného výberu.
Základnú, nulovú, hypotézu označujeme H0a je to hypotéza, ktorú overujeme (testujeme). Oproti nej staviame alternatívnu hypotézu H1a je to vlastne druhá možnosť, ktorú uvažujeme v prípade, že nulová hypotéza neplatí.
Postup pri testovaní štatistických hypotéz:
1. Formulácia nulovej hypotézy - H0.Výsledným cieľom pri väčšine štatistických testov je zhodnotenie vzťahu medzi premennými – H0 potom vyjadruje nezávislosť premenných.
Príklad H0: Žiaci 4.A budú v testovaní z matematiky rovnako úspešní ako žiaci z 4.B.
2. Formulácia alternatívnej hypotézy - H1: Nemusí byť jednoduchou negáciou H0, môže v sebe zahŕňať iba určitú časť možností, ktoré prichádzajú do úvahy v prípade, že H0 neplatí. Teda, napr. H1môže mať tvar:
- Žiaci 4.A. budú v testovaní z matematiky úspešnejší ako žiaci 4.B.
alebo:
-Žiaci 4.B. budú v testovaní z matematiky buď menej alebo viac úspešní ako žiaci 4.B.
Pravdivosť H1 sa dokazuje vždy iba nepriamo - tak, že ukážeme, že H0 je nepravdepodobná a alternatívna - jediná zostávajúca- je tak pravdepodobná. H1 najčastejšie vyjadruje štatistickú závislosť premenných – a väčšinou pravdivosť tejto hypotézy chceme dokázať.
3. Stanovenie hladiny významnosti –α
Nakoľko overovanie štatistických hypotéz sa zakladá na skúmaní výberových súborov, podlieha aj náhodným chybám. Tieto voláme chyby prvého (I.) a druhého (II.)druhu.
Hladina významnosti je pravdepodobnosť chyby I. druhu. Túto urobíme v prípade, že zamietneme H0 , ktorá v skutočnosti platí. Teda vtedy, ak prídeme k záveru, že medzi premennými existuje vzťah, i keď medzi nimi vzťah nie je.
Hladina významnosti sa stanovuje na 5 % (t.j. 0,05) alebo 1 %.
Pravdepodobnosť chyby II. druhu značíme β a potom doplnkovú pravdepodobnosť voláme sila testu a označujeme ju 1 – β.
Obidve chyby sú nepriamo úmerné, teda, ak α sa približuje k 1, β sa približuje k 0, vždy sa pevne zvolí hladina významnosti α a na tejto hladine sa následne minimalizuje β.
Pri testovaní štatistických hypotéz môžu nastať tieto situácie:
|
rozhodnutie |
skutočnosť |
||
|
|
H0 pravdivá |
H0 nepravdivá |
|
|
nezamietnutá H0 |
p = 1 - α |
p = β; chyba 2.druhu |
|
|
zamietnutá H0 |
p = α; chyba 1. druhu |
p = 1 - β |
|
H0 a H1 sú:
-
navzájom disjunktné, teda sa vylučujú
len jedna môže byť pravdivá.
-
vyčerpávajúce
spolu pokrývajú všetky možnosti tak, že jedna alebo druhá musí byť pravdivá.
4.) Výpočet testovacej štatistiky a pravdepodobnosti. Zo vzorky sa počíta testovacia štatistika, ktorá má za predpokladu pravdivosti H0 primerané rozdelenie.
P - hodnota je:
-
pravdepodobnosť, že vzťah, ktorý sme zistili z našich údajov je len dôsledkom nešťastnej vzorky a že v prípade, že by sme vybrali ďalšiu náhodnú vzorku, nemuseli by sme nájsť nič.
-
najnižšia hodnota hladiny významnosti vedúca k zamietnutiu nulovej hypotézy
-
odhadovaná pravdepodobnosť zamietnutia pravdivej H0 . Čím je hodnota P menšia, tým viac sme presvedčení, že H0 nie je pravdivá a teda by mala byť zamietnutá.
5.) Rozhodnutie Existujú dva možné stavy:
H0 je pravdivá
H0 je nepravdivá
Sú dve možné rozhodnutia: Nezamietnuť H0 Zamietnuť H0
V prípade, že P < αH0 sa zamietne (voči H1). Teda, rozdiel, ktorý sme vo vzorke namerali, je príliš veľký na to, aby bol len náhodný ⟹ medzi premennými existuje vzťah.
V prípade, že P ≥ αH0 nemôžeme zamietnuť – rozdiel, ktorý sme vo vzorke namerali, môže byť len náhodný. Nemáme teda dostatočný dôkaz na to, aby sme H0 zamietli a nemáme dostatok dôkazov na to aby sme mohli tvrdiť, že medzi premennými je vzťah.
Ak
-
P < 0,05 ⟹ štatisticky významný vzťah
-
P < 0,01 ⟹ vysoko významný štatistický vzťah
Rozhodnutie o tom, či zamietnuť, alebo nezamietnuť H0 nie je vždy postačujúce. Ak porovnávame P hodnoty bez doplňujúcich informácii a vyvodzujeme závery, nemusíme dôjsť k správnemu záveru.
Zapamätáme si:
-
pri testovaní môžeme vždy urobiť chybu I. alebo II. druhu
-
v reálnom svete hypotézu nemožno nikdy dokázať, môžeme ju len zamietnuť alebo nezamietnuť
-
v matematike môže byť hypotéza aj dokázaná
Príklad:
Počas súdu s človekom obžalovaním zo zavraždenia má padnúť rozhodnutie, či dotyčná osoba spáchala alebo nespáchala zločin.
Riešenie:
Súdny systém sa riadi tým, že pokiaľ sa nepodarí obžalovanému dokázať vinu, je nevinný.
Môžeme teda sformulovať hypotézy:
H0: Obvinený je nevinný.
H1: Obvinený je vinný.
Tabuľka: Rôzne možnosti vzťahu medzi skutočnosťou a rozhodnutím súdu.
|
rozhodnutie |
skutočnosť |
||
|
|
Obvinený je nevinný. |
Obvinený je vinný. |
|
|
Obvinený je nevinný. |
správne |
chyba 2.druhu |
|
|
Obvinený je vinný. |
chyba 1. druhu |
správne |
|
Chyba 1. druhu môže mať pre obvineného fatálne následky, preto jej možnosť vylučujeme najmenšou možnou mierou – súd musí jasne preukázať vinu obvineného. Rozhodnutie súdu podliehajú preskúmaniu vyšších inštancií. Toto zodpovedá voľbe veľmi malej hladiny významnosti, ale v mnohých prípadoch presne nevieme, ktorá chyba je pre nás dôležitejšia.
Zopakujte si:
1. Charakterizuj štatistickú hypotézu.2. Čo je to testovanie štatistických hypotéz?
3. Čo je to alternatívna hypotéza?
4. Aké chyby môžeme urobiť pri testovaní hypotéz?
Použitá literatúra:
vlastné poznámkyhttp://homen.vsb.cz/~oti73/cdpast1/KAP11/KAP12.HTM
http://math.sk/mpm/testovanie-hypotez.pdf
http://rimarcik.com/navigator/hypotezy.html
http://umv.science.upjs.sk/efm/sites/default/files/Ucebnica_statistiky.pdf