Základy biostatistiky LS 2004/2005
6. cvičení: základní pojmy statistického rozhodování, testy o jednom
výběru
data: Cvic.S0, popis v souboru CVIC.TXT
popisné
statistiky pro výšku desetiletých hochů (CHLAPCI)
- Descriptive Statistics | Descriptive Stats
- Summary, Means, Variation, Quartile, Normality Test, Stem-Leaf,
Histogram, Probability
- interpretace,
zejména směr. odchylka vers. střední chyba, intervaly spolehlivosti pro
mi, sigma, sigma na druhou, nevhodnost histogramu pro málo pozorování,
přijatelnost předpokladu o normálním rozdělení
jednovýběrový
t-test H0: mi = 136.1,
oboustranná alternativa
- Analysis | T-Tests | One-Sample T-Test
- Variables | Response Var. : CHLAPCI | Ho Value: 136.1
- Reports | Variable Names: Labels | pouze Probability Plot
- připomenout význam popisných statistik
- interpretovat zejména výsledek t
testu: VOLÍME POUZE
JEDEN ŘÁDEK podle předem zvolené alternativy, diskutovat možné další
alternativy (vymýšlet
situace vhodnosti možných alternativ), jak by to dopadlo
- POZOR, na přednášce původně
tato úloha se známým rozptylem, proto jiný výsledek
- interpretace intervalu spolehlivosti jako
množiny těch mi0, pro
které bychom H0 nezamítli
- zkusit
nastavit H0
na 135 nebo 143
- test předpokladů
(zde normální rozdělení) jako ověření našeho předpokladu, zamítnutí
spíš varování než zákaz, srovnej s pravděpodobnostním diagramem
podobně pro výšky
dívek, stejná H0, oboustranná alternativa
- studenti pracovat samostatněji
podobně pro
TEPLOTA (vysvětlení v CVIC.TXT) H0: mi = 28
- interpretovat zejména při
oboustranné alternativě
- zde nemáme zkušenost (jako u výšky), že data mají normální
rozdělení, proto (i když test normality bez problémů) zkusíme postupy,
které normalitu nevyžadují
- Reports | nastav také Nonparametric Report
- při interpretaci
výsledků připomenout jak se tvoří kritický obor: obsahuje výsledky,
které svědčí spíš pro alternativu než pro hypotézu, velikost stanovíme
tak, aby chyba 1. druhu nejvýš s pravděpodobností alfa
- znaménkový test (sign) porovnává počet naměřených hodnot menších
než mi0 s počtem hodnot větších . Dosažené hladiny (p-hodnoty)
znaménkového test jsou uvedeny pod označením Prob Lower (alternativa
<), Prob Higher (alternativa >), Prob Both (oboustranná
alternativa)
- ověřit pravděpodobnosti uvedené u znaménkového testu pomocí
Probability Calculator (N=10+3=13, R=10)
- Wilcoxonův test navíc bere v úvahu, že některá měření jsou k mi0
blíže, jiná dál, neměří ale jak daleko
(nyní
jen orientačně, podrobněji bude na přednášce) - zvláště při menších
počtech pozorování je lépe vzít opatrnější
výstup s opravou na spojitost
POZOR
ve staré verzi (NCSS 6.0, zřejmě také ve volně šiřitelné verzi, která
je částí NCSS 6.0) je výstup znaménkového testu dost zmatený.
Doporučuji v případě párového testu volit takové pořadí proměnných,
aby počet zárorných rozdílů byl menší
než počet kladných rozdílů. Pak aspoň testová statistika pro
oboustrannou alternativu (Prob Both) je správně. Ve verzi NCSS 2001
byly už tyto problémy odstraněny.
zkusmo
spočítat neparametrické testy také pro výšky dívek
test o
pravděpodobnosti alternativního (binomického) rozdělení
lze hrací kostku, u které nám ve 30
hodech padla šestka 8 krát, považovat za symetrickou?
- Analysis | Other | One Proportion
- Sample Size (n): 30, Number of Successes (X): 8, Hypothesized
Proportion (P0): 0.166667
- co vyjde, pokud šestka padla desetkrát?
- nebereme v úvahu výsledek
Normal Approximation using (P) - interpretovat;
kdy má smysl jednostranná alternativa?
- opakovat pro dvojnásobky (60 a 16) a trojnásobky (90 a 24),
porovnat výsledky
příklad Kalous (skripta str. 90)
- n=50, X=33, P0=0.5, jednostranná alternativa
- ve skriptech není
použita oprava na spojitost
pokud by zbyl čas, tak lze se vrátit k sčítání rovnoměrných
(výsledkem přibližně normální)
040319, 050329 -KZv