Základy biostatistiky LS 2002/2003
7. cvičení: testy o jednom výběru, párové testy
data: Kojeni.S0, popis v souboru KOJENI.TXT
jednovýběrový t test H0: mi = 50, oboustranná alternativa, pro porodní délky hochů
- Data | Filter | pohlavi="hoch" | Filiter Systém Actice | RUN
- Analysis | T-Tests | One-Sample T-Test
- Variables | Response Var. : por_delka | Ho Value: 50 | Filter Active
- Reports | Variable Names: Labels | pouze Probability Plot
- interpretovat zejména výsledek
t testu: VOLÍME POUZE JEDEN ŘÁDEK podle předem zvolené alternativy, diskutovat možné další alternativy, jak by to dopadlo
- interpretace intervalu spolehlivosti jako mno
žiny těch mi0, pro které bychom H0 nezamítli
- zkusit změnit Alpha Level na 1 % resp 10 %, porovnejte výsledky
- test předpokladů (zde normální rozdělení) jako ověření našeho předpokladu, zamítnutí spíš varování než zákaz, srovnej s pravděpodobnostním diagramem
podobně pro
porodní délky dívek, stejná H0, oboustranná alternativa
- studenti pracovat samostatněji
párový test: jsou otcové v (populačním průměru) o 10 cm vyšší?
- Analysis | t-tests | Paired T-Tests
- Response … vys_otec | Paired … vys_matka | H0 Value 10
- interpretovat, porovnat s intervalem spolehlivosti pro rozdíl (populačních) průměrů
- Jak se zmení odpověď, pokud úlohu přeformulujeme, budeme (předem) chtít dokýzat, že otcové jsou v populačním průměru
aspoň o 10 cm vyšší?
Párový test: jsou otcové v (populačním smyslu) o 3 roky starší?
Analysis | t-tests | Paired T-Tests
Response … vek_otec | Paired … vek_matka | H0 Value 3
zde nemáme zkušenost (jako u výšky), že data mají normální rozdělení, proto (test normality na problém ukazuje!) použijeme postupy, které normalitu nevyžadují
Reports | nastav také Nonparametric Report
při interpretaci výsledků připomenout jak se tvoří kritický obor: obsahuje výsledky, které svědčí spíš pro alternativu než pro hypotézu, velikost stanovíme tak, aby chyba 1. druhu nejvýš s pravděpodobností alfa
znaménkový test (sign) porovnává počet otců starších než matka a více než o tři roky s počtem otců starších o méně než o tři roky (někteří tedy vypadnou)
výsledná p hodnota je v Prob. Both
ověřit pravděpodobnosti uvedené u znaménkového testu pomocí Probability Calculator (N=85, R=36, dá pst, že bude ještě méně případů, kdy je otec starší o víc než o 3 roky, rovnou 0,096380)
Wilcoxonův test navíc bere v úvahu, že některá měření jsou k mi0 blíže, jiná dál, neměří ale jak daleko (nyní jen orientačně, podrobněji bude na přednášce)
zvláště při menších počtech pozorování je lépe vzít opatrnější výstup s opravou na spojitost
spočítat
stejné úlohy zvláš
ť pro dívky
samostatně s uložením do souboru nechat studenty rozhodovat o tom, zda lze prokázat, že u dětí vysokoškolaček jsou otcové starší než matky (případně o dva či tři roky,
p
odle úvahy cvičícího)
ukládání logu studentů:
1) učitel na disku E: v adresáři Dokumenty zřídí adresář (řekněme) Biostat
2) studenti si vyprázdní log, na první řádek uvedou svoje jméno a pod svým jménem log uloží do tohoto nově vzniklého adresáře
3) pracují samostatně, do logu ukládají, občas log pod stejným (svým) jménem uloží (dovolí přepsat)
4) pomocí dataprojektoru lze na plátně sledovat, že data studentů uložena
5) nakonec si cvičící data odnese na disketě (nebo odešle emailem?)