Základy biostatistiky LS 2002/2003
2. cvičení
Ověřit, jak studenti umí
spustit NCSS pomocí ikonky Biostatistika
Zopakovat popisné statistiky, připomenout krabicový diagram.
Porovnání dvou a více souborů, závislost na nominálním znaku (faktoru)
data: deti23.S0
krabicový diagram a popisné statistiky pro porodní délku DEL0
proč jsou některé děti vyznačeny zvlášť?
založit tabulku pro průměr, medián, kvartily, směr. odchylku, kvart. rozpětí, zapsat hodnoty
měnit délku druhého nejmenšího dítěte tak, aby na něj dolní tykadlo dosáhlo
současně pro několik změněných hodnot pro dvě původně nejmenší děti doplnit tabulku: co se mění?
jak se změní statistiky a krabicový diagram, když změníme měřítko?
spočítat a zapsat popisné statistiky pro HMOT12
zavést novou veličinu HMOTNOST (HMOT12 vyjádřit v [kg])
spočítat popisné statistiky současně pro HMOT12 a HMOTNOST
popisné statistiky a krabicové diagramy (HMOT12, HMOTNOST) porovnat
vyjádřit tuto váhu jako odchylku od 10,5 kg (tj- přibližně od průměru; nová veličina HM105=HMOTNOST-10.5)
popisné statistiky a krabicový diagram (HMOTNOST, HM105) porovnat (co se číselně změnilo?)
závisí HMOT12 na pohlaví?
- krabicový diagram (Group 1: SEX, Titles | Value Labels:Value Labels)
- popisné statistiky (Descriptive Stats) HMOT12, SEX
- tabulka popisných statistik: Descriptive Statistics | Descriptive Tables
- Response Variables: HMOTNOST
- Table Columns: SEX, Table Rows PRÁZDNÉ
- Reports | Table Format: 2 Combined Stats, One By
- nastav Report pouze pro Counts, Means, Medians, Std.Dev's
- Format | Value Labels: Value Labels
jiná možnost:
- Reports | Table Format: 3 Separate Stats, One By (Plot …)
- pro Means přidat graf pomocí Both místo Report
souvisí VEKM s pořadím dítěte POR?
krabicový diagram (samostatně zvolit nastavení šablony, komentovat)
popisná tabulka (VEKM, POR) => příliš malé četnosti pro 3 4 děti, lépe sloučit
novou proměnnou POR3 jako POR-(POR=4) (vysvětlit proč se slučují dvě kategorie)
znovu krabicový diagram a tabulka popisných statistik
celkový průměr váženým průměrem jednotlivých průměrů (je možno spočítat vážený průměr jednotlivých průměrů pomocí Excelu)
celková směr. odchylka je větší! (vyšlo by 5.30447, při vážení rozptylů pak 5.424776)
samostatně podobné úlohy
(např. VEKO)
datový soubor ICHS.S0 (pozor, jde o výběr z populace mužů, kteří mají PRÁVĚ jeden rizikový faktor pro ischemickou chorobu srdeční, nelze všechno zobecňovat na všechny muže
souvisí hmotnost s kouřením?
krabicový diagram
tabulka popisných statistik
souvisí hmotnost se vzděláním?
krabicový diagram
tabulka popisných statistik
souvisí hmotnost se vzděláním a s kouřením?
Response: HMOT
Table Columns: VZDEL, Table Rows: KOUR
6 Separate Stats, Two By's (Plots Possible)
všude pouze Report
spočítaly se všechny statistiky? PROČ NE?
u průměru vyžádat i graf (Reports | UMeans: | Both)
hrubší rozlišování kuřáků - lze přímo volbou třídění
zrušit KOR v Discrete Variables, dáte je do Numeric Variables a nastavit tam 2 0 4 (proč?)
u grafu průměrů komentovat nepřítomnost INTERAKCE
souvisí hmotnost se vzděláním a RCHOL? (cholesterol
jako rizikový faktor)
- opět tabulka včetně grafu, náznak interakce
ukázat vliv volby měřítka, nastavit na svislé ose měřítko od nuly
MOŽNÉ další téma: závislost spojitých veličin
souvisí výška a hmotnost?
případně rozlišit podle RCHOL