Základy biostatistiky LS 2002/2003
3. cvičení
1) dokončit úlohy ze souboru cvic02, přičemž u třídění podle jediné položky uvedené pro řádky lze použít u tabulky také formát číslo 7:
třídění podle několika faktorů (nominálních či ordinálních znaků)
datový soubor ICHS.S0 (pozor, jde o výběr z populace mužů, kteří mají PRÁVĚ jeden rizikový faktor pro ischemickou chorobu srdeční, nelze všechno zobecňovat na všechny muže)
souvisí hmotnost s kouřením?
krabicový diagram
tabulka popisných statistik
souvisí hmotnost se vzděláním?
krabicový diagram
tabulka popisných statistik
souvisí hmotnost se vzděláním a s kouřením?
Response: HMOT
Table Columns: VZDEL, Table Rows: KOUR
6 Separate Stats, Two By's (Plots Possible)
všude pouze Report
spočítaly se všechny statistiky? PROČ NE?
hrubší rozlišování kuřáků - lze přímo volbou třídění
zrušit KOUR v Discrete Variables, dáte je do Numeric Vareiables a nastavit tam 2 0 4 (proč?)
přidat k průměru také graf (Both), komentovat nepřítomnost INTERAKCE
souvisí BMI s kouřením a vzděláním?
spočítat BMI = HMOT / (VYSKA/100)^2
v zadání výpočtu tabulek zaměnit hmotnost proměnnou BMI
komentovat změnu (pro HMOT), jaké otázky mohou vznikat?
souvisí BMI se vzděláním a RCHOL? (cholesterol jako rizikový faktor)
opět tabulka včetně grafu, náznak interakce
souvisí hmotnost se vzděláním a RCHOL? (cholesterol jako rizikový fak
tor)
- opět tabulka včetně grafu, náznak interakce
2) závislost spojitých veličin
závisí hmotnost a výška postavy?
- Graphics | Scatter Plots
- Variables | Horizontal Var. VYSKA | Vertical Var. HMOT
- zdůraznění trendu: Lines 1 | Regression zaškrtnout, ULOŽIT
- co udělá jiné měřítko? Vertical | Minimum 0
- zkusit (nesmyslných) Minimum -500 (krásná příležitost k demagogii)
odlišit jen silné kuřáky
nová proměnná kurak pomocí KOUR=5 (Label kuřák)
Grouping Variable: kurak, upravit měřítzko svislé osy, Variable Names: Labels
legendu lze doplnit pomocí Legend | Show Legend
komentovat možný vztah obou přímek
vyšetřit BMI (závislost na výšce, věku, systolickém tlaku a kouření)
pracovat samostatně, rozhodovat zda bodové nebo krabicové diagramy, komentovat
podat data: IQ1.S0 (známkové průměry v pololetí 7. a 8. třídy, IQ, pohlaví)
porovnat chlapce a dívky (opakování)
- krabicový diagram pro IQ, třídit podle POHLAVI
- interpretovat zjištění (závislost spojitého znaku na nominálním
znaku?)
- ověřit interpretaci výpočtem tabulky popisných statistik (průměr, medián, směr. odchylka)
- jak dopadne porovnání ZN7, ZN8?
závislost ZN8 a ZN7:
- Graphics | Scatter Plots
- Variables: Horizontal Var. ZN7, Vertical Var. ZN8
- Lines 1: Method: L. S.
- Jsou tyto znaky nezávislé? (přímka usnadní představu; popište slovy)
- zkusit rozlišit chlapce a děvčata pomocí Grouping Var. POHLAVI
- Legend: Show Legend
- měřítka: Horizontal 5, Vertical 6
- Titles: Value Labels: Value Labels
- jiné rozlišení pohlaví Symbols: Symbol 1, Symbol 2
- jaké úlohy? existence závislosti; jsou závislosti pro obě pohlaví shodné?
- uložit do zápisníku (Log)
závislost ZN7 a IQ:
- v čem tato zato závislost jiná?
- s rostoucí ZN7 klesá IQ (ZN8 rostlo)
- závislosti pro hochy a dívky mohou být
různé
- porovnat se závislostí ZN8 na ZN7
- jak se změní dojem z obrázku, když měřítko na svislé ose roztáhneme (0 - 1000)? DŮLEŽITÉ
lineární závislost (přímka)
nakreslete závislost Y = 1 + 1 * X:
- Graphics | Function Plots | Model | Formula: 1 + 1 * X;
nastavit měřítko na svislé ose: Y: -10 10; X: -5 5
uložit do zápisníku
podobně 1 + 2 * X a -5 + 2 * X
prohlédněte zápisník, co se změní pro 1 - 1 * X?
nelineární závislost
- Y = exp(X); Y = log(X); Y = X + X^2 (proč nesymetrické kolem nuly?)