# 4. cvičení # cíl: # načtení většího souboru (Kojeni) # úprava dat, převod na faktory # pravděpodobnostní diagram (probability plot, QQ plot) # opakování některých úloh z předchozích cvičení # klasická definice pravděpodobnosti # # spustit z ikony R 2.15.1 SDI # nastavit pracovní adresář setwd("J:/biostat") ## setwd("C:/Users/Karel Zvára/Documents/vyuka/biostatistika/biostat") ## setwd("D:/vyuka/biostatistika/biostat") # vyčistit pracovní prostor # Misc | Remove all objects pak odklepnout souhlas # nebo rm(list=ls(all=TRUE)) # spustit commander library(RcmdrPlugin.TeachingDemos) # spustit commander # # práce s větším souborem: # načteme soubor Kojeni.csv # prohlédnout data, stručně popsat význam proměnných # trvani kolik týdnů matka kojila, zjišťováno v 24. týdnu # pocet.deti kolikáté dítě # Vzdelani vzdělání matky # Prs zda bylo dítě přiloženo k prsu do půl hodiny # hmotnost, delka v 24. týdnu života dítěte # Otec zda byl otec přítomen porodu # Dudlik zda dítě dostal dudlík # Plan zda matka označila těhotenství za plánované # Porodnice rozlišení Praha resp. okresní nemocnice # Koj24 zda v 24. týdnu matka ještě kojila # význam ostatních je nasnadě # # zjistit četnosti Vzdelani: # Statistics | Summaries | Frequency distributions # NUTNO upravit pořadí hodnot Vzdelani # Data | Manage variables in active data set | Reorder factor levels # přepsat původní proměnnou, přirozené hodnoty, jako uspořádaný faktor # (při zadávání čísel výhodné použít tabelátor) # # na faktory převést nula-jedničkové proměnné, # abychom je mohli použít ke třídění: # Dudlik, Otec, Plan, Prs, Koj24: # Porodnice (1=Praha,2=venkov) # Data | Manage variables in active data set | Convert numeric variables to factors # zvolit vhodná slovní označení (ne,ano, bez uvozovek) # # soubor Kojeni uložit jako Kojeni.RData do adresáře data # Data | Active data set | Save active data set # použij nabízený název, ulož do adresáře data # # pro kontrolu rozumných pořadí hodnot nových faktorů # provést summary() všech proměnných: # Statistics | Summaries | Active data set # všimnout si také tří možností vyjádření pohlaví # # závislost výšky otce na výšce matky: # graficky: Graphs | Scatter plot | vek.m na osu x! # číselně: Statistics | Summaries | Correlation matrix # # ZAZNAMENÁVAT jednotlivé grafy # v grafickém okénku: # History | Recording # History | Add # všimout si zaškrtnutí u Recording # # doplnit přímku y = 0 + 1*x abline(0,1) # kteří otcové jsou mladší než matka? (najdi na grafu) # kolik je takových dvojic? with(Kojeni,sum(vek.o