# přednáška 8 rm(list=ls()) # vyčištění prac. prostoru # načtení dat, která jsou ve složce "data" uložené v pracovní složce: Vysky <- read.table("data/vysky.txt",header=TRUE) summary(Vysky) # vybereme pouze výšky hochů, uložíme do pracovního prostoru: hosi <- Vysky$vyska[Vysky$HochL] print(prumer<-mean(hosi)) # průměrná výška print(sx <- sd(hosi)) # směr. odchylka print(n <- length(hosi)) # rozsah výběru print(se <- sx/sqrt(n)) # střední chyba (průměru) print(tStar <- qt(0.975,n-1))# kritiská hodnota t-rozdělení c(prumer-se*tStar,prumer+se*tStar)# int. spolehlivosti pro stř. hodnotu # pomocí jednoduchého modelu confint(lm(hosi~1)) # # jednovýběrový t-test, dosazení do vzorečku: mu0 <- 136.1 print(T <- (prumer-mu0)/sd) print((prumer-mu0)/sx*sqrt(n)) # nejsnáze pomocí funkce t.test: t.test(hosi,mu=mu0) # vedlejším produktem je interval spolehlivosti pro mu # # dvouvýběrový t-test boxplot(vyska~Pohlavi,data=Vysky,main="Výšky desetiletých",col=c("red","blue")) # t.test(vyska~Pohlavi,data=Vysky,var.equal=TRUE) t.test(vyska~Pohlavi,data=Vysky,var.equal=FALSE) # # párový t.test # # načtení dat za předpokladu, že soubor Kojeni.RData je ve složce # nazvané data umístěné v pracovní složce: data(Kojeni) attach(Kojeni) t.test(vyska.o-vyska.m,mu=10,data=Kojeni) t.test(vyska.o,vyska.m,paired=TRUE,mu=10,data=Kojeni)