#	přednáška 8
rm(list=ls())		#	vyčištění prac. prostoru
#	načtení dat, která jsou ve složce "data" uložené v pracovní složce:
Vysky <- read.table("data/vysky.txt",header=TRUE)
summary(Vysky)
#	vybereme pouze výšky hochů, uložíme do pracovního prostoru:
hosi <- Vysky$vyska[Vysky$HochL]
print(prumer<-mean(hosi))	#	průměrná výška
print(sx <- sd(hosi))		#	směr. odchylka
print(n <- length(hosi))	#	rozsah výběru
print(se <- sx/sqrt(n))		#	střední chyba (průměru)
print(tStar <- qt(0.975,n-1))#	kritiská hodnota t-rozdělení
c(prumer-se*tStar,prumer+se*tStar)#	int. spolehlivosti pro stř. hodnotu
#	pomocí jednoduchého modelu
confint(lm(hosi~1))
#
#	jednovýběrový t-test, dosazení do vzorečku:
mu0 <- 136.1
print(T <- (prumer-mu0)/sd)
print((prumer-mu0)/sx*sqrt(n))
#	nejsnáze pomocí funkce t.test:
t.test(hosi,mu=mu0)
#	vedlejším produktem je interval spolehlivosti pro mu
#
#	dvouvýběrový t-test
boxplot(vyska~Pohlavi,data=Vysky,main="Výšky desetiletých",col=c("red","blue"))
#
t.test(vyska~Pohlavi,data=Vysky,var.equal=TRUE)
t.test(vyska~Pohlavi,data=Vysky,var.equal=FALSE)
#
#	párový t.test
#
#	načtení dat za předpokladu, že soubor Kojeni.RData je ve složce
#	nazvané data umístěné v pracovní složce:
data(Kojeni)
attach(Kojeni)
t.test(vyska.o-vyska.m,mu=10,data=Kojeni)
t.test(vyska.o,vyska.m,paired=TRUE,mu=10,data=Kojeni)