STP094 Regrese

Přednáška je věnována lineárnímu modelu s normálním rozdělením, zejména lineární regresi. Vychází se z geometrické představy o prostoru možných středních hodnot. Vedle alternativního odvození obecné teorie je pozornost věnována chování běžných statistik v případě, že některý z klasických předpokladů není splněn. Na vhodných místech se prohlubují znalosti o modelech analýzy rozptylu. Část přednášky se zabývá regresní diagnostikou, hledáním modelu, případně multikolineritou. Výklad je ovlivněn moderním statistickým prostředím (S+, R) s jazykem S a jeho možnostmi zejména při ověřování splnění předpokladů. Podle časových možností se budeme věnovat také regresi nelineární.

Cvičení bude po celý semestr probíhat v počítačové laboratoři K10. Hlavním programovým produktem bude R, který je v K10 k disposici a především je volně šiřitelný (http://cran.r-project.org/). Další podmínkou k získání zápočtu (vedle pravidelné práce na cvičení) bude pravděpodobně vypracování individuální úlohy.

Zkouška obsahuje kromě obhajování vypracovaných úloh dvě otázky z odpřednášené látky (teoretické nebo metodické).

Je k disposici text přednášky v elektronické formě(vzhledem ke knižnímu vydání jsou texty staženy) (*.PS, *.PS úsporně, resp. *.PDF, *.PDF úsporně). Upozorňuji však, že text budu během semestru ještě průběžně upravovat. K disposici je také seznam výchozích otázek pro zkoušení (*.PS, *.PDF).

PS (050103)

Dovoluji si upozornit, že někteří studenti vynechali příliš mnoho cvičení. Jak bylo řečeno na začátku semestru, za každou absenci nad obvyklou míru (tj. nad 3) je třeba písemně vypracovat jednu úlohu z těch, které jsme řešili na cvičení. Tyto dodatečné úlohy mi pošlete stejným způsobem, jako úlohu individuální. Vyberte si některou (některé) z úloh:
draha.txt, fazekas.txt, hepaga.txt, hlavy.txt, iq.txt, listy.txt, melanom.txt, voda.txt