(NMST 551) Statistický projektový seminář
St: 14:00 - 15:30 | @K3
Všeobecné informácie
Cieľom Statistickho projektového semináru NMST551 je získanie praxe v analýze reálných dat a zpracování výzkumnej zprávy - t.j. príprava odborného textu s výsledkami štatistickej analýzy vo forme vedeckého článku. V priebehu semestra sa bude postupne analyzovať jeden konkrétny dátový súbor: budeme diskutovať nad možnosťami prípravy a spracovania dat, nad rôznymi metódami následnej štatistikej analýzy, implementáciou jednotlivých metód v programe R a postupne sa budeme venovať rôznym otázkam a problémom, ktoré v súvislosti so spracovaním dátového súboru nastanú.
Okrem samotnej analýzy budeme diskutovať aj spôsob tvorby výzkumnej správy, formuláciu odborného textu a prezentáciu štatistických výsledkov. Na tejto stránke bude postupne zverejňovaný a priebežne aktualizovaný zoznam úloh, ktoré je nutné v danom týždni vypracovať.
Každý študent odovzdá na konci semestru vlastnú prácu - vedecký odborný článok (resp. výskumnú správu), vypracovanú podľa jednotlivých úloh, zadávaných v priebehu semetra. Zároveň vypracuje oponentský posudok na članok jedného z kolegov.
Formát výuky
- Jednou týdně společná beseda
- Každý týden samostatná práce dle zadání
- Postupné vypracování písemné zprávy
- Na závěr vzájemná oponentura výzkumných zpráv
Zadanie projektu pre Zimný semester 2021/2022
Analýza agresivity a sociálnych interakcií sumcov v závislosti na farbe sumca, dennom cykle, krvných testoch a stresových hormónoch.
Podrobný popis experimentu a expertných hypotéz: PDF file (English)
Podkladové datové súbory: oficiálna stránka predmetu v SIS (po nalogovaní)
Ďalšie podrobnosti: Počas prvého semináru, v Stredu, 06.10.2021, od 14:00 v K3.
Sylabus/Úlohy pre samostatnú prácu
- Úkol č.1 | Due to 06/10/21
Oboznámiť sa s dátovými súbormi a porozumieť a pochopiť štruktúru dat. Načítať dátové súbory v programe R a premyslieť možné spôsoby ich spracovania za účelom zodpovedania položených vedeckých hypotéz (viď PDF súbor so zadaním).
- Úkol č.2 | Due to 13/10/21
Zjednotiť podkladové datové súbory do jednej tabuľky (data.frame). Podrobne premyslieť rôzne možnosti ohľadom nasledujúcich bodov:- Konkrétny spôsob vzájomného previazania datového súboru so sociálnymi interakciami a dvoch súborov s krvnými testami a stresovými hormónmi;
- Spôsob sumarizácie stresovych hormónov a krvných testov (naviazanosť na čas a rozdelenie do príslušných skupín);
- Kvantifikácia agresivity resp. sociálno-agresivnej aktivivy (ako závislej premennej) s využitím zaznamenaných premenných (bitting, chasing, frontal a lateral display, ale zvážiť aj využitie výmeny v úkryte, alebo celkovej pohybovej aktivity);
- Predbežné roztriedenie (vysvetľujúcich) premenných z datového súboru krvných testov a stresových enzýmov;
(primárne zaujímavé (resp. z určitého hľadiska dôležité) premenné boli určené expertne: DOC súbor)
- Úkol č.3 | Due to 20/10/21
V náväznosti na formulované vedecké hypotézy definovať a vytvoriť (závislú) premennú pre kvantifikáciu sociálnych a (alebo) agresívnych interakcií. Voľbu, resp. definíciu veličiny pre kvantifikáciu sociálnych/agresivných interakcii zdôvodniť vhodnými popisnými charakteristikami/grafmi.
Následne pripraviť PDF súbor s výsledkami (t.j., tabuľka s výberovnými charakteristikami a obrázky) doplniť zmysluplný text do sekcie Výsledky a PDF report odoslať emailom na adresu maciak[AT]karlin.mff.cuni.cz najneskôr v pondelok, t.j. 18.10.2021 (večer).
- Úkol č.4 | Due to 27/10/21
Dopracovať tabuľku (tabuľky) s popisnými charakteristikami, aby dostatočne podrobne a dostatočne presne popisovali data. Doplniť popisok, aby tabuľka so svojím popiskom tvorila kompletný a samostatný celok. Analogicky dopracovať aj obrázky s popisnými charakteristikami. Doplniť kvantitatívnu interpretáciu exploratívnej analýzy do sekcie "Výsledky". PDF report odoslať emailom na adresu maciak[AT]karlin.mff.cuni.cz najneskôr v pondelok, t.j. 25.10.2021 (večer).
- Úkol č.5 | Due to 03/11/21
Doladiť tabuľky s popisnými charakteristikami (špecíalne pridať informáciu o rozsahu náhodných výberov, popisné charakteristiky experimentálnej skupiny, t.j. váha a veľkosť skupiny a dostatočne výpovedný popisok) a obrázky. Doplniť sekciu Úvod a prvé dve časti sekcie "Metódy" (popis experimentu a popis postupu pri spracovaní a príprave dat). Na základe prezentovaných popisných charakteristík premýšlať nad použitím vhodného štatistického modelu. PDF report odoslať emailom na adresu maciak[AT]karlin.mff.cuni.cz najneskôr v pondelok, t.j. 01.11.2021 (večer).
- Úkol č.6 | Due to 24/11/21
Spracovať data pomocou pravdepodobnostného/štatistického modelu. Model navrhnúť tak, aby jednak korespondoval s datami a zároveň dokázal zodpovedať na položené vedecké hypotézy. Do reportu doplniť tabuľku s odhadnutými parametrami a aspoň niektoré z parametrov interpretovať. PDF report odoslať emailom na adresu maciak[AT]karlin.mff.cuni.cz najneskôr v pondelok, t.j. 22.11.2021 (večer).
- Úkol č.7 | Due to 01/12/21
Interpretovať navrhnutý model v zmysle vhodných odhadnutých parametrov (napr. pomer šancí v prípade logistického regresného modelu, alebo multiplikatívné efekty v prípade log-lineárneho modelu pre Poissonové počty). V reporte zapracovať individuálne pripomienky a PDF report zaslať na adresu maciak[AT]karlin.mff.cuni.cz najneskôr v pondelok, t.j. 29.11.2021 (večer).
- Úkol č.8 | Due to 08/12/21
Dopracovať interpretáciu modelu. Do výsledkov doplniť významné aj nevýznamné p-hodnoty a kvantitatívne interpretovať odhadnuté efekty v použitom modeli. Doplniť zaujímavé a dôležité závery relevantné pre kladené hypotézy z úvodu. Dopracovať report (okrem zaveru a abstraktu -- t.j., doplniť odkaz na literatúru, informáciu o použitom programe pre spracovanie dat a následnú štatistickú analýzu, prípadne dotiahnuť formuláciu textu) a PDF report zaslať na adresu maciak[AT]karlin.mff.cuni.cz najneskôr v pondelok, t.j. 06.12.2021 (večer).
Povinná a doporučená literatúra
- Zásady psaní výzkumných zpráv (M.Kulich)
- Ako písať vedecký článok (J.S.Dodd)
- Ako pracovať v LaTeXu s tabuľkami (L.F.Mori)
- Ako pracovať v LaTeXu s obrázkami (D.P.Carlisle)
- The Problem of Numeracy (A.S.C.Ehrenberg)
- Writing Technical Papers or Reports (A.S.C.Ehrenberg)
- The Science of Scientific Writing (G.D.Gopen & J.A.Swan)
- A Case for Simple Tables (M.A.Koschat)
- What Makes a Good Graph? (S.P.Duke)
- Online katalóg LaTeXových balíčkov a dokumentace (LaTeX)
Názorné ukážky niekoľkých vedeckých článkov
- Wounding of Whale Calves by Kelp Gulls
- Prediction of Post-Operative Liver Dysfunction
- Physical Activity and Motor Competence in 4-7-Year-Old Children
- Predictors of Career Success
- Native American Ancestry, Body Mass Index and Diabetes Risk
Na záver
The fundamental purpose of scientific discourse is not the mere presentation of information and thought, but rather its actual communication. It does not matter how pleased an author might be to have converted all the right data into sentences and paragraphs; it matters only whether a large majority of the reading audience accurately perceives what the author had in mind.
George Gopen and Judith Swan
Disclaimer
Vrámci platných Pravidiel pro organizaci studia na Matematicko-fyzikální fakultě Univerzity Karlovy (ze dne 14.června, 2017), sa vzhľadom k Čl. 8, dds.2 týchto pravidiel týmto vyhlasuje, že povaha předmětu vylučuje právo studenta na jeden řádny a dva opravné termíny pro získaní zápočtu. Získaní zápočtu sa riadi výhradne pravidlami uvedenými vyššie a detailne popisanými v tomto NMSA 407 outline documente.