(NMST 551) Statistický projektový seminář
Výuka semináru zabezpečovaná spoločne s kolegom, doc. Arnoštom Komárkom
Po: 14:00 - 15:30 | @Praktikum KPMS
Všeobecné informácie
Hlavným cieľom Statistického projektového semináru -- NMST551 je získanie praxe v štatistickej analýze reálných dat a následne vypracovanie výzkumnej zprávy -- t.j. príprava odborného textu s výsledkami analýzy vo forme komplexnho vedeckého článku. Počas semestra budú študenti pracovať na jednom konkrétnom probléme (datovy súbor), ktorý ma za cieľ zodpovedať na explicitne formulované vedecké/odborné hypotézy. V priebehu semestra bude preto postupne nutne jednak spracovať a pripraviť data na analýzu, štatistický data analyzovať (t.j., popisné charakteristiky, diskusia nad rôznymi metódami štatistikej analýzy a voľba vhodného pravdepodobnostného/stochastického modelu), implementovať jednotlivé metódy v programe R a vypracovať záverečnú správu s výsledkami analýzy (so všetkými potrebnými formálnymi náležitosťami, ktoré sú neoddeliteľnou súčasťou dobrého vedeckého článku) a interpretáciou.
Na tejto stránke bude postupne zverejňovaný a priebežne aktualizovaný zoznam špecifických úloh, ktoré bude nutné v danom týždni vypracovať.
Na konci semestru každý študent odovzdá finálny článok -- odborný vedecký text (resp. výskumná správa), vypracovaný podľa jednotlivých úloh, zadávaných v priebehu semetra. Súčastou získania zápočtu je aj vypracovanie stručného oponentského posudku na članok jedného z kolegov/spolužiakov.
Formát výuky
- Jednou týdně společná beseda
- Každý týden samostatná práce dle zadání
- Postupné vypracování písemné zprávy
- Na závěr vzájemná oponentura výzkumných zpráv
Zadanie projektu pre Zimný semester 2022/2023
Recovery After Stroke: Comparison of Four European Rehabilitation Centers.
- Podrobný popis experimentu a expertných hypotéz: PDF (English version)
- Podkladové data (tri súbory): SIS (po prihlásení)
- Ďalšie podrobnosti: Počas prvého semináru, Pondelok, 03.10.2022, od 14:00, Praktikum KPMS
Sylabus (úlohy pre samostatnú prácu)
- Úkol č.1 | Due to 10/10/22
Oboznámiť sa s dátovými súbormi a porozumieť a pochopiť štruktúru dat. Načítať dátové súbory v programe R a premyslieť možné spôsoby ich spracovania za účelom zodpovedania položených vedeckých hypotéz (viď PDF súbor so zadaním).
- Úkol č.2 | Due to 17/10/22
Vypracovať popisné charakteristiky pre dôležité (závislé aj nezávislé) premenné a pripraviť tabuľku ktorá bude vhodne zobrazovať podstatnú štruktúru podkladových dat. Tabuľku s popisnými charakteristikami (resp. dve tabuľky -- jednú pre nezávislé premenné a druhú pre závislé premenné) uložiť vo forme PDF súboru, doplniť vhodným popiskom a obrázkokm, ktorý bude náležite reprezentovať to najpodstatnejšie. Výsledný PDF súbor s tabuľkou a obrázkom zaslať emailom obom vyučujúcim najneskôr v nedeľu večer.
- Úkol č.3 | Due to 24/10/22
Dopracovať tabuľku (resp. tabuľky) s popisnými charakteristikami pre vysvetľujúce aj závislé premenné. Popisné charakteristiky závislých premenných musia odzrkadľovať základnú závislostnú štruktúru dat vzhľadom k niektorým (aspoň tým podstatným) vysvetľujúcim premenným. Naformulovať prvú časť sekcie "Výsledky" -- t.j., kvantitatívne popísať a zrozumiteľne vysvetliť dôležité popisné charakteristiky z tabuliek.
- Úkol č.4 | Due to 31/10/22
Doladiť formuláciu paragrafou v sekcii "Výsledky". Premyslieť a navrhnúť vhodný stochastický/štatistický model, pomocou ktorého jednotlivé centra budú vzájomne porovnané. Intuitívný zápis modelu explicitne formulovať v reporte. Okrem toho doladiť tabuľky s popisnými charakteristikami a podľa poznámok a pripomienok dopracovať prvú časť sekcie "Výsledky" (t.j., popis popisných charakteristík).
- Úkol č.5 | Due to 07/11/22
Dopracovať návrh stochastického/štatistického modelu, ktorý bude následne použitý pre analýzu dat a porovnanie štyroch centier. Explicitne sa zameriať na tri otázky: a) Akým konkrétnym spôsobom je reprezentované (resp. parametrizované) každé centrum? b) Ako je formulovaný regresný model, akým spôsobom neznáme parametre budu v modeli vystupovať a ako budú získané príslušné empirické odhady? c) Akým konkrétným spôsobom (t.j., štatistickým testom) budu jednotlivé centra explicitné porovnané? Aká bude následna interpretácia výsledkov?
- Úkol č.6 | Due to 14/11/22
Upraviť navrhnutý regresný model tak, aby porovnanie jednotlivých centier bolo zmysluplné, intuitívne, štatisticky uskutočniteľné (možnosť formulovať štatistický test a získať p-hodnotu) a umožňovalo aj explicitné zrovnanie výrazne rôznych priebehov (napr. iné počiatočné hodnoty pacientov a iná rýchlosť zlepšenia vrámci horného obmedzenia uvažovanej stupnice hodnôt). Podrobne zdôvodniť parametrický model pre závislosť na čase (je naozaj linárny?). Dobrovoľná úloha je pokúsiť sa naformulovať sekciu "Metódy".
- Úkol č.7 | Due to 21/11/22
Vypracovať finálny model -- t.j. rozšíriť model ktorý berie do úvahy čas a štyri centra o všetky ďalšie (podstatné) vysvetľujúce premenné. Stručne interpretovať model (pomocou zmysluplne formulovaných viet zrozumiteľných aj pre nematematika/neštatistika) a aplikovať model pre explicitné porovnanie všetkých rehabilitačných centier.
- Úkol č.8 | Due to 28/11/22
Finalne porovnať rehabilitačné centra na základe vybudovaného modelu. Premyslieť a vypracovať aj konkrétnu graficku vizualizáciu finálneho porovnania (intuitívnu a jednoducho pochopiteľnú aj pre nematematika/neštatistika). Dokončiť sekciu metódy.
Povinná a doporučená literatúra
- Zásady psaní výzkumných zpráv (M.Kulich)
- Ako písať vedecký článok (J.S.Dodd)
- Ako pracovať v LaTeXu s tabuľkami (L.F.Mori)
- Ako pracovať v LaTeXu s obrázkami (D.P.Carlisle)
- The Problem of Numeracy (A.S.C.Ehrenberg)
- Writing Technical Papers or Reports (A.S.C.Ehrenberg)
- The Science of Scientific Writing (G.D.Gopen & J.A.Swan)
- A Case for Simple Tables (M.A.Koschat)
- What Makes a Good Graph? (S.P.Duke)
- Online katalóg LaTeXových balíčkov a dokumentace (LaTeX)
Názorné ukážky niekoľkých (dobrých aj špatných) vedeckých článkov
- Wounding of Whale Calves by Kelp Gulls
- Prediction of Post-Operative Liver Dysfunction
- Physical Activity and Motor Competence in 4-7-Year-Old Children
- Predictors of Career Success
- Native American Ancestry, Body Mass Index and Diabetes Risk
Na záver
The fundamental purpose of scientific discourse is not the mere presentation of information and thought, but rather its actual communication. It does not matter how pleased an author might be to have converted all the right data into sentences and paragraphs; it matters only whether a large majority of the reading audience accurately perceives what the author had in mind.
George Gopen & Judith Swan
Disclaimer
Vrámci platných Pravidiel pro organizaci studia na Matematicko-fyzikální fakultě Univerzity Karlovy (ze dne 14.června, 2017), sa vzhľadom k Čl. 8, dds.2 týchto pravidiel týmto vyhlasuje, že povaha předmětu vylučuje právo studenta na jeden řádny a dva opravné termíny pro získaní zápočtu. Získaní zápočtu sa riadi výhradne pravidlami uvedenými vyššiena tejto web stránke (a tiež na stránke predmetu v SIS).