NMST539 | Cvičenie 5Metóda maximálnej vierohodnosti pre mnohorozmerné normálne rozdelenieLS 2020/2021 | 30/03/21 | (online výuka)zdrojový Rmd súbor (kódovanie UTF8)Outline piateho cvičenia:
Metóda maximálnej vierohodnosti je jednym zo základných nástrojov určených pre odhadovanie neznámeho parametru \(\theta \in \Omega\) (prípadne mnohorozmerného – t.j. vektorového parametru \(\boldsymbol{\theta} \in \Omega\)) v určitom predpokladanom rozdelení na základe náhodného výberu. Postup je obecne založený na tzv. vierohodnostnej funkcii: pre náhodný výber \(\boldsymbol{X}_1, \dots, \boldsymbol{X}_{n}\) z \(p \in \mathbb{N}\) rozmerného rozdelenia s hustotou \(f(\boldsymbol{x}, \boldsymbol{\theta})\) je vierohodnostná funkcia definovaná predpisom \[ L(\boldsymbol{\theta}, \mathcal{X}) = \prod_{i = 1}^n f(\boldsymbol{X}_i, \boldsymbol{\theta}), \] čo je funkcia vzľadom k argumentu \(\boldsymbol{\theta} \in \Omega\) skonštruovaná na základe náhodného výberu \(\mathcal{X} = (\boldsymbol{X}_{1}, \dots, \boldsymbol{X}_{n})^\top\). Príslušný odhad \(\widehat{\boldsymbol{\theta}}\) neznámeho vektorového parametru \(\boldsymbol{\theta}\) je definovaný ako argument, ktorý maximalizuje vierohodnostnú funkciu, t.j. hodnota \(L(\boldsymbol{\theta}, \mathcal{X})\) je maximálna možná, resp. \[ \widehat{\boldsymbol{\theta}} = \mathop{Argmax}_{\boldsymbol{\theta} \in \Omega} L(\boldsymbol{\theta}, \mathcal{X}). \] Maximálne vierohodný odhad \(\widehat{\boldsymbol{\theta}}\) neznámeho vektorového parametru \(\boldsymbol{\theta} \in \Omega\) je za určitých predpokladov regularity asymptoticky normálny a platí, že \[
\sqrt{n} (\widehat{\boldsymbol{\theta}} - \boldsymbol{\theta}) \sim N_{p}(\boldsymbol{0}, \mathbb{I}_{p}^{-1}(\boldsymbol{\theta})), \quad \textrm{pre} \quad n \to \infty
\] kde \(\mathbb{I}_{p}(\boldsymbol{\theta})\) je tzv. Fisherova informačná matica o neznámom vektorovom parametri \(\boldsymbol{\theta} \in \Omega\). Maximálne vierohodný odhad \(\widehat{\boldsymbol{\theta}}\) je teda asymptotický nestranný a eficientný (v tom zmysle, že asymptotická variančná-kovariančná matica \(\mathbb{I}_{p}^{-1}(\boldsymbol{\theta})\) dosahuje Rao-Cramérovu úroveň). 1. Maticová algebra infinitesimálneho počtuV následujúcej časti stručne pripomenieme niektoré užitočné pravidla pre maticové počítane v súvislosti s deriváciou matíc a determinantov. V prípade mnohorozmerného parametru \(\boldsymbol{\theta} = (\theta_1, \dots, \theta_p)^\top \in \Omega \subseteq \mathbb{R}^p\) je výhodné pracovať s pomocou tohto maticového kalkulu. Pomocou matíc menších rozmerov (napr. \(2 \times 2\), alebo \(3 \times 3\)) samostatne overte platnosť nasledujúcich pravidiel:
Uvedené pravidlá sú užitočné pri derivácii vierohodnostnej funkcie a získanie príslušného maximálne vierohodného odhadu v rôznych mnohorozmerných rozdeleniach. V následujúcej časti niektoré z týchto pravidiel využijeme pri konštrukcii maximálne vierohodného odhadu neznámeho vektorového parametru pre rôzne rozdelenia. 2. Metóda maximálnej vierohodnosti pre mnohorozmerný parameterPre prvé dva príklady je pre získanie maximálne vierohodného odhadu postačujúce využiť štandardný postup na základe parciálných derivácii. Pre posledné dva príklady je ale omnoho výhodnejšie využiť vhodné vzťahy uvedené vyššie. Príklad 9 Uvažujme dvojrozmerný náhodný výber \(\boldsymbol{X}_1, \dots, \boldsymbol{X}_{n}\), kde \(\boldsymbol{X}_{i} = (X_{i 1}, X_{i, 2})^\top\), z rozdelenia s hustotou \[
f_{\boldsymbol{\theta}}(x_{1}, x_{2}) = \frac{1}{\theta_1\theta_2} \cdot exp\Big\{ -\big( \frac{x_1}{\theta_1} + \frac{x_2}{\theta_2} \big) \Big\} \cdot \mathbb{I}_{\{x_1 > 0\}} \mathbb{I}_{\{x_2 > 0\}},
\] kde \(\boldsymbol{\theta} = (\theta_1, \theta_2)^\top \in (0, \infty) \times (0, \infty)\). Nájdite odhad neznámeho vektorového parametru pomocou metódy maximálnej vierohodnosti a spočítajte Rao-Cramérovu mez. Príklad 10 Príklad 11 Príklad 12 3. Štatistické testy pomerom vierohodnostiExample 13 \[ H_{0}: \boldsymbol{\mu} = \boldsymbol{\mu}_{0}, \] oproti obecnej (obojstrannej) alternatíve \[ H_{1}: \boldsymbol{\mu} \neq \boldsymbol{\mu}_{0}. \]
Testová štatistika závisí na \((\overline{\boldsymbol{X}}_n - \boldsymbol{\mu}_{0})^\top \mathcal{S}^{-1} (\overline{\boldsymbol{X}}_n - \boldsymbol{\mu}_{0})\) a navyše, za platnosti nulovej hypotézy \(H_0\) platí, že \[ (n - 1)(\overline{\boldsymbol{X}}_n - \boldsymbol{\mu}_{0}) ^\top \mathcal{S}^{-1} (\overline{\boldsymbol{X}}_n - \boldsymbol{\mu}_{0}) \sim T_{p, n - 1}^2. \] S využitím znalosti o Hotellingovom \(T^2\) rozdelení a jeho súvislosti s Fisherovým F rozdelením (viď minulé čvičenie) je vpodstate už triviálne daný test v programe R naprogramovať a aplikovať na konkrétne data. V nasledujúcom príklade sa zameriame na obecnejšiu variantu testu. Príklad 14 \[ H_{0}: 2\mu_{1} - \mu_2 = 0.\] Zaujíma nás teda konkrétna lineárna kombinácia jednotlivých zložiek neznámeho vektoru stredných hodnôt. Rozlíšime dva prípady: variančná-kovariančná matica \(\Sigma\) je známa, prípadne \(\Sigma\) je neznáma matica.
V obecnom tvare je možné nulovú hypotézu vyjadriť v tvare \[ H_0: \mathbb{A}\boldsymbol{\mu} = a, \] kde \(\boldsymbol{\mu} = (\mu_1, \mu_2)^\top = (1, 2)^\top\), \(\mathbb{A} = (2, -1)\), a \(a = 0\). Obecná alternatíva má tvar \[ H_1: \mathbb{A}\boldsymbol{\mu} \neq a, \] V prípade, že variančná-kovariančná matica \(\Sigma\) je známa, ľahko sa overí, že za platnosti nulovej hypotézy dostaneme \[ T_{n} = n(\mathbb{A}\overline{\boldsymbol{X}}_{n} - a)^\top(\mathbb{A}\Sigma \mathbb{A}^\top)^{-1} (\mathbb{A} \overline{\boldsymbol{X}}_{n} - a) \sim \chi_{1}^{2}. \] a nulová hypotéza je zamietaná pre veľké hodnoty testovej štatistiky \(T_{n}\) (t.j., pre hodnoty \(T_{n}\), ktoré sú väčšie, než príslušný \((1 - \alpha)\) kvantil \(\chi_2\) rozdelenia – v našom konkrétnom prípade s jedným stupňom voľnosti, kde \(\alpha \in (0, 1)\)). Pomocou nasledujúcich príkazov spočítame hodnotu testovej štatistiky pre nasimulované data:
a túto hodnotu je potrebné porovnať s príslušným kvantilom \(\chi_1^2(0.95) = 3.8415\). Nulovú hypotézu teda na hladine \(\alpha = 0.05\) nezamietame (keďže hodnota testovej štatistiky \(T_n\) je približne \(0.37\), čo je menej, ako daná kritická hodnota). Ak budeme ale predpokladať, že variančná-kovariačná matica \(\Sigma\) je tiež neznáma, musíme test založiť na inej testovej štatistike, ktorú jednoducho získame tak, že neznámu maticu nahradíme príslušným (empirickým) odhadom. Samotné rozdelenie testovej štatistiky za platnosti nulovej hypotézy sa ale zmení, keďže tentokrat je nutné počítať aj s určítou mierou variability, ktorá je prítomná v odhade neznámej variančnej-kovariančnej matice. Opäť priamočiaro dostaneme, že platí \[ \tilde{T}_{n} = (n - 1)(\mathbb{A}\overline{\boldsymbol{X}}_{n} - a)^\top(\mathbb{A}\mathcal{S} \mathbb{A}^\top)^{-1} (\mathbb{A} \overline{\boldsymbol{X}}_{n} - a) \sim T_{1, n - 1}^2, \] pričom konkrétnu hodnotu spočítame pomocou programu R
a túto hodnotu tentokrát porovnáme s príslušným kvantilom Fisherovho rozdelenia \(F_{1, 99}(0.95) = 3.9371\). Nulovú hypotézu teda na rovnakej hladine \(\alpha = 0.05\) zamietame. Oba testy vychádzaju podobne – a to hlavne v prípadoch, keď je rozsah náhodného výberu dostatočne veľký a odhad variančnej-kovariančnej matice je konzistentný. Domáca (samostatná) úloha(Deadline: Šieste cvičenie / 06.04.2021)Rozmyslite si malú simulačnú štúdiu, v ktorej sa zameriate na empirické vlastnosti štatistického testu pomerom vierohodnosti pri známej, resp. neznámej variančnej-kovariačnej matici v mnohorozmernom normálnom rozdeleni (alternatívne môžete uvažovať aj test pomerom vierohodnosti v nejakom inom rozdeleni).
|