Processo empírico – Wikipédia, a enciclopédia livre

Em teoria das probabilidades, um processo empírico é um processo estocástico que descreve a proporção de objetos em um sistema em um dado estado. Para um processo em um espaço de estados discreto, uma cadeia de Markov populacional de tempo contínuo^[1]^[2] ou modelo populacional de Markov^[3] é um processo que conta o número de objetos em um dado estado (sem reescalonamento). Na teoria de campo médio, teoremas do limite (conforme o número de objetos se torna grande) são considerados e generalizam o teorema central do limite para medidas empíricas.^[4] Aplicações da teoria dos processos empíricos surgem na estatística não paramétrica.^[5]

Definição

Para variáveis aleatórias independentes e identicamente distribuídas $X_{1},X_{2},\cdots ,X_{n}$ em $\mathbb {R}$ com função distribuição acumulada comum $F(x)$ , a função distribuição empírica é definida por:

$F_{n}(x)={\frac {1}{n}}\sum _{i=1}^{n}I_{(-\infty ,x]}(X_{i}),$

em que $I_{C}$ é a função indicadora do conjunto $C$ .^[6]

Para todo $x$ fixo, $F_{n}(x)$ é uma sequência de variáveis aleatórias que converge a $F(x)$ quase certamente pela lei forte dos grandes números, isto é, $F_{n}$ converge pontualmente a $F$ . O matemático ucraniano Valery Glivenko e o matemático italiano Francesco Paolo Cantelli fortaleceram este resultado ao provar a convergência uniforme de $F_{n}$ a $F$ pelo teorema de Glivenko–Cantelli.^[7]

Uma versão centralizada e escalonada da medida empírica é a medida sinalizada:

$G_{n}(A)={\sqrt {n}}(P_{n}(A)-P(A)).$

Isto induz um mapa sobre as funções mensuráveis $f$ dado por:

$f\mapsto G_{n}f={\sqrt {n}}(P_{n}-P)f={\sqrt {n}}\left({\frac {1}{n}}\sum _{i=1}^{n}f(X_{i})-\mathbb {E} f\right).$

Pelo teorema central do limite, $G_{n}(A)$ converge em distribuição a uma variável aleatória normal $N(0,P(A)(1-P(A)))$ para um conjunto mensurável fixo $A$ .^[8] De forma semelhante, para uma função fixa $f$ , $G_{n}f$ converge em distribuição a uma variável aleatória normal $N(0,\mathbb {E} (f-\mathbb {E} f)^{2})$ , desde que $\mathbb {E} f$ e $\mathbb {E} f^{2}$ .^[9]

${\bigl (}G_{n}(c){\bigr )}_{c\in {\mathcal {C}}}$ é um processo empírico indexado por ${\mathcal {C}}$ , uma coleção de subconjuntos mensuráveis de $S$ .^[10]

${\bigl (}G_{n}f{\bigr )}_{f\in {\mathcal {F}}}$ é um processo empírico indexado por ${\mathcal {F}}$ , uma coleção de funções mensuráveis de $S$ a $\mathbb {R}$ .^[11]

Um resultado significante na área dos processos empíricos é o teorema de Donsker. Isto levou a um estudo das classes de Donsker: conjuntos de funções com a útil propriedade de processo empíricos indexados por estas classes que convergem fracamente a um certo processo gaussiano.^[12] Ainda que se possa mostrar que classes de Donsker são classes de Glivenko–Cantelli, o contrário não é verdadeiro em geral.

Exemplo

Como um exemplo, considere funções distribuição empírica. Para variáveis aleatórias independentes e identicamente distribuídas de valores reais $X_{1},X_{2},\cdots ,X_{n}$ , elas são dadas por:

$F_{n}(x)=P_{n}((-\infty ,x])=P_{n}I_{(-\infty ,x]}.$

Neste caso, processos empíricos são indexados por uma classe ${\mathcal {C}}=\{(-\infty ,x]:x\in \mathbb {R} \}.$ . Mostrou-se que ${\mathcal {C}}$ é uma classe de Donsker em particular.^[13]

${\sqrt {n}}(F_{n}(x)-F(x))$ converge fracamente em $\ell ^{\infty }(\mathbb {R} )$ a uma ponte browniana $B(F(x))$ .

Referências

↑ Bortolussi, Luca; Hillston, Jane; Latella, Diego; Massink, Mieke. «Continuous approximation of collective system behaviour: A tutorial». Performance Evaluation. 70 (5): 317–349. doi:10.1016/j.peva.2013.01.001
↑ Stefanek, Anton; Hayden, Richard A.; Gonagle, Mark Mac; Bradley, Jeremy T. (4 de junho de 2012). «Mean-Field Analysis of Markov Models with Reward Feedback». Springer, Berlin, Heidelberg. Analytical and Stochastic Modeling Techniques and Applications. Lecture Notes in Computer Science (em inglês): 193–211. ISBN 9783642307812. doi:10.1007/978-3-642-30782-9_14
↑ Dayar, Tuǧrul; Hermanns, Holger; Spieler, David; Wolf, Verena (1 de novembro de 2011). «Bounding the equilibrium distribution of Markov population models». Numerical Linear Algebra with Applications (em inglês). 18 (6): 931–946. ISSN 1099-1506. doi:10.1002/nla.795
↑ Dudley, R. M. (1978). «Central Limit Theorems for Empirical Measures». The Annals of Probability (em inglês). 6 (6): 899–929. ISSN 0091-1798. doi:10.1214/aop/1176995384
↑ Mojirsheibani, Majid. «Nonparametric curve estimation with missing data: A general empirical process approach». Journal of Statistical Planning and Inference. 137 (9): 2733–2758. doi:10.1016/j.jspi.2006.02.016
↑ Billingsley, Patrick (20 de janeiro de 2012). Probability and Measure (em inglês). [S.l.]: John Wiley & Sons. ISBN 9781118341919
↑ Wolfowitz, J. (1954). «Generalization of the Theorem of Glivenko-Cantelli». The Annals of Mathematical Statistics (em inglês). 25 (1): 131–138. ISSN 0003-4851. doi:10.1214/aoms/1177728852
↑ Dudley, R. M. (28 de julho de 1999). Uniform Central Limit Theorems (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521461023
↑ Dzhaparidze, K. O.; Nikulin, M. S. (1 de outubro de 1982). «Probability distributions of the Kolmogorov and omega-square statistics for continuous distributions with shift and scale parameters». Journal of Soviet Mathematics (em inglês). 20 (3): 2147–2164. ISSN 0090-4104. doi:10.1007/BF01239992
↑ R., Kosorok, Michael (2008). Introduction to empirical processes and semiparametric inference. New York, N.Y.: Springer. ISBN 9780387749785. OCLC 233972325
↑ Shorack, G.; Wellner, J. (1 de janeiro de 2009). Empirical Processes with Applications to Statistics. Col: Classics in Applied Mathematics. [S.l.]: Society for Industrial and Applied Mathematics. ISBN 9780898716849. doi:10.1137/1.9780898719017
↑ vaart, Aad van der; Wellner, Jon (9 de março de 2013). Weak Convergence and Empirical Processes: With Applications to Statistics (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781475725452
↑ Donsker, Monroe D. (1952). «Justification and Extension of Doob's Heuristic Approach to the Kolmogorov- Smirnov Theorems». The Annals of Mathematical Statistics (em inglês). 23 (2): 277–281. ISSN 0003-4851. doi:10.1214/aoms/1177729445

[1] Bortolussi, Luca; Hillston, Jane; Latella, Diego; Massink, Mieke. «Continuous approximation of collective system behaviour: A tutorial». Performance Evaluation. 70 (5): 317–349. doi:10.1016/j.peva.2013.01.001

[2] Stefanek, Anton; Hayden, Richard A.; Gonagle, Mark Mac; Bradley, Jeremy T. (4 de junho de 2012). «Mean-Field Analysis of Markov Models with Reward Feedback». Springer, Berlin, Heidelberg. Analytical and Stochastic Modeling Techniques and Applications. Lecture Notes in Computer Science (em inglês): 193–211. ISBN 9783642307812. doi:10.1007/978-3-642-30782-9_14

[3] Dayar, Tuǧrul; Hermanns, Holger; Spieler, David; Wolf, Verena (1 de novembro de 2011). «Bounding the equilibrium distribution of Markov population models». Numerical Linear Algebra with Applications (em inglês). 18 (6): 931–946. ISSN 1099-1506. doi:10.1002/nla.795

[4] Dudley, R. M. (1978). «Central Limit Theorems for Empirical Measures». The Annals of Probability (em inglês). 6 (6): 899–929. ISSN 0091-1798. doi:10.1214/aop/1176995384

[5] Mojirsheibani, Majid. «Nonparametric curve estimation with missing data: A general empirical process approach». Journal of Statistical Planning and Inference. 137 (9): 2733–2758. doi:10.1016/j.jspi.2006.02.016

[6] Billingsley, Patrick (20 de janeiro de 2012). Probability and Measure (em inglês). [S.l.]: John Wiley & Sons. ISBN 9781118341919

[7] Wolfowitz, J. (1954). «Generalization of the Theorem of Glivenko-Cantelli». The Annals of Mathematical Statistics (em inglês). 25 (1): 131–138. ISSN 0003-4851. doi:10.1214/aoms/1177728852

[8] Dudley, R. M. (28 de julho de 1999). Uniform Central Limit Theorems (em inglês). [S.l.]: Cambridge University Press. ISBN 9780521461023

[9] Dzhaparidze, K. O.; Nikulin, M. S. (1 de outubro de 1982). «Probability distributions of the Kolmogorov and omega-square statistics for continuous distributions with shift and scale parameters». Journal of Soviet Mathematics (em inglês). 20 (3): 2147–2164. ISSN 0090-4104. doi:10.1007/BF01239992

[10] R., Kosorok, Michael (2008). Introduction to empirical processes and semiparametric inference. New York, N.Y.: Springer. ISBN 9780387749785. OCLC 233972325

[11] Shorack, G.; Wellner, J. (1 de janeiro de 2009). Empirical Processes with Applications to Statistics. Col: Classics in Applied Mathematics. [S.l.]: Society for Industrial and Applied Mathematics. ISBN 9780898716849. doi:10.1137/1.9780898719017

[12] vaart, Aad van der; Wellner, Jon (9 de março de 2013). Weak Convergence and Empirical Processes: With Applications to Statistics (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9781475725452

[13] Donsker, Monroe D. (1952). «Justification and Extension of Doob's Heuristic Approach to the Kolmogorov- Smirnov Theorems». The Annals of Mathematical Statistics (em inglês). 23 (2): 277–281. ISSN 0003-4851. doi:10.1214/aoms/1177729445

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

v d e Processos estocásticos
Tempo discreto	Cadeias de Markov Passeio aleatório Autoevitante Processo de Bernoulli Processo de Galton–Watson Processo de Moran Variáveis aleatórias independentes e identicamente distribuídas
Tempo contínuo	Processo de Bessel Movimento browniano Ponte Excursão Fracionário Geométrico Meander Processo de Cauchy Processo de Cox Processo de Feller Processo de Fleming–Viot Processo de Hunt Difusão de Itô Processo de Itô Processo Lévy Tempo local Processo aditivo de Markov Processo de McKean–Vlasov Processo Ornstein–Uhlenbeck Processo de Poisson Evolução de Schramm–Loewner Processo de Wiener Processo de nascimento e morte Processo de contato Passeio aleatório de tempo contínuo Processo empírico Difusão de salto
Ambos	Processo gaussiano Modelo Galves-Löcherbach Cadeias estocásticas com memória de alcance variável Modelo oculto de Markov Processo de Markov Martingale Ruído branco Processo regenerativo
Campos e outros	Processo de Dirichlet Medida de Gibbs Modelo de Hopfield Modelo de Ising Modelo de Potts Campo aleatório de Markov Processo de Pitman–Yor Grafo aleatório
Modelos de série temporal	Modelos ARCH ARIMA ARMA
Modelos financeiros	Black–Derman–Toy Black–Karasinski Chen Cox–Ingersoll–Ross (CIR) Garman–Kohlhagen Heath–Jarrow–Morton (HJM) Heston Ho–Lee Hull–White LIBOR market Rendleman–Bartter SABR volatility Vašíček Wilkie
Modelos atuariais	Bühlmann Cramér–Lundberg Sparre–Anderson
Modelos de filas	Fila M/M/1
Propriedades	Càdlàg Processo contínuo de Feller Gauss–Markov Markov Contínuo Reversível no tempo
Teoremas limites	Teorema central do limite Teorema de Donsker Teoria ergódica Teorema de Fisher–Tippett–Gnedenko Lei dos grandes números Lei do logaritmo iterado Teorema de Sanov
Desigualdades	Burkholder–Davis–Gundy Kunita–Watanabe Martingale de Doob
Ferramentas	Fórmula de Cameron–Martin Convergência de variáveis aleatórias Exponencial de Doléans-Dade Teorema da decomposição de Doob–Meyer Fórmula de Dynkin Fórmula de Feynman–Kac Teorema de Girsanov Integral de Itô Lema de Itō Teorema da continuidade de Kolmogorov Teorema da extensão de Kolmogorov Métrica de Lévy–Prokhorov Teorema de Prokhorov Integral de Skorokhod Teorema da representação de Skorokhod Espaço de Skorokhod Equação diferencial estocástica Tanaka Integral de Stratonovich Espaço de Wiener Clássico Abstrato Princípio da reflexão
Disciplinas	Ciências atuariais Econometria Teoria ergódica Matemática financeira Teoria das probabilidades Teoria das filas Estatística Cálculo estocástico Série temporal Aprendizado de máquina
Categoria:Processos estocásticos