Distribuição F de Fisher-Snedecor – Wikipédia, a enciclopédia livre

Distribuição F de Fisher-Snedecor
	Função densidade de probabilidade
	Função distribuição acumulada
Parâmetros	, graus de liberdade
Suporte
f.d.p.
f.d.a.
Média	; para
Moda	; para
Variância	; para
Obliquidade	; para
Curtose	Definida no texto.
Entropia
Função Geradora de Momentos	Não existe. Os momentos brutos estão definidos no texto.
Função Característica	; onde é a função hipergeométrica confluente do segundo tipo

Em teoria das probabilidades e estatística, a distribuição F de Fisher-Snedecor, também conhecida como distribuição F, distribuição F de Fisher e distribuição F de Snedecor, em homenagem ao biólogo e estatístico britânico Ronald Fisher e ao matemático norte-americano George Waddel Snedecor,^[1] é uma distribuição de probabilidade contínua que surge frequentemente como a distribuição nula da estatística de um teste, mais notadamente na análise de variância, como no teste F.^[2]^[3]^[4]^[5]

Definição

Se uma variável aleatória $X$ tiver uma distribuição F com parâmetros $d_{1}$ e $d_{2}$ , escrevemos $X\sim F(d_{1},d_{2})$ . Então, a função densidade de probabilidade de $X$ é dada por

{\begin{aligned}f(x;d_{1},d_{2})&={\frac {\sqrt {\frac {(d_{1}\,x)^{d_{1}}\,\,d_{2}^{d_{2}}}{(d_{1}\,x+d_{2})^{d_{1}+d_{2}}}}}{x\,\mathrm {B} \!\left({\frac {d_{1}}{2}},{\frac {d_{2}}{2}}\right)}}\\&={\frac {1}{\mathrm {B} \!\left({\frac {d_{1}}{2}},{\frac {d_{2}}{2}}\right)}}\left({\frac {d_{1}}{d_{2}}}\right)^{\frac {d_{1}}{2}}x^{{\frac {d_{1}}{2}}-1}\left(1+{\frac {d_{1}}{d_{2}}}\,x\right)^{-{\frac {d_{1}+d_{2}}{2}}}\end{aligned}}

para $x$ real e maior que zero. Aqui, $\mathrm {B}$ é uma função beta. Em muitas aplicações, os parâmetros $d_{1}$ e $d_{2}$ são números inteiros positivos, mas a distribuição é bem definida para valores reais positivos destes parâmetros.

A função distribuição acumulada é

F(x;d_{1},d_{2})=I_{\frac {d_{1}x}{d_{1}x+d_{2}}}\left({\tfrac {d_{1}}{2}},{\tfrac {d_{2}}{2}}\right),

em que $I$ é a função beta incompleta regularizada.

O valor esperado, a variância e outros detalhes sobre $F(d_{1},d_{2})$ são dados na caixa ao lado. Para $d_{2}>8$ , a curtose de excesso é

\gamma _{2}=12{\frac {d_{1}(5d_{2}-22)(d_{1}+d_{2}-2)+(d_{2}-4)(d_{2}-2)^{2}}{d_{1}(d_{2}-6)(d_{2}-8)(d_{1}+d_{2}-2)}}

.

O $k$ -ésimo momento de uma distribuição $F(d_{1},d_{2})$ existe e é finita somente quando $2k<d_{2}$ e é igual a^[6]

\mu _{X}(k)=\left({\frac {d_{2}}{d_{1}}}\right)^{k}{\frac {\Gamma \left({\tfrac {d_{1}}{2}}+k\right)}{\Gamma \left({\tfrac {d_{1}}{2}}\right)}}{\frac {\Gamma \left({\tfrac {d_{2}}{2}}-k\right)}{\Gamma \left({\tfrac {d_{2}}{2}}\right)}}

A distribuição F é uma parametrização particular da distribuição beta prima, também chamada de distribuição beta de segundo tipo.

A função característica é^[7]

\varphi _{d_{1},d_{2}}^{F}(s)={\frac {\Gamma ({\frac {d_{1}+d_{2}}{2}})}{\Gamma ({\tfrac {d_{2}}{2}})}}U\!\left({\frac {d_{1}}{2}},1-{\frac {d_{2}}{2}},-{\frac {d_{2}}{d_{1}}}\imath s\right)

em que $U(a,b,z)$ é a função hipergeométrica confluente do segundo tipo.

Caracterização

O valor observado de uma variável aleatória de distribuição F com parâmetros $d_{1}$ e $d_{2}$ surge como a razão de dois valores observados de distribuição qui-quadrado apropriadamente escalados:^[8]

X={\frac {U_{1}/d_{1}}{U_{2}/d_{2}}}

em que

$U_{1}$ e $U_{2}$ têm distribuições qui-quadrado com graus de liberdade $d_{1}$ e $d_{2}$ respectivamente e
$U_{1}$ e $U_{2}$ são independentes.

Em instâncias em que a distribuição F é usada, por exemplo, na análise de variância, a independência de $U_{1}$ e $U_{2}$ pode ser demonstrada pela aplicação do teorema de Cochran.

Equivalentemente, a variável aleatória da distribuição F também pode ser escrita como

X={\frac {s_{1}^{2}}{\sigma _{1}^{2}}}\;/\;{\frac {s_{2}^{2}}{\sigma _{2}^{2}}}

em que $s_{1}^{2}$ e $s_{2}^{2}$ são as somas dos quadrados $S_{1}^{2}$ e $S_{2}^{2}$ de dois processos normais com variâncias $\sigma _{1}^{2}$ e $\sigma _{2}^{2}$ divididas pelo número correspondente de $\chi ^{2}$ graus de liberdades. $d_{1}$ e $d_{2}$ são respectivamente $s_{1}^{2}={\frac {S_{1}^{2}}{d_{1}}}$ e $s_{2}^{2}={\frac {S_{2}^{2}}{d_{2}}}$ .

Em um contexto frequencista, uma distribuição F escalada dá portanto a probabilidade $p(s_{1}^{2}/s_{2}^{2}|\sigma _{1}^{2},\sigma _{2}^{2})$ , ela própria com distribuição F, sem qualquer escala, o que se aplica onde $\sigma _{1}^{2}$ é igual $\sigma _{2}^{2}$ . Este é o contexto em que a distribuição F aparece de forma mais generalizada em testes F: em que a hipótese nula é de que duas variâncias normais independentes são iguais e as somas observadas de alguns quadrados apropriadamente selecionados são então examinadas a fim de verificar se sua razão é significantemente incompatível com esta hipótese nula.

A quantidade $X$ tem a mesma distribuição na estatística bayesiana, se um método de Jeffreys não informativo, de rescalamento invariante for tomado para as probabilidades a priori de $\sigma _{1}^{2}$ e $\sigma _{2}^{2}$ .^[9] Neste contexto, uma distribuição F escalada dá assim a probabilidade a posteriori $p(\sigma _{1}^{2},\sigma _{2}^{2}|s_{1}^{2}/s_{2}^{2})$ , em que as somas agora observadas $s_{1}^{2}$ e $s_{2}^{2}$ são tomadas como conhecidas.

De forma geral, resumida e simplificada, a distribuição F tem como características básicas:

É uma família de curvas, cada uma, determinada por dois tipos de graus de liberdade, os correspondentes à variância no numerador, e os que correspondem à variância no denominador.
É uma distribuição positivamente assimétrica.
A área total sob cada curva de uma distribuição F é igual a 1.
Todos os valores de X são maiores ou iguais a 0.
Para todas as distribuições F, o valor médio de X é aproximadamente igual a 1.^[10]

Equação diferencial

A função densidade de probabilidade da distribuição F é uma solução da seguinte equação diferencial:

\left\{{\begin{array}{l}2x\left(d_{1}x+d_{2}\right)f'(x)+\left(2d_{1}x+d_{2}d_{1}x-d_{2}d_{1}+2d_{2}\right)f(x)=0,\\[12pt]f(1)={\frac {d_{1}^{\frac {d_{1}}{2}}d_{2}^{\frac {d_{2}}{2}}\left(d_{1}+d_{2}\right){}^{{\frac {1}{2}}\left(-d_{1}-d_{2}\right)}}{B\left({\frac {d_{1}}{2}},{\frac {d_{2}}{2}}\right)}}\end{array}}\right\}

Propriedades e distribuições relacionadas

Se $X\sim \chi _{d_{1}}^{2}$ e $Y\sim \chi _{d_{2}}^{2}$ forem independentes, então ${\frac {X/d_{1}}{Y/d_{2}}}\sim \mathrm {F} (d_{1},d_{2})$ ;
Se $X_{k}\sim \Gamma (\alpha _{k},\beta _{k})\,$ forem independentes, então ${\frac {\alpha _{2}\beta _{1}X_{1}}{\alpha _{1}\beta _{2}X_{2}}}\sim \mathrm {F} (2\alpha _{1},2\alpha _{2})$ ;
Se $X\sim \operatorname {Beta} (d_{1}/2,d_{2}/2)$ (distribuição beta), então ${\frac {d_{2}X}{d_{1}(1-X)}}\sim \operatorname {F} (d_{1},d_{2})$ ;
Equivalentemente, se $X\sim F(d_{1},d_{2})$ , então ${\frac {d_{1}X/d_{2}}{1+d_{1}X/d_{2}}}\sim \operatorname {Beta} (d_{1}/2,d_{2}/2)$ ;
Se $X\sim F(d_{1},d_{2})$ , então $Y=\lim _{d_{2}\to \infty }d_{1}X$ tem a distribuição qui-quadrado $\chi _{d_{1}}^{2}$ ;
$F(d_{1},d_{2})$ é equivalente a distribuição T-quadrado de Hotelling escalada ${\frac {d_{2}}{d_{1}(d_{1}+d_{2}-1)}}\operatorname {T} ^{2}(d_{1},d_{1}+d_{2}-1)$ ;
Se $X\sim F(d_{1},d_{2})$ , então $X^{-1}\sim F(d_{2},d_{1})$ ;
Se $X\sim t(n)$ (distribuição t de Student), então:

X^{2}\sim \operatorname {F} (1,n)

X^{-2}\sim \operatorname {F} (n,1)

A distribuição F é um caso especial de distribuição de Pearson de tipo 6;
Se $X$ e $Y$ forem independentes com $X,Y\sim \mathrm {Laplace} (\mu ,b)$ , então:

{\tfrac {|X-\mu |}{|Y-\mu |}}\sim \operatorname {F} (2,2)

;

Se $X\sim F(n,m)$ , então ${\frac {\log {X}}{2}}\sim \operatorname {FisherZ} (n,m)$ (distribuição z de Fisher);
A distribuição F não central simplifica à distribuição F se $\lambda =0$ ;
A distribuição F não central dupla simplifica à distribuição F se $\lambda _{1}=\lambda _{2}=0$ ;
Se $\operatorname {Q} _{X}(p)$ for o quantil $p$ para $X\sim F(d_{1},d_{2})$ e $\operatorname {Q} _{Y}(1-p)$ for o quantil $1-p$ para $Y\sim F(d_{2},d_{1})$ , então

\operatorname {Q} _{X}(p)={\frac {1}{\operatorname {Q} _{Y}(1-p)}}

.

Ver também

Referências

↑ «Earliest Known Uses of Some of the Words of Mathematics (F)». jeff560.tripod.com. Consultado em 19 de junho de 2017
↑ Johnson, Norman Lloyd; Kotz, Samuel; Balakrishnan, N. (8 de maio de 1995). Continuous univariate distributions (em inglês). [S.l.]: Wiley & Sons. ISBN 9780471584940
↑ Abramowitz, Milton; Stegun, Irene A. (30 de abril de 2012). Handbook of Mathematical Functions: with Formulas, Graphs, and Mathematical Tables (em inglês). [S.l.]: Courier Corporation. ISBN 9780486158242
↑ «1.3.6.6.5. F Distribution». www.itl.nist.gov. Consultado em 19 de junho de 2017
↑ Mood, Alexander McFarlane; Graybill, Franklin A.; Boes, Duane C. (janeiro 1974). Introduction to the Theory of Statistics (em inglês). [S.l.]: McGraw-Hill. ISBN 9780070428645
↑ «F distribution». www.statlect.com. Consultado em 19 de junho de 2017
↑ Phillips, P. C. B. (1 de abril de 1982). «The true characteristic function of the F distribution». Biometrika. 69 (1): 261–264. ISSN 0006-3444. doi:10.1093/biomet/69.1.261
↑ DeGroot, Morris H.; Schervish, Mark J. (2002). Probability and Statistics (em inglês). [S.l.]: Addison-Wesley. ISBN 9780201524888
↑ Box, George E. P.; Tiao, George C. (25 de janeiro de 2011). Bayesian Inference in Statistical Analysis (em inglês). [S.l.]: John Wiley & Sons. ISBN 9781118031445
↑ LARSON, Ron; FARBER, Betsy (2016). Estatística Aplicada. São Paulo: PEARSON. 2 páginas

Ligações externas

[1] «Earliest Known Uses of Some of the Words of Mathematics (F)». jeff560.tripod.com. Consultado em 19 de junho de 2017

[2] Johnson, Norman Lloyd; Kotz, Samuel; Balakrishnan, N. (8 de maio de 1995). Continuous univariate distributions (em inglês). [S.l.]: Wiley & Sons. ISBN 9780471584940

[3] Abramowitz, Milton; Stegun, Irene A. (30 de abril de 2012). Handbook of Mathematical Functions: with Formulas, Graphs, and Mathematical Tables (em inglês). [S.l.]: Courier Corporation. ISBN 9780486158242

[4] «1.3.6.6.5. F Distribution». www.itl.nist.gov. Consultado em 19 de junho de 2017

[5] Mood, Alexander McFarlane; Graybill, Franklin A.; Boes, Duane C. (janeiro 1974). Introduction to the Theory of Statistics (em inglês). [S.l.]: McGraw-Hill. ISBN 9780070428645

[6] «F distribution». www.statlect.com. Consultado em 19 de junho de 2017

[7] Phillips, P. C. B. (1 de abril de 1982). «The true characteristic function of the F distribution». Biometrika. 69 (1): 261–264. ISSN 0006-3444. doi:10.1093/biomet/69.1.261

[8] DeGroot, Morris H.; Schervish, Mark J. (2002). Probability and Statistics (em inglês). [S.l.]: Addison-Wesley. ISBN 9780201524888

[9] Box, George E. P.; Tiao, George C. (25 de janeiro de 2011). Bayesian Inference in Statistical Analysis (em inglês). [S.l.]: John Wiley & Sons. ISBN 9781118031445

[10] LARSON, Ron; FARBER, Betsy (2016). Estatística Aplicada. São Paulo: PEARSON. 2 páginas

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

Distribuição F de Fisher-Snedecor

Função densidade de probabilidade

Função distribuição acumulada
Parâmetros	$d_{1}$ , $d_{2}>0$ graus de liberdade
Suporte	$x\in [0,+\infty )$
f.d.p.	${\frac {\sqrt {\frac {(d_{1}\,x)^{d_{1}}\,\,d_{2}^{d_{2}}}{(d_{1}\,x+d_{2})^{d_{1}+d_{2}}}}}{x\,\mathrm {B} \!\left({\frac {d_{1}}{2}},{\frac {d_{2}}{2}}\right)}}\!$
f.d.a.	$I_{\frac {d_{1}x}{d_{1}x+d_{2}}}\left({\tfrac {d_{1}}{2}},{\tfrac {d_{2}}{2}}\right)$
Média	${\frac {d_{2}}{d_{2}-2}}\!$ para $d_{2}>2$

Moda	${\frac {d_{1}-2}{d_{1}}}\;{\frac {d_{2}}{d_{2}+2}}$ para $d_{1}>2$
Variância	${\frac {2\,d_{2}^{2}\,(d_{1}+d_{2}-2)}{d_{1}(d_{2}-2)^{2}(d_{2}-4)}}\!$ para $d_{2}>4$
Obliquidade	${\frac {(2d_{1}+d_{2}-2){\sqrt {8(d_{2}-4)}}}{(d_{2}-6){\sqrt {d_{1}(d_{1}+d_{2}-2)}}}}\!$ para $d_{2}>6$
Curtose	Definida no texto.
Entropia	$\ln \left(\sigma {\sqrt {2\,\pi \,{\rm {e}}}}\right)\!~$
Função Geradora de Momentos	Não existe. Os momentos brutos estão definidos no texto.
Função Característica	${\frac {\Gamma ({\frac {d_{1}+d_{2}}{2}})}{\Gamma ({\tfrac {d_{2}}{2}})}}U\!\left({\frac {d_{1}}{2}},1-{\frac {d_{2}}{2}},-{\frac {d_{2}}{d_{1}}}\imath t\right)$ onde $U(a,b,z)$ é a função hipergeométrica confluente do segundo tipo