Log-normal Función de densidad de probabilidad Función de distribución de probabilidad Parámetros μ ∈ R , {\displaystyle \mu \in \mathbb {R} ,} σ > 0 {\displaystyle \sigma >0} Dominio x ∈ ( 0 , ∞ ) {\displaystyle x\in (0,\infty )} Función de densidad (pdf) 1 x σ 2 π exp ( − ( ln x − μ ) 2 2 σ 2 ) {\displaystyle {\frac {1}{x\sigma {\sqrt {2\pi }}}}\exp \left(-{\frac {(\ln x-\mu )^{2}}{2\sigma ^{2}}}\right)} Función de distribución (cdf) Φ ( ln ( x ) − μ σ ) {\displaystyle \Phi \left({\frac {\ln(x)-\mu }{\sigma }}\right)} Media exp ( μ + σ 2 2 ) {\displaystyle \exp \left(\mu +{\frac {\sigma ^{2}}{2}}\right)} Mediana exp ( μ ) {\displaystyle \exp(\mu )} Moda exp ( μ − σ 2 ) {\displaystyle \exp(\mu -\sigma ^{2})} Varianza e 2 μ + σ 2 ( e σ 2 − 1 ) {\displaystyle e^{2\mu +\sigma ^{2}}\left(e^{\sigma ^{2}}-1\right)} Coeficiente de simetría ( e σ 2 + 2 ) e σ 2 − 1 {\displaystyle \left(e^{\sigma ^{2}}+2\right){\sqrt {e^{\sigma ^{2}}-1}}} Entropía log 2 ( σ e μ + 1 2 2 π ) {\displaystyle \log _{2}\left(\sigma e^{\mu +{\frac {1}{2}}}{\sqrt {2\pi }}\right)}
En probabilidad y estadística , la distribución normal logarítmica es una distribución de probabilidad continua de una variable aleatoria cuyo logaritmo está normalmente distribuido . Es decir, si X {\displaystyle X} es una variable aleatoria con una distribución normal, entonces exp ( X ) {\displaystyle \operatorname {exp} (X)} tiene una distribución log-normal, es decir e X ∼ Lognormal ( μ x , σ x 2 ) {\displaystyle e^{X}\sim \operatorname {Lognormal} (\mu _{x},\sigma _{x}^{2})} .
Log-normal también se escribe log normal o lognormal o distribución de Tinaut .
Una variable puede ser modelada como log-normal si puede ser considerada como un producto multiplicativo de muchos pequeños factores independientes. Un ejemplo típico es un retorno a largo plazo de una inversión: puede considerarse como un producto de muchos retornos diarios.
Una variable aleatoria positiva X {\displaystyle X} tiene una distribución lognormal con parámetros μ {\displaystyle \mu } y σ {\displaystyle \sigma } y escribimos X ∼ Lognormal ( μ , σ 2 ) {\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})} , si el logaritmo natural de X {\displaystyle X} sigue una distribución normal con media μ {\displaystyle \mu } y varianza σ 2 {\displaystyle \sigma ^{2}} , esto es
ln ( X ) ∼ N ( μ , σ 2 ) {\displaystyle \ln(X)\sim N(\mu ,\sigma ^{2})} Sean Φ {\displaystyle \Phi } y ϕ {\displaystyle \phi } las funciones de distribución acumulada y de densidad de una normal estándar N ( 0 , 1 ) {\displaystyle N(0,1)} , entonces la función de densidad de probabilidad de la distribución log-normal está dada por:
f X ( x ) = d d x P [ X ≤ x ] = d d x P [ ln ( X ) ≤ ln ( x ) ] = d d x Φ ( ln x − μ σ ) = ϕ ( ln x − μ σ ) d d x ( ln x − μ σ ) = ϕ ( ln x − μ σ ) 1 σ x = 1 σ x 2 π exp ( − ( ln x − μ ) 2 2 σ 2 ) {\displaystyle {\begin{aligned}f_{X}(x)&={\frac {d}{dx}}\operatorname {P} [X\leq x]={\frac {d}{dx}}\operatorname {P} [\ln(X)\leq \ln(x)]={\frac {d}{dx}}\Phi \left({\frac {\ln x-\mu }{\sigma }}\right)\\&=\phi \left({\frac {\ln x-\mu }{\sigma }}\right){\frac {d}{dx}}\left({\frac {\ln x-\mu }{\sigma }}\right)=\phi \left({\frac {\ln x-\mu }{\sigma }}\right){\frac {1}{\sigma x}}\\&={\frac {1}{\sigma x{\sqrt {2\pi }}}}\exp \left(-{\frac {(\ln x-\mu )^{2}}{2\sigma ^{2}}}\right)\end{aligned}}} Función de Distribución[ editar ] La función de distribución acumulada es
F X ( x ) = Φ ( ln x − μ σ ) {\displaystyle F_{X}(x)=\Phi \left({\frac {\ln x-\mu }{\sigma }}\right)} donde Φ {\displaystyle \Phi } es la función de distribución acumulada de una normal estándar N ( 0 , 1 ) {\displaystyle N(0,1)} .
La expresión anterior también puede ser escrita como
1 2 [ 1 + erf ( ln x − μ σ 2 ) ] = 1 2 erfc ( − ln x − μ σ 2 ) {\displaystyle {\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {\ln x-\mu }{\sigma {\sqrt {2}}}}\right)\right]={\frac {1}{2}}\operatorname {erfc} \left(-{\frac {\ln x-\mu }{\sigma {\sqrt {2}}}}\right)} Log-normal Multivariada [ editar ] Si X ∼ N ( μ , Σ ) {\displaystyle {\boldsymbol {X}}\sim N({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})} es una distribución normal multivariada entonces Y = exp ( X ) {\displaystyle {\boldsymbol {Y}}=\exp({\boldsymbol {X}})} tiene una distribución lognormal multivariante con media
E [ Y ] i = e μ i + 1 2 Σ i i {\displaystyle \operatorname {E} [{\boldsymbol {Y}}]_{i}=e^{\mu _{i}+{\frac {1}{2}}\Sigma _{ii}}} y matriz de covarianza
Var ( Y ) i j = e μ i + μ j 1 2 ( Σ i i + Σ j j ) ( e Σ i j − 1 ) {\displaystyle \operatorname {Var} ({\boldsymbol {Y}})_{ij}=e^{\mu _{i}+\mu _{j}{\frac {1}{2}}(\Sigma _{ii}+\Sigma _{jj})}\left(e^{\Sigma _{ij}}-1\right)} Si X ∼ Lognormal ( μ , σ 2 ) {\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})} entonces la variable aleatoria X {\displaystyle X} cumple algunas propiedades.
La media de X {\displaystyle X} es
E [ X ] = e μ + σ 2 2 {\displaystyle \mathrm {E} [X]=e^{\mu +{\frac {\sigma ^{2}}{2}}}} La varianza de X {\displaystyle X} es
Var ( X ) = ( e σ 2 − 1 ) e 2 μ + σ 2 {\displaystyle \operatorname {Var} (X)=\left(e^{\sigma ^{2}}-1\right)e^{2\mu +\sigma ^{2}}} . La distribución log-normal, la media geométrica , y la desviación estándar geométrica están relacionadas. En este caso, la media geométrica es igual a exp ( μ ) {\displaystyle \exp(\mu )} y la desviación estándar geométrica es igual a exp ( σ ) {\displaystyle \exp(\sigma )} .
Si una muestra de datos determina que proviene de una población distribuida siguiendo una distribución log-normal, la media geométrica de la desviación estándar geométrica puede utilizarse para estimar los intervalos de confianza tal como la media aritmética y la desviación estándar se usan para estimar los intervalos de confianza para un dato distribuido normalmente.
Límite de intervalo de confianza log geométrica 3σ límite inferior μ − 3 σ {\displaystyle \mu -3\sigma } μ g e o / σ g e o 3 {\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }^{3}} 2σ límite inferior μ − 2 σ {\displaystyle \mu -2\sigma } μ g e o / σ g e o 2 {\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }^{2}} 1σ límite inferior μ − σ {\displaystyle \mu -\sigma } μ g e o / σ g e o {\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }} 1σ límite superior μ + σ {\displaystyle \mu +\sigma } μ g e o σ g e o {\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }} 2σ límite superior μ + 2 σ {\displaystyle \mu +2\sigma } μ g e o σ g e o 2 {\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }^{2}} 3σ límite superior μ + 3 σ {\displaystyle \mu +3\sigma } μ g e o σ g e o 3 {\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }^{3}}
Donde la media geométrica μ g e o = exp ( μ ) {\displaystyle \mu _{\mathrm {geo} }=\exp(\mu )} y la desviación estándar geométrica σ g e o = exp ( σ ) {\displaystyle \sigma _{\mathrm {geo} }=\exp(\sigma )}
Los primeros momentos son:
μ 1 = e μ + σ 2 / 2 {\displaystyle \mu _{1}=e^{\mu +\sigma ^{2}/2}} μ 2 = e 2 μ + 4 σ 2 / 2 {\displaystyle \mu _{2}=e^{2\mu +4\sigma ^{2}/2}} μ 3 = e 3 μ + 9 σ 2 / 2 {\displaystyle \mu _{3}=e^{3\mu +9\sigma ^{2}/2}} μ 4 = e 4 μ + 16 σ 2 / 2 {\displaystyle \mu _{4}=e^{4\mu +16\sigma ^{2}/2}} o de forma general:
μ k = e k μ + k 2 σ 2 / 2 . {\displaystyle \mu _{k}=e^{k\mu +k^{2}\sigma ^{2}/2}.} Inferencia Estadística[ editar ] Estimación de parámetros[ editar ] Para determinar los estimadores por máxima verosimilitud de la distribución lognormal con parámetros μ {\displaystyle \mu } y σ 2 {\displaystyle \sigma ^{2}} , podemos utilizar el mismo método que se utilizó para estimar los parámetros de una distribución normal . Notemos que
L ( μ , σ ) = ∏ i = 1 n 1 x i φ μ , σ ( ln x i ) {\displaystyle L(\mu ,\sigma )=\prod _{i=1}^{n}{\frac {1}{x_{i}}}\varphi _{\mu ,\sigma }(\ln x_{i})} donde φ {\displaystyle \varphi } denota la función de densidad de la distribución normal N ( μ , σ 2 ) {\displaystyle N(\mu ,\sigma ^{2})} entonces la función logarítmica de verosimilitud es
L ( x 1 , x 2 , . . . , x n ; μ , σ ) = − ∑ i ln x i + L N ( ln x 1 , ln x 2 , . . . , ln x n ; μ , σ ) {\displaystyle {\mathcal {L}}(x_{1},x_{2},...,x_{n};\mu ,\sigma )=-\sum _{i}\ln x_{i}+{\mathcal {L}}_{N}(\ln x_{1},\ln x_{2},...,\ln x_{n};\mu ,\sigma )} Dado que el primer término es constante respecto a μ {\displaystyle \mu } y σ {\displaystyle \sigma } , ambas funciones logarítmicas de verosimilitud, L {\displaystyle {\mathcal {L}}} y L N {\displaystyle {\mathcal {L}}_{N}} , obtienen su máximo con el mismo μ {\displaystyle \mu } y σ {\displaystyle \sigma } , por lo tanto, utilizando los estimadores por máxima verosimilitud son idénticos a los de la distribución normal para observaciones ln x 1 , ln x 2 , … , ln x n {\displaystyle \ln x_{1},\ln x_{2},\dots ,\ln x_{n}}
μ ^ = ∑ k ln x k n , σ 2 ^ = ∑ k ( ln x k − μ ^ ) 2 n . {\displaystyle {\widehat {\mu }}={\frac {\sum _{k}\ln x_{k}}{n}},\qquad {\widehat {\sigma ^{2}}}={\frac {\sum _{k}{\left(\ln x_{k}-{\widehat {\mu }}\right)^{2}}}{n}}.} Para una n {\displaystyle n} finita, estos estimadores son in sesgados.
Distribución log-normal ajustada a datos de lluvias máximas diarias por año.[ 1] En la hidrología , se utiliza la distribución log-normal para analizar variables aleatorias como valores máximos de la precipitación y la descarga de ríos,[ 2] y además para describir épocas de sequía.[ 3]
La imagen azul ilustra un ejemplo del ajuste de la distribución log-normal a lluvias máximas diarias ordenadas, mostrando también la franja de 90% de confianza , basada en la distribución binomial . Las observaciones presentan los marcadores de posición , como parte del análisis de frecuencia acumulada . Distribución relacionada[ editar ] Si X ∼ N ( μ , σ 2 ) {\displaystyle X\sim \ N(\mu ,\sigma ^{2})} es una distribución normal entonces e X ∼ Lognormal ( μ , σ 2 ) {\displaystyle e^{X}\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})} . Si X ∼ Lognormal ( μ , σ 2 ) {\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})} entonces ln ( X ) ∼ N ( μ , σ 2 ) {\displaystyle \ln(X)\sim N(\mu ,\sigma ^{2})} . Si X m ∼ Lognormal ( μ , σ m 2 ) , m = 1... n ¯ {\displaystyle X_{m}\sim \operatorname {Lognormal} (\mu ,\sigma _{m}^{2}),\ m={\overline {1...n}}} son variables independentes log-normalmente distribuidas con el mismo parámetro μ y permitiendo que varíe σ, y Y = ∏ m = 1 N X m {\displaystyle Y=\prod _{m=1}^{N}X_{m}} , entonces Y es una variable distribuida log-normalmente como: Y ∼ Lognormal ( μ , ∑ m σ m 2 ) {\displaystyle Y\sim \operatorname {Lognormal} \left(\mu ,\sum _{m}\sigma _{m}^{2}\right)} . Si X ∼ Lognormal ( μ , σ 2 ) {\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})} entonces X α ∼ Lognormal ( α μ , α 2 σ 2 ) {\displaystyle X^{\alpha }\sim \operatorname {Lognormal} (\alpha \mu ,\alpha ^{2}\sigma ^{2})} para α ≠ 0 {\displaystyle \alpha \neq 0} . Se puede usar software o programa de computadora para el ajuste de una distribución de probabilidad , incluyendo la lognormal, a una serie de datos:
Easy fit Archivado el 23 de febrero de 2018 en Wayback Machine ., "data analysis & simulation" MathWorks Benelux (enlace roto disponible en Internet Archive ; véase el historial , la primera versión y la última ). ModelRisk , "risk modelling software" Ricci distributions, fitting distrubutions with R , Vito Ricci, 2005 Risksolver, automatically fit distributions and parameters to samples StatSoft distribution fitting Archivado el 30 de agosto de 2012 en Wayback Machine . CumFreq [2] , libre sin costo, incluye la distribución normal, la lognormal , raíz-normal, cuadrado-normal, e intervalos de confianza a base de la distribución binomial Calculadora Distribución log-normal ↑ CumFreq, software for cumulative frequency analysis and probability distribution fitting [1] ↑ Oosterbaan, R.J. (1994). «Chapter 6 Frequency and Regression Analysis» . En Ritzema, H.P., ed. Drainage Principles and Applications, Publication 16 . Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175-224. ISBN 90-70754-33-9 . ↑ Burke, Eleanor J.; Perry, Richard H.J.; Brown, Simon J. (2010). «An extreme value analysis of UK drought and projections of change in the future». Journal of Hydrology 388 : 131. doi :10.1016/j.jhydrol.2010.04.035 .