Método de Newton , la enciclopedia libre

En análisis numérico, el método de Newton (conocido también como el método de Newton-Raphson o el método de Newton-Fourier) es un algoritmo para encontrar aproximaciones de los ceros o raíces de una función real. También puede ser usado para encontrar el máximo o mínimo de una función, encontrando los ceros de su primera derivada.

Historia

El método numérico de Newton fue descrito por Sir Isaac Newton en De analysi per aequationes numero terminorum infinitas ('Sobre el análisis mediante ecuaciones con un número infinito de términos', escrito en 1669, publicado en 1711 por William Jones) y en De metodis fluxionum et serierum infinitarum (escrito en 1671, traducido y publicado como Método de las fluxiones en 1736 por John Colson). Sin embargo, su descripción difiere en forma sustancial de la descripción moderna presentada más arriba: Newton aplicaba el método solo a polinomios, y no consideraba las aproximaciones sucesivas x_n, sino que calculaba una secuencia de polinomios para llegar a la aproximación de la raíz x. Finalmente, Newton ve el método como puramente algebraico y falla al no ver la conexión con el cálculo.

Isaac Newton probablemente derivó su método de forma similar aunque menos precisa del método de François Viète. La esencia del método de Viète puede encontrarse en el trabajo del matemático persa Sharaf al-Din al-Tusi.

El método de Newton-Raphson es llamado así por el matemático inglés Joseph Raphson (contemporáneo de Newton) se hizo miembro de la Royal Society en 1691 por su libro Aequationum Universalis, publicado en 1690, que contenía este método para aproximar raíces. Newton en su libro Método de las fluxiones describe el mismo método, en 1671, pero no fue publicado hasta 1736, lo que significa que Raphson había publicado este resultado 46 años antes. Aunque no fue tan popular como los trabajos de Newton, se le reconoció posteriormente.

Descripción del método

El método de Newton es un método abierto, en el sentido de que no está garantizada su convergencia global. La única manera de alcanzar la convergencia es seleccionar un valor inicial lo suficientemente cercano a la raíz buscada. Así, se ha de comenzar la iteración con un valor razonablemente cercano al cero (denominado punto de arranque o valor supuesto). La relativa cercanía del punto inicial a la raíz depende mucho de la naturaleza de la propia función; si ésta presenta múltiples puntos de inflexión o pendientes grandes en el entorno de la raíz, entonces las probabilidades de que el algoritmo diverja aumentan, lo cual exige seleccionar un valor supuesto cercano a la raíz. Una vez que se ha hecho esto, el método linealiza la función por la recta tangente en ese valor supuesto. La abscisa en el origen de dicha recta será, según el método, una mejor aproximación de la raíz que el valor anterior. Se realizarán sucesivas iteraciones hasta que el método haya convergido lo suficiente.

Sea $f:[a,b]\to \mathbb {R}$ una función derivable definida en el intervalo real $[a,b]$ . Empezamos con un valor inicial $x_{0}$ y definimos para cada número natural $n$

x_{n+1}=x_{n}-{\frac {f(x_{n})}{f'(x_{n})}}.

Donde $f'$ denota la derivada de $f$ .

Nótese que el método descrito es de aplicación exclusiva para funciones de una sola variable con forma analítica o implícita conocible. Existen variantes del método aplicables a sistemas discretos que permiten estimar las raíces de la tendencia, así como algoritmos que extienden el método de Newton a sistemas multivariables, sistemas de ecuaciones, etcétera.

Obtención del algoritmo

Tres son las formas principales por las que tradicionalmente se ha obtenido el algoritmo de Newton-Raphson.

La primera de ellas es una simple interpretación geométrica. En efecto, atendiendo al desarrollo geométrico del método de la secante, podría pensarse en que si los puntos de iteración están lo suficientemente cerca (a una distancia infinitesimal), entonces la secante se sustituye por la tangente a la curva en el punto. Así pues, si por un punto de iteración trazamos la tangente a la curva, por extensión con el método de la secante, el nuevo punto de iteración se tomará como la abscisa en el origen de la tangente (punto de corte de la tangente con el eje $x$ ). Esto es equivalente a linealizar la función, es decir, $f$ se reemplaza por una recta tal que contiene al punto ( $x_{0}$ , $f$ ( $x_{0}$ )) y cuya pendiente coincide con la derivada de la función en el punto, $f'(x_{0})$ . La nueva aproximación a la raíz, $x_{1}$ , se logra de la intersección de la función lineal con el eje de abscisas. Matemáticamente:

f'(x_{n})={\frac {f(x_{n})}{x_{n}-x_{n+1}}}

En la ilustración adjunta del método de Newton se puede ver que $x_{n+1}$ es una mejor aproximación que $x_{n}$ para el cero (x) de la función $f$ .

Una forma alternativa de obtener el algoritmo es desarrollando la función $f(x)$ en serie de Taylor, para un entorno del punto $x_{n}$ :

f(x)=f(x_{n})+f'(x_{n})(x-x_{n})+(x-x_{n})^{2}{\frac {f''(x_{n})}{2!}}+...\,

Si se trunca el desarrollo a partir del término de grado 2, y evaluamos en $x_{n+1}$ :

f(x_{n+1})=f(x_{n})+f'(x_{n})(x_{n+1}-x_{n})\,

Si además se acepta que $x_{n+1}$ tiende a la raíz, se ha de cumplir que $f(x_{n+1})=0$ , luego, sustituyendo en la expresión anterior, obtenemos el algoritmo.

Finalmente, hay que indicar que el método de Newton-Raphson puede interpretarse como un método de iteración de punto fijo. Así, dada la ecuación $f(x)=0$ , se puede considerar el siguiente método de iteración de punto fijo:

g(x)=x+h(x)f(x)\,

Se escoge h (x) de manera que $g'(r)=0$ ( $r$ es la raíz buscada). Dado que $g'(r)$ es:

g'(r)=1+h'(r)f(r)+h(r)f'(r)=1+h(r)f'(r)\,

Entonces:

h(r)={\frac {-1}{f'(r)}}

Como $h(x)$ no tiene que ser única, se escoge de la forma más sencilla:

h(x)={\frac {-1}{f'(x)}}

Por tanto, imponiendo subíndices:

g(x_{n})=x_{n+1}=x_{n}-{\frac {f(x_{n})}{f'(x_{n})}}

Expresión que coincide con la del algoritmo de Newton-Raphson

Convergencia del método

El orden de convergencia de este método es, por lo menos, cuadrático. Sin embargo, si la raíz buscada es de multiplicidad algebraica mayor a uno (i.e, una raíz doble, triple, …), el método de Newton-Raphson pierde su convergencia cuadrática y pasa a ser lineal de constante asintótica de convergencia 1-1/m, con m la multiplicidad de la raíz.

Existen numerosas formas de evitar este problema, como pudieran ser los métodos de aceleración de la convergencia tipo Δ² de Aitken o el método de Steffensen.

x_{n+1}=x_{n}-m{\frac {f(x_{n})}{f'(x_{n})}}.

Evidentemente, este método exige conocer de antemano la multiplicidad de la raíz, lo cual no siempre es posible. Por ello también se puede modificar el algoritmo tomando una función auxiliar g(x) = f(x)/f'(x), resultando:

x_{n+1}=x_{n}-{\frac {g(x_{n})}{g'(x_{n})}}.

Su principal desventaja en este caso sería lo costoso que pudiera ser hallar g(x) y g'(x) si f(x) no es fácilmente derivable.

Por otro lado, la convergencia del método se demuestra cuadrática para el caso más habitual sobre la base de tratar el método como uno de punto fijo: si g (r)=0, y g'(r) es distinto de 0, entonces la convergencia es cuadrática. Sin embargo, está sujeto a las particularidades de estos métodos.

Nótese de todas formas que el método de Newton-Raphson es un método abierto: la convergencia no está garantizada por un teorema de convergencia global como podría estarlo en los métodos de falsa posición o de bisección. Así, es necesario partir de una aproximación inicial próxima a la raíz buscada para que el método converja y cumpla el teorema de convergencia local.

Teorema de Convergencia Local del Método de Newton

Sea $f\in {\mathcal {C}}^{2}([a,b])$ . Si $p\in [a,b]$ , $\displaystyle f(p)=0$ y $f'(p)\neq 0$ , entonces existe un $r>0$ tal que si $|x_{0}-p|<r\,$ , entonces la sucesión x_n con $n\in \mathbb {N}$ verifica que:

|x_{n}-p|<r\,

para todo

n

y

x_{n}

tiende a

p

cuando

n

tiende a infinito.

Si además $f\in {\mathcal {C}}^{3}([a,b])$ , entonces la convergencia es cuadrática.

Teorema de Convergencia Global del Método de Newton

Sea $f\in {{\mathcal {C}}^{2}[a,b]}$ verificando:^[1]

$f(a)f(b)<0$
$f'(x)\neq 0$ para todo $x\in {[a,b]}$
$f''(x)f''(y)\geq 0$ para todo $x,y\in {[a,b]}$
$\max \left\{{{\frac {\left|{f(a)}\right|}{\left|{f'(a)}\right|}},{\frac {\left|{f(b)}\right|}{\left|{f'(b)}\right|}}}\right\}\leq b-a$

Entonces existe un único $s\in {[a,b]}$ tal que $f(s)=0$ por lo que la sucesión converge a $s$ .

Estimación del error

Se puede demostrar que el método de Newton-Raphson tiene convergencia cuadrática: si $\alpha$ es raíz, entonces:

|x_{k+1}-\alpha |\leq C|x_{k}-\alpha |^{2}

para una cierta constante $C$ . Esto significa que si en algún momento el error es menor o igual a 0,1, a cada nueva iteración doblamos (aproximadamente) el número de decimales exactos. En la práctica puede servir para hacer una estimación aproximada del error:

Error relativo entre dos aproximaciones sucesivas:

E={\frac {|x_{k+1}-x_{k}|}{|x_{k+1}|}}

Con lo cual se toma el error relativo como si la última aproximación fuera el valor exacto. Se detiene el proceso iterativo cuando este error relativo es aproximadamente menor que una cantidad fijada previamente.

Ejemplo

Consideremos el problema de encontrar un número positivo $x$ tal que $\cos(x)=x^{3}$ . Podríamos tratar de encontrar el cero de $f(x)=\cos(x)-x^{3}$ .

Sabemos que $f'(x)=-\operatorname {sen}(x)-3x^{2}$ . Ya que $\cos(x)\leq 1$ para todo $x$ y $x^{3}>1$ para $x>1$ , deducimos que nuestro cero está entre 0 y 1. Comenzaremos probando con el valor inicial $x_{0}=0.5$

{\begin{matrix}x_{1}&=&x_{0}-{\frac {f(x_{0})}{f'(x_{0})}}&=&0,5-{\frac {\cos(0,5)-0,5^{3}}{-\sin(0,5)-3\times 0,5^{2}}}&=&1,112141637097\\x_{2}&=&x_{1}-{\frac {f(x_{1})}{f'(x_{1})}}&&\vdots &=&{\underline {0}},909672693736\\x_{3}&&\vdots &&\vdots &=&{\underline {0,86}}7263818209\\x_{4}&&\vdots &&\vdots &=&{\underline {0,86547}}7135298\\x_{5}&&\vdots &&\vdots &=&{\underline {0,8654740331}}11\\x_{6}&&\vdots &&\vdots &=&{\underline {0,865474033102}}\end{matrix}}

Los dígitos correctos están subrayados. En particular, $x_{6}$ es correcto para el número de decimales pedidos. Podemos ver que el número de dígitos correctos después de la coma se incrementa desde 2 (para x₃) a 5 y 10, ilustrando la convergencia cuadrática.

Conjunto $O_{x,\alpha }^{n}(h)$ de Operadores Fraccionales

El cálculo fraccional de conjuntos (Fractional Calculus of Sets (FCS)), mencionado por primera vez en el artículo titulado "Sets of Fractional Operators and Numerical Estimation of the Order of Convergence of a Family of Fractional Fixed-Point Methods",^[2] es una metodología derivada del cálculo fraccional.^[3] El concepto principal detrás del FCS es la caracterización de los elementos del cálculo fraccional utilizando conjuntos debido a la gran cantidad de operadores fraccionales disponibles.^[4]^[5]^[6] Esta metodología se originó a partir del desarrollo del método de Newton-Raphson fraccional ^[7] y trabajos relacionados posteriores.^[8]^[9]^[10]

El cálculo fraccional, una rama de las matemáticas que trata con derivadas de orden no entero, surgió casi simultáneamente con el cálculo tradicional. Esta emergencia fue en parte debido a la notación de Leibniz para derivadas de orden entero: ${\frac {d^{n}}{dx^{n}}}$ . Gracias a esta notación, L’Hopital pudo preguntar en una carta a Leibniz sobre la interpretación de tomar $n={\frac {1}{2}}$ en una derivada. En ese momento, Leibniz no pudo proporcionar una interpretación física o geométrica para esta pregunta, por lo que simplemente respondió a L’Hopital en una carta que "... es una aparente paradoja de la cual, algún día, se derivarán consecuencias útiles".

El nombre "cálculo fraccional" se origina a partir de una pregunta histórica, ya que esta rama del análisis matemático estudia derivadas e integrales de un cierto orden $\alpha \in \mathbb {R}$ . Actualmente, el cálculo fraccional carece de una definición unificada de lo que constituye una derivada fraccional. En consecuencia, cuando no es necesario especificar explícitamente la forma de una derivada fraccional, típicamente se denota de la siguiente manera:

{\frac {d^{\alpha }}{dx^{\alpha }}}.

Los operadores fraccionales tienen varias representaciones, pero una de sus propiedades fundamentales es que recuperan los resultados del cálculo tradicional a medida que $\alpha \to n$ . Considerando una función escalar $h:\mathbb {R} ^{m}\to \mathbb {R}$ y la base canónica de $\mathbb {R} ^{m}$ denotada por $\{{\hat {e}}_{k}\}_{k\geq 1}$ , el siguiente operador fraccional de orden $\alpha$ se define utilizando notación de Einstein:^[11]

o_{x}^{\alpha }h(x):={\hat {e}}_{k}o_{k}^{\alpha }h(x).

Denotando $\partial _{k}^{n}$ como la derivada parcial de orden $n$ con respecto al componente $k$ -ésimo del vector $x$ , se define el siguiente conjunto de operadores fraccionales ^[12] ^[13]:

$O_{x,\alpha }^{n}(h):=\left\{o_{x}^{\alpha }:\exists o_{k}^{\alpha }h(x){\text{ y }}\lim _{\alpha \to n}o_{k}^{\alpha }h(x)=\partial _{k}^{n}h(x)\ \forall k\geq 1\right\},$

cuyo complemento es:

$O_{x,\alpha }^{n,c}(h):=\left\{o_{x}^{\alpha }:\exists o_{k}^{\alpha }h(x)\ \forall k\geq 1{\text{ y }}\lim _{\alpha \to n}o_{k}^{\alpha }h(x)\neq \partial _{k}^{n}h(x){\text{ para al menos un }}k\geq 1\right\}.$

Como consecuencia, se define el siguiente conjunto:

O_{x,\alpha }^{n,u}(h):=O_{x,\alpha }^{n}(h)\cup O_{x,\alpha }^{n,c}(h).

Extensión a Funciones Vectoriales

Para una función $h:\Omega \subset \mathbb {R} ^{m}\to \mathbb {R} ^{m}$ , el conjunto se define como:

{}_{m}O_{x,\alpha }^{n,u}(h):=\left\{o_{x}^{\alpha }:o_{x}^{\alpha }\in O_{x,\alpha }^{n,u}([h]_{k})\ \forall k\leq m\right\},

donde $[h]_{k}:\Omega \subset \mathbb {R} ^{m}\to \mathbb {R}$ denota el $k$ -ésimo componente de la función $h$ .

Véase también

Referencias

↑ Miguel Pasadas. Universidad de Granada, ed. «Tema 2 Resolución de Ecuaciones No Lineales».
↑ Sets of Fractional Operators and Numerical Estimation of the Order of Convergence of a Family of Fractional Fixed-Point Methods
↑ Applications of fractional calculus in physics
↑ A review of definitions for fractional derivatives and integral
↑ A review of definitions of fractional derivatives and other operators
↑ How many fractional derivatives are there?
↑ Fractional Newton-Raphson Method
↑ Acceleration of the order of convergence of a family of fractional fixed-point methods and its implementation in the solution of a nonlinear algebraic system related to hybrid solar receivers
↑ Code of a multidimensional fractional quasi-Newton method with an order of convergence at least quadratic using recursive programming
↑ Sets of Fractional Operators and Some of Their Applications
↑ Einstein summation for multidimensional arrays
↑ Torres-Hernandez, A.; Brambila-Paz, F. (December 29, 2021). «Sets of Fractional Operators and Numerical Estimation of the Order of Convergence of a Family of Fractional Fixed-Point Methods». Fractal and Fractional 5 (4): 240. doi:10.3390/fractalfract5040240.
↑ Acceleration of the order of convergence of a family of fractional fixed-point methods and its implementation in the solution of a nonlinear algebraic system related to hybrid solar receivers

Tjalling J. Ypma, Historical development of the Newton-Raphson method, SIAM Review 37 (4), 531–551, 1995.
P. Deuflhard, Newton Methods for Nonlinear Problems. Affine Invariance and Adaptive Algorithms. Springer Series in Computational Mathematics, Vol. 35. Springer, Berlín, 2004. ISBN 3-540-21099-7.
C. T. Kelley, Solving Nonlinear Equations with Newton's Method, no 1 in Fundamentals of Algorithms, SIAM, 2003. ISBN 0-89871-546-6.
J. M. Ortega, W. C. Rheinboldt, Iterative Solution of Nonlinear Equations in Several Variables. Classics in Applied Mathematics, SIAM, 2000. ISBN 0-89871-461-3.
W. H. Press, B. P. Flannery, S. A. Teukolsky, W. T. Vetterling, Numerical Recipes in C: The Art of Scientific Computing, Cambridge University Press, 1992. ISBN 0-521-43108-5 (available free online, with code samples: [1]), sections 9.4 [2] and 9.6 [3].
W. H. Press, B. P. Flannery, S. A. Teukolsky, W. T. Vetterling, Numerical Recipes: The Art of Scientific Computing, Cambridge University Press, 2007. ISBN 0-521-88068-8 (available for a fee online, with code samples [4]).
W. H. Press, B. P. Flannery, S. A. Teukolsky, W. T. Vetterling, Numerical Recipes in Fortran, Cambridge University Press, 1992. ISBN 0-521-43064-X (online, with code samples: [5])
Endre Süli and David Mayers, An Introduction to Numerical Analysis, Cambridge University Press, 2003. ISBN 0-521-00794-1.
Weisstein, Eric W. «Newton's method and Convergence». En Weisstein, Eric W, ed. MathWorld (en inglés). Wolfram Research. Consultado el 29 de agosto de 2009.

Enlaces externos

Datos: Q374195
Multimedia: Newton Method / Q374195

[1] Miguel Pasadas. Universidad de Granada, ed. «Tema 2 Resolución de Ecuaciones No Lineales».

[2] Sets of Fractional Operators and Numerical Estimation of the Order of Convergence of a Family of Fractional Fixed-Point Methods

[3] Applications of fractional calculus in physics

[4] A review of definitions for fractional derivatives and integral

[5] A review of definitions of fractional derivatives and other operators

[6] How many fractional derivatives are there?

[7] Fractional Newton-Raphson Method

[8] Acceleration of the order of convergence of a family of fractional fixed-point methods and its implementation in the solution of a nonlinear algebraic system related to hybrid solar receivers

[9] Code of a multidimensional fractional quasi-Newton method with an order of convergence at least quadratic using recursive programming

[10] Sets of Fractional Operators and Some of Their Applications

[11] Einstein summation for multidimensional arrays

[12] Torres-Hernandez, A.; Brambila-Paz, F. (December 29, 2021). «Sets of Fractional Operators and Numerical Estimation of the Order of Convergence of a Family of Fractional Fixed-Point Methods». Fractal and Fractional 5 (4): 240. doi:10.3390/fractalfract5040240.

[13] Acceleration of the order of convergence of a family of fractional fixed-point methods and its implementation in the solution of a nonlinear algebraic system related to hybrid solar receivers

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]