Método de Newton , la enciclopedia libre

En análisis numérico, el método de Newton (conocido también como el método de Newton-Raphson o el método de Newton-Fourier) es un algoritmo para encontrar aproximaciones de los ceros o raíces de una función real. También puede ser usado para encontrar el máximo o mínimo de una función, encontrando los ceros de su primera derivada.

Historia

[editar]

El método numérico de Newton fue descrito por Sir Isaac Newton en De analysi per aequationes numero terminorum infinitas ('Sobre el análisis mediante ecuaciones con un número infinito de términos', escrito en 1669, publicado en 1711 por William Jones) y en De metodis fluxionum et serierum infinitarum (escrito en 1671, traducido y publicado como Método de las fluxiones en 1736 por John Colson). Sin embargo, su descripción difiere en forma sustancial de la descripción moderna presentada más arriba: Newton aplicaba el método solo a polinomios, y no consideraba las aproximaciones sucesivas xn, sino que calculaba una secuencia de polinomios para llegar a la aproximación de la raíz x. Finalmente, Newton ve el método como puramente algebraico y falla al no ver la conexión con el cálculo.

Isaac Newton probablemente derivó su método de forma similar aunque menos precisa del método de François Viète. La esencia del método de Viète puede encontrarse en el trabajo del matemático persa Sharaf al-Din al-Tusi.

El método de Newton-Raphson es llamado así por el matemático inglés Joseph Raphson (contemporáneo de Newton) se hizo miembro de la Royal Society en 1691 por su libro Aequationum Universalis, publicado en 1690, que contenía este método para aproximar raíces. Newton en su libro Método de las fluxiones describe el mismo método, en 1671, pero no fue publicado hasta 1736, lo que significa que Raphson había publicado este resultado 46 años antes. Aunque no fue tan popular como los trabajos de Newton, se le reconoció posteriormente.

Descripción del método

[editar]
La función ƒ es mostrada en azul y la línea tangente en rojo. Vemos que xn+1 es una mejor aproximación que xn para la raíz x de la función f.

El método de Newton es un método abierto, en el sentido de que no está garantizada su convergencia global. La única manera de alcanzar la convergencia es seleccionar un valor inicial lo suficientemente cercano a la raíz buscada. Así, se ha de comenzar la iteración con un valor razonablemente cercano al cero (denominado punto de arranque o valor supuesto). La relativa cercanía del punto inicial a la raíz depende mucho de la naturaleza de la propia función; si ésta presenta múltiples puntos de inflexión o pendientes grandes en el entorno de la raíz, entonces las probabilidades de que el algoritmo diverja aumentan, lo cual exige seleccionar un valor supuesto cercano a la raíz. Una vez que se ha hecho esto, el método linealiza la función por la recta tangente en ese valor supuesto. La abscisa en el origen de dicha recta será, según el método, una mejor aproximación de la raíz que el valor anterior. Se realizarán sucesivas iteraciones hasta que el método haya convergido lo suficiente.

Sea una función derivable definida en el intervalo real . Empezamos con un valor inicial y definimos para cada número natural

Donde denota la derivada de .

Nótese que el método descrito es de aplicación exclusiva para funciones de una sola variable con forma analítica o implícita conocible. Existen variantes del método aplicables a sistemas discretos que permiten estimar las raíces de la tendencia, así como algoritmos que extienden el método de Newton a sistemas multivariables, sistemas de ecuaciones, etcétera.

Obtención del algoritmo

[editar]

Tres son las formas principales por las que tradicionalmente se ha obtenido el algoritmo de Newton-Raphson.

La primera de ellas es una simple interpretación geométrica. En efecto, atendiendo al desarrollo geométrico del método de la secante, podría pensarse en que si los puntos de iteración están lo suficientemente cerca (a una distancia infinitesimal), entonces la secante se sustituye por la tangente a la curva en el punto. Así pues, si por un punto de iteración trazamos la tangente a la curva, por extensión con el método de la secante, el nuevo punto de iteración se tomará como la abscisa en el origen de la tangente (punto de corte de la tangente con el eje ). Esto es equivalente a linealizar la función, es decir, se reemplaza por una recta tal que contiene al punto (, ()) y cuya pendiente coincide con la derivada de la función en el punto, . La nueva aproximación a la raíz, , se logra de la intersección de la función lineal con el eje de abscisas. Matemáticamente:

Ilustración de una iteración del método de Newton (la función f se muestra en azul y la línea de la tangente en rojo). Vemos que es una aproximación mejor que para la raíz de la función .

En la ilustración adjunta del método de Newton se puede ver que es una mejor aproximación que para el cero (x) de la función .

Una forma alternativa de obtener el algoritmo es desarrollando la función en serie de Taylor, para un entorno del punto :

Si se trunca el desarrollo a partir del término de grado 2, y evaluamos en :

Si además se acepta que tiende a la raíz, se ha de cumplir que , luego, sustituyendo en la expresión anterior, obtenemos el algoritmo.

Finalmente, hay que indicar que el método de Newton-Raphson puede interpretarse como un método de iteración de punto fijo. Así, dada la ecuación , se puede considerar el siguiente método de iteración de punto fijo:

Se escoge h (x) de manera que ( es la raíz buscada). Dado que es:

Entonces:

Como no tiene que ser única, se escoge de la forma más sencilla:

Por tanto, imponiendo subíndices:

Expresión que coincide con la del algoritmo de Newton-Raphson

Convergencia del método

[editar]

El orden de convergencia de este método es, por lo menos, cuadrático. Sin embargo, si la raíz buscada es de multiplicidad algebraica mayor a uno (i.e, una raíz doble, triple, …), el método de Newton-Raphson pierde su convergencia cuadrática y pasa a ser lineal de constante asintótica de convergencia 1-1/m, con m la multiplicidad de la raíz.

Existen numerosas formas de evitar este problema, como pudieran ser los métodos de aceleración de la convergencia tipo Δ² de Aitken o el método de Steffensen.

Evidentemente, este método exige conocer de antemano la multiplicidad de la raíz, lo cual no siempre es posible. Por ello también se puede modificar el algoritmo tomando una función auxiliar g(x) = f(x)/f'(x), resultando:

Su principal desventaja en este caso sería lo costoso que pudiera ser hallar g(x) y g'(x) si f(x) no es fácilmente derivable.

Por otro lado, la convergencia del método se demuestra cuadrática para el caso más habitual sobre la base de tratar el método como uno de punto fijo: si g (r)=0, y g'(r) es distinto de 0, entonces la convergencia es cuadrática. Sin embargo, está sujeto a las particularidades de estos métodos.

Nótese de todas formas que el método de Newton-Raphson es un método abierto: la convergencia no está garantizada por un teorema de convergencia global como podría estarlo en los métodos de falsa posición o de bisección. Así, es necesario partir de una aproximación inicial próxima a la raíz buscada para que el método converja y cumpla el teorema de convergencia local.

Teorema de Convergencia Local del Método de Newton

[editar]

Sea . Si , y , entonces existe un tal que si , entonces la sucesión xn con verifica que:

para todo y tiende a cuando tiende a infinito.

Si además , entonces la convergencia es cuadrática.

Teorema de Convergencia Global del Método de Newton

[editar]

Sea verificando:[1]

  1. para todo
  2. para todo

Entonces existe un único tal que por lo que la sucesión converge a .

Estimación del error

[editar]

Se puede demostrar que el método de Newton-Raphson tiene convergencia cuadrática: si es raíz, entonces:

para una cierta constante . Esto significa que si en algún momento el error es menor o igual a 0,1, a cada nueva iteración doblamos (aproximadamente) el número de decimales exactos. En la práctica puede servir para hacer una estimación aproximada del error:

Error relativo entre dos aproximaciones sucesivas:

Con lo cual se toma el error relativo como si la última aproximación fuera el valor exacto. Se detiene el proceso iterativo cuando este error relativo es aproximadamente menor que una cantidad fijada previamente.

Ejemplo

[editar]

Consideremos el problema de encontrar un número positivo tal que . Podríamos tratar de encontrar el cero de .

Sabemos que . Ya que para todo y para , deducimos que nuestro cero está entre 0 y 1. Comenzaremos probando con el valor inicial

Los dígitos correctos están subrayados. En particular, es correcto para el número de decimales pedidos. Podemos ver que el número de dígitos correctos después de la coma se incrementa desde 2 (para x3) a 5 y 10, ilustrando la convergencia cuadrática.

Conjunto de Operadores Fraccionales

[editar]

El cálculo fraccional de conjuntos (Fractional Calculus of Sets (FCS)), mencionado por primera vez en el artículo titulado "Sets of Fractional Operators and Numerical Estimation of the Order of Convergence of a Family of Fractional Fixed-Point Methods",[2]​ es una metodología derivada del cálculo fraccional.[3]​ El concepto principal detrás del FCS es la caracterización de los elementos del cálculo fraccional utilizando conjuntos debido a la gran cantidad de operadores fraccionales disponibles.[4][5][6]​ Esta metodología se originó a partir del desarrollo del método de Newton-Raphson fraccional [7]​ y trabajos relacionados posteriores.[8][9][10]

Ilustración de algunas líneas generadas por el método de Newton–Raphson fraccional para la misma condición inicial pero con diferentes órdenes del operador fraccional implementado. Fuente: Applied Mathematics and Computation

El cálculo fraccional, una rama de las matemáticas que trata con derivadas de orden no entero, surgió casi simultáneamente con el cálculo tradicional. Esta emergencia fue en parte debido a la notación de Leibniz para derivadas de orden entero: . Gracias a esta notación, L’Hopital pudo preguntar en una carta a Leibniz sobre la interpretación de tomar en una derivada. En ese momento, Leibniz no pudo proporcionar una interpretación física o geométrica para esta pregunta, por lo que simplemente respondió a L’Hopital en una carta que "... es una aparente paradoja de la cual, algún día, se derivarán consecuencias útiles".

El nombre "cálculo fraccional" se origina a partir de una pregunta histórica, ya que esta rama del análisis matemático estudia derivadas e integrales de un cierto orden . Actualmente, el cálculo fraccional carece de una definición unificada de lo que constituye una derivada fraccional. En consecuencia, cuando no es necesario especificar explícitamente la forma de una derivada fraccional, típicamente se denota de la siguiente manera:

Los operadores fraccionales tienen varias representaciones, pero una de sus propiedades fundamentales es que recuperan los resultados del cálculo tradicional a medida que . Considerando una función escalar y la base canónica de denotada por , el siguiente operador fraccional de orden se define utilizando notación de Einstein:[11]

Denotando como la derivada parcial de orden con respecto al componente -ésimo del vector , se define el siguiente conjunto de operadores fraccionales [12][13]​:

cuyo complemento es:

Como consecuencia, se define el siguiente conjunto:

Extensión a Funciones Vectoriales

[editar]

Para una función , el conjunto se define como:

donde denota el -ésimo componente de la función .

Véase también

[editar]

Referencias

[editar]

Enlaces externos

[editar]