This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
El proposito de estos modulos es entregar los conceptos teoricos necesarios y las aplica-ciones en forma dirigida, de modo que el estudiante pueda participar en forma activa,en el proceso ensenanza - aprendizaje, elaborando su propio material de estudio. Ellogro deseable es que el estudiante aprenda a aprender.
1.1. Error.
En el analisis de un algoritmo, es necesario considerar el error en la aproximacion obtenida ala solucion del problema. Este error puede producirse por varios factores, en el ejemplo 1.1 porredondeo de la aritmetica y termino del proceso infinito. Estos errores son parte inevitable delproceso de solucion y no deben confundirse con los errores cometidos por el usuario, como falla enel algoritmo o error en la programacion.Para cada algoritmo podemos conocer una cota de error, esto es una cota sobre el error en lasolucion calculada.Una cota que no depende de la solucion y puede ser calculada previamente, se llama cota de errora priori. Cuando una cota no puede ser calculada hasta despues de la completacion de la parteprincipal de los calculos es llamada una cota a posteriori. La cota de error es mas grande que elerror, por tal razon debemos desarrollar metodos alternativos de estimacion de error para algunosproblemas. Las cotas de error y estimativos son a menudo calculables y nos dan informacion tantodel comportamiento asintotico del error como del mejoramiento de las aproximaciones.Existen dos formas de medir o cuantificar la magnitud de un error.
Definicion 1.1 . Sea x∗ una aproximacion del valor exacto x. Un indicador natural es la distanciaentre el valor exacto y el aproximado.Definimos,
El error absoluto como la distancia,
EA(x∗) = |x− x∗|
Observamos que el error absoluto no permite comparar la precision entre aproximaciones dediferentes ordenes de magnitudes.
4
El error relativo como,
ER(x∗) =EA(x∗)|x|
=|x− x∗||x|
Este error es mas significativo para comparar aproximaciones.
El error porcentual es el error relativo multiplicado por 100,
EP (x∗) = 100 · ER(x∗)
Estos conceptos de error tienen solo un valor formal,puesto que no se conoce el valor exacto x. Enla practica, se determina una cota o estimativo del error.
Otro concepto importante es el de intervalo precision, diremos que [a, b] es un intervalo precisionde x, que denotaremos por I(x), si
P (x ∈ [a, b]) = 1
es decir, la probabilidad que x este en el intervalo de precision es la cierta.Relacion entre error absoluto e intervalo de precision
Dada una cota del error absoluto de x∗, es posible determinar el intervalo de precision de x.
Sea ε una cota del error absoluto,
EA(x∗) ≤ ε ⇔ |x− x∗| ≤ ε ⇔ x∗ − ε ≤ x ≤ x∗ + ε
es decir, x ∈ [x∗ − ε, x∗ + ε] , luego I(x) = [x∗ − ε, x∗ + ε].
Inversamente, dado I(x) = [a, b] un intervalo de precision de x, es posible determinar unacota del error absoluto de cualquier aproximacion x∗ en [a, b].
Sea x∗ ∈ [a, b] ⇒ |x− x∗| ≤ max (x∗ − a, b− x∗) = ε
de donde,EA(x∗) ≤ ε.
Si x∗ = a+b2 ε = b−a
2 .
Observamos que el error absoluto no es significativo, a menos que tengamos algun conocimientode la magnitud de x. A menudo se usa el error relativo en termino de porcentajes.Otro punto importante de considerar al seleccionar un algoritmo es la eficiencia, que se mide deacuerdo al numero de operaciones aritmeticas basicas requeridas para dar una exactitud en elresultado.
5
1.2. Dıgitos significativos.
El uso de la aritmetica de las computadoras lleva al concepto de dıgitos significativos. El dıgitoprincipal o mas significativo de un numero real x 6= 0, es el dıgito no nulo mas a la izquierdade su expresion decimal. Todos los dıgitos, incluyendo los ceros a la derecha del dıgito significativoprincipal, son significativos y el ultimo de la serie es el menos significativo. Sin embargo, los cerosa la izquierda del dıgito significativo principal no son significativos. Por ejemplo, si x = 0.0670 eldıgito significativo principal es 6 y el dıgito menos significativo es el cuarto de izquierda a derechacero.
Definicion 1.2
Diremos que x∗ aproxima a x con λ dıgitos significativos (o cifras) ssi λ es el entero masgrande no negativo tal que:
|x− x∗||x|
< 5× 10−λ o |x− x∗| < 5× 10−λ|x|. (1)
i)ii) Diremos que x∗ aproxima a x con λ dıgitos significativos (o cifras) ssi λ es el entero masgrande no negativo tal que:
|x− x∗| < 0.5× 10σ−λ
donde σ es el exponente de la potencia de 10 que resulta al transformar x∗ a la notacioncientıfica normalizada.
Ejemplo 1.1 Para que x∗ aproxime a 1000 con cuatro cifras significativas, debe satisfacer :
|x∗ − 1000||1000|
< 5× 10−4. (2)
Es decir, 999.5 < x∗ < 1000.5
Ejemplo 1.2
Si x∗ = 5.98 la notacion normalizada de x∗ = 0.598× 101, es decir, σ = 1.
i)ii) Si x = 0.5 y x∗ = 4.9, determine el numero de dıgitos significativos de la aproximacion.
Ejemplo 1.3 Aproxime con 4 dıgitos significativos de precision el cero de la funcion f(x) =x− cos(x) que se encuentra en el intervalo [0, pi
2 ], usando metodo de Newton.Raphson.
sol. Graficamos en el intervalo [0, pi2 ]
6
Figura 1: f(x) = x− cos(x) x ∈ [0, π2 ]
Algoritmo de Newton-Raphson: Dada una aproximacion inicial x0, generamos una sucesion{xn)}∞n=1, tal que xn se determina por:
xk+1 = xk −(f(xk)f ′(xk)
. (3)
Observando el grafico podemos seleccionar x0 = 0.7854, presentamos los resultados de cada itera-cion en la siguiente tabla
1. Use el metodo de Newton para aproximar con precision 10−4las raıces dex− 0.8− 0.2 sin (x) = 0 en [0, π
2 ].
2. Aproxime con precision 10−5 las raıces deex + 2−x + 2cos(x)− 6 = 0.
7
1.3. Polinomios de Taylor
Teorema 1.1 Sean
i) f ∈ Cn[a, b] y f (n+1) existe en [a, b).
ii) x0 ∈ [a, b]
entonces para toda x ∈ [a, b] existe ξ(x) entre x0 y x tal que :
f(x) = Pn(x) +Rn(x)
donde:
Pn(x) = f(x0) + f ′(x0)(x− x0) + f ′′(x0)(x− x0)2
2!+ f ′′′(x0)
(x− x0)3
3!+ · · ·
+f (n)(x0)(x− x0)n
n!y
Rn(x) = f (n+1)(ξ(x))(x− x0)(n+1)
(n+ 1)!
Pn(x) se llama el polinomio de Taylor de grado n para f alrededor de x0 y Rn(x) se llamael residuo o error de truncamiento asociado con Pn(x). La serie infinita que se obtiene altomar el lımite de Pn(x), cuando n → ∞ se denomina serie de Taylor para f alrededor de x0.El termino de error de truncamiento se refiere generalmente al error involucrado al usar sumasfinitas o truncadas para aproximar la suma de una serie infinita.
1.3.1. Formula de Euler
Un metodo numerico para de resolver el Problema de valor inicial :
P.V.I.
{y′ = f(x, y)y(x0) = y0.
es el metodo de Euler. Si escribimos la serie de Taylor, con respecto a algun punto xi de la soluciony(x), entonces tenemos:
y(x) = yi + y′i(x− xi) + y′′i(x− xi)2
2!+ y′′′i
(x− xi)3
3!+ · · ·
Entonces, podemos aproximar la solucion en xi+1 por:
yi+1 = yi + y′ih+ y′′ih2
2!+ y′′′i
h3
3!+ · · ·
8
donde, h = xi+1 − xi. Es claro que mientras mas terminos se consideren en el desarrollo de Taylormejor sera la aproximacion. Si consideramos dos terminos del desarrollo, obtenemos:
yi+1 = yi + y′ih⇔ yi+1 = yi + f(xi, yi)h i = 0, 1, 2, · · · (4)
Observese que (197) es el metodo de Euler, con un error de orden O(h2), esto significa que losterminos no considerados contienen potencias de h con exponente mayor o igual que 2.Error de local del metodo de Euler.
Consideramos:yi+1 = yi + hf(xi, yi)
y suponemos y(x) en serie de Taylor con segunda derivada continua en un intervalo que contienea xi
suponiendo yi = y(xi), obtenemos la formula para el error local:
ei+1 = y(xi+1)− yi+1 =(h2)2y′′(ξ). (6)
Como generalmente no se conoce el valor de ξ, aunque teoricamente exista, no se puede calculareste error , pero es posible determinar un estimativo, acotando esta expresion por el maximo quealcanza la segunda derivada en el intervalo, es decir
|ei+1| ≤M · h2
2!(7)
conM = max
x∈(xi,xi+1)|y′′(x)|
Observemos que el maximo M no depende de h, luego si se reduce h en un factor de 12 , la cota
derror se reduce en 14 y una reduccion de h en un factor de 1
10 , la cota derror se reduce en 1100 .
Actividades 1.1 Para el problema de valor inicial siguiente
y′ = 0.2xy , y(1) = 1
Use el metodo de Euler para obtener una aproximacion a y(1.5) usando h = 0.1 y h = 0.05.Resuelva esta ecuacion analıticamente usando alguno de los metodos ya estudiados y elabore unatabla que incluya en los puntos seleccionados (Use h = 0.1 ) el valor exacto, el valor aproximadoy el error relativo para cada aproximacion .
9
2. Ecuaciones No lineales.
Modulo 2Prof. M.Angelica Vega
2.1. Metodo de Biseccion
Problema 1. Dada una funcion f(x) no lineal y continua en el intervalo [a, b]. Determinar unaraız α ∈ [a, b] de la ecuacion f(x) = 0.
Ante el problema planteado surgen las siguientes interrogantes :1. ¿Existe solucion?2. Si existe solucion . ¿Es unica ?3. ¿Como determinarla ?1.- Existencia : Teorema de Bolzano.
La existencia de solucion esta garantizada por el teorema de Bolzano, cuyo enunciado afirma quebajo las hipotesis :i) f continua en [a, b].ii) f(a) y f(b) de distinto signo. (es decir, f(a) · f(b) < 0 )entonces,existe α ∈ (a, b) tal que f(α) = 0.
2.- Unicidad :
La existencia de una unica solucion en el intervalo de precicion queda garantizada por el siguienteteorema visto en Calculo Diferencial .
Teorema 2.1 Si f es una funcion que satisface las hipotesis :i) f continua en [a, b].ii) f(a) · f(b) < 0.iii) f es diferenciable en (a, b)iv) Signo de f ′(x) es constante en (a, b) entonces,existe un unico α ∈ (a, b) tal que, f(α) = 0.
Metodo de Biseccion. Se basa en el teorema de Bolzano, por lo tanto se supone :i) f continua en I(α) = [a, b].ii) f(a) · f(b) < 0Algoritmo de la Biseccion .
1.- Dividir el intervalo de precision I(α) por la mitad, obteniendose:
x1 =(a + b)
2
8
2.- Analizar f(x1)Si f(x1) = 0 , entonces α = x1 y detener el proceso.Si f(x1) 6= 0 , entonces
Si f(x1) · f(a) < 0 , f(x) tiene un cero en el intervalo [a, x1].
Si f(x1) · f(a) > 0 , f(x) tiene un cero en[x1, b].
3.- Repitiendo los pasos 1 y 2 se genera una sucesion de aproximaciones, hasta que se satisfaga unacondicion de termino.Ventajas y desventajas.Es posible demostrar que si f(x) es continua en [a, b] y f(a)·f(b) < 0, el procedimiento de bisecciongenera una sucesion que converge a la raız α y
|xn − α| ≤ (b− a)2n
. (8)
Sin embargo este metodo tiene la desventaja que la convergencia es lenta .Del resultado anterior, se puede deducir una formula para determinar el numero de iteraciones,dada una cierta tolerancia ε.
c) ¿Cuantas iteraciones se deben realizar para que la aproximacion sea correcta a lo menosen 4 cifras significativas?
2.2. Metodo de la secante.
Se basa en encontrar una aproximacion a la raız mediante rectas secantes a la grafica de f(x), demodo que, si (xk−1, f(xk−1)) y (xk, f(xk)) son dos puntos de la grafica de f(x) una aproximaciona la raız α es, xk+1 interseccion de la recta secante que une los puntos mencionados con el eje X.De donde se deduce :
xk+1 = xk −(f(xk) · (xk − xk−1))(f(xk)− f(xk−1))
. (10)
9
Figura 2:
Algoritmo de la Secante .
1.- Dadas dos aproximaciones x0 y x1.2.- Generamos una sucesion de aproximaciones {xk+1} definida por:
xk+1 = xk −(f(xk) · (xk − xk−1))(f(xk)− f(xk−1))
.
Metodo de la Regula Falsi.
Este algoritmo es una mezcla de los metodos de biseccion y secante.1.- Si [a, b] es el intervalo de precision, unimos (a, f(a)) y (b, f(b)) para obtener x1 como interseccionde la recta secante que pasa por los puntos precedentes y el eje X.
2.- Trazamos la recta secante por (x1, f(x1)) y (b, f(b)) cuya interseccion sobre el eje X determinados subintervalos, escogemos aquel que contiene a la raız, verificando :Si f(x1) · f(b) < 0 , la raız esta en [x1, b] , de lo contrario la raız pertenece al intervalo [a, x1] .3.- Supongamos que f(x1) · f(b) < 0 , repetimos el paso 1 considerando el intervalo [x1, b] , demodo que se obtiene la aproximacion x2, como interseccion de la secante y el eje X.
4.- Procediendo ası sucesivamente obtenemos la sucesion {xk+1} definida por :
xk+1 = xk −(f(x[k]) · (b− xk))
(f(b)− f(xk))(11)
Graficamente,
Actividades 2.2
10
Figura 3:
Usando el metodo de la secante, obtener el cero de
f = x− 2 senx
que esta en el intervalo [1,5, 2]
Dada f = x3 + x2 − 3x− 3 , determine en forma aproximada la raız que se encuentra en elintervalo [0,3] .
Metodo de Newton-Raphson.
El metodo de Newton-Raphson es uno de los metodos numericos mas conocidos en la resoluciondel problema de busqueda de raıces de la ecuacion :
f(x) = 0
Existen tres formas de derivar este metodo, un enfoque basado en el polinomio de Taylor, comoun procedimiento para obtener una convergencia mas rapida que la que se obtiene con los otrosmetodos y el metodo grafico.Discutiremos este ultimo. Geometricamente consiste en dada una funcion dos veces continuamentediferenciable, nos aproximamos a la raız mediante rectas tangentes, de modo que si ((xk, f(xk)) esun punto de la grafica de f(x), trazamos la recta tangente en este punto y donde la tangente cortaal eje X obtenemos la aproximacion xk+1, es decir, geometricamentede donde deducimos
xk+1 = xk −(f(xk))(f ′(xk))
. (12)
11
Figura 4:
Actividades 2.3 Use el metodo de Newton-Raphson para determinar una aproximacion de lamayor raız negativa de la ecuacion f(x) = 0 con
2.3. Estudio de la convergencia del metodo de Newton-Raphson.
Definicion 2.1 Si {xn} es una sucesion de numeros reales que converge a la raız r, diremos quela razon de convergencia es de orden α si existen dos constantes C y α y un entero N tal que,
|xn+1 − r| ≤ C|xn − r|α ,∀n ≥ N o lımn→∞
|xn+1 − r||xn − r|α
= C. (13)
Observacion 2.1 i) Si usamos la notacion |en+1| = |xn+1 − r| (error absoluto cometido en la(n+1)- esima aproximacion), el lımite puede abreviarse por
lımn→∞
|en+1||en|α
= C.
ii) Si C < 1 y N es un entero tal que
|xn+1 − r| ≤ C|xn − r| ∀n ≥ N
diremos que la convergencia es a lo menos lineal .
12
iii) Si existen C no necesariamente menor que 1 y un entero N tal que
|xn+1 − r| ≤ C|xn − r|2 ∀n ≥ N
diremos que la convergencia es a lo menos cuadratica.
2.4. Velocidad de convergencia del metodo de Newton- Raphson
Comentamos antes, que otra forma de obtener Newton-Raphson consiste en derivarlo a partir deldesarrollo en serie de Taylor de la funcion f(x).En efecto, supongamos que desarrollamos en serie la funcion no lineal f(x) en torno del punto xk
f(x) = f(xk) + f ′(xk)(x− xk) + f ′′(ξ)2! (x− xk)2 evaluamos en xk+1
f(xk+1) = f(xk) + f ′(xk)(xk+1 − xk) + f ′′(ξ)2! (xk+1 − xk)2.
(14)
donde, ξ ∈ (xk, xk+1). Truncando el tercer termino, queda
f(xk+1) = f(xk) + f ′(xk)(xk+1 − xk). (15)
En la interseccion con el eje X, f(xk+1) = 0, luego
0 = f(xk) + f ′(xk)(xk+1 − xk). (16)
Ordenando, se obtiene
xk+1 = xk −f(xk)f ′(xk)
. (17)
La formula del metodo de Newton.Ademas este desarrollo permite estimar el error de la formula y la velocidad de convergencia delmetodo.En efecto, supongamos que en el desarrollo anterior xk+1 es xr el valor exacto, entonces f(xr) = 0.y
0 = f(xk) + f ′(xk)(xr − xk) +f ′′(ξ)
2!(xr − xk)2. (18)
Restando (16) y (18) se obtiene :
0 = f ′(xk)(xr − xk+1) + f ′′(ξ)2! (xr − xk)2
0 = ek+1f′(xk) + f ′′(ξ)
2! (ek)2.
ek+1 =−f ′′(xk)2f ′(xk)
e2k
De esta ultima igualdad se deduce que el error es casi proporcional al cuadrado del error anteriorlo que significa que el numero de cifras decimales correctas se duplica en cada iteracion.
13
Tomando valor absoluto y lımite cunado k →∞, se tiene que
lımk→∞
|ek+1||ek|2
=|f ′′(ξ)|
2|f ′(xk)|. (19)
De aquı deducimos que el metodo converge cuadraticamente, si f ′(xk) 6= 0, es decir si la raız essimple.
Teorema 2.2 Si f ∈ C2[a, b] y r es una raız es simple en [a, b] (es decir, f(r) = 0 y f ′(r) 6= 0 )entonces, existe un δ > 0 tal que el metodo de Newton-Raphson generara una sucesion que convergecuadraticamente a r para cualquier aproximacion inicial x0 ∈ [r − δ, r + δ] .
Observacion 2.2 Deducimos que no ocurre necesariamente convergencia cuadratica si laraız no es simple.
El metodo de Newton-Raphson en general es muy eficiente, sin embargo hay situaciones enque no es aplicable o se comporta en forma deficiente. Uno de estos casos es cuando la funcionposee raıces multiples.
La siguiente figura muestra graficamente, un ejemplo donde no es posible aplicar Newton-Raphson. ¿Podrıa explicar porque ?
Figura 5: f(x) = x− cos(x) x ∈ [0, π2 ]
Actividades 2.4 Los problemas que se presentan a continuacion son 2 casos especiales, donde noes posible aplicar Newton-Raphson
14
Dada la funcion
f(x) = −12x3 +
52x
aproxime la raız positiva, use como aproximacion inicial x0 = 1. y realice 6 iteraciones.¿Que sucede ? ¿Porque ocurre esto ?
Dada la funcionf(x) = (x− 1)3(x− 2)
aproxime la menor raız, use como aproximacion inicial x0 = 1,75
¿Que sucede ? ¿A que atribuye este hecho ?
Raıces multiples.
Las raıces multiples presentan algunas dificultades para los metodos que hemos analizado.
i) Si una funcion no cambia de signo en raıces multiples pares impide el uso de los metodoscerrados que usan intervalos y los metodos abiertos tienen la limitacion que pueden serdivergentes.
ii) Otra dificultad que puede presentarse, es el hecho que f(x) y f ′(x) tiendan a cero. En estoscasos, hay dificultades con el metodo de Newton-Raphson y el de la secante (aproximacionde f ′(x)) que provocan una division por cero.
iii) Ralston y Rabinowitz demostraron que los metodos de Newton-Raphson y secante conver-gen linealmente cuando hay raıces multiples y han propuesto algunas modificaciones que seobtienen a partir del metodo de newton-Raphson para problemas con funciones que tienenraıces multiples.
iv) El siguiente metodo es una modificacion de Newton-Raphson, tiene convergencia cuadratica:
xk+1 = xk −mf(xk)f ′(xk)
. (20)
donde, m es la multiplicidad de la raız, es decir m = 2 si la raız tiene multiplicidad 2.
v) Otra modificacion de Newton-Raphson, se obtiene definiendo una nueva funcion
u(x) =f(x)f ′(x)
,
que tiene raıces en las mismas proporciones que la funcion original. Se sustituye u(x) en (17)y se obtiene:
xk+1 = xk −f(xk) · f ′(xk)
[f ′(xk)]2 − f(xk) · f ′′(xk). (21)
15
Actividades 2.5 Usar metodo de Newton-Raphson y el modificado (21)para aproximar la raızmultiple de :
f(x) = x3 − 5x2 + 7x− 3
use como aproximacion inicial x0 = 0. Realice a lo menos 5 iteraciones con el metodo de Newton-Raphson.
Nota 2.1 El material bibliografico usado para la elaboracion de este taller :
Analisis Numerico. R.L. Burden-J.D. Faires
Metodos numericos. S.C. Chapra- R.P. Canale
16
2.5. Metodos de punto fijo.
Modulo 3Prof: Marıa Angelica Vega U.
Sea f(x) = 0 una ecuacion no lineal. Los metodos para determinar una raız de esta ecuacion, quese expresan en la forma
x = g(x)
se denominan Metodos de Iteracion Funcional o Metodos de punto fijo. Una solucion deesta ecuacion se llama punto fijo de g y la funcion g(x) se llama funcion de iteracion . Frenteal problema de buscar los puntos fijos de la ecuacion x = g(x), surgen las siguientes interrogantes :1.- ¿Cuando una funcion g(x) tiene un punto fijo ?2.- ¿Si existe, es unico ?3.- ¿ Como determinarlo ?Las respuestas a la primera y segunda interrogante, es el resultado que veremos a continuacionformalizado como Teorema de existencia y unicidad.
Teorema 2.3 Teorema de Existencia y unicidad. Si
i) g(x) es continua en [a, b].
ii) g(x) pertenece a [a, b], para todo x que pertenece al intervalo [a, b]. entonces, existe un puntofijo para g(x) en (a, b).
Si ademas,
iii) g(x) es diferenciable en (a, b)
iv) |g(x)| ≤ k < 1 , para todo x perteneciente al intervalo (a, b), entonces , g(x) tiene un unicopunto fijo en [a, b].
Demostracion.
1) Existencia. Si g(a) = a y g(b) = b la existencia de un punto fijo es trivial.
Suponemos entonces,
a < g(a) y b > g(b) (Por hipotesis g(x) ∈ [a, b]).
Definimos:h(x) = g(x)− x
observamos que,
i) h(x) es continua en [a, b]
ii)
h(a) = g(a)− a > 0h(b) = g(b)− b < 0
}⇒ h(a) · h(b) < 0.
17
Por teorema de Bolzano existe p ∈ (a, b) tal que
h(p) = 0 ⇔ g(p)− p = 0 ⇔ p = g(p)
, luego p es punto fijo.
2) Unicidad. Supongamos que p y q son dos puntos fijos distintos. Por Teorema del Valor Medio,
( f continua y diferenciable, existe ξ ∈ (p, q) tal que f ′(ξ) = f(b)−f(a)b−a .) Tenemos,
Contradiccion de suponer p 6= q, luego p = q en [a, b].
Algoritmo de punto fijo.
1.- Dada una aproximacion inicial x0,2.- Generamos una sucesion de aproximaciones {xn} definida por :
xn = g(xn−1)
. Situacion grafica de algunas funciones.
Figura 6: x = (1/3)x + 0,2 Figura 7: x = x(1/3)
Actividades 2.6 La ecuacion x3 + 4x2 − 10 = 0 tiene una raız en [1, 2], obtenga al menos 5funciones de iteracion.
Convergencia
Teorema 2.4 Bajo las hipotesis del teorema de existencia y unicidad, si p0 ∈ [a, b] la sucesiondefinida por
pn = g(pn−1)
18
Figura 8: x = (3/2)x
converge al unico punto fijo. Ademas se cumple
i)|pn − p| ≤ kn
1− k|p0 − p1| ∀n ≥ 1.
ii)|pn − p| ≤ kn|p0 − p| ≤ kn max {p0 − a, b− p0},
puesto que, p ∈ [a, b].Demostracion. Hacerla como ejercicio. Se utilizan las hipotesis del Teorema de existencia yunicidad y el Teorema del Valor Medio.
Actividades 2.7 Sea g(x) = (x2−1)3 en [−1, 1] . Demostrar que g(x) tiene un unico punto fijo en
(−1, 1).
Velocidad de Convergencia.
Teorema 2.5 Sea p un punto fijo de g(x), tal que p ∈ I y sea
xk = g(xk−1) para k = 1, 2, ...
i) Si g ∈ C1(I(p)) y g′(p) 6= 0, entonces
|xk+1 − xk| ≈ g′(p)|xk − xk−1|
de modo que, si x0 ∈ I(p) entonces,{xk} converge linealmente a p con C = g′(p) si 0 < |g′(p)| < 1.
19
{xk} diverge linealmente a p con C = g′(p) si |g′(p)| > 1.ii) Si g′′(x) es continua y g′(p) = 0 entonces,
|xk+1 − xk| ≈ −12g′′(p)|xk − xk−1|
si x0 ∈ I(p) entonces,{xk} converge cuadraticamente a p con C = − 1
2g′′(p).Si g′(p) = ±1 , {xk} puede converger o diverger muy lentamente.Demostracion. Consultar Analisis Numerico de M.J.Maron-R.J.Lopez.
2.6. Convergencia del Metodo de Newton-Raphson
Teorema 2.6 Si α es una raız simple de f(x) = 0, entonces el algoritmo de Newton Raphsontiene convergencia Cuadratica.Sol. α raız simple de f(x) = 0 implica que:
f(x) = (x− α) · h(x) con h(α) 6= 0
f ′(x) = h(x) + (x− α) · h′(x)
f ′(α) = h(α) 6= 0
Desarrollando f(x) en serie de Taylor alrededor de x = α se tiene :
f(x) = f(α) + f ′(α)(x− α) +f ′′(α)(x− α)2
2!+
f ′′′(ξ)(x− α)2
3!
Para algun ξ en un entorno de α. Consideremos el algoritmo de Newton-Raphson:
xn+1 = xn −f(xn)f ′(xn)
xn+1 − α = xn − α− 1f ′(xn)
(f ′(α)(xn − α) +
f ′′(α)(xn − α)2
2!+
f ′′′(ξ)(xn − α)3
3!
)
xn+1 − α =(xn − α)2
f ′(xn)
[f ′(xn)− f ′(α)
(xn − α)− f ′′(α)
2!− f ′′′(ξ)(xn − α)
3!
]
lımn→∞|xn+1 − α||xn − α|2
=∣∣∣∣ 1f ′(α)
(f ′′(α)− f ′′(α)2
)∣∣∣∣ =
∣∣∣∣ 12f ′(α)
∣∣∣∣ = cte
(22)Luego el metodo de Newton tiene orden de convergencia 2 para α raız simple.
Teorema 2.7 Si α es una raız multiplicidad p de f(x) = 0, entonces el algoritmo de NewtonRaphson tiene convergencia lineal.Dem. α raız simple de f(x) = 0 implica que:
Luego el metodo de Newton-Raphson tiene orden convergencia 1 o lineal para α raız multiple.
Actividades 2.8
1. Considere la ecuacion:e
x2 − 2x = 0 (24)
i) Verifıque la ecuacion (24) tiene una raız en el intervalo [4, 5].ii) Demuestre que en el intervalo [4, 5] esta la mayor raız positiva de la ecuacion (24).iii) Para obtener la raız que esta en [4, 5], se propone el siguiente algoritmo de punto fijo:
xk+1 =e
xk2
2(25)
Determine justificadamente , si es posible garantizar la convergencia del algoritmo parahallar la raız . Usando (25) y una aproximacion x0, adecuada, trate de obtener unaaproximacion de la citada raız.
iv) Proponga un algoritmo de punto fijo convergente, y uselo con x0 conveniente, paradeterminar una aproximacion de la raız de (24) en [4, 5].
2. Puede demostrarse que la forma que adopta un cable suspendido de sus extremos es catenaria.Una ecuacion de una catenaria esta dada por:
y = coshx
a
21
donde a es una constante por determinar. El eje Y equidista de sus puntos extremos. Uncable telefonico esta suspendido, a la misma altura, de dos postes que estan a 200 pies unodel otro. El cable tiene una caıda maxima de 10 pies en el punto medio del cable. Determineel valor de a. (Recuerde que cosh0 = 1.)
Nota 2.2 El material bibliografico usado para la elaboracion de este taller :
Analisis Numerico. R.L. Burden-J.D. Faires
Analisis Numerico. M.J. Maron - R.J. Lopez.
22
3. Ceros de las funciones Polinomicas.
Una expresion de la forma:
Pn(x) = anxn + an−1xn−1 + · · · a1x + a0
donde, los ai son constantes, an 6= 0, se llama polinomio de grado n.Recordamos el metodo de Horner:
Teorema 3.1 Metodo de Horner.Sea
Pn(x) =n∑
k=0
akxk , anneq0 , an = bn
i) Si bk = ak + bk+1x0 , ∀k = n− 1, · · · 1, 0 entonces
Observacion 3.1 Si se usa el metodo de Newton - Raphson para determinar las raıces de unpolinomio P (x), para evaluar P (xk) y P ′(xk) puede usarse el metodo de Horner.
23
Ejemplo 3.1 Usando Newton - Raphson y Metodo de Horner, aproximar la mayor raız negativade
ii) Calculo de P ′(x0)Para determinar P ′(−2) = Q(−2), usamos nuevamente metodo de Horner.
2 −4 5 −7−4 16 −42
2 −8 21 −49
Luego P ′(−2) = −49 Usamos Metodo de Newton-Raphson
x1 = −2− 10−49
≈ −1,796
Segunda y Tercera iteracion.
Actividades 3.1 Separar las raıces de los siguientes polinomios:a) P3(x) = 3x3 + 2x− 1c) P4(x) = x4 − 2x2 + 1
24
UNIVERSIDAD DE SANTIAGO DE CHILE
CALCULO NUMERICO
Ecuaciones No lineales.
Modulo 5
Prof: Marıa Angelica Vega U.
3.1. Sistemas de Ecuaciones No lineales.
Un sistema de n ecuaciones con n incognitas x1, x2, ..., xn se dice no lineal si una o mas ecuacioneses no lineal.Notacion.
f1(x1, ..., xn) = 0f2(x1, ..., xn) = 0
... =...
fn(x1, ..., xn) = 0
o
f1(x) = 0f2(x) = 0
... =...
fn(x) = 0
donde x =
x1
x2
...xn.
Este sistema puede escribirse abreviadamente como, ~F ( ~X) = ~0 (o F(x) = 0 .) Notese que lasolucion es un vector que debe satisfacer simultaneamente todas las ecuaciones del sistema.
Ejemplo 3.2 Analizar, si es posible determinar la solucion de :i)
yex − 2 = 0x2 + y − 4 = 0
ii)xey − x5 + y + 3 = 0
x + y + tanx− sen y = 0
Solucion.
i) Segun la notacion anterior:
f1(x, y) = yex − 2 = 0f2(x, y) = x2 + y − 4 = 0
25
Figura 9: x = (1/3)x + 0,2
Graficamente, Una forma simple de resolver este sistema es, usar los metodos empleados en laresolucion de sistemas lineales, es decir, despejar y en ambas ecuaciones, obteniendose:
x2 + 2e−x − 4 = 0
Usando cualquier metodo para aproximar raıces de ecuaciones no lineales se obtiene:
x1 ≈ (−0,6, 3,7)T y x2 ≈ (1,9, 0,4)T
ii) ¿Es posible usar el metodo anterior para determinar una solucion de:
f1(x, y) = xey − x5 + y + 3 = 0f2(x, y) = x + y + tanx− sen y = 0
Justificar la respuesta.
3.2. Metodo de Newton- Raphson Generalizado.
La idea es ahora extender el metodo de Newton- Raphson, visto para funciones de una variablereal a funciones de dos o mas variables, para resolver el sistema:
F(x) = 0 ⇔
{f(x, y) = 0g(x, y) = 0
(26)
Analizaremos el caso mas simple, es decir, funciones de dos variables. Para ello recordamos elteorema de Taylor, para funciones de 2 variables .Sea u = f(x, y) y todas sus derivadas parciales de orden menor o igual a (n + 1) continuas enuna region D = {(x, y)/a ≤ x ≤ b c ≤ y ≤ d}. Sea (x0, y0) ∈ D, para todo (x, y) ∈ D existen
26
ξ ∈ (x, x0) y η ∈ (y, y0) tal que:
Pn(x, y) = f(x0, y0) + (x− x0)∂f
∂x(x0, y0) + (y − y0)
∂f
∂y(x0, y0)+
=(x− x0)2
2!∂2f
∂x2(x0, y0) +
(x− x0)(y − y0)2!
∂2f
∂x∂y(x0, y0)+
=(y − y0)2
2!∂2f
∂y2(x0, y0) + · · ·+
=1n!
n∑j=0
(nj
)(x− x0)n−j(y − y0)j ∂nf
∂xn−j∂yj(x0, y0)+
=1
(n + 1)!
n+1∑j=0
(n + 1
j
)(x− x0)n+1−j(y − y0)j ∂n+1f
∂xn+1−j∂yj(ξ, η).
(27)
Pn(x, y) se llama Polinomio de Taylor de grado n en dos variables para la funcion f alrededorde (x0, y0). El ultimo termino corresponde al termino de error.Deduccion del metodo.
Aplicamos (27) para desarrollar las funciones no lineales f y g del sistema (26) en torno del punto(xk, yk).
f(x, y) = f(xk, yk) + (x− xk)∂f
∂x(xk, yk) + (y − yk)
∂f
∂y(xk, yk)+
=(x− xk)2
2∂2f
∂x2(ξ, η) +
(x− xk)(y − yk)2
∂2f
∂x∂y(ξ, η)+
=(y − yk)2
2∂2f
∂y2(ξ, η) + · · ·
g(x, y) = g(xk, yk) + (x− xk)∂g
∂x(xk, yk) + (y − yk)
∂g
∂y(xk, yk)+
=(x− xk)2
2∂2g
∂x2(ξ, η) +
(x− xk)(y − yk)2
∂2g
∂x∂y(ξ, η)+
=(y − yk)2
2∂2g
∂y2(ξ, η) + · · ·
(28)
Evaluando en (xk+1, yk+1) y trucando el termino de error se tiene:
f(xk+1, yk+1) = f(xk, yk) + (xk+1 − xk)∂f
∂x(xk, yk) + (yk+1 − yk)
∂f
∂y(xk, yk)
g(xk+1, yk+1) = g(xk, yk) + (xk+1 − xk)∂g
∂x(xk, yk) + (yk+1 − yk)
∂g
∂y(xk, yk).
(29)
27
Como la aproximacion (xk+1, yk+1) corresponde donde,
f(xk+1, yk+1) = 0 = g(xk+1, yk+1),
reordenando se obtiene:
(xk+1 − xk)∂f
∂x(xk, yk) + (yk+1 − yk)
∂f
∂y(xk, yk) = −f(xk, yk)
(xk+1 − xk)∂g
∂x(xk, yk) + (yk+1 − yk)
∂g
∂y(xk, yk) = −g(xk, yk).
(30)
Con el fın de simplificar la notacion, escribimos el sistema en forma matricial
Jk ·∆ = −xk. (31)
donde,
Jk =
∂f
∂x(xk)
∂f
∂y(xk)
∂g
∂x(xk)
∂g
∂y(xk)
es la matriz jacobiana, en
xk =(
xk
yk
)para xk =
(f(xk)g(xk)
)y ∆ =
(∆x∆y
)=
(xk+1 − xk
yk+1 − yk
)De (31) podemos escribir
∆ = −J−1F(xk)xk+1 = xk − J−1F(xk) (32)
Esta ultima ecuacion es una generalizacion de la formula de Newton-Raphson para funciones nolineales de una variable real.
Ejemplo 3.3 Resolver el ejemplo 1.1 i) usando metodo de Newton.Raphson generalizado.Solucion. Consideremos:
sabemos que tiene dos raıces, aproximaremos la raız positiva, usando
x0 =(−0,63,7
)Determinamos:
F(x) =(
yex − 2x2 + y − 4
), J =
(yex ex
2x 1
)
28
Evaluando en el dato inicial x0, tenemos
F(x0) =(
3,7e−0,6 − 2(−0,6)2 + 3,7− 4
), J0 =
(3,7e−0,6 e−0,6
2(−0,6) 1
)de donde, (
2,03060 0,548812−1,2 1
)·(
∆x∆y
)= −
(0,0306031
0,006
)De aquı (
∆x∆y
)=
−12,68917
(1 −0,548812
1,2 2,03060
)·
(0,0306031
0,006
)luego, (
∆x∆y
)=
(0,000865−0,05896
)Como
x1 − x0 = ∆x0 ⇒ x1 = x0 + ∆x0
entonces,
x1 =(−0,63,7
)+
(0,000865−0,05896
)=
(−0,5991353,64104
)Si realizamos una segunda iteracion, se obtiene:
x2 = x1 + ∆x1 =(−0,5991253,64105
)Actividades 3.2 Use el metodo de Newton-Raphson para determinar la aproximacion x3 de lasolucion del sistema no lineal √
x + 12cosz = ln 1
y
y ln 4x + 1 = 2z + ez
4x + y sen z = 1(34)
use como aproximacion inicial
x0 =
13
13
π6
Ayuda. Programando el algoritmo de Newton Raphson generalizado, en MAPLE se obtiene:
x1 =
,2399765202,3506602354
,551268419 · 10−1
, x2 =
0,24974296630,3672616918
0,26800671 · 10−3
, x3 =
0,24999997230,3678789014
−0,1485685 · 10−6
x4 =
0,2500000000,3678794411
−,1098834 · 10−9
, x5 =
0,25000000000,3678794411
−,7324581877 · 10−10
29
Nota 3.1 Observese que el metodo converge a
x =
14
1e
0
30
Método de Müller Es un método de interpolación que aproxima la función f(x) cuya raíz interesa por un polinomio cuadrático. Para determinar dicho polinomio se consideran tres puntos cercanos a la raíz de la ecuación f(x) = 0. Sean
20 0 1 1 2 2( , ) , ( , ) .( , ) dichos puntos y sea ( ) el polinomio
que interpola a ( ) en dichos puntos.A x f B x f y C x f P u au bu c
f x= + +
Para simplificar la obtención del polinomio cuadrático se supone que el origen pasa por el punto que esta en medio de los otros dos. Sea
1 1 0 2 0 2
20 0
21 1 1 1
Sea , Los coeficientes , , del polinomio ( ) se determinan resolviendo el sistema (0) (0) (0)
( )
h x x h x xa b c P uP f a b c f
P h f ah bh c
= − = −
= ⇒ + + =
= ⇒ + + 12
2 2 2 2 2
2 0 1 0
2
1
1 00
( )( en este desarrollo se considera , es decir, es el punto del medio)
Se obtiene,con :
· (1 )· ,
f
P h f ah bh c fx x x x
hdh
d f d fc f a
=
= ⇒ − + =< <
=
− += =
22 1 0 1
21 1
2
·,(1 )· ·
Con los valores determinados de , , se resuelve ( ) 0
f f f a hbd d h h
a b c P u au bu c
+ − −=
+
= + + =
eligiendo la raíz más cercana a 0x . Este valor es:
0 2
2 4
El signo del denominador se toma de modo que coincida con el de : si 0 se considera el signo + y si 0 se elig
cr xb b ac
b bb
= −± −
>< e el signo - en el denominador.
De ese modo el denominador toma su mayor valor absoluto.El valor calculado es uno de los tres puntos a considerar en el siguiente paso,es decir,si queda a la derecha
rr 0 0 1 0
0 2
0
de x se toman los puntos , , y si queda a la izquierda de ,los puntos a considerar son , , .En ambos casos los puntos se redefinen de modo que sea el punto del medio de los tres esco
x x r r xx x r
x gidos.
Ejemplo:
:= y − ( )sin x 12 x
Su gráfica es:
La raíz está entre x2 =1.8 y x1 = 2.2. Tomando x0 =2.0 entre x2 y x1
:= x0 2.0 := x1 2.2 := x2 1.8
los correspondientes valores de f(x), h1, h2 y d son: := y0 -.0907025732
:= y1 -.2915035962
:= y2 .0738476309
:= h1 .2 := h2 .2
:= d 1.000000000
Resolviendo el sistema se obtienen los coeficientes del polinomio cuadrático:
:= a -.4531352362
:= b -.9133780680
:= c -.0907025732
Por ser b < 0 se considera el signo (-) en el denominador de la expresión para r, raíz del polinomio ( r es una primera aproximación a la raíz de f(x) )
:= r 1.895252107
La raíz r del polinomio se encuentra a la izquierda de x0. Los nuevos valores son
Una segunda aproximación a la raíz es r1 y la raíz "exacta" es rexac:
:= r1 2.880990772 := rexac 2.880986321
El valor de la función en x = r1 es: := y33 -.0000155441
Modulo 6
Prof. M.Angelica Vega U.
4. Sistemas de Ecuaciones Lineales.
4.1. Metodos directos
Estos metodos consisten en sustituir la matriz A por una sucesion de matrices elementales, demanera que se obtiene un sistema sea mas facil de resolver.
4.1.1. Metodo de Gauss.
El metodo de eliminacion gaussiana es uno de los metodos directos clasico para resolver el sistemaAx = b, consiste de dos etapas.Etapa 1. Triangularizacion.Para efectos de la operatoria, resulta mas simple, efectuar las operaciones sobre la matriz aumen-tada A en lugar de A.El metodo consiste en obtener una sucesion de sistemas equivalentes
A(k)x = b(k) , (k = 1, 2, ... , n)
mediante operaciones elementales de fila, tal que para cada k = 2, 3 , . . . , n.
A(k) =
a(1)11 a
(1)12 . . . . . . . . . . . . a
(1)1 n
... a(1)1 n+1
0 a(2)22 . . . . . . . . . . . . a
(2)2n
... a(2)2 n+1
0 0. . .
......
...
0 0 . . . a(k)kk a
(k)k k+1 . . . a
(k)k n
... a(k)k n+1
0 0 . . . a(k)k+1 k a
(k)k+1 k+1 . . . a
(k)k+1 n
... a(k)k+1 n+1
...... . . .
...... . . .
......
0 0 . . . a(k)n k a
(k)n k+1 . . . a
(k)n n
... a(k)n n+1.
(35)
donde,
b(k) =
a(1)1 n+1
...a(k)n n+1
...a(k)n n+1.
(36)
conA(1) = A ,
31
A(k) = (a(k)ij ) se obtiene de la siguiente manera:
a(k)ij =
a(k−1)ij si, i = 1, 2, . . . k − 1 ; j = 1, 2, . . . n + 1
0 si, i = k, k + 1, . . . n ; j = 1 . . . k − 1 ,
a(k−1)ij − a
(k−1)i k−1
a(k−1)k−1 k−1
a(k−1)k−1 j sii = k, k + 1 . . . n ; j = k, k + 1 . . . n + 1 ..
(37)
El proceso termina cuando A(n) es triangular superior, teniendose el sistema A(n)x = b(n).Notese que en esta etapa solo se obtiene una matriz triangular superior. En la etapa siguiente, seresuelve el sistema.Etapa 2. Retrosustitucion.Resolvemos la n-esima ecuacion
xn =a(n)n n+1
a(n)n n
.
Usando xn se puede despejar xn−1 de la n− 1-ecuacion
xn−1 =a(n−1)n−1 ,n+1 − a
(n−1)n−1 n xn
an−1 n−1;
continuando con este proceso, se tiene que, para cadai = n− 1, n− 2, . . . , 2, 1 ,
xi =ai
i ,n+1 − aii nxn − ai
i n−1xn−1 − · · · · · · · · · − aii i+1xi+1
aii=
aii ,n+1 −
∑nj=i+1 ai
ijxj
aii(38)
Nota 4.1 Denotaremos por :
mi k =ai k
ak k
al numero que produce un cero en la fila i columna k, denominado multiplicador y a los elementosai i le llamaremos elementos pivotes.
Observemos que, a(k)i j , se obtiene de :
a(k)i j = a
(k−1)i j −mk−1
i k−1 · a(k−1)k−1 j
Actividades 4.1
i) Ejemplo 4.1 Use eliminacion de Gauss para resolver:
3x1 − 0,1x2 − 0,2x3 = 7,85 ,
0,1x1 + 7x2 − 0,3x3 = −19,4 ,
0,3x1 − 0,2x2 + 10x3 = 71,4 ,
efectuar los calculos con 6 cifras significativas.
32
Solucion : la matriz aumentada es
A =
3 −0,1 −0,2 7,850,1 7 −0,3 −19,40,3 −0,2 10 71,4
luego,los multiplicadores que producen ceros en la primera columna son :
m2 1 =a2 1
a1 1=
0,13
= 0,03333333
y
m3 1 =a3 1
a1 1=
0,33
= 0,09999999
ii) Ejemplo 4.2 Use eliminacion de Gauss para resolver los siguientes sistemas: a)
0,0003x1 + 3,0000x2 = 2,0001 ,
1,0000x1 + 1,0000x2 = 1,0000 ,
b)
1,0000x1 + 1,0000x2 = 1,0000 ,
0,0003x1 + 3,0000x2 = 2,0001 ,
c) Compare los resultados de a) y b) al considerar 3, 4 y 5 cifras significativas. ¿A que con-clusion llega ?
4.1.2. Eliminacion gaussiana con y sin pivoteo.
De la Actividad I.ii), se observa que pueden surgir dificultades en algunos casos, como cuando elpivote es pequeno en relacion a los otros elementos de la columna a la que pertenece el elementopivote. Una forma de mejorar las soluciones se usa como estrategia pivotear. El llamado pivoteoparcial consiste en seleccionar el elemento de mayor valor absoluto ubicado en la misma columnaque el pivote, bajo la diagonal e intercambiar filas. Al procedimiento de buscar el elemento demayor valor absoluto tanto en las columnas como en las filas y luego intercambiar se conoce comopivoteo total.El pivoteo completo o total no es muy usado puesto que el intercambio de columnas implica unintercambio de las incognitas, lo que agrega complejidad injustificada.
Actividades 4.2 1. Use eliminacion de Gauss para resolver el sistema :
x1 + x2 − x3 = −3 ,
6x1 + 2x2 + 2x3 = 2 ,
−3x1 + 4x2 + x3 = 1 ,
usando,
33
Gauss simple.
Eliminacion gaussiana con pivoteo parcial.
Eliminacion gaussiana con pivoteo total.
2. Para k = 0, 1, 2, ..., sea x(k) = [xk, yk, zk]T generada por :
4xk+1 = −xk − yk + 2 ,
6yk+1 = +2xk + yk − zk − 1 ,
−4xk+1 = −xk + yk − zk + 4 ,
a) Demuestre que la sucesion de vectores {x(k)}∞k=1 es convergente para cualquier vectorinicial x(0).
b) Determine el vector x al cual converge usando Gauss con pivote parcial.
c) Encuentre el vector x iterando el sistema dado.
3. Suponga que trabaja con una maquina que redondea a dos decimales para resolver el siguientesistema :
0,10 · 10−1x + y = 1x− y = 0
Use el metodo de eliminacion de Gauss para encontrar la solucion.
Efectue un pivoteo parcial y compare con la solucion anterior. La solucion exacta delsistema es x = y = 100
101 .
34
4.2. Factorizacion LU
A = LU
Una primera interrogante es ¿Existe tal factorizacion? . Un primer resultado que garantiza laexistencia de esta factorizacion dice,
Teorema 4.1 Si puede aplicarse la eliminacion gaussiana al sistema Ax = b sin intercambio defilas, entonces la matriz A puede factorizarse como
A = LU ,
donde
U =
a(1)11 a
(1)12 . . . a
(1)1n
0 a(2)22
. . ....
.... . . . . . a
(n−1)n−1 n−1
0 . . . 0 a(n)nn
y
L =
1 0 . . . 0
m21 1. . .
......
. . . . . . 0mn1 . . . mn n−1 1
(39)
Notese que al factorizar A en LU ,
Ax = b ⇔ L(Ux) = b
entonces, es posible resolver el sistema utilizando dos sistemas que involucran matrices triangulares,se resuelve primero Ly = b y luego Ux = y. De modo que si L = (lij), entonces se obtiene elvector y por sustitucion hacia adelante,
y1 =b1
l11
y los yi para cada i = 2, 3, . . . n, mediante
yi =1lii
[bi −
i−1∑j=1
lijyj
].
Ası conociendo el vector y podemos obtener en el sistema Ux = y el vector x por retrosustitucion.El Teorema 1 proporciona una factorizacion de la matriz A, observe que los elementos de la matrizL son los elementos multiplicadores mi j que se obtuvieron al realizar la eliminacion gaussiana,excepto los elementos de la diagonal principal que son 1. Esta factorizacion se conoce como Fac-torizacion de Doolitle.Queda analizar una segunda interrogante . si A admite una factorizacion LU , ¿ esta sera unica?
35
Analicemos el problema general, el factorizar A como LU , significa que hay que resolver las ecua-ciones
Notemos que las ecuaciones anteriores, no determinan a L y a U en forma unica. Para cada i sepuede asignar un valor no nulo lii o uii (pero no a ambos). ¿Porque ? Justifique . Por ejemplo, silii = 1 para i = 1, 2, . . . , n, es la descomposicion de Doolitle que se obtiene como vimos al aplicareliminacion gaussiana. Otra eleccion simple es uii = 1 para cada i en este caso la factorizacion esla de Crout, o bien asumir que lii = uii en cual caso tenemos la factorizacion de Choleski
Actividades 4.3
i) Descomponer la matriz A usando la factorizacion de Crout, en el sistema :
x1 + x2 − x3 = −3 ,
6x1 + 2x2 + 2x3 = 2 ,
−3x1 + 4x2 + x3 = 1 ,
ii) Problema N◦3 de la PEP1 (Sem II-2000) Para determinar la temperatura en cuatro puntosinteriores equidistantes de una barra, hay que resolver la ecuacion :
Atk+1 = tk , k = 0, 1, 2, ...
donde,
A =
3 −1 0 0−1 3 −1 00 −1 3 −10 0 −1 3
, t0 =
10121210
(41)
(tk es la distribucion de la temperatura en los puntos interiores de la barra en el instante k.
a) Mediante el metodo de Gauss (sin pivote) determine t1.
b) Obtenga t2 y t3, usando una descomposicion A = LU .
iv) Investigue como a partir de la factorizacion de Doolitle puede obtener la factorizacion deCrout ? Ilustre el metodo con un ejemplo.
36
4.2.1. Matrices definidas positivas.
Definicion 4.1 Una matriz A simetrica es definida positiva si y solo si
xT Ax > 0 ,∀x ∈ Rn − {0} (43)
Ejemplo 4.3 Verifique si la matriz dada es definida positiva. 2 −1 0−1 2 −10 −1 2
(44)
En la practica puede resultar difıcil determinar si una matriz es definida positiva a partir de ladefinicion, el siguiente resultado constituye un criterio de gran utilidad para este proposito.
Teorema 4.2 A es simetrica y definida positiva, si y solo si Dk > 0 , ∀ k = 1, ..., n, donde Dk esel determinante:
Dk =
∣∣∣∣∣∣∣a11 · · · a1k
.... . .
...ak1 · · · akk
∣∣∣∣∣∣∣Dem. Consultar, Introduction to Numerical Analysis de Stoer - Bulirsch.
Teorema 4.3 Si A es simetrica y definida positiva, entonces :i) A es no singularii) aii > 0, para cada i = 1, 2, ..., n.Dem.
i) Supongamos A no invertible, entonces exite x 6= 0 tal que el sistema Ax = 0, de dondexT Ax = 0, lo que contradice el hecho de A definida positiva. Por tanto, A es no singular.
ii) Ejercicio
Teorema 4.4 Si A es una matriz real, simetrica y definida positiva, entonces A = LLT , donde Les una matriz triangular inferior con diagonal positiva.Dem. Consultar Analisis Numerico de Burden - Faires o Kincaid - Cheney
4.2.2. Matrices diagonal dominante.
Definicion 4.2 Sea A una matriz cuadrada de orden n, diremos que A es diagonal dominantesi
|aii| ≥n∑
j=1j 6=i
|aij |,∀i, 1 ≤ i ≤ n (45)
Veamos algunos resultados importantes,
37
Teorema 4.5 Si A es diagonal dominante, entonces A es invertible.
Teorema 4.6 Si A es diagonal dominante y todos los elementos de la diagonal son reales positivos, entonces la parte real de cada valor propio es positiva. Dem. Algebra Lineal. Grossman. Mc GrawHill.
Teorema 4.7 Si A es simetrica, diagonal dominante, con los coeficientes diagonales positivos,entonces A es definida positiva.Dem. Usando el teorema anterior, si λi > 0 deduciremos que xtAx > 0. Como A es simetrica,tiene un conjunto de autovectores ortonormales (teorema espectral), entonces cualquier vector xpuede escribirse como una combinacion lineal de ellos,
De la ortogonalidad y la normalizacion xtixi = 1. Luego,
xtAx = (c1xt1 + c2x
t2 + ... + cnxt
n)(c1λ1x1 + c2λ2x2 + ... + cnλnxn)
= c21λ1x1 + c2
2λ2x2 + ... + c2nλnxn
como λi > 0, se tiene que ∀i xtAx > 0.
Observacion 4.1 El recıproco del teorema anterior es falsa, es decir existen matrices simetricasdefinidas positivas que no son diagonal dominante. De un contraejemplo.
38
Modulo 7Prof : Marıa Angelica Vega U.
5. Metodos iterativos.
5.1. Normas vectoriales y matriciales.
5.1.1. Preliminares.
Actividades 5.1
i) Si V es un espacio vectorial, ¿Que es una norma sobre V ? , ¿Como se define la distanciaentre dos vectores ? ¿Cuando una sucesion de vectores es convergente ?
ii) Sea V = IRn, las normas de uso frecuente en IRn son,
‖x‖1 =∑n
i=1 |xi| , llamada norma 1
‖x‖2 =(∑n
i=1 x2i
)1/2, llamada norma euclıdea o norma 2
‖x‖∞ = max1≤i≤n |xi| , llamada norma infinito o del maximo.
Ejemplo 5.1 Compare la longitud de los siguientes tres vectores en IR4, usando cada una de lasnormas anteriores.
x = (4, 4,−4, 4)T y = (0, 5, 5, 5)T w = (6, 0, 0, 0)T
Definicion 5.1 Diremos que dos normas son equivalentes si existen dos numeros α y β positivostales que
α‖v‖q ≤ ‖v‖p ≤ β‖v‖q.
Demuestre las siguientes afirmaciones.(Haga una en clases ).
iv) Las normas ‖v‖∞ y ‖v‖1 son equivalentes, en efecto
‖v‖∞ ≤ ‖v‖1 ≤ n‖v‖∞
v) Las normas ‖v‖∞ y ‖v‖2 son equivalentes
‖v‖∞ ≤ ‖v‖2 ≤√
n‖v‖∞ o1√n‖v‖2 ≤ ‖v‖∞ ≤ ‖v‖2 .
vi) Las normas ‖v‖1 y ‖v‖2 son equivalentes
‖v‖2 ≤ ‖v‖1 ≤√
n‖v‖2.
Observacion 5.1 ¿Por que es importante que las normas estudiadas sean equivalentes ?
Porque se puede utilizar cualquiera de ellas. Ası si, por ejemplo, se tiene una sucesion de vectoresque tiende a v para una cierta norma, entonces la sucesion tambien converge a v para las otrasnormas (equivalentes).
40
5.1.2. Normas matriciales
Definicion 5.2 Sea An el conjunto de las matrices de orden n, con las operaciones habituales,definidas sobre IR (o CI ). Definiremos una norma matricial como una aplicacion
‖ · ‖ : An → IR
que verifica las siguientes propiedades :
i) ‖A‖ ≥ 0 , ∀ A ∈ An y ‖A‖ = 0 ⇐⇒ A = 0ii) ‖αA‖ = |α|‖A‖ , ∀ α ∈ IR y A ∈ An
iii) ‖A + B‖ ≤ ‖A‖+ ‖B‖ , ∀ A,B ∈ An
iv) ‖AB‖ ≤ ‖A‖‖B‖ , ∀ A,B ∈ An.
Comentarios:
i) An puede ser considerado como un espacio vectorial de dimension n2, Ası las cosas, las tresprimeras propiedades son similares a las correspondientes de una norma vectorial; mientrasque la ultima propiedad es propia de las normas matriciales.
ii) Un concepto importante para nuetros propositos es norma matricial inducida, puesto quepermite relacionar las normas vectoriales con las normas matriciales, pilar fundamental parael estudio de convergencia y analisis de error en el calculo numerico.
Definicion 5.3 Sean A una matriz n×n y ‖ ·‖v una norma vectorial definida en IRn, llamaremosnorma matricial inducida o norma matricial subordinada, con respecto a la norma vectorial dadaal numero:
‖A‖ = supv 6=0
‖Av‖v
‖v‖v= sup
‖v‖=1
‖Av‖.
Actividades 5.2 Investigue, como demostrar los siguientes resultados importantes.
i) Para toda norma matricial inducida, se cumple
‖Ax‖v ≤ ‖A‖‖x‖v , x ∈ IRn. (46)
En este caso se dice que la norma matricial y la norma vectorial son compatibles.
ii) Sea A = (aij) una matriz cuadrada real, entonces
‖A‖1 = sup‖Av‖1‖v‖1
= max1≤j≤n
n∑i=1
|aij |
‖A‖2 = sup‖Av‖2‖v‖2
=√
ρ(AT A) =√
ρ(AAT ) = ‖AT ‖2 (norma espectral)
‖A‖∞ = sup‖Av‖∞‖v‖∞
= max1≤i≤n
n∑j=1
|aij | (norma del maximo.)
41
Nota 5.1 Si A es una matriz de orden n, ρ(A) denota el radio espectral de A, es decir
ρ(A) = maxλi∈σ(A)
|λi|
Observacion 5.2 Existen normas matriciales que no son subordinadas a ninguna norma vectorial,por ejemplo, la norma
‖A‖E =
∑i,j
|aij |21/2
= (tr(A∗A))1/2
es una norma matricial no subordinada.
Nota 5.2 La matriz aumentada de un sistema lineal Ax = b en general se almacena con un errorde redondeo, si la solucion calculada se obtiene usando una estrategia de pivoteo que limita el error,entonces la solucion calculada y la solucion exacta son iguales hasta alrededor de la exactitud dela maquina usada. Por lo tanto es util saber si la matriz de los coeficientes esta mal condicionada.Se entiende por matriz mal condicionada si pequenos cambios en los elementos de la matrizA, pueden producir grandes cambios en el vector solucion.
Un indicador de mal condicionamiento es el llamado numero de condicion de la matriz A quese define como
K(A) = ‖A‖ · ‖A−1‖
Este numero tiene la propiedad que, K(A) ≥ 1, luego un numero de condicion de una matrizcercano a 1 es indicador de buen condicionamiento y un numero de condicion muy grande, esindicador de mal condicionamiento.
Actividades 5.3
i) Determine ‖x‖ , ‖A‖ y ‖A−1‖ para las ‖ · ‖1 y ‖ · ‖∞, si
x =
2−53
y A =
−1 1 −42 2 03 3 2
(47)
ii) ¿Cual es el numero de condicion de la matriz A.
iii) Determine la norma espectral de A. (Para entretenerse fuera de la clase ).
5.1.3. Otros resultados importantes para el estudio de los metodos iterativos.
Si A es una matriz real de orden n, se tiene
i) ρ(A) ≤ ‖A‖, para cualquier norma ‖ · ‖.
42
ii) Diremos que A es una matriz convergente, si
lımk→∞
(ak)ij = 0 para cada i = 1, 2, ..., n y j = 1, 2, ..., n.
Las siguientes afirmaciones son equivalentes:
i) A es una matriz convergente.ii) lım
n→∞‖(An)‖ = 0, para alguna norma natural ‖ · ‖.
iii) ρ(A) < 1.
iv) lımn→∞
Anx = 0.
Actividades 5.4 !’ Entretengase ! , demuestre que A es una matriz convergente si
A =(
12 014
12
)(48)
Teorema 5.1 Las siguientes afirmaciones son equivalentes:
i) A es una matriz convergente.ii) lım
n→∞‖(An)‖ = 0, para alguna norma natural ‖ · ‖.
iii) ρ(A) < 1.
iv) lımn→∞
Anx = 0.
5.2. Metodos iterativos.
Los metodos directos requieren alrededor de 2n3/3 operaciones aritmeticas para resolver un sistemalineal de n×n, lo que limita el tamano de los sistemas que pueden ser resueltos de manera directa.Por ejemplo cuando se resuelven numericamente ecuaciones diferenciales pueden surgir sistemasde 20000 variable.Una alternativa que puede lograr gran exactitud para n grande son los metodos iterativos.Para obtener un metodo iterativo procedemos como antes, re-escribimos el sistema de ecuacionescomo una iteracion de punto fijo. Es decir,
Ax = b. (49)
lo escribimos, en la forma
x(k+1) = Mx(k) + c para cadak ≥ 1. (50)
donde la matriz M , se llama matriz de iteracion. Relacionando nuestros conocimientos sobrenormas con estos metodos, existen algunos resultados importantes que garantizan la convergenciade estos metodos. ( Se sugiere cosultar la demostracion en los textos de la bibliografıa entregada.)
43
1) El radio espectral de la matriz M , ρ(M) cumple
ρ(M) ≤ ‖M‖
para cualquier norma matricial inducida.
2) Sea M matriz n × n, el proceso iterativo (61) converge para cada k ≥ 1 y c 6= 0 a la unicasolucion si y solo si ρ(M) < 1.
Para transformar (49) en un problema de punto fijo, se descompone la matriz A en la suma,
A = L + D + U
donde, D es la diagonal principal de A, L es la parte diagonal inferior de la matriz A y U es laparte triangular superior de A con ceros en las diagonales.
5.2.1. Metodo de Jacobi.
i) Forma matricial
Transformamos el sistema,
Ax = b ⇔ (D + L + U)x = b⇔ Dx = b− (L + U)x⇔ x = D−1[b− (L + U)x]⇔ x = −D−1(L + U)x + D−1b⇔ x = MJACx + c.
(51)
De aquı que la matriz de de iteracion de Jacobi es,
MJAC = −D−1(L + U).
y c = D−1b.
ii) Forma en terminos de las componentes
La i-esima componente del vector correspondiente a (k + 1)-esima iteracion es,
x(k+1)i =
1aii
bi −n∑
j=1j 6=i
aijx(k)j
. (52)
44
5.3. Metodo de Gauss-Seidel.
i) Forma matricial
En este caso se hace la transformacion,
Ax = b ⇔ (D + L + U)x = b⇔ (D + L)x = b− Ux⇔ x = (D + L)−1[b− Ux]⇔ x = −(D + L)−1Ux + (D + L)−1b⇔ x = MGSx + c.
(53)
De aquı que la matriz de de iteracion de Gauss-Seidel es,
MGS = −(D + L)−1U.
y el vector c = (D + L)−1b.
ii) Forma en terminos de las componentes
Este metodo es un mejoramiento del metodo de Jacobi, que consiste en calcular la compo-nente x
(k)i a partir de las componentes de x(k−1) en la forma siguiente, para i > 1, han
sido calculadas las x(k)1 , ..., x
(k)i−1 que supuestamente son mejores aproximaciones que las
x(k−1)1 , ..., x
(k−1)i−1 a las componentes x1, ..., xi−1, de la solucion real , por lo tanto se usa esta
ii) En termino de componentesPara fines computacionales la ecuacion matricial, puede escribirse:
x(k)i = (1− ω)x(k−1)
i +ω
aii
bi −i−1∑j=1
aijx(k)j −
n∑j=i+1
aijx(k−1)j
, (2)
para i = 1, 2, ..., n.
Si ω = 1 , tenemos el metodo de Gauss-Seidel.Si 0 < ω < 1, los metodos de relajacion se denominan metodos de sub-relajacion y se pueden usaren sistemas que no son convergentes por el metodo de Gauss-Seidel.Si ω > 1 los metodos se denominan metodos de sobre-relajacion y se pueden usar para acelerar laconvergencia en sistemas que son convergentes mediante el metodo de Gauss-Seidel.
5.5. Resultados importantes
i) Para cualquier x(0) ∈ Rn, la sucesion definida por
x(k+1) = Mx(k) + c para cadak ≥ 1. (61)
converge a la solucion unica si y solo si ρ(M) < 1.
ii) Si ‖M‖ < 1 para cualquier norma matricial subordinada, la sucesion generada por (61)converge para cualquier x(0) ∈ Rn y se satisafacen las cotas de error:
• ‖x− x(k)‖ ≤ ‖M‖k‖x(0) − x‖
• ‖x− x(k)‖ ≤ ‖M‖k
1− ‖M‖‖x(1) − x(0)‖
iii) Si A es diagonal dominante, entonces para cualquier eleccion de x(0) los metodos de Jacobiy Gauss-Seidel convergen a la solucion exacta del sistema.
iv) Si A es definida positiva y 0 < ω < 2, entonces el metodo SOR converge para cualquieraproximacion inicial.
v) Si A es definida positiva y tridiagonal, entonces ρ(MGS) = ρ(MJAC)2 < 1 y la eleccionoptima de ω, es
ω =2
1 +√
1− ρ(MJAC)2.
47
5.6. Analisis de error y Numero de Condicion
Consideremos el sistema A−→x =−→b y supongamos que A es una matriz invertible, analicemos las
siguientes situaciones:
1. Si se perturba la matriz A−1 para obtener una nueva matriz B la solucion x = A−1b resultaperturbada y la escribiremos x = Bb. Nos preguntamos ¿Que tan grande es la solucionperturbada en terminos absolutos y relativos ? sol. Consideremos || · ||p una norma vectorialy su correspondiente norma matricial subordinada, determinamos
es decir, el error relativo de la solucion x esta acotado por κ(A) veces el error relativo de−→b .
Observacion 5.3
i) El numero de condicion depende de la norma vectorial seleccionada.
48
ii) Si κ(A) es pequeno, entonces pequenas perturbaciones en−→b conducen a pequenas perturba-
ciones en x.
Ejemplo 5.2 Analizar el condicionamiento de la matriz A =(
1 1 + ε1− ε 1
)con ε > 0.
Sol. Determinamos A−1
A−1 =(
1 −1− ε−1 + ε 1
)Usando norma infinito, tenemos,
||A||∞ = 2 + ε , ||A−1||∞ = ε−2(2 + ε)
κ(A) =[(2 + ε)
ε
]2
=4 + 4ε + ε2
ε2>
4ε2
Si ε ≤ 0,01, entonces κ(A) ≥ 40000. Esto significa que una pequena perturbacion sobre b puedeinducir una perturbacion o error relativo de 40000 veces mayor en la solucion del sistema Ax = b.
Observacion 5.4 En el caso de los metodos iterativos, podemos medir que tan buena es la solucionaproximada x, calculando
i) Ax
ii) y r = b−Ax. Este vector se denomina vector residual.
Observamos ademas que la diferencia e = x− x se llama vector residual.
Podemos resumir una relacion importante entre vector error y vector residual.
Teorema 5.2 Si x es la solucion exacta de Ax = b, donde b = b− r implica r = − b.
1κA)
||r||||b||
≤ ||e||||x||
≤ κ(A)||r||||b||
Criterios de parada.
Se define el vector el residual r(k) = b−Ax(k) y el vector error e(k) = x− x(k).
Criterio 1. Dada una tolerancia ε, iterar hasta que,
‖r(k)‖‖r(0)‖
< ε.
Criterio 2. Sean, b , x , x(0) ∈ Rn y A una matriz no singular, entonces:
‖e(k)‖‖e(0)‖
≤ κ(A)‖r(k)‖‖r(0)‖
.
donde, κ(A) es el numero de condicion de la matriz A.
49
Criterio 3. El criterio 1, depende del valor inicial x(0), de modo que si la aproximacion inicialno es buena, los resultados pueden ser grotescos. Se recomienda usar en su lugar,
‖r(k)‖‖b‖
< ε.
Actividades 5.6
i) Demuestre el teorema anterior
ii) Demuestre que si ||A|| < 1 entonces
• I −A es invertible.• ||(I + A)−1|| ≤ (1− ||A||)−1
• (I + A)−1 = I −A + A2 −A3 + · · ·
• ||(I + A)−1|| ≥ 11 + ||A||
Teorema 5.3 El radio espectralρ(A) = inf
||.||||A||
es el ınfimo sobre todas las normas matriciales subordinadas.
Actividades 5.7
1) Contra los deseos de su corredor Jeanette compra x tıtulos de acciones de ENDESA, y tıtulosde acciones de CTC Chile y z tıtulos de acciones de Chilgener . A inicios de Enero, Febreroy Marzo, las acciones de ENDESA valıan $5,18 , $3,14 y $3,01 por tıtulo, las acciones deCTC Chile $2,10 , $6,03 y $2,18 por tıtulo y las acciones de Chilgener, $2,90 , $2,80 y $5,53por tıtulo, respectivamente.
a) Determine el vector (x(2), y(2), z(2)) mediante el metodo de Gauss-Seidel, si Jeanettegasto en total $2945,30 , $4113,85 y $3417,00 en Enero, Febrero y Marzo, respectiva-mente. (x(0) = (150, 150, 150)T ).(Justifique).
b) Determine una estimacion del error absoluto de la aproximacion anterior.c) De acuerdo a lo obtenido en a), ¿Cuantos tıtulos de cada empresa adquirio Jeanette ?
2) El sistema de ecuaciones Ax = b, donde
A =(
3 21 2
),x =
(x1
x2
),b =
(12
)(62)
puede resolverse mediante el siguiente metodo iterativo :
x(k+1) = x(k) + α(Ax(k) − b),
x(0) =(
11
), (63)
50
a) Determinar todos los valores de α para los cuales se puede garantizar la convergenciadel algoritmo.
b) Determinar si para α = −0,4 el algoritmo es convergente.
51
1
2
Aproximacion de funciones.Modulo 10
Prof. Marıa Angelica Vega U.
El proposito de estos modulos es entregar los conceptos teoricos basicosnecesarios y algunas aplicaciones en forma dirigida, de modo que el estudian-te pueda participar en forma activa, en el proceso ensenanza - aprendizaje,elaborando su propio material de estudio. El logro deseable es que el estudian-te aprenda a aprender. Es claro que este material debe ser complementadocon el apoyo de la bibliografıa sugerida.
2.1 Interpolacion Polinomica.
El Problema :Dado el conjunto de (n+ 1) puntos, del grafico de una funcion f , deno-
se requiere encontrar una funcion polinomica P (x) al que llamaremos poli-nomio interpolante para f , de a lo mas grado n que satisfaga la condicionde interpolacion, expresada por
P (xi) = f(xi) , ∀i = 0, 1, ...n. (2.1)
Soluciones al Problema :
Inspirandonos en el criterio de Taylor, de acuerdo a (2.1), observemosque el polinomio de Taylor es combinacion lineal de los elementos de la base
{1, (x− x0), (x− x0)2, (x− x0)3...(x− x0)n...}
para el espacio vectorial de los polinomios de una variable real sobre IR. Esobvio que los polinomios de Taylor son utiles para aproximar una funcionsobre intervalos pequenos alrededor del punto x0, pero en la practica este nosiempre es el caso y es necesario usar un metodo mas eficiente que incluyainformacion en otros puntos.
2.1. INTERPOLACION POLINOMICA. 3
2.1.1 Metodo de los coeficientes indeterminados.
Tomando en cuenta lo anterior, podemos proponer que el polinomio inter-polante sea una combinacion lineal de los elementos de la base canonica delespacio de los polinomios por la sencillez en los calculos, es decir
Pn(x) =n∑
i=0
aixi = a0 + a1x+ a2x
2 + ...+ anxn. (2.2)
Ası el problema se reduce a encontrar los coeficientes de las potencias dex, de donde se obtiene un sistema de ecuaciones cuyas incognitas son estoscoeficientes. Veamos estas ideas aplicadas a un problema practico.
Actividad I.
Suponga que una empresa contrata servicios y entrega la siguiente infor-macion exacta,
Piezas Vendidas (en millones) 1 2 3 4 5Ganancia Neta (en millones) 11.2 15.3 17.1 16.9 15.0
Tabla 1.
se pide determinar cuantas piezas deben venderse para maximizar laganancia neta, dejando estipulado en las bases del contrato que no habrafuturas contrataciones si la respuesta es equıvoca . Se debe hacer una re-comendacion y justifıcarla.
♣Consideraciones sobre el metodo.♣
Este metodo que resulta muy simple en este caso, presenta la dificultadque la matriz de los coeficientes asociada al sistema de ecuaciones que seobtiene al aplicar la condicion de interpolacion, es la matriz de Vandermonde,que se caracteriza por volverse rapidamente mal condicionada cuando n, elorden de la matriz crece en funcion del grado del polinomio, por tanto estemetodo no es conveniente para hallar polinomios interpolantes.
De aquı que es importante estudiar otra forma de escribir este polinomio,de modo de obviar el que tengamos que resolver un sistema de ecuacioneslineales mal condicionado. Los metodos de Lagrange y de Newton son losque tradicionalmente se estudian en cualquier curso de calculo numerico,ambos se basan en escribir el polinomio de interpolacion como combinacionlineal de elementos de alguna base del espacio vectorial de los polinomiosdistinta de la canonica.
4
2.1.2 Metodo de Lagrange.
Sea Pn(x) el polinomio que interpola a la funcion f en los (n+ 1) puntos
Luego si dividimos el polinomio li(x) por el valor li(xi), obtenemos el poli-nomio :
li(x) =n∏
j=0 j 6=i
(x− xj)(xi − xj)
=(x− x0)...((x− xi−1)(x− xi+1)...(x− xn)
(xi − x0)...(xi − xi−1)(xi − xi+1)...(xi − xn).
(2.9)Que por construccion cumple las condiciones (2.5)y (2.6).
Los polinomios li(x) se conocen con el nombre polinomios de Lagrange,mientras que Pn(x) recibe el nombre de polinomio interpolante de Lagrangepara f(x) en los puntos (x0, f0) , (x1, f1) , ..., (xn, fn), que suele denotarsegeneralmente Ln(x).
Aplicaremos la idea de Lagrange al problema del ejemplo anterior con elfın de obtener algun tipo comparacion entre ambos metodos.
Actividad II.
Solucione el problema planteado en la actividad I, usando un polinomiode Lagrange para interpolar la funcion representada por los datos dados.
2.1. INTERPOLACION POLINOMICA. 5
Observacion 2.1 • Sabemos que si el polinomio interpolante existe, esunico, por lo tanto es obvio pensar que el polinomio es el mismo usandocualesquiera de los dos metodos anteriores, mas aun usando cualquierotro metodo.
• El metodo de Lagrange para determinar el polinomio interpolante com-parado con el metodo de coeficientes indeterminados, es un tanto labo-rioso por la cantidad de calculos involucrados al calcular los elementosde la base, pero tiene un valor teorico importante en la deduccion deotros metodos numericos, como por ejemplo formulas de integracionnumerica, aproximacion de soluciones de ecuaciones diferenciales, etc.
Si en la formula (2.3), n = 1 el polinomio interpolante adopta la forma,
P1(x) = f(x0)(x− x1)(x0 − x1)
+ f(x1)(x− x0)(x1 − x0)
.(2.10)
o (2.10) en forma simplificada,
P1(x) = f(x0)l0(x) + f(x1)l1(x) (2.11)
con,
l0(x) =x− x1
(x0 − x1), l1(x) =
x− x0
(x1 − x0).
cuya grafica es la recta que pasa por los puntos dados por lo que este prob-lema se conoce como Interpolacion lineal.
Otra situacion particular es el caso en que n = 2, es decir se tienen lospuntos,
(x0, f(x0)) , (x1, f(x1)) , (x2, f(x2)),
el polinomio P2(x) que interpola a la funcion f(x) en los tres puntos es
La grafica corresponde a la parabola que pasa por los puntos dados, eneste caso hablamos de interpolacion cuadratica.
♣Consideraciones sobre el metodo.♣
Uno de los inconvenientes que tiene la forma de Lagrange para el poli-nomio de interpolacion, es que al agregar otro ” punto de interpolacion ” o” nodo ”, los elementos de la base polinomios de Lagrange,
li(x) , para i = 0, 1, ..., n+ 1.
deben ser calculados nuevamente uno a uno. Surge entonces la inquietudde como construir el polinomio de interpolacion en forma mas eficiente, demodo de aprovechar la informacion ya procesada al agregar nuevos nodos.Este hecho amerita que busquemos otra forma de escribir el polinomio deinterpolacion, es decir expresarlo en otra base del espacio vectorial.
2.1. INTERPOLACION POLINOMICA. 7
2.1.3 Forma de Newton para el Polinomio de Interpolacion
En la forma de Newton el polinomio interpolante Pn(x) es escrito usando unabase parecida a la usada para expresar el polinomio de Taylor, observemosambas bases :
Notemos que por construccion este polinomio es de grado a lo mas n yes logico pensar los coeficientes ai , para i = 0, 1, ..., n deben determinarsede modo que se verifique la condicion de interpolacion. Para ello evaluamosPn(x) en cada xi.
Para x0 obtenemos:
Pn(x0) = f(x0) = a0.
Analogamente si evaluamos Pn(x) en x1 tenemos:
a1 =f(x1)− f(x0)
x1 − x0
Pn(x) evaluado en x2
a2 =f(x2)− f(x0)
(x2 − x0)(x2 − x1)− f(x1)− f(x0)
(x2 − x1)(x1 − x0).
Ası obtenemos sucesivamente los otros valores de las constantes a3, · · · , an.Para simplificar la escritura de los coeficientes ai, introducimos el con-
cepto de diferencias divididas lo que permite escribir el polinomio de Newtonen una forma mas simple.
Diferencias Divididas
Consideremos (n+1) puntos cualesquiera Pi(xi, f(xi)) , i = 0...n, nonecesariamente equiespaciados, definimos :
1. diferencias divididas de orden cero por:
f [xi] = f(xi).
2. Si consideramos un par de puntos indexados cualesquiera
Pi(xi, f(xi)) y Pi+1(xi+1, f(xi+1))
8
definimos la primera diferencia dividida o diferencia dividida de orden1 como el numero :
f [xi, xi+1] =f(xi+1)− f(xi)
xi+1 − xi.
Al relacionar f [xi, xi+1] con su significado geometrico, sabemos quecorresponde a la pendiente del segmento lineal que une Pi y Pi+1,entonces si f [xi, xi+1] > 0 implica que f(x) es creciente en [xi, xi+1]y si f [xi, xi+1] < 0 implica que f(x) es decreciente en [xi, xi+1]. Esdecir, este concepto nos proporciona informacion adicional acerca dela grafica de la funcion.
3. Consideremos ahora un trıo de puntos consecutivos
Pi(xi, f(xi)) , Pi+1(xi+1, f(xi+1)) y Pi+2(xi+2, f(xi+2))
definimos la segunda diferencia dividida o diferencia dividida de orden2 como el numero :
f [xi, xi+1, xi+2] =f [xi+1, xi+2]− f [xi, xi+1]
xi+2 − xi.
Como f [xi, xi+1, xi+2] es el cuociente entre el cambio de pendiente yel cambio en x, de modo que si f [xi, xi+1, xi+2] > 0 geometricamentela grafica de f(x) es concava hacia arriba y si f [xi, xi+1, xi+2] < 0 lagrafica de f(x) es concava hacia abajo en el intervalo [xi, xi+2].
O sea, tenemos ademas informacion acerca de la concavidad de lafuncion.
4. En general considerando los n+ 1 puntos consecutivos
(xi, fi) , (xi+1, fi+1) , ..., (xi+n, fi+n)
podemos definir recursivamente la n-esima diferencia dividida o difer-encia dividida de orden n por :
f [xi, ..., xi+n] =f [xi+1, xi+n]− f [xi, xi+n−1]
xi+n − xi.
Vemos que hay una relacion entre las diferencias divididas y el valor delos coeficientes del polinomio de Newton (2.16).
Los calculos para determinar las diferencias divididas pueden facilitarsemucho, si estas se representan abreviadamente en una tabla.
2.1. INTERPOLACION POLINOMICA. 9
xi f [xi] f [xi, xi+1] f [xi, xi+1, xi+2] f [xi, xi+1, xi+2, xi+3] · · ·x0 f [x0]
f [x0, x1]x1 f [x1] f [x0, x1, x2]
f [x1, x2] f [x0, x1, x2, x3] · · ·x2 f [x2] f [x1, x2, x3]
f [x2, x3] f [x1, x2, x3, x4] · · ·x3 f [x3] f [x2, x3, x4]
f [x3, x4] f [x2, x3, x4, x5] · · ·x4 f [x4] f [x3, x4, x5]
f [x4, x5]x5 f [x5]
f [x5, x6]x6 f [x6]
Tabla 2. Diferencias Divididas
Al observar la tabla 2 podemos darnos cuenta que las diferencias divididasque aparecen en la diagonal que va desde el extremo superior izquierdo alextremo inferior derecho son precisamente los coeficientes de (2.16), usandoeste hecho el polinomio interpolante puede expresarse en forma simplificadacomo:
Consideremos nuestro ejemplo modelo y construyamos el polinomio in-terpolante en la forma de Newton.
¿Como medimos que tan buena es la aproximacion ?
Cuando en calculo diferencial se estudia el polinomio de Taylor de gradon para aproximar una funcion f ∈ C(n+1)[a, b] en un punto x0 ∈ [a, b] su de-sarrollo involucra el termino Rn(x) llamado residuo o error de truncamientoy que se define como :
Rn(x) =f (n+1)(ξ)(n+ 1)!
(x− x0)(n+1) , ξ ∈ (x0, x). (2.17)
Cabe pensar entonces que al aproximar una funcion mediante un polinomiode interpolacion usando mas de un punto, tambien existe un termino de errorinvolucrado y de hecho es una extension de (2.17). En el siguiente resultadoformalizamos este hecho.
Teorema 2.1 Si x0, x1, ..., xn son (n + 1) puntos distintos en [a, b] y f ∈C(n+1)[a, b] entonces, para cada x ∈ [a, b] existe un ξ(x) en (a, b) tal que :
10
E(x) = f(x)− Pn(x) =f (n+1)(ξ)(n+ 1)!
(x− x0)(x− x1)...(x− xn). (2.18)
donde Pn(x) es el polinomio interpolante de Lagrange.
Demostracion. Se deja como inquietud, sin embargo podemos comentarque se usa como parte del argumento el teorema de Rolle.
Observacion 2.2 • Es posible obtener una relacion entre diferencia di-vidida y el termino
f (n+1)(ξ)(n+ 1)!
,
de modo que podemos expresar la formula de error en terminos dediferencias divididas. Para ello consideremos :
que es otra forma de expresar el error de interpolacion.
• El polinomio de Newton puede expresarse para datos equiespaciados,usando el concepto de diferencias progresivas y regresivas, para may-ores detalles consultar la bibliografıa recomendada al final.
2.1. INTERPOLACION POLINOMICA. 11
2.1.4 El problema de Hermite
El problema mas simple de Hermite es encontrar el polinomio H(x) delmenor grado posible, tal que interpole a la funcion f(x) y a su derivadaf ′(x) en (n+ 1) puntos x0, · · · , xn , es decir, el polinomio debe satisfacer
H(xi) = f(xi) , ∀i = 0, ..., n
H ′(xi) = f ′(xi) , ∀i = 0, ..., n
y el Problema General consiste en suponer que :
1. En el nodo i se conocen los valores
p(j)(xi) , p(j−1)(xi) , p′(xi) , p(xi).
2. Sea ki el numero de condiciones de interpolacion sobre el nodo xi.
3. Si x0, ..., xn son los nodos entonces
p(j)(xi) = f (j)(xi) , ∀ j = 0, 1, · · · ki−1 , i = 0, ..., n
De los dos problemas presentados estudiaremos el caso simple, aquellospolinomios que geometricamente se parecen a la funcion en los puntos deinterpolacion (xi, f(xi)) en el sentido que las rectas tangentes al polinomioy a la funcion tienen el mismo valor, es decir poseen misma derivada en unavecindad del punto de interpolacion.
2.1.5 ¿ Como obtener el polinomio de Hermite ?
Podemos determinar el polinomio de Hermite basandonos en la forma deLagrange o extendiendo la forma de Newton.
1. Polinomio de Hermite basado en la forma de Lagrange.
Consideremos los nodos x0, ..., xn y supongamos que en cada nodo ten-emos:
p(xi) = f(xi) , ∀i = 0, ..., n
p′(xi) = f ′(xi) , ∀i = 0, ..., n
Observemos que tenemos (n+1) condiciones sobre f(x) y (n+1) condicionessobre f ′(x) en total (2n + 2) condiciones, por lo que el polinomio es degrado (2n+ 1). Procediendo en forma similar a la usada para determinar laforma del polinomio interpolante de Lagrange, se propone que la forma delpolinomio de Hermite es :
H2n+1(x) =∑n
i=0 f(xi)hi(x) +∑n
i=0 f′(xi)hi(x). (2.20)
12
Con hi(x) y hi(x) elementos de una base para el espacio vectorial de lospolinomios, tales que,
hi(xj) = δij , hi(xj) = 0.
h′i(xj) = 0 , h′i(xj) = δij .(2.21)
Al aplicar las condiciones de interpolacion y las relaciones (2.21) el lectorpuede comprobar que se obtiene que :
Deberıa deducirse en forma analoga a como se obtiene el error del poli-nomio interpolante de Lagrange. En efecto,
Si x0, ..., xn son (n + 1) puntos distintos en [a, b] y f ∈ C(2n+2)[a, b] yH(x) es el polinomio de grado ≤ (2n+ 1) tal que :
H(xi) = f(xi) , ∀i = 0, ..., n
H ′(xi) = f ′(xi) , ∀i = 0, ..., n
entonces, a cada x ∈ [a, b] le corresponde ξ(x) ∈ [a, b] tal que,
E(x) = f(x)−H(x) =f (2n+2)(ξ(x))
(2n+ 2)!
n∏i=0
(x− xi)2. (2.25)
2.1. INTERPOLACION POLINOMICA. 13
Observacion 2.3 Es conveniente senalar que en el caso particular que ex-iste un solo nodo x0, se conoce la funcion f(x) y sus n derivadas el polinomiode Hermite es el polinomio de Taylor, es decir
H(x) = P (x)
= P (x0) + P ′(x0)(x− x0) + P ′′(x0)(x− x0)2
2!+ · · ·+ P (n)(x0)
(x− x0)n
n!.
(2.26)
2. Polinomio de Hermite basado en la forma de Newton.
La idea es ahora extender el metodo de las diferencias divididas de New-ton para resolver el problema de interpolacion de Hermite. Ello se lograconstruyendo la tabla como antes, con la variante de incluir un nodo en latabla tantas veces como condiciones dadas existan sobre el. Para ilustraresta situacion consideraremos a modo de ejemplo el caso en que se tienendos puntos de interpolacion x0 y x1 y se conocen los valores de la funcion ysu derivada. Inspirandonos en el polinomio de Taylor podemos intuir que elpolinomio que interpola la funcion y su derivada en los nodos dados es de laforma :
Observacion 2.4 En general se puede demostrar que, si los puntos xi sondistintos y f (n)(x) es continua en el nodo xk, entonces :
limxk+n→xk
f [xk, · · · , xk+n] =f (n)(xk)
n!, xk = xk+1 = · · · = xk+n. (2.31)
Actividad I.
1) Encuentre un polinomio p(x) de grado menor o igual que 4 que cumplacon las condiciones :
f(0) = 0 , f ′(0) = 0 , f(2) = 16 , f ′(2) = 32 , f ′′(2) = 48
Usando
– el primer nodo como pivote
– el ultimo nodo como pivote.
2) PEP 2 (Problema 3). Segundo Semestre del 2000.
Un automovil recorrio 160 km en un camino que une dos ciudades, yempleo, en este trayecto, 2 hora y 20 minutos. Use los datos de latabla adjunta para determinar :
a) La distancia recorrida en los primeros 45 minutos de viaje. (Useun polinomio cubico.)
b) El tiempo empleado en llegar a la mitad del camino recorrido.
Tiempo (en min) Distancia (en Km)0 0.0010 8.0030 27.0060 58.0090 100.00120 145.00140 160.00
3 ) PEP 2 (Problema 1). Segundo Semestre del 2001.
Considere la funcion f(x) = ex + senx+ 2 definida en [0, π].
2.1. INTERPOLACION POLINOMICA. 15
a) Aproxime la funcion dada, utilizando interpolacion lineal por
tramos y los puntos xi =iπ
4, i=0,1,2,...,4.
b) Mediante la aproximacion encontrada en el punto anterior, estimeel valor de la funcion en el punto x = 1.25 y determine su errorabsoluto comparando el valor aproximado con el exacto.
4) PEP 2 (Problema 2). Segundo Semestre del 2001. Usando mınimoscuadrados, se desea determinar una funcion que represente los datosde la siguiente tabla:
k 0 1 2 3 4xk 1 3 6 9 15
f(xk) 5.12 3.00 2.48 2.34 2.18
a) Encuentre una aproximacion de mınimos cuadrados usando lafuncion
h(x) = α+β
x
b) Utilizando los datos de la tabla y la aproximacion anterior, calcule:
9.2. Polinomios de Tchebyshev y economizacion de series.
El estudio de lo polinomios de Tchebyshev conduce a los resultados siguientes:
i) Permiten una colocacion optima de los puntos de interpolacion para minimizar el error en lainterpolacion de lagrange.
ii) Permiten reducir el grado del interpolante con una perdida mınima de precision.
Definicion 9.1 Se definen los polinomios de Tchebyshev por
Tn(x) = cos(n arc cos (x)) − 1 ≤ x ≤ 1 y n = 0, 1, 2, · · · (142)
la sustitucion θ = arc cos (x) implica que:
Tn(x) = cos(n θ) − 1 ≤ x ≤ 1 (143)
Usando identidades trigonometricas la ecuacion 143 se transforma en
Tn+1(x) = 2xTn(x)− Tn−1)(x) para cada n = 1, 2, · · · y x ∈ [−1, 1] (144)
con T0(x) = 1 y T1(x) = x. Esta relacion de recurrencia implica que para cada n ≥ 1, Tn es unpolinomio de grado n con coeficiente principal 2n−1.
9.2.1. Propiedades o Teoremas importantes
Propiedad 9.1 El polinomio de Tchebyshev Tn d egrado n ≥ 1 tiene n ceros simplesn en [−1, 1]
xk = cos(
(2k − 1)π(2n)
)para k = 1, 2, · · · , n. (145)
Ademas tiene extremos absolutos en
xk = cos(
(k)π(n)
)para k = 0, 1, · · · , n. (146)
con
Tn(xk) = cos(
(k)π(n)
)para k = 0, 1, · · · , n. (147)
Las graficas de algunos polinomios de Tchebyshev se presentan en la siguiente figura: En estosgraficos se puede observar las siguientes 3 propiedades de los polinomios de Chebyshev:
1. |Tn(x)| ≤ 1 ∀ − 1 ≤ x ≤ 1.
81
Figura 11: Graficas de T1 , ..., T5
2. Tn tiene n ceros reales distintos en el interior de [−1, 1].
3. |Tn(x)| alcanza su maximo modulo de 1 en [−1, 1] en n+1 puntos, incluyendo ambos extremos±1 y Tn(x) toma los valores ±1 alternadamente en estos puntos.
Observacion 9.1 i) Los polinomios monicos (coeficiente inicial 1) Tn de Tchebyshev, sepueden deducir de los polinomio de Tchebyshev Tn, dividiendo por 2n−1,
T0(x) = 1 , Tn(x) = 21−nTn(x) para cada n ≥ 1.
ii) Estos polinomios satisfacen la relacion de recurrencia,
T2(x) = xT1(x)−12T0(x) , Tn+1(x) = xTn(x)− 1
4Tn−1(x)
para cada n ≥ 2.
iii) Debido a la relacion lineal entre Tn y Tn la propiedad 8.1, implica que los ceros de Tnocurrentambien en,
xk = cos(
(2k − 1)π(2n)
)para k = 1, 2, · · · , n. (148)
y que los valores extremos de los Tn ocurren en
xk = cos(kπ
(n)
)para k = 0, 1, · · · , n. (149)
82
iv) En estos valores extremos para n ≥ 1
Tn(xk) =(−1)k
2n−1para cada k = 0, 1, 2, · · · , n
De esto ultimo, se deduce la siguiente propiedad
Propiedad 9.2 Los polinomios de la forma Tn, cuando n ≥ 1, tienen la propiedad
12n−1
= maxx∈[−1,1]
|Tn(x)| ≤ maxx∈[−1,1]
|Pn(x)| para toda Pn ∈∏
n
En esta ultima expresion, se produce la igualdad si y solo sı Pn = Tn
Observacion 9.2 1. La respuesta a la interrogante ¿donde colocar los nodos interpolantes paraminimizar el error en la interpolacion de Lagrange? Recordemos que: Si f ∈ Cn+1[−1, 1] yx − 0, · · · , xn son numeros distintos en el intervalo [−1, 1], entonces para cada x ∈ [−1, 1]existe ξ(x) en (−1, 1) tal que,
f(x) = P (x) +f (n+1)(ξ(x))
(n+ 1)!(x− x0)(x− x1) · · · (x− xn), (150)
donde P es el poinomio interpolante de Lagrange. Vimos que una alternativa de minimizarel error es ubicar los nodos de una forma optima, lo equivale a encontrar los nodos queminimizan la expresion.
|(x− x0)(x− x1) · · · (x− xn)|sobre todo el intervalo [−1, 1]. Como
(x− x0)(x− x1) · · · (x− xn). (151)
es un polinomio monico de grado (n+ 1), la propiedad anterior implica que este mınimo seobtiene ssı
(x− x0)(x− x1) · · · (x− xn) = Tn+1(x). (152)
Luego si se escoge xk como el (k + 1) cero de Tn+1 para cada k = 0, 1, · · ·n, es decir cuandoxk se escoja como
xk+1 = cos(
(2k + 1)π(2(n+ 1))
)para k = 1, 2, · · · , n. (153)
el valor maximo de |(x− x0)(x− x1) · · · (x− xn)| sera minimizado. Como,
maxx∈[−1,1] |Tn+1(x)| = 2−n ⇒ 12n
= maxx∈[−1,1]
|(x− x0)(x− x1) · · · (x− xn+1)|
≤ maxx∈[−1,1] |(x− x0)(x− x1) · · · (x− xn)|.
(154)
para cualquier eleccion de x0, x1, · · · , xn en el intervalo [−1, 1]
83
2. Esta tecnica de eleccion de puntos que minimizan el error interpolante puede extendersefacilmente a un intervalo cerrado general [a, b] usando el cambio de variables
x =12[(b− a)x+ a+ b]
para transformar los numeros xk, en el intervalo [−1, 1] en los numeros correspondientes xk
en el intervalo [a, b].
Ejemplo 9.1 Sea f(x) = xex en [0, 1,5]. Construir dos polinomios interpolantes de grado a lo mastres.
iii) Hacer una tabla comparativa entre los valores exactos de la funcion, el polinomio usandonodos igualmente espaciados y el polinomio de Tchebyshev T4 y entre los errores absolutosde los dos polinomios.
Sol.
i) Usando los nodos igualmente espaciados se obtiene:
especialmente cuando no puede ser resuelta por metodos analıticos.
Se obtiene aproximando f(x) en [a, b] mediante un polinomio de interpolacion, es decir,
f(x) = Pn(x) + E(x) , entonces∫ b
af(x)dx =
∫ b
aPn(x)dx+
∫ b
aE(x)dx
de modo que si
Pn(x) =n∑
i=0
f(xi)li(x)
es el polinomio interpolante de Lagrange,∫ b
a
f(x)dx =n∑
i=0
f(xi)∫ b
a
pi(x)dx. (106)
En general, si el integrando es:∫ b
a
w(x)f(x)dx =n∑
i=0
Hi(x)f(xi) + Eint. (107)
donde w(x) es una funcion peso, losHi(x) se determinan imponiendo que Ec , el error de cuadraturasea cero, si f es un polinomio de grado menor o igual que n.
7.1.1. Metodo del Trapecio.
Si en la formula, (??), n=1 entonces los puntos de interpolacion son x0 y x1∫ x1
x0
f(x)dx =1∑
i=0
Hi(x)f(xi) = H0f(x0) +H1f(x1).
luego hay que calcular, H0 y H1, en efecto
H0 =∫ x1
x0
l0(x)dx =∫ x1
x0
x− x1
x0 − x1dx =
−1h
∫ x1
x0
(x− x1)dx =h
2.
Analogamente resulta:
H1 =h
2.
Luego,
∫ x1
x0f(x)dx =
h
2[f(x0) + f(x1)]. (108)
denominada Regla del trapecio.
¿Que representa graficamente esta formula ?
Error de cuadratura
¿Que podemos decir del error cometido ? Para ello integramos el error de la aproximacion polino-mial, en efecto
E = f(x)− P1(x) =f ′′(ξ)
2(x− a)(x− b)
utilizando el teorema del valor medio para integrales, se tiene que
ET =∫ b
a
E(x)dx = − 112
(b− a)3f ′′(ξ). (109)
Notese aquı que b−a = h es la longitud del intervalo y que la formula (??) proporciona un resultadoexacto para polinomios de grado a lo mas 1. Esta formula se conoce con elnombre de metodo deltrapecio simple.
Una forma de disminuir el error de cuadratura, es considerar mas puntos de interpolacion porejemplo (n + 1), en este caso el intervalo [a, b]lo dividimos en n subintervalos de longitud h y encada subintervalo aplicamos el metodo anterior , obteniendose,
∫ b
af(x)dx =
b− a
2n[f(x0) + f(xn) + 2
n−1∑i=1
f(x0 + ih)]. (110)
denominada metodo del trapecio generalizada y el termino de error
ET =−112
h3
n2f ′′(ξ)
de donde un estimativo del error es :
|ET | ≤h3
12n2max
a≤x≤b|f ′′(x)|
7.1.2. Metodo de Simpson.
Si en la formula, (??), n=2 entonces los puntos de interpolacion son x0, x1 y x2 y
∫ x2
x0
f(x)dx =2∑
i=0
Hi(x)f(xi) = H0f(x0) +H1f(x1) +H2f(x2).
luego hay que calcular, H0, H1 y H2, en efecto
∫ x1
x0f(x)dx =
∫ x2
x0(
(x− x1)(x− x2)(x0 − x1)(x0 − x2)
f(x0) +(x− x0)(x− x2)
(x1 − x0)(x1 − x2)f(x1))dx
+∫ x2
x0
(x− x0)(x− x1)(x2 − x0)(x2 − x1)
f(x2)dx+∫ x2
x0
(x− x0)(x− x1)(x− x2)6
f (3)(ξ(x))dx.
evaluando las integrales (Consultar Analisis Numerico de Burden-Faires.) se obtiene :∫ x1
x0
f(x)dx =h
3[f(x0) + 4f(x1) + f(x2)]−
h5
90f (4).
denominada Regla de Simpson simple. Como la derivada involucrada en el error es de cuartoorden, entonces la formula sera exacta para polinomios de grado menor que 4.
Observemos que si queremos generalizar este metodo a n subintervalos, el metodo requiere de dos
intervalos consecutivos, por lo que n debe ser par. Generalizamos definiendo: n = 2m , h =b− a
2mtenemos
a = x0 < x1 < ... < x2m = b , xi = x0 + ih , i = 0, ..., 2m
entonces ∫ b
af(x)dx =
h
3
[+f(x0) + 2
m−1∑i=1
f(x2i) + 4m∑
i=1
f(x2i−1) + f(x2m)
]
−h5
90
m∑i=1
f (4)(ξi).
(111)
Un concepto importante, es saber determinar el grado de exactitud o de precision de una formulade cuadratura. El grado de exactitud o precision de una formula de cuadratura es el enteropositivo n tal que E(Pk) = 0, para todos los polinomios Pk de grado menor o igual que n, peroE(Pn+1) 6= 0 para algun polinomio de grado (n+ 1).
Actividades 7.1 Problema 1. (PEP No 3. Sem I - 2000) Una partıcula con masa m = 20 kg semueve a traves de un fluido y esta sometida a una resistencia viscosa dada por:
R(v) = −v3/2
donde v es su velocidad. La relacion entre el tiempo t, la velocidad v, y la resistencia R esta dadapor:
t =∫ v(t)
v0
m
R(v)dv (en segundos)
donde v0 es la velocidad inicial.
a) Suponiendo que v0 = 15 m/seg y usando cuatro intervalos de igual longitud, determinar eltiempo T que se requiere para que la partıcula llegue a v(T ) = 7,0 m/seg.
b) Estime el error cometido en (a)
Problema 2. Considere la siguiente formula de integracion numerica:∫ 2
−2
f(x)dx =29[5f(−2
√0,6) + 8f(0) + 5f(2
√0,6)] (1)
a) Usando la formula (1), estime el valor de la siguiente integral:∫ 1
b) Determine el polinomio de mayor grado para el que la formula (1) es exacta.
7.2. Cuadratura Gaussiana.
Recordamos que las formulas de Newton-Cotes se obtuvieron al integrar los polinomios inter-polantes de Lagrange. Como el termino de error en el polinomio interpolante involucra la derivadade orden (n+ 1) de la funcion que se esta aproximando, la formula es exacta cuando se aproximacualquier polinomio de grado menor o igual a n. Luego las formulas de Newton-Cotes tienen gradode precision de a lo menos n.
Todas las formulas de Newton-Cotes requieren que se conozcan los valores de la funcion que seva a integrar, en puntos equiespaciados ( datos tabulados), sin embargo si la funcion esta dadaexplıcitamente, los puntos para evaluar la funcion pueden escogerse de modo que la aproximaciontenga una mayor precision.
La cuadratura Gaussiana consiste en escoger los puntos de evaluacion de la funcion de modoque la aproximacion sea optima.
Problema. Se trata de escoger los puntos x∗0, x∗1, ..., x
∗n en [a, b] y las constantes H0,H1, ...,Hn de
modo que el error obtenido en: ∫ b
a
f(x)dx ≈n∑
i=0
Hif(x∗i )
sea mınimo, para cualquier f . La mejor eleccion es la que maximice el grado de precision de laformula.
Como los valores de los Hi son arbitrarios y los x∗i solo a que la funcion cuya integral se estaaproximando, debe estar definida en estos puntos , hay (2n + 2) parametros involucrados. Si loscoeficientes de un polinomio se consideran tambien como parametros, entonces la clase mas grandede polinomios para la cual es exacta la formula sera 2n+ 1.
Actividades 7.2 Se considera la formula de cuadratura:∫ 1
−1
f(x)dx = A[f(x1) + f(x2) + f(x3)) + E
i) Determinar las ecuaciones que permiten calcular A , x1 , x2 , x3 de modo que la formulasea exacta para polinomios del mayor grado posible.
ii) Si en la formula anterior se impone x2 = 0. Determinar A , x2 , x3. ¿Cual es el mayorgrado del polinomio para el que la formula obtenida es exacta?
Sol.
x2 = 0 , x1 = −√
22
, x3 =√
22
, A =23.
La formula es exacta para polinomios de grado ≤ 3.
De la actividad anterior , es claro que para aplicar cuadratura Gaussiana, necesitaremos algunosconceptos relacionados con conjuntos ortogonales de funciones.
Definicion 7.1 Diremos que un conjunto de funciones {Φ0,Φ1, · · · ,Φn} es ortogonal en [a, b],con respecto a la funcion peso w(x) ≥ 0, si
∫ b
aΦ0kΦjw(x)dx = 0 , cuando j 6= k y∫ b
aΦ0kΦjw(x)dx > 0 , cuando j = k
Algunas Propiedades importantes.
1) Si {Φ0,Φ1, · · · ,Φn} es un conjunto ortogonal de polinomios definidos en [a, b] y Φi es degrado i para cada i = 0, 1, · · · , n, entonces para cualquier polinomio Q(x) de grado a lo masn, existen constantes unicas α0, α1, · · · , αn}, tales que:
Q(x) =n∑
i=0
αiΦi(x)
2) Si {Φ0,Φ1, · · · ,Φn} es un conjunto ortogonal de polinomios definidos en [a, b] con respecto auna funcion de peso continua w y Φk es un polinomio de grado k para cada k = 0, 1, · · · , n,entonces Φk tiene k raıces en el intervalo (a, b).
Resumen Polinomios Ortogonales.
Polinomios de Legendre.
i) Son ortogonales con respecto a la funcion peso w(x) = 1 en [a, b] = [−1, 1]
ii) Formula Recursiva.
Pn+1 =(
2n+ 1n+ 1
)xPn(x)−
(n
n+ 1
)Pn−1(x)
para todo n ≥ 1, P0(x) = 1, P1(x) = x.
iii) Formula para los pesos.
Wj =−2
(n+ 1)Pn+1(xj)P ′n(xj), j = 1, ..., n
En esta formula n representa el grado del polinomio.
iv) Formula para el error.
E(f) =22n+1(n!)4
(2n+ 1)[(2n)!]3f (2n)(ξ).
con ξ ∈ [−1, 1] y n grado del polinomio.
Polinomios de Laguerre.
i) Son ortogonales con respecto a la funcion peso w(x) = e−x en [a, b] = [0,∞)
ii) Formula Recursiva.
Ln+1 =(
1n+ 1
)(2n+ 1− x)Ln(x)−
(n
n+ 1
)Ln−1(x)
para todo n ≥ 1, L0(x) = 1, L1(x) = 1− x.
iii) Formula para los pesos.
Wj =[(n)!]2
Ln+1(xj)L′n(xj).
iv) Formula para el error.
E(f) =(n!)2f (2n)(ξ)
(2n)!.
con ξ ∈ [0,∞).
Polinomios de Hermite.
i) Son ortogonales con respecto a la funcion peso w(x) = e−x2en [a, b] = (−∞,∞)
ii) Formula Recursiva.Hn+1 = 2xHn(x)− 2nHn−1(x)
para todo n ≥ 1, H0(x) = 1, H1(x) = 2x.
iii) Formula para los pesos.
Wj =2(n+1)(n)!
√π
[H ′n(xj)]2
.
iv) Formula para el error.
E(f) =n!√πf (2n)(ξ)
2n[(2n)!].
con ξ ∈ (−∞,∞).
Polinomios de Tchebyshev.
i) Son ortogonales con respecto a la funcion peso w(x) = (1− x2)−1/2 en [a, b] = [−1, 1]
ii) Formula Recursiva.Tn+1(x) = 2xTn(x)− Tn−1(x)
para todo n ≥ 1, T0(x) = 1, T1(x) = x.
iii) Formula para los pesos.
Wj =π
n.
donde n representa el numero de ceros del polinomio.
iv) Formula para el error.
E(f) =2π
22n(2n)!f (2n)(ξ).
con ξ ∈ (−1, 1).
Actividades 7.3 1. Estimar ∫ 3
1
dx
x
usando un polinomio de Legendre de grado 3. Estimar ademas el error.
Sol.
x0 = −√
(35) , x1 = 0 , x2 =
√(35)
H0 =59, H1 =
89, H2 =
59
g(y) =1
y + 2, I ≈ 1,098039 , |E| < 0,045714
2. Estimar ∫ ∞
−∞e−x2
x2dx ,
usando un polinomio de Hermite de grado 2.
Sol.
x1 = −√
22
, x2 =√
22
, H1 = H2 =√π
2, I =
sqrtπ
2
3. Calcular : ∫ 1
−1
cosx√1− x2
dx
uasndo un polinomio de Tchebyshev de grado 2.
Sol. I ≈ 2,38884
4. La formula de Gauss - Tchebyshev,∫ 1
−1
f(x)√1− x2
dx approxπ
n
n∑i=1
f(xi)
es exacta para polinomios de grado 2n-1.
a) Demuestrelo para el caso n=3.
b) Aproxime usando lo anterior: ∫ π
0
cosx√π2 − x2
dx.
7.3. Integrales Indefinidas
Supongamos que desamos evaluar la integral:
F (x) =∫ x
a
f(t)dt. (112)
para a ≤ x ≤ b. Podemos escoger un adecuado paso de h para aproximar el lado derecho de (112),para x = a+ h , x = a+ 2h , ... cada integral puede estimarse por alguna regla de cuadratura porejemplo trapecio. Los valores intermedios de F (x) pueden estimarse por interpolacion.
Otro metodo es reemplazar f por algun polinomio de aproximacion p y aproximar F integrando p.
Si |f(x)− p(x)| < ε para a ≤ x ≤ b entonces,∣∣∣∣F (x)−∫ x
a
p(t)dt∣∣∣∣ < ∫ x
a
εdx ≤ (b− a)ε
para a ≤ x ≤ b. Tomando [a, b] como [−1, 1] una adecuada eleccion de p es la serie de Tchebyshev
b∑r=0
αrTr(x). (113)
donde,
αr =2N
N∑j=0
f(xj)Tr(xj). (114)
y xj = cos(πjN ), con N > n. Para integrar la expresion (113), es necesario integrar Tr(x), cuya
integral indefinida es un polinomio de grado r+1. Por lo tanto, queda una suma de T0 , T1, ..., Tr+1.Para evaluar en general la integral de Tr(x) es mas facil usar t = cos(θ), de modo que:∫
Tr(x)dx = −∫
cosrθ sin θdθ
=12
∫[sin (r − 1)θ − sin (r + 1)θ]dθ
=12
(cos(r + 1)θ
r + 1− cos(r − 1)θ
r − 1
)+ C
Si r 6= 1, escogemos C de modo que se cumpla la condicion Tr(−1) = (−1)r , de modo que:∫ x
−1
Tr(t)dt =12
(Tr+1(x)r + 1
− Tr−1(x)r − 1
)+
(−1)r+1
r2 − 1. (115)
donde r > 1. Ademas, ∫ x
−1T0(t)dt =
14T1(x) + 1
∫ x
−1T1(t)dt =
14T1(x)−
14
Luego integrando (113), tenemos:
∫ x
−1
(n∑
r=0
αrTr(t)
)dt =
n+1∑j=0
βjTj(x). (116)
De (115) se deduce que :
βj =12j
(αj+1 − αj−1) , 1 ≤ j ≤ n− 1. (117)
y
β0 =12α0 −
14α1 +
n∑r=2
(−1)r+1αr
r2 − 1
Si se define αn+1 = αn+2 = 0, la expresion (117) se cumple para j = n y n+ 1.
7.4. Integrales Impropias
Recordando como se definen las integrales impropias de primera y segunda clase, tenemos los dosproblemas siguientes:
i) Estimar∫ b
af(x)dx, donde f tiene una singularidad en x = b, entonces definimos sobre el
intervalo [a, b− ε], con 0 < ε < b− a. Suponemos que
lımε→0
∫ b−ε
a
f(x)dx
existe. Por ejemplo,∫ 1
0(1− x)
12 dx
ii) Estimar∫∞
af(x)dx, donde f esta definida sobre cualquier intervalo [a, b] y
lımb→∞
∫ b
a
f(x)dx
existe. Por ejemplo,∫∞1x−2dx
Una tecnica que es util algunas veces en ambos casos es hacer un cambio de variables adecuado.Ası la sustitucion t = (1−x2)
12 transforma la integral impropia i)
∫ 1
0(1−x)− 1
2 sinxdx en la integral
propia 2∫ 1
0sin 1− t2dt que puede estimarse usando alguna regla de cuadratura estandard .
Otra tecnica usada es remocion de la singularidad. Consideremos la integral impropia
I =∫ 1
0
x−pcosxdx , 0 < p < 1
con singularidad en x = 0. Podemos aproximar cosx por el primer termino de la serie de Tayloralrededor de x = 0, nos da
I =∫ 1
0
x−pdx+∫ 1
0
x−p(cosx− 1)dx.
La primera integral tiene el valor (1 − p)−1. La segunda integral puede calcularse mediante unmetodo numerico, puesto que su integrando no tiene singularidad, ya que cosx − 1 se comportacomo − 1
2x2 en x = 0. Sin embargo, x−p(cosx − 1) se comporta como − 1
2x2−p, cuya segunda
derivada y las derivadas de orden superior son singulares en x = 0. Por lo tanto no es posiblegarantizar que la integracion numerica de resultados exactos.
Ejemplo 7.1
7.5. Integrales Multiples
Dscutiremos integrales sobre una region rectangular. Mediante un cambio de variables, el rectangulopuede transformarse en cuadrado. Usando cualquier cuadratura en una dimension, tenemos :∫ b
a
(∫ b
af(x, y)dx
)dy =
∫ b
a
(∑Ni=0 ωif(xi, y)
)dy
=∑N
i=0 ωi
∫ b
af(xi, y)dy
=∑N
i=0 ωi
(∑Nj=0 ωjf(xi, yj)
),
donde, en realidad xi = yi . Los numeros xi ωi representan los puntos y los pesos respectivamente,en una dimension. Luego para dos dimensiones tenemos:
∫ b
a
(∫ b
a
f(x, y)dx
)dy =
N∑i,j=0
ωiωjf(xi, yj). (118)
denominada unaregla de integracion del producto. Por ejemplo, para un producto con la reglade Simpso compuesta en dos dimensiones con 4 subintervalos en cada direccion, el valor relativo alos pesos 1, 4, 2, 4, 2, 1, son multiplicados, los resultados de muestran en la siguiente tabla:
Tabla relativa a los pesos de un producto usando Simpson
1 4 2 4 14 16 8 16 42 8 4 8 24 16 8 16 41 4 2 4 1
La suma de los numeros en la tabla es (1 + 4 + 2 + 4 + 1)2 Consideraremos la funcion f(x, y) ≡ 1,por lo tanto la regla integrara la funcion sobre la region con area (b−a)2, cada numero en la tabla
debe ser multiplicado por(b− a)2
144para obtener los pesos ωiωj de (118).
El estimativo de error de las reglas del producto, da un error estimado para la regla unidimensional.Se puede obtener una cota de error basados en la regla de Simpson , con paso h. Si R denota laregion cuadrada a ≤ x ≤ b , a ≤ y ≤ b, entonces:
∫ b
a
f(x, y)dx =N∑
i,j=0
ωif(xi, y)− (b− a)h4
180f (iv)
x (ξy, y). (119)
7.6. Diferenciacion Numerica
Se trata de encontrar metodos para aproximar f ′ dados los valores de x en ciertos puntos. Si pes una aproximacion polinomial a f , podemos usar p′ como una aproximacion a f ′. Sin embargo,puede ocurrir que el modulo maximo de f ′(x)− p′(x) sobre el intervalo [a, b] puede ser mucho masgrande que el modulo maximo de f(x)− p(x). Por lo tanto se buscaran otros metodos. La formuladel error es:
f(x)− pn(x) =∏n+1
(x)f (n+1)(ξx)(n+ 1)!
. (120)
donde,∏
n+1(x) = (x− x0) · · · (x− xn). Derivando,
f ′(x)− p′n(x) = Π′n+1(x)f (n+1)(ξx)(n+ 1)!
+Π(n+1)(x)(n+ 1)!
d
dxf (n+1)(ξx). (121)
Recordamos la formula de diferencias avanzadas:
pn(x) = pn(x0 + sh) = f0 +(s1
)4f0 + · · ·+
(sn
)4nf0 (122)
De x = x0 + sh se tienedx
ds= h, por lo tanto,
p′n(x) =ds
dx
d
dspn(x0 + sh) =
1h
d
dspn(x0 + sh). (123)
Ası
p′n(x) =1h
[4f0 +
12(2s− 1)42f0 + · · ·+ d
ds
(sn
)4nf0
]. (124)
Para calcular Π′n+1(xr) escribimos:
Πn+1(x) = (x− xr)Πj 6=r(x− xj). (125)
De aquı obtenemos:
Π′n+1(x) =(d
dx(x− xr)
)Πj 6=r(x− xj) + (x− xr)
d
dxΠj 6=r(x− xj). (126)
En x = xr, el segundo termino sera cero y obtenemos:
Π′n+1(xr) =∏j 6=r
(xr − xj) = (−1)n−rhnr!(n− r)!. (127)
ya que xr − xj = (r − j)h. Por lo tanto, (121) puede expresarse como:
f ′(xr)− p′n(xr) = (−1)n−rhn r!(n− r)!(n+ 1)!
f (n+1)(ξx)r. (128)
De aquı podemos deducir algunas reglas:
Con n = 1 en (124) obtenemos:
p′1(x) =f1 − f0h
− . (129)
y con r = 0 en (128) tenemos:
f ′(x0) =1h4f0 =
f1 − f0h
− 12hf ′′(ξ0). (130)
Con n = 2 en (124) y r = 1 obtenemos la derivada centrada en x1, interpolando los puntos x0 , x1
y x2, si x = x1 entonces s = 1 y la formula (124) se transforma en :
p′2(x1) =1h
[4f0 +1242f0] =
f2 − f02h
. (131)
Esta es una aproximacion a f ′(x1), con error (128).
f ′(x1)−f2 − f0
2h= −1
6h2f ′′′(ξ1). (132)
Se pueden obtener las formulas de diferencia progresiva , centrada y regresiva respectivamente:
f ′(x) ≈ f(x+ h)− f(x)h
. (133)
y
f ′(x) ≈ f(x+ h)− f(x− h)2h
. (134)
f ′(x) ≈ f(x+ h)− f(x− h)2h
. (135)
Las derivadas de orden superior de f son aproximadas por las derivadas de orden superior delpolinomio interpolante pn. Si procedemos como antes, tenemos:
p′′n(x) =1h2
d2
ds2pn(x0 + sh)
y de (124) tenemos:
p′′n(x) =1h2
[42f0 +
d2
ds2
(s3
)43f0 + · · ·+ d2
ds2
(sn
)4nf0
]. (136)
donde x = x0 + sh y n ≤ 2. Para n = 2 encontramos que:
p′′2(x) =1h242f0
Consideramos esto como una aproximacion a f ′′(x) en x = x1. Ası
f ′′(x1) ≈f2 − 2f1 + f0
h2. (137)
Generalizando esta estrategia para cualquier k ≤ n obtenemos:
p(k)n (x) =
1hk
[dk
dsk
(sk
)4kf0 + · · ·+ dk
dsk
(sn
)4nf0
]. (138)
De aquı se obtiene,
f (k)(x) ≈ 4kf0hk
. (139)
Si consideramos la formula (139) para aproximar f (k)(x) para un x centrado en el intervalo [x0, xk]y si k = 2m, entonces tenemos:
f (2m)(xm) ≈ 42mf0h2m
. (140)
Si k = 2m−1, el intervalo [x0, x2m−1] no tiene un punto central tabulado, en este caso se generalizael procedimiento adaptado para la estimacion de la primera derivada. Usamos (140) con n = k+1 =2m, encontrando
f (2m−1)(xm) ≈ 1h2m−1
(42m−1f0 +1242mf0). (141)
Ya que,42mf0 = 4(42m−1f0) = 42m−1f1 −42m−1f0. (142)
obtenemos:
f (2m−1)(xm) ≈ 42m−1f0 +42m−1f12h2m−1
. (143)
De (143) y (140) se pueden obtener aproximaciones para la tercera y cuarta derivada:
f (3)(x2) ≈1h3
(f4 − 2f3 + 2f1 − f0). (144)
y
f (4)(x2) ≈1h4
(f4 − 4f3 + 6f2 − 4f1 + f0). (145)
Se pueden obtener otras reglas de derivacion considerando mas terminos en (138)
y de (154) tenemos:
p′′n(x) =1h2
[42f0 +
d2
ds2
(s3
)43f0 + · · ·+ d2
ds2
(sn
)4nf0
]. (166)
donde x = x0 + sh y n ≤ 2. Para n = 2 encontramos que:
p′′2(x) =1h242f0
Consideramos esto como una aproximacion a f ′′(x) en x = x1. Ası
f ′′(x1) ≈f2 − 2f1 + f0
h2. (167)
Generalizando esta estrategia para cualquier k ≤ n obtenemos:
p(k)n (x) =
1hk
[dk
dsk
(sk
)4kf0 + · · ·+ dk
dsk
(sn
)4nf0
]. (168)
De aquı se obtiene,
f (k)(x) ≈ 4kf0hk
. (169)
Si consideramos la formula (169) para aproximar f (k)(x) para un x centrado en el intervalo [x0, xk]y si k = 2m, entonces tenemos:
f (2m)(xm) ≈ 42mf0h2m
. (170)
Si k = 2m−1, el intervalo [x0, x2m−1] no tiene un punto central tabulado, en este caso se generalizael procedimiento adaptado para la estimacion de la primera derivada. Usamos (170) con n = k+1 =2m, encontrando
f (2m−1)(xm) ≈ 1h2m−1
(42m−1f0 +1242mf0). (171)
Ya que,42mf0 = 4(42m−1f0) = 42m−1f1 −42m−1f0. (172)
obtenemos:
f (2m−1)(xm) ≈ 42m−1f0 +42m−1f12h2m−1
. (173)
De (173) y (170) se pueden obtener aproximaciones para la tercera y cuarta derivada:
f (3)(x2) ≈1h3
(f4 − 2f3 + 2f1 − f0). (174)
y
f (4)(x2) ≈1h4
(f4 − 4f3 + 6f2 − 4f1 + f0). (175)
Se pueden obtener otras reglas de derivacion considerando mas terminos en (168)
90
Modulo de clases
Prof. Marıa Angelica Vega U.
9.7. Mınimos cuadrados Discretos.
Consiste en buscar una una funcion aproximada que ajuste la forma de la tendencia que siguen losdatos sin pasar necesariamente por los puntos dados. Un modo de hacer esto es determinar unacurva que minimice la diferencia entre los puntos dados y la curva. Este metodo se conoce comoregresion por mınimos cuadrados. El caso mas simple de una aproximacion por mınimos cuadradoses el ajuste de las observaciones mediante una lınea recta. La figura siguiente muestra la mejorlınea recta.Regresion lineal. Este problema clasico puede enunciarse : Dada una funcion continua f sobreun intervalo [a, b] y un conjunto de n observaciones (x1, y1), (x2, y2), · · · , (xn, yn), buscamos unalınea recta de ecuacion
f(x) = a0 + a1x
tal que la diferencia entre el valor real de y y el valor aproximado obtenido por f(x) sea el menorposible. Recordemos que se definio el error o residuo entre la funcion y) y su aproximacion como :
e = y − a0 − a1x.
¿Como obtener la recta de regresion ? La regresion lineal es un metodo poderoso en el sentidoque ajusta los datos a la mejor lınea. Sabemos que este es un problema de optimizacion y debemosencontrar los valores a0 y a1 de f(x) = a0 + a1x de modo que la suma
Er =n∑
i=1
(ei)2 =n∑
i=1
(yi − f(xi))2. (176)
sea mınima. Para ello derivamos la ecuacion (176) con respecto a cada coeficiente e igualamos acero, de donde tenemos :
∂Er
∂a0= −2
∑ni=1(yi − a0 − a1xi) = 0
∂Er
∂a1= −2
∑ni=1(yi − a0 − a1xi)xi = 0
De aquı se tiene el sistema de ecuaciones lineales, escrito en la forma Aa = b:( ∑ni=1 1
∑ni=1 xi∑n
i=1 xi
∑ni=1 x
2i
)(a0
a1
)=( ∑n
i=1 yi∑ni=1 xiyi
)o equivalentemente
(n
∑ni=1 xi∑n
i=1 xi
∑ni=1 x
2i
)(a0
a1
)=( ∑n
i=1 yi∑ni=1 xiyi
)Resolviendo el sistema matricial obtenemos los valores de a0 y a1.
91
Ejemplo 9.2 Ajuste a una lınea recta los siguientes cinco puntos. ¿Que puede decir del error quese obtiene
Solucion. Determinamos cada uno de los terminos que aparecen en (9.7)
Calculo de las sumas.
n = 5 ,∑5
i=1 xi = 34∑5i=1 xi = 34 ,
∑5i=1 yi = 15,12∑5
i=1 yi = 15,12 ,∑5
i=1 xiyi = 82,76∑5i=1 x
2i = 352 ,
∑5i=1 y
2i = 51,5928
de donde tenemos el sistema de ecuaciones :
Sistema de ecuaciones (5 3434 352
)(a0
a1
)=(
15,1282,76
)Usando eliminacion gaussiana encontramos los valores del vector a
a0 = 4,15298 , a1 = −0,166027.
de donde la ecuacion de la recta es:
L(x) = 4,15− 0,17 ∗ x
Actividades 9.4
i) Encuentre el sistema matricial que se obtiene al ajustar, usando:
f(x) = P (x) = a0 + a1x+ a2x2.
ii) Dado un conjunto de m observaciones (x1, y1), ..., (xm, ym). aproximar los datos con un poli-nomio de grado n, usando el procedimiento de mınimos cuadrados. Observe que el polinomioes ahora
f(x) = P (x) =n∑
i=1
aixi.
Problema 2. Supongamos que queremos ajustar n datos, P1(x1, y1), · · · , Pn(xn, yn) con una fun-cion g(x) de dos parametros γ1 y γ2 , es decir
g(x) = γ1Φ1(x) + γ2Φ2(x).
Notemos que Φ1(x) y Φ(x) son funciones conocidas elementales de x que no son necesariamenteelementos de una base para los polinomios. Obviamente para encontrar la g(x) que minimiza elcuadrado de los errores hay que determinar los parametros γ1 y γ2. En efecto,
E(g) =n∑
i=1
(yi − g(xi))2. (177)
92
Derivando parcialmente con respecto a γ1 y γ2, igualando a cero y reordenando se obtiene elsiguiente sistema de ecuaciones en forma matricial Aγ = b( ∑n
i=1 Φ1(xi)Φ1(xi)∑n
i=1 Φ2(xi)Φ1(xi)∑ni=1 Φ1(xi)Φ2(xi)
∑ni=1 Φ2(xi)Φ2(xi)
)(γ1
γ2
)=( ∑n
i=1 Φ1(xi)yi∑ni=1 Φ2(xi)yi
)Las ecuaciones del sistema se denominan ecuaciones normales y cualquier modelo lineal (sumaponderada de dos funciones) de dos parametros pueden ajustarse a un sistema de ecuacioneslineales. El error en este caso puede determinarse luego de encontrar γ1 y γ2, usando:
E(g) =n∑
i=1
(yi)2 −
(γ1
n∑i=1
Φ1(xi)yi + γ2
n∑i=1
Φ2(xi)yi
)(178)
Para ilustrar este modelo, tomemos el ejemplo 0.2 y ajustemos los datos usando una funcion dedos parametros como sigue.
Ejemplo 9.3 Ajustar mediante el metodo de mınimos cuadrados, los datos del ejemplo 1.15 con
una hiperbola desplazada del tipo g(x) = γ1 +γ2
x. Determine el error cometido al ajustar los datos
con la recta y con la parabola.
9.8. Algo sobre Normas de funciones.
Definicion 9.2 La norma de una funcion f que pertenece a alguna clase de funciones continuasC es una funcion de C al conjunto de los numeros reales no negativos :
|| · || : C → R+
f 7→ ||f || ≥ 0
tal que verifica las siguientes propiedades :
i) ||f || > 0 , ||f || = 0 ⇔ f = 0
ii) ∀ λεR y fεC ||λf || = |λ||f ||
iii) ∀ f, g εC ||f + g|| ≤ |||f ||+ ||g||
Algunas normas conocidas con fεC
i)||f ||∞ = max
a≥x≥b|f(x)|. (179)
Esta norma definida sobre [a, b] es llamada norma del maximo, norma infinito o normade Tchebyshev. Verificar como ejercicio que satisface las propiedades de una norma.
93
ii)
||f ||p =
{∫ b
a
|f(x)|pdx
} 1p
. (180)
conocida como p− norma, donde f ∈ C[a, b] y p ≥ 1. Obviamente cada valor de p ≥ 1 esuna norma, aunque en la practica se utiliza p = 1 y p = 2.
Normas Discretas (es decir para fεC(X))
i)||f ||∞ = max
0≤i≤N|f(xi)|. (181)
llamada norma infinito discreta.
ii)
||f ||p ={ΣN
i=0|f(xi)|pdx} 1
p . (182)
conocida como p− norma discreta, siendo p ≥ 1.
La desigualdad triangular es difıcil de demostrar para esta ultima norma, excepto para p = 1 yp = 2.
Nota 9.1 i) Observemos que se ha usado ||f ||∞ para denotar dos normas diferentes (179) sobreC[a, b] y (181) analogamente sucede con ||f ||p.
ii) Existe la siguiente relacion entre la norma (181) y las p− normas (182) dada por :
lımp→∞
{ΣN
i=0|f(xi)|pdx} 1
p = max0≥ix≥N
|f(xi)|. (183)
iii) La mejor aproximacion respecto a la norma infinito se llama aproximacion minimax,puesto que esta aproximacion minimiza el error maximo ||f − q||∞ sobre todo q ∈ Pn(x)
iv) La mejor aproximacion respecto a la norma 2 se llama aproximacion mınimo cuadrado.
94
Modulo N◦ 9
Profesores : Edgard Shipley - Marıa Angelica Vega U.Erklarungen: Zusammengestohlen aus Verschiedenem diesem und jenem
Ludwig van Beethoven.
9.9. Aproximacion de Mınimos Cuadrados Continuos.
Problema 2. Sea f ∈ C[a, b] , queremos determinar un polinomio Pn de grado ≤ n que minimiceel error : ∫ b
a
(f(x)− Pn(x))2dx
Sean Pn(x) =n∑
k=0
akxk y E(a0, ..., an) =
∫ b
a
(f(x)− Pn(x))2dx. (184)
es decir, la funcion error es,
E(a0, ..., an) =∫ b
a
(f(x)−n∑
k=0
akxk)2dx. (185)
Para determinar los coeficientes ak, k = 0, 1, 2, ..., n, debemos resolver el siguiente sistema:
∂E
∂aj= 0 para j = 0, 1, 2, ..., n.
De (??), obtenemos
E(a0, ..., an) =∫ b
a
f(x)2dx− 2n∑
k=0
ak
∫ b
a
f(x)xkdx+∫ b
a
(n∑
k=0
akxk
)2
dx. (186)
Luego,∂E
∂aj= −2
∫ b
af(x)xjdx+
∫ b
a2(∑n
k=0 akxk)xjdx
= −2∫ b
af(x)xjdx+ 2
∑nk=0 ak
∫ b
axj+kdx = 0 , j = 0, 1, ..., n.
De aquı el sistema es:
n∑k=0
ak
∫ b
a
xj+kdx =∫ b
a
f(x)xjdx , j = 0, 1, ..., n. (187)
Las ecuaciones (??) son las ecuaciones normales y tienen solucion unica si f ∈ C[a, b]. La matrizde los coeficientes de este sistema es:
H = (hi,j) =(bj+k+1 − aj+k+1
j + k + 1
)
95
que es una matriz de Hilbert mal condicionada que produce dificultades con el error de redondeo.Observemos que al dar valores a j en (??), se obtiene:
j = 0, −2(∫ b
af(x)dx+
∫ b
a
(∑nk=0 akx
k)dx)
= 0
j = 1, −2(∫ b
af(x)xdx+
∫ b
a
(∑nk=0 akx
k)xdx
)= 0
......
j = n, −2(∫ b
af(x)xndx+
∫ b
a
(∑nk=0 akx
k)xndx
)= 0
Ejemplo 9.4 (Burden) Determinar el polinomio de grado dos que aproxima por mınimos cuadra-dos a la funcion f(x) = sin (πx) en el intervalo [0, 1].Sol. El sistema (??) queda:
1 1
213
12
13
14
13
14
15
a0
a1
a2
=
∫ 1
0sinπxdx∫ 1
0x sinπxdx∫ 1
0x2 sinπxdx
=
2π
1π
π2−4π3
El polinomio aproximante de grado dos para f(x) = sin (πx) en el intervalo [0, 1] es
P2(x) = −0,050465 + 4,12251x− 4,12251x2
9.9.1. Metodo Generalizado
Podemos usar en lugar de la base canonica para polinomios,{1, x, x2, ..., xn} , cualquier base defamilia de polinomios ortogonales en el intervalo [a, b] respecto de una funcion peso w(x). Para ellodebemos tener presente los siguientes conceptos:
Definicion 9.3 Un espacio con producto interno (E.P.I.) es un (E, 〈 , 〉) donde:
〈f, h〉 = 〈h, f〉
〈f, ah+ bg〉 = a〈f, h〉+ b〈f, g〉
〈f, f〉 = ||f ||2 > 0
96
Propiedad 9.1 Algunas propiedades importantes en un E.P.I.
〈∑n
1 aifi, g〉 =∑n
1 ai〈fi, g〉
||f + g||2 = ||f ||2 + 2〈f, g〉+ ||g||2
Si f⊥g ⇒ ||f + g||2 = ||f ||2 + ||g||2
|〈f, g〉| = ||f ||||g||
||f + g||2 + ||f − g||2 = 2(||f ||2 + ||g||2)
Teorema 9.1 Sea G un subespacio de un espacio con producto interno E. Para toda f ∈ E , g ∈ Gson equivalentes las proposiciones:
i) g es una mejor aproximacion a f ∈ G
ii) f − g ⊥ G si 〈f − g, h〉 = 0
Definicion 9.4 Si B = {ϕ0, ϕ1, ϕ2, ..., ϕn} es una base de los polinomios ortogonales en [a, b]respecto de w(x) se cumple:
〈ϕj , ϕk〉 =∫ b
a
w(x)φj(x)ϕk(x)dx =
{0, si j 6= k
γk, si j = k
Observacion 9.1 Recordemos que,
Un conjunto de funciones ψ0, ψ1, ..., ψn es linealmente independiente en [a, b] si
n∑j=0
cjϕj = 0 ⇒ cj = 0 para cada j = 0, 1, ..., n
De lo contrario decimos que el conjunto es linealmente dependiente.
Sea ϕj un polinomio de grado j para cada j = 0, 1, ..., n y sea ψ0, ψ1, ..., ϕn un conjunto lin-ealmente independiente. Si Πn es el conjunto de todos los polinomios de grado ≤ n, entoncescualquier polinomio de Πn puede expresarse como
Pn(x) = Σnj=0cjϕj(x)
.
De modo que el problema de determinar un polinomio Pn(x) =∑n
j=0 cjϕj(x) de grado n queminimice el error
E(c0, ..., cn) =∫ b
a
w(x)[f(x)− Pn(x)]2dx. =∫ b
a
w(x)
f(x)−n∑
j=0
cjϕj
2
dx. (188)
97
se reduce a determinar la solucion del sistema de ecuaciones lineales obtenido mediante
∂E
∂ci= 0 ⇔
∫ b
aw(x)
[f(x)−
∑nj=0 cjϕj(x)
]ϕi(x)dx = 0
∂E
∂ci= 0 ⇔
∑nj=0 cj〈ϕj , ϕi〉 = 〈f, ϕi〉 ⇒ ciγi = 〈f, ϕi〉 , i = 0, 1, ..., n
Por tanto los coeficientes de Pn(x) estan dados por:
cj =〈f, ϕj〉γj
=
∫ b
aω(x)f(x)ϕj(x)dx∫ b
aω(x)ϕ2
j (x)dxj = 0, 1, ..., n.. (189)
El producto interior definido por 〈f, g〉 =∫ b
aω(x)f(x)g(x)dx permite definir la llamada Norma-2
que esta dada por
||f ||2 =√〈f, f〉 =
(∫ b
a
ω(x)f(x)2dx
) 12
.[a, b] (190)
Con lo anterior,el problema de minimizar el error (??), puede expresarse como:Problema 2. Determinar
mın ||f − Pn||2 , con Pn ∈ Πn
donde Πn es el espacio de los polinomios generados por B.
Existe un metodo para generar una familia de polinomios ortogonales en un intervalo dado, respectode una funcion peso ω(x). Este metodo es el llamado metodo de Gramm-Schmidt que consiste endeterminar los polinomios de la siguiente manera:
98
1. ϕ0(x) = 1 , ϕ1(x) = (x−B1)ϕ0(x)
2. B1 se determina de modo que 〈ϕ1, ϕ0〉 = 0. Se obtiene ;
B1 =
∫ b
aω(x)xϕ0(x)2dx∫ b
aω(x)ϕ2
0(x)dx
3. Para k ≥ 2, ϕk(x) = (x−Bk)ϕk−1 − Ckϕk−2
Bk =
∫ b
aω(x)xϕ2
k−1(x)dx∫ b
aω(x)ϕ2
k−1(x)dx, Ck =
∫ b
aω(x)xϕk−1(x)ϕk−2dx∫ b
aω(x)ϕ2
k−2(x)dx
Ejemplo 9.6 Los polinomios de Legendre son ortogonales en [−1, 1] con funcion peso ω(x) = 1 yse define ϕ0(x) = 1. Aplicando la formula anterior recursivamente, se obtiene
ϕ1(x) = x , ϕ2(x) = x2 − 13, ϕ3(x) = x2 − 3
5x
.
Ejemplo 9.7 Encontrar la aproximacion de mınimos cuadrados de grado dos, de la funcion f(x) =e−x con x ∈ [−1, 1] usando polinomios de Legendre.Sol.: Sea P2(x) = aϕ0(x) + bϕ1(x) + cϕ2(x) el polinomio que minimiza ||f − P2||22. En este casolas ecuaciones que determinan los coeficientes son:
a =
∫ 1
−1e−xϕ0(x)dx∫ 1
−1ϕ2
0(x)dx=
12[−e−x]1−1 =
12(e− e−1)
b =
∫ 1
−1e−xϕ1(x)dx∫ 1
−1ϕ2
1(x)dx=
∫ 1
−1e−xxdx∫ 1
−1x2dx
=3(−2)
2e= −3
e= −3e−1
c =
∫ 1
−1e−xϕ2(x)dx∫ 1
−1ϕ2
2(x)dx=
∫ 1
−1e−x(x2 − 1
3 )dx∫ 1
−1(x2 − 1
3 )dx =
154
(e− 7e−1)
El polinomio cuadratico que minimiza la aproximacion por mınimos cuadrados es:
P2(x) = aϕ0(x) + bϕ1(x) + cϕ2(x)
= 12 (e− e−1)ϕ0(x)− 3e−1ϕ1(x) + 15
4 (e− 7e−1)ϕ2(x)
En el grafico, se muestra la funcion y su aproximacion : El error es 0,001440569656, luego ||e−x−P2(x)||2 = 0,3795483706e−1
99
Figura 11: f(x) = e−x
Ejemplo 9.8 Encontrar las aproximaciones por mınimos cuadrados ay(t) = t2 en (0, 1), usando polinomios de Legendre de grado 1.Sol.
1) El polinomio de Legendre de grado 0 es P0(x) = 1 y P1(x) = x
2) Transformacion del intervalo (0, 1) a (−1, 1).
Consideremos la recta x = at+ b, si t = 0 ⇒ x = −1 ⇒ b = −1
luego x = at− 1 y si t = 1 ⇒ x = 1 ⇒ a = 2
luego, la recta de transformacion es x = 2t− 1 t = x+12 , es decir (0, 1) ↔ (−1, 1) y
y =(x+ 1)2
4ademas P0(x) = 1 P1(x) = x
Usando (4)
ak =2k + 1
2
∫ 1
−1
y(x)Pk(x)dx
a0 =12
∫ 1
−1
(x+ 1)2
4dx =
13
a1 =32
∫ 1
−1
(x+ 1)2
4xdx =
12.
Luego,
y(x) =13P0(x) +
12P1(x) =
13
+x
2
100
y
y(t) = t− 16
Ejemplo 9.9 Dada f(x) = e−2x en [1, 3]. Determinar la mejor aproximacion ag(x) = a+ bx2 + cx4.
Sol. La base {1, x2, x4} genera el subespacio G ≤ E, consideremos g ∈ G , f ∈ E y recordemosque
Ejemplo 9.11 Ilustrativo. Sea f(x) = e−2x con x ∈ [1, 3] encontrar la mejor aproximacion a f(x)
i) respecto de la base β = {x, 3x2 + 1} con w(x) = 1 en || · ||2.
ii) respecto de la base β∗ = {x+ 1, x2} con w(x) = e−x en || · ||∞.
Sol. i) Nuestro proposito es encontrar g(x) =∑〈f(x), gi(x)〉gi(x). Para ello
Se debe ortonormalizar, para obtener g1(x) y g2(x) respecto a β = {v1(x) = x, v2(x) =3x2 + 1}
103
g1(x) =v1(x)
||v1(x)||2, y
||v1(x)||22 = 〈v1(x), v1(x)〉 =∫ 3
1
1 · (v1(x))2dx =∫ 3
1
x2dx =x3
3|31 =
263
de donde, ||v1(x)||2 =√
263 y
g1(x) =x√263
=
√326x
g2(x) =w2(x)
||w2(x)||2, donde w2(x) = v2(x)− 〈v2(x), g1(x)〉g1(x)
〈v2(x), g1(x)〉 =∫ 3
1
(3x2 + 1)
√326xdx = 21,74
Luego, w2(x) = (3x2+1)−21,74√
326x es ortonormal a g1(x), perono necesariamente unitario.
Falta determinar
||w2(x)||22 =∫ 3
1
(w2(x))2dx =∫ 3
1
[(3x2 + 1)− 21,74
√326x]2dx = 16,98
Luego, ||w2(x)||2 =√
16,98 y
g2(x) =(3x2 + 1)− 21,74
√326x
4,12
Luego, β∗ = {g1(x), g2(x)} es ortonormal segun la norma || · ||2 y la mejor aproximacion es
g(x) = 〈f(x), g1(x)〉g1(x) + 〈f(x), g2(x)〉g2(x)
y
〈f(x), g1(x)〉 =∫ 3
1e−2x
√326xdx = 0,033
〈f(x), g2(x)〉 =∫ 3
1e−2x
(3x2 + 1)− 21,74√
326x
4,12xdx = 0,045
,
entonces la mejor aproximacion es:
g(x) = 0,033
√326x− 0,045
(3x2 + 1)− 21,74√
326x
4,12
104
Modulo N◦ 10
Profesores : Marıa Angelica Vega U.Erklarungen: Zusammengestohlen aus Verschiedenem diesem und jenem
Ludwig van Beethoven.
10. Aproximacion Minimax.
10.0.4. Caso Discreto.
Problema Este problema no es directo como el metodo de mınimos cuadrados. Por ejemplo siqueremos encontrar el polinomio minimax P1(x) = a0 + a1x que aproxima a f(x) = x
12 en un
intervalo [ 14 , 1]
E = mın[a0,a1]
max14≤x≤1
|x 12 − (a0 + a1x)|
La mejor lınea recta es aquella para la cual el error maximo ocurre en x = 14 , x = 1 y en algun
punto interior x = ξ. Entoncesa0 + a1
4 − ( 14 )
12 = E
a0 + a1ξ − ξ12 = −E
a0 + a1 − 1 = E.
Observamos que hay 3 ecuaciones y 4 incognitas, a0, a1, E y ξ. La cuarta ecuacion se obtiene delhecho que la derivada es cero en x = ξ para el error E = f(x)− (a0 + a1x). Es decir,
12ξ−
12 − b = 0
Ya que E en x = ξ
a0 + a14 − ( 1
4 )12 = E
a0 + a1 − 1 = E.
De aquı,
b =23, ξ =
916
, a =1748
, E =148
Luego la mejor aproximacion es y(x) =1748
+23x, que aproxima con un error no mejor que
148.
10.1. Algoritmo de Remez.
Permite construir aproximaciones minimax, debido al mate´matico ucraniano E.Ya. Remez.Algoritmo de Remez Calcula iterativamente el polinomio minimax p ∈ Pn, para f ∈ C[a, b] enun conjunto de (n+2) puntos. La sucesion de polinomios p converge al polinomio minimax p∗ ∈ Pn
y la sucesion de conjuntos X converge a X∗ sobre el cual f − p∗ es equioscilante.
105
Paso 1. Escoger un conjunto X = {x1, x2, ..., xn+2}.
Paso 2. Resolver el sistema de ecuaciones lineales,
f(xi)− p(xi = (−1)ie , 1 ≤ i ≤ n+ 2 (191)
para determinar un numero real e y un polinomio p ∈ Pn.
Paso 3. Cambiar el conjunto X, de la siguiente manera:
• Cuando [a, b] es [−1, 1], una forma comun de elegir el conjunto X en paso 1 es el con-junto de puntos extremos de Tn+1. Para este conjunto inicial, el paso 2 da el polinomiominimax inmediatamente cuando f(x) = xn+1. En el caso general las ecuaciones linealesdel paso 2 siempre tienen una unica solucion.
• Para llevar a cabo el paso 3, necesitamos primero estimar ||f − p||∞ , donde p ∈ Pn esel polinomio que ha sido calculado en el paso 2.
• Si ||f − p||∞ es suficientemente cercana a |e| entonces por teorema 4.3 p es proximo alpolinomio minimax y terminamos el proceso iterativo.
• De otra forma, sea ξ un punto tal que
|f(ξ)− p(ξ)| = ||f − p||∞.
Incluimos el punto ξ en el conjunto X y borramos uno de los puntos existentes de modoque f − p tenga signos alternados sobre los (n+ 2) puntos de X.
• Si ξ esta entre a y x1, descartamos x1 o xn+2 y anaalogamente si ξ esta entre xn+2 y b,descartamos x1 o xn+2. De otra forma, ξ esta entre dos xi consecutivos y en este casodescartamos uno de ellos apropiadamente.
Ejemplo 10.1 Encontrar el polinomio minimax de grado 2, para f(x) = ( 38x+ 5
8 )12 en [−1, 1].
Sol. Escogemos X = {−1,−0,5, 0,5, 1} inicialmente, los puntos extremos de T3 y resolvemos elsistema de ecuaciones lineales (??) de donde obtenemos:
con 5 cifras decimales.Evaluando f − p en intervalos intervalos de 0,01, encontramos que hay maximo y mınimo local en−1 , −0,61 , 0,40 y 1 y f − p tiene signos alternados en estos puntos, los que tomamos como elnuevo conjunto X. Resolviendo el sistema(??) nos da otra vez
Recordemos que, p ∈ Pn es una mejor aproximacion de f ∈ C con respecto a una normadada si
||f − g|| = infq∈Pn
||f − g||
Las aproximaciones con respecto a la norma infinito se denominan aproximacionesminimax, porque es la mejor aproximacion que minimiza el error maximo ||f −q||∞ ∀q ∈ Pn
Problema 10.1 i) Determinar ||√x||2.
ii) Hallar un polinomio g(x) = a0 + a1x ortogonal a f(x) = 1.
iii) Encontrar el polinomio minimax para f(x) =√
1 + x2 en [0, 1].Sol.
i)
||√x||2 = 〈
√x,√x〉 =
∫ e
1
x ln |x|dx =e2
2− e2
4+
14.
ii)
g(x)⊥f(x) ⇔ 〈g(x), f(x)〉 = 0
⇔ 〈a0 + a1x, 1)〉 = 0 ⇔ 〈a0, 1〉+ a1〈x, 1〉 = 0
⇔∫ e
1a0 · 1 · ln |x|dx+ a1
∫ e
1x · 1 · ln |x|dx = 0
⇔ a0
∫ e
1ln |x|dx+ a1
∫ e
1x ln |x|dx = 0
⇔ a0 + a1
(e2
2− e2
4+
14
)= 0
107
Tenemos infinitas soluciones. En terminos de a0,
a0 = −a1
(e2
2− e2
4+
14
)⇒ a0 = a1
(e2
4− e2
2− 1
4
),
luego g(x) = a1
(e2
4− e2
2− 1
4
)+ a1x es ortogonal a 1.
iii) Polinomio minimax. De (??).
a1 =f(1)− f(0)
1=√
2− 1
a0 =1 + f(c)
2− (√
2− 1)( c
2
)donce c es tal que, f ′(c) = a1
f ′(x) =x√
1 + x2⇒ f ′(c) =
c√1 + c2
luego,c√
1 + c2=√
2− 1 ⇒ c√1 + c2
= 0,42 ⇒ c = 0,455 ⇒ f(c) = 1,0986
luego,
a0 =(
1 + 1,09862
)− (√
2− 1)(
1,09862
)= 0,955
Por tanto, la aproximacion minimax lineal a f(x) en [0, 1] es:
P1(x) = 0,955 + (√
2− 1)x.
Observacion 10.1 Observamos que puede haber mas de una mejor aproximacion a f .Determinar la mejor aproximacion polinomial a f ∈ L∞[a, b] equivale a resolver elproblema : ”minimizar max |f(x) − pn(x)| si x ∈ [a, b] y pn ∈ Πn”, es decir, se debedeterminar el polinomio de grado ≤ n que minimiza el valor maximo de |f(x)− pn(x)|.
Proposicion 10.1 Existe una unica mejor aproximacion que resuelve el problema mıni-max.
Teorema 10.1 (Teorema de la alternancia para polinomios) Para cualquier funcionf(x) ∈ C[a, b] existe una unica mejor aproximacion polinomial mınimax pn(x) queesta caracterizada por la propiedad alternante de que hay (a lo menos) n+2 puntos en[a, b] en los cuales f(x)− pn(x) obtiene sus valores maximos absolutos (nominalmente||f − pn||∞) con signos alternados.
108
Este teorema se atribuye a Tchebyshev. Pero Borel (1905) establecio que la condicionde alternancia es una condicion necesaria y suficiente y que existe solo un polinomioque cumple con dicha caracterizacion
Ejemplo 10.2 La funcion f(x) = x2 se aproxima por f∗ = p1(x) = x − 0,125 en [0, 1].Entonces, el error f(x) − p1(x) = x2 − x + 0,125 tiene un valor maximo absoluto enlos puntos 0, 0,5 y 1 y alcanza los valores 0,125,−0,125, 0,125 que tienen signos alterna-dos. Por lo tanto, es la unica aproximacion mınimax. La grafica de la funcion y laaproximacion es:
Figura 12: f(x) = x2
109
10.2. Propiedad mınimax de los polinomios de Tchebyshev
Los polinomios de Tchebyshev, Tn(x) con x = cosθ tiene (n+1) valores extremos en lospuntos x = yk = cos
(kπn
)con k = 0, 1, 2, ..., n
Proposicion 10.2 Los polinomios de Tchebyshev alcanzan su valor maximo en mag-nitud igual a 1 en [−1, 1] en los (n + 1) puntos x = yk = cos
(kπn
)con k = 0, 1, 2, ..., n y
presenta signos alternados en dichos puntos.
La proposicion evoca el teorema de la alternancia y se puede aplicar de la siguienteforma:
Sea f(x) = xn y sea pn−1(x) su aproximacion polinomial mınimax de grado n−1 enel intervalo [−1, 1]. Por el teorema de la alternancia f(x)− pn−1(x) = xn − pn−1(x),debe tener dicha propiedad en n+ 1 puntos.
El coeficiente principal de Tn(x) es 2n−1 de modo que 21−nTn(x) es de la mismaforma que f(x)−pn−1(x) = xn−pn−1(x) y con la misma propiedad de la alternancia.
Se sigue de lo anterior que
xn − pn−1(x) = 21−nTn(x)
Claramente 21−nTn(x) es un polinomio monico de grado n. Del Teorema de la alter-nancia y de lo anterior es el siguiente corolario.
Corolario 10.1 La aproximacion polinomial mınimax de grado n− 1 a la funcion
f(x) = xn en [−1, 1] es pn−1(x) = 21−nTn(x)
Corolario 10.2 (Propiedad mınimax de Tn(x) ) La aproximacion polinomial mınimaxen [−1, 1] mediante un polinomio monico de grado n a la funcion cero es 21−nTn(x)
Ejemplo 10.3 . La aproximacion mınimax a la funcion cero en [−1, 1], mediante unpolinomio monico de grado 4 es,
2−3T4(x) = 2−3(8x4 − 8x2 + 1) = x4 − x2 + 0,125
Este polinomio tiene la propiedad de la alternancia y tiene valores extremos0,125 , −0,125 , 0,125 , −0,125 y 0,125 respectivamente, en los cinco puntos dados por
yk = cosπ
4, k = 0, 1, 2, 3, 4
De aquı,
yk = 1 ,1√(2)
, 0 , − 1√(2)
,−1
Tambien por el corolario 1, la aproximacion mınimax por un polinomio cubico a lafuncion f(x) = x4 es p3(x) = x4 − (x4 − x2 + 0,125) = x2 − 0,125.
110
El error f(x)−p3(x) tiene la propiedad alternante en los puntos yk, obtenidos anterior-mente. Se debe destacar que x2−0,125 es una aproximacion polinomial cuadratica a lafuncion x4 en [−1, 1] y tambien presenta cinco extremos. El teorema de la alternanciase cumple en n+ 3 puntos.
El teorema senala que la alternancia de los signos se cumple para a lo menos n + 2puntos.
Si el intervalo de aproximacion es [0, 1] en vez de [−1, 1], se debe redefinir los polinomiosde Tchebyshev a dicho intervalo. Estos polinomios trasladados se denotan por T ∗n(x) ysu recorrido es [0, 1]. Para obtener T ∗n(x) a partir de Tn(x) se debe efectuar un cambiode intervalo, usando la transformacion:
s = 2x− 1 o bien x =12(1 + s) , x ∈ [0, 1] , s ∈ [−1, 1]
Se obtiene:T ∗n(x) = Tn(s) = Tn(2x− 1)
Luego:
T ∗0 (x) = 1 , T ∗1 (x) = x , T ∗2 (x) = 8x2 − 8x+ 1 , T ∗3 (x) = 32x3 − 48x2 + 18x− 1
y ası sucesivamente. En general el polinomio monico de aproximacion mınimax degrado n a cero es
21−2nT ∗n(x)
Por ejemplo el polinomio de aproximacion mınimax de grado dos a la funcion cero en[0, 1] es:
2−3T ∗2 (x) = 2−3(8x2 − 8x+ 1) = x2 − x+ 0,125
Ejemplo 10.4 Ilustrativo.(Aproximacion Minimax en una base ortonormal.)
Sea f(x) = e−2x con x ∈ [1, 3] encontrar la mejor aproximacion a f(x) respecto de labase β∗ = {x+ 1, x2} con w(x) = e−x en || · ||∞.Sol.
Se debe ortonormalizar, para obtener g1(x) y g2(x) respecto a β∗.
g1(x) =v1(x)
||v1(x)||∞=
x+ 1||v1(x)||∞
, y
||v1(x)||∞ = maxx∈[1,3]
|v1(x)| = 4 ⇒ g1(x) =x+ 1
4
g2(x) =w2(x)
||w2(x)||∞, donde w2(x) = v2(x)− 〈v2(x), g1(x)〉g1(x)⊥g1(x)
〈v2(x), g1(x)〉 =∫ 3
1
exx2x+ 14
dx =174e3 +
14e = 86,04
111
Luego, w2(x) = x2 − 86,04x+ 1
4.
Falta determinar
||w2(x)||∞ = maxx∈[1,3]
|w2(x)| = maxx∈[1,3]
|x2 − 86,04x
4− 86,04
4|
Sea p2(x) = x2 − 86,04x
4− 86,04
4entonces
p′2(x) = 2x− 86,044
= 0 ⇒ x = 10,755
p′′2(10,755) > 0 ⇒ (10,755, f(10,755) es un mınimo. El maximo se alcanza en x = 1.Luego
||w2(x)||∞ = |1− 86,044
− 86,044
| = 42
y
g2(x) =x2 − 86,04
x+ 14
42
Luego, la mejor aproximacion es
g(x) = 〈f(x), g1(x)〉g1(x) + 〈f(x), g2(x)〉g2(x)
〈f(x), g1(x)〉 =∫ 3
1e−2xexx+ 1
4dx = 0,21
〈f(x), g2(x)〉 =∫ 3
1e−2xex
x2 − 86,04x+14
42dx = −0,41
entonces la mejor aproximacion es:
g(x) = 0,21x+ 1
4x− 0,41
(x2 − 86,04x+1
4
42
)
112
10.3. Potencias de xn en terminos de {Tn(x)}
Se puede demostrar que:
xn = 21−n
k=[n2 ]∑
k=0
(nk
)Tn−2k(x). (194)
donde [m] representa la parte entera de m y senala que el k-esimo termino de la sumadebe dividirse por dos si n es par y k = n
2 .
Ejemplo 10.5 Ilustrar para el caso n = 4. En efecto, tenemos
x4 = 2−3∑2
k=0
(4k
)T4−2k(x)
= 2−3[T4(x) +(
41
)T2(x) + 1
2
(42
)T0(x)
= 18T4(x) + 1
2T2(x) + 38T0 = (x)
Esto ultimo se usa en la Economizacion de Tchebyshev cuando una funcion se aproxi-ma por Taylor (Maclaurin) hasta un cierto grado y se rebaja dicho grado manteniendoun cierto orden de exactitud.
Ejemplo 10.6 f(x) = e(x) en [−1, 1], con un error tolerable de 0,05, reemplazando eltermino del desarrollo que contiene a x4 por los polinomios de Tchebyshev de gradomenor o igual a 4.
113
Metodo de Diferencias Finitas
Prof: Marıa Angelica Vega U.
Modulo 12
12. Resolucion Numerica del Problema de Valor
de Contorno de orden 2.
Hemos visto dos metodos para determinar la solucion particular yp de la
solucion general de una ecuacion diferencial no homogenea con coeficientes
constantes y = yc + yp. Ambos metodos tienen sus ventajas y desventajas,
ademas de no ser aplicables para cualquier expresion de g(x).
El metodo que analizaremos ahora denominado Metodo de diferen-
cias finitas, tiene la ventaja de ser aplicable a cualquier problema de con-
torno, desde no lineal a ecuaciones diferenciales parciales para las que no
siempre existe un metodo analıtico para determinar su solucion, pero tiene la
desventaja de dar un valor aproximado de la solucion exacta en algunos pun-
tos del dominio de definicion de la solucion que son elegidos por el usuario.
Problema. Se trata de resolver el siguiente Problema de Valor de Con-
196
torno (P.V.C)
y′′(x) = P (x)y′(x) +Q(x)y(x) + r(x) , 0 ≤ x ≤ 1
y(0) = 0.
y(1) = 0.
(211)
con P (x), Q(x), r(x), funciones continuas en un intervalo abierto I.
Observemos que en el problema (211), la ecuacion diferencial es no ho-
mogenea con coeficientes variables.
12.1. Metodo de diferencias finitas.
Este metodo consiste en
Dividir el intervalo [0, 1] en N + 1 subintervalos de igual longitud, de
modo que:
xi = i · h , i = 0, 1, · · · , N + 1 (212)
donde,
h =1
N + 1
En cada nodo xi, se aproximan las derivadas de la ecuacion:
y′′(xi) = P (xi)y′(xi) +Q(xi)y(xi) + r(xi) , i = 0, 1, · · · , N + 1.
(213)
197
Existen varias formas de aproximar las derivadas, pero es recomend-
able usar diferencias centradas , puesto que resulatan aproximaciones
mejores,
y′′(xi) =y(xi+1)− 2y(xi) + y(xi−1)
h2
y′(xi) =y(xi+1)− y(xi−1)
2h.
(214)
Reemplazamos las expresiones de (214) en (213), simplificamos la no-
tacion escribiendo yi en lugar de y(xi) y reordenamos los terminos de
la ecuacion en la siguiente forma :
−r(xi)h2 = −(
1 +h
2p(xi)
)yi−1+(2+h2Q(xi))yi−
(1− h
2p(xi)
)yi+1 , i = 1, · · · , N.
(215)
Observacion 12.1 Observemos que (215) es un sistema de ecua-
ciones lineales, cuyas incognitas son los valores de la solucion aproxi-
mada evaluada en los siguientes puntos (extremos de intervalos),
xi , i = 1, · · · , N.
Ejemplo 12.1 Use el metodo de diferencias finitas para resolver el
(P.V.C.):
y′′ =−2t
(y′ − 2) , y(12) = 3 , y(1) = 3
198
Solucion. Notemos que en esta ecuacion P (t) =−2t, Q(t) = 0 , r(t) =
4t.
La ecuacion (215) en forma discreta queda,
−(
2− 2h
ti
)yi−1 − (4 + 2h2 · 0)yi +
(2 + 2
h
ti
)yi+1 =
8h2
ti, i = 1, · · · , N.
(216)
Si tomamos h = 0,1, tenemos que t0 = 0,5 , t1 = 0,6 , t2 = 0,7 , t3 = 0,8 y
t4 = 0,9 , t5 = 1,0. Sustituimos en (216) y obtenemos el sistema matricial :
−473
0 0
127
−4167
0
074
−494
0 0169
−4
;
y1
y2
y3
y4
=
860− 2(
56) · 3
870880
890− 2(
109
) · 3
=
−7315435110
−26945
.
(217)
De aquı la solucion aproximada es,
y1 =4315
, y2 =167, y3 =
5720
, y4 =26290
Actividades 12.1
Escriba el sistema de ecuaciones (215) en la forma matricial Ay = b
Dado el P.V.C.
y′′ + y + x = 0 , 0 < x < 1 con
y(0) = y(1) = 0.
• Determine la solucion exacta del problema.
199
• Use el metodo de diferencias finitas, con N=3, para obtener una
solucion aproximada del problema.
Resuelva el P.V.C.
y′′ = −3y′ + 2y + 2x+ 3 , 0 < x < 1 con
y(0) = 2.
y(1) = 1.
use h=0.25 y compare los resultados con la solucion exacta.
200
Metodos Numericos para resolver Ecuaciones Diferenciales
Parciales.
Prof. Marıa Angelica Vega U.
Modulo 14
Observacion 15.2 Este tema ha sido desarrollado, usando el texto Metodos
Numericos para Ingenieros. Steven C. Chapra - Raymond P.Canale
16. Ecuaciones elıpticas.
Se usan para caracterizar problemas en estado estacionario con valores
en la frontera.
16.1. La ecuacion de Laplace
La ecuacion de Laplace, se utiliza para modelar diversos problemas que
tienen que ver con el potencial de una variable desconocida. Se usara una
placa calentada para deducir y resolver esta EDP elıptica. En la figura se
muestra la placa y un elemento sobre la cara de una placa rectangular del-
gada de espezor 4z. La placa esta totalmente aislada excepto en sus ex-
tremos, donde la temperatura puede ajustarse a un nivel preestablecido. El
aislamiento y el espesor de la placa permiten que la transferencia de calor
222
Figura 12: Placa delgada de espesor 4z
esta limitada solamente a las dimensiones de x y y. En estado estacionario el
flujo de calor hacia el elemento en una unidad de tiempo 4t debe ser igual