-
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
Fundada en 1551
FACULTAD DE CIENCIAS MATEMÁTICAS
E.A.P. DE INVESTIGACIÓN OPERATIVA
“LAS REDES NEURONALES ARTIFICIALES Y SU IMPORTANCIA COMO
HERRAMIENTA EN LA TOMA DE DECISIONES”
TRABAJO DE INVESTIGACIÓN
Para optar el Título Profesional de:
LICENCIADA EN INVESTIGACIÓN OPERATIVA
AUTORA
MARÍA DEL ROSARIO VILLANUEVA ESPINOZA
LIMA – PERÚ 2002
-
A mis hijos, David y Claudia
-
Agradecimientos
El desarrollo de esta monografía ha sido posible gracias al
estímulo constante
brindado por el Lic. Jaime Alcalde Ch., quien sugirió el tema
básico sobre el que se ha
elaborado el presente trabajo.
Tratándose de un tema sobre el que hay muy pocas experiencia
locales, considero
especialmente importante expresar mi agradecimiento al Ing.
Antonio Morán, Jefe de
la Carrera de Ingeniería Electrónica de la Universidad Peruana
de Ciencias Aplicadas,
que con su basta experiencia en el desarrollo de redes
neuronales artificiales me
orientó en repetidas ocasiones para la construcción de la red
que soporta el caso
práctico incluido en este trabajo.
Asimismo, mi agradecimiento a la Dra. Ana Maria Villanueva
Espinoza, perinatóloga
del Instituto Peruano de Seguridad Social, que me brindó los
datos necesarios para el
desarrollo de la aplicación, y a quien corresponde la definición
de su objetivo e
interpretación de los resultados con ella obtenidos.
Por último, aunque no por eso menos importante, agradezco la
paciencia y
comprensión de mis hijos, a quienes resté atención durante las
muchas horas de
investigación que demandó la presente monografía y la
construcción de la
correspondiente red neuronal artificial.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
SUMMARY
This project describes the fundamentals of typical Artificial
Neural Networks
along with a historical evolution, which includes some of their
most important
models to date. In addition, a biological introduction is
presented that focuses
on the elements these networks try to emulate, an explanation of
each
component, and the learning algorithms implemented. There after,
a depiction
of application areas, especially in decision making support is
pointed out due to
their capability to identify and classify patterns. Finally, the
development of a
medical application: By using a commercial software, a
Backpropagation
Artificial Neural Network can assist in the detection of the
main risk factors for
babies whose mothers have a history of abortion.
KEYWORDS: - Artificial Neural Networks
- Backpropagation
- Soft Computing
- Learning Patterns
- Artificial Intelligence
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
RESUMEN
Se describen los fundamentos de las Redes Neuronales
Artificiales, y su
evolución histórica, presentando algunos de los modelos más
importantes.
Se presenta una introducción biológica, enfocada principalmente
en la
descripción de los elementos del sistema neurológico que las
redes neuronales
artificiales emulan, para luego describir cada uno de sus
componentes y los
diversos algoritmos de aprendizaje que implementan.
Se describen algunas de las áreas de aplicación, específicamente
en los
sistemas de soporte a las decisiones, aprovechando las
capacidades de
clasificación e identificación de patrones.
Por último se desarrolla un caso práctico en el área médica: una
red neuronal
para apoyo en la identificación de factores de mayor riesgo para
los hijos de
madres con antecedentes de aborto, empleando un software
comercial
emulador de redes neuronales Backpropagation.
PALABRAS CLAVE: - Redes Neuronales Artificiales
- Backpropagation
- Soft Computing
- Patrones de Aprendizaje
- Inteligencia Artificial
-
TABLA DE CONTENIDO
CAPÍTULO I I.1 INTRODUCCIÓN I.2 SURGIMIENTO Y EVOLUCIÓN I.3
REDES NEURONALES I.4 PANORAMA HISTÓRICO I.5 BREVE INTRODUCCIÓN
BIOLÓGICA
CAPÍTULO II
II.1 ESTRUCTURA DE UN SISTEMA NEURONAL ARTIFICIAL II.2
CARACTERÍSTICAS
CAPÍTULO III
III.1 ELEMENTOS DE UNA RED NEURONAL ARTIFICIAL III.1.1 La
Neurona Artificial III.1.2 Estado de Activación III.1.3 Función de
Salida o de Transferencia III.1.4 Conexiones entre Neuronas III.1.5
Función o Regla de Activación III.1.6 Regla de Aprendizaje III.1.7
Formas de Conexión entre Neuronas
CAPÍTULO IV
IV 1 TOPOLOGÍA DE LAS REDES NEURONALES IV.1.1 Redes Neuronales
Monocapa IV.1.2 Redes Neuronales Multicapa
CAPÍTULO V
V.1 ALGORITMOS NEURONALES V.1.1 El aprendizaje supervisado V.1.2
El aprendizaje no supervisado o autoorganizado
CAPÍTULO VI
VI.1 LA RED BACKPROPAGATION VI.1.1 La Regla Delta
Generalizada
CAPÍTULO VII VII.1 APLICACIONES DE LAS REDES NEURONALES
ARTIFICIALES VII.2 OPERATIVA VII.3 Listado de Aplicaciones CAPÍTULO
VIII VIII.1 CASO PRÁCTICO
Red Natural para apoyo a identificación de factores de mayor
riesgo en hijos de madres con antecedentes de aborto
-
CONCLUSIONES RECOMENDACIONES BIBLIOGRAFÍA ANEXO A VALORES DE LA
RED NEURONAL IMPORTANCIA DE CADA ENTRADA ANEXO B
GRÁFICO
ANEXO C FICHA DE DATOS
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
CAPÍTULO I
I.1 INTRODUCCIÓN
Existe actualmente una tendencia a establecer un nuevo campo de
las ciencias de la
computación que integre los diferentes métodos de resolución de
problemas que no
pueden ser descritos fácilmente mediante el enfoque algorítmico
tradicional. Todos
estos métodos se originan, de una u otra forma, en la emulación
más o menos
inteligente del comportamiento de los sistemas biológicos.
A pesar de que todavía existen discrepancias al respecto, ya se
han acuñado algunos
términos para denotar este nuevo campo: Computación Cognitiva
(Cognitive
Computing), Computación del mundo real (Real-world Computing),
Computación
Blanda (Soft Computing) , este último enfatizando su diferencia
con la computación
tradicional o Hard Computing.
Estos métodos están orientados a resolver problemas donde es
necesario manejar
información masiva, imprecisa, incierta o distorsionada propia
del mundo real (toma de
decisiones, reconocimiento de formas, habla, etc.). Algunos de
éstos son la Lógica
Borrosa o difusa (Fuzzy Logic), las Redes Neuronales
Artificiales, los Algoritmos
genéticos, la Teoría del Caos y la Teoría del Aprendizaje.
Siendo todos éstos
enfoques diferentes, existe una tendencia a buscar combinaciones
entre ellos, de
manera que a cada aspecto de los problemas reales que deban ser
resueltos se le
aplica la técnica que resulta más apropiada.
El trabajo de la presente monografía está enfocado
específicamente en la metodología
de las Redes Neuronales Artificiales. Se presenta una panorámica
de esta técnica, su
evolución histórica y una descripción de las características más
significativas.
Asimismo, se describen los principales modelos de redes
neuronales, en especial el
conocido como Backpropagation, el de más amplia difusión,
empleado además para el
desarrollo del caso práctico que forma parte del presente
trabajo.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Asimismo, se brinda un alcance de las áreas de aplicación,
específicamente en los
sistemas de soporte a las decisiones, aprovechando las
capacidades de clasificación e
identificación de patrones, de mayores aplicaciones prácticas en
los procesos de
negocio que las más ampliamente conocidas de reconocimiento de
voz e imágenes.
En el capítulo I se da una panorámica histórica de la evolución
de las redes
neuronales y su relación con la inteligencia artificial.
Asimismo se presenta una breve
introducción biológica donde se muestra, de manera simplificada,
la forma de operar
de las neuronas y sistemas neurológicos biológicos, con el
objetivo de identificar en
ellos los elementos que son emulados mediante esta técnica.
En el capítulo II se describe la estructura de los sistemas
neuronales artificiales,
poniendo énfasis en su analogía con los sistemas neuronales
biológicos, así como las
características similares al cerebro con las que cuenta debido a
su constitución y
fundamentos (como el procesamiento paralelo y el aprendizaje
adaptativo).
El capítulo III detalla cada uno de los elementos de una red
neuronal artificial: la
neurona artificial, las diferentes funciones de salida o
transferencia, el estado de
activación, regla de activación, conexiones y reglas de
aprendizaje.
El capítulo IV describe las distintas topologías o arquitecturas
de redes neuronales. Se
incluyen dos cuadros que muestra estos aspectos de las redes
monocapa y multicapa
más conocidas.
El capítulo V describe los diferentes algoritmos neuronales de
aprendizaje supervisado
y no supervisado. A continuación (capítulo VI) se detalla la red
Backpropagation, que
toma su nombre del algoritmo de aprendizaje que implementa, y es
la más
ampliamente utilizada en la actualidad.
Por último, los capítulos VII y VIII se dedican a las
aplicaciones prácticas de esta
técnica. En el capítulo VII se muestra una lista de ejemplos de
aplicaciones por
disciplinas: empresa, medio ambiente, biología, medicina,
manufactura, etc., mientras
que el capítulo VIII se dedica al caso práctico desarrollado
para la identificación de los
factores de mayor impacto en las condiciones al nacer de los
hijos de las madres con
antecedente de abortos.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
I.2 SURGIMIENTO Y EVOLUCIÓN
Las redes neuronales son una rama de la Inteligencia Artificial.
En las redes
neuronales el conocimiento se incorpora mediante el aprendizaje
a partir de
ejemplos.
Las redes neuronales artificiales son ampliamente utilizadas en
la actualidad por
ejemplo para el escaneo de imágenes, reconocimiento de patrones,
problemas de
optimización, clasificación de datos financieros, apoyo al
diagnóstico médico, etc.
Un computador convencional es una máquina que ejecuta una serie
de instrucciones
de forma secuencial, siendo capaz de realizar complicadas
operaciones lógicas y
aritméticas de una forma muy rápida, mucho más que el cerebro
humano.
Pese a ello, existen tareas sencillas como el reconocimiento de
patrones, que ni los
grandes supercomputadores son capaces de resolver de un modo
eficiente, mientras
que el cerebro lo viene haciendo desde hace millones de años con
suma facilidad y
eficiencia.
Por esta razón, algunos científicos han vuelto la vista hacia el
cerebro tratando de
estudiarlo desde el punto de vista de la computación. La
estructura del cerebro es
radicalmente diferente a la del computador convencional. No está
compuesto por un
único microprocesador altamente complejo y eficiente, sino por
miles de millones de
ellos, las neuronas, que realizan de modo impreciso y
relativamente lento un tipo de
cálculo muy simple.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Cerebro Computador
Velocidad de Proceso = 10-2 seg. (100 Hz) =10-9 seg. (1000
MHz)
Estilo de Procesamiento paralelo Secuencial
Número de Procesadores 10 11 - 1014 Pocos
Conexiones 10,000 por procesador Pocas
Almacenamiento del conocimiento Distribuido Direcciones
fijas
Tolerancia a fallos amplia Nula
Tipo de control del proceso Auto organizado centralizado
Tabla: Cerebro frente a computador convencional Von Neumann
(Martín del Brío,
Sanz Molina. 2002)
En este proceso del pensamiento científico surgieron los
sistemas neuronales
artificiales, con la idea de tomar las características
esenciales de la estructura
neuronal del cerebro para crear sistemas que lo emularan en
parte, mediante sistemas
electrónicos. Estos sistemas están compuestos por multitud de
pequeños
procesadores simples, a los que se denomina neuronas
artificiales.
Con las redes neuronales se intenta expresar la solución de
problemas complejos, no
como una secuencia de pasos, sino como la evolución de unos
sistemas de
computación inspirados en el funcionamiento del cerebro humano,
y dotados por tanto
de cierta “inteligencia”, los cuales no son sino la combinación
de una gran cantidad de
elementos simples de proceso (neuronas) interconectados que,
operando de forma
masivamente paralela, consiguen resolver problemas relacionados
con el
reconocimiento de formas o patrones, predicción, codificación,
clasificación, control y
optimización.
Aunque existen computadores neuronales, con cientos de
pequeños
microprocesadores que trabajan en paralelo, lo cierto es que
mediante software se
puede emular el comportamiento de estas redes neuronales en un
computador
convencional y existen multitud de programas de redes neuronales
que funcionan
incluso en un computador personal.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Las redes neuronales operan sobre la base de reconocimiento de
patrones, y pueden
adquirir, almacenar y utilizar conocimiento experimental,
obtenido a partir de ejemplos.
Esta forma de adquirir el conocimiento es una de sus
características más destacables:
no se programa de forma directa, como en los sistemas expertos,
sino que se adquiere
a partir de ejemplos, por ajuste de parámetros de las neuronas
mediante un algoritmo
de aprendizaje.
En cuanto al modo interno de trabajo las redes neuronales son
modelos matemáticos
multivariantes que utilizan procedimientos iterativos, en
general para minimizar
funciones de error.
DIFERENCIA CON LOS SISTEMAS EXPERTOS
Las redes neuronales se asemejan a los sistemas expertos en
cuanto al objetivo de
representar el conocimiento pero son radicalmente opuestos en
cómo aspiran a
conseguirlo. Los sistemas expertos se acercan más al
razonamiento deductivo -
obtener reglas- y las redes neuronales al inductivo -aprendizaje
mediante ejemplos-.
La gestión empresarial utiliza frecuentemente ambos esquemas de
razonamiento, por
lo que ambas técnicas tienen cabida. Además, ambos modelos son
perfectamente
compatibles, de forma que se pueden integrar en un único
sistema.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
I.3 REDES NEURONALES E INTELIGENCIA ARTIFICIAL
REDES DE AUTOPROCESO:
INTELIGENCIA ARTIFICIAL
REDES DE AUTOPROCESO
PROCESAMIENTO NUMÉRICO
PROCESAMIENTO SIMBÓLICO
SISTEMAS ASOCIATIVOS
SISTEMAS DISTRIBUIDOS
REDES NEURONALES
REDES SUBSIMBÓLICAS
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Formadas por nodos en los que hay elementos procesadores de
información de cuyas
interacciones locales depende el comportamiento del sistema.
a) PROCESAMIENTO NUMÉRICO:
Reciben la señal de entrada desde el exterior y operan sobre
ella. Son sistemas
constituidos por nodos de hardware interconectados formando una
red. También se
conocen como sistemas conectivistas o conexionistas.
SISTEMAS DISTRIBUIDOS:
La conexión entre los nodos se realiza de forma global, bajo
unas reglas de
composición.
SISTEMAS ASOCIATIVOS:
La conexión se realiza agrupando el sistema en subredes. También
se conocen como
redes de redes.
REDES SUBSIMBÓLICAS:
Las agrupaciones locales de los nodos representan conceptos.
REDES NEURONALES
Cada nodo de la red funciona corporativamente. Cada nodo es una
neurona.
b) PROCESAMIENTO SIMBÓLICO:
Estas redes están constituidas por conceptos (nodos) y por
reglas sintácticas (lazos de
interconexión). Ambas forman las llamadas bases de conocimiento.
La simulación de
estas redes es casi exclusivamente software.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
TABLA: FORMAS BÁSICAS DE COMPUTACIÓN
Computación Convencional
Computación Simbólica Computación Neuronal
Basado en: Arquitectura Von Neumann Lógica cognitiva
Neurobiología
Apropiada para:
Algoritmos conocidos Heurística Adaptación
Pero no para: Condiciones difusas Causalidad desconocida
Cálculos precisos
Memoria: Precisa, estática Bases de conocimiento Distribuida
Construida mediante:
Diseño, programación y prueba
Representación del conocimiento + motor de inferencia
Configuración y aprendizaje
Soporte: Computadores secuenciales Máquinas LISP Procesadores
paralelos
Tabla: Formas básicas de Computación (Martín del Brío, Sanz
Molina. 2002)
I.4 PANORAMA HISTÓRICO
Las primeras explicaciones teóricas sobre el cerebro y el
pensamiento fueron dadas
por algunos antiguos filósofos griegos, como Platón (427-347
a.C) y Aristóteles (384-
422 a.C). Las mismas ideas sobre el proceso mental las mantuvo
Descartes (1596-
1650) y los filósofos empiristas del siglo X.
La clase de las llamadas máquinas cibernéticas, a la cual la
computación neuronal
pertenece, tiene más historia de la que generalmente se cree:
Heron el Alejandrino
construyó un autómata hidráulico sobre el año 100 a.C
Alan Turing en 1936 fue el primero en estudiar el cerebro como
una forma de ver la
computación; sin embargo los primeros teóricos que concibieron
los fundamentos de la
computación neuronal fueron Warren McCulloch, un neurofisiólogo,
y Walter Pitts, un
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
matemático, quienes en 1943 lanzaron una teoría sobre la forma
de trabajar de las
neuronas. Ellos modelaron una red neuronal simple mediante
circuitos eléctricos.
En 1957, Frank Rosenblatt comenzó el desarrollo del Perceptrón.
Esta es la más
antigua red neuronal, y se usa hoy en día de varias formas para
aplicaciones como de
reconocimiento de patrones. Este modelo era capaz de
generalizar, es decir, después
de haber aprendido una serie de patrones era capaz de reconocer
otros similares,
aunque no se hubieran presentado anteriormente.
En 1959, Bernard Widrow y Marcial Of., de Stanford,
desarrollaron el modelo
ADALINE (Adaptative LINear Elements). Esta fue la primera red
neuronal aplicada a
un problema real (filtros adaptativos para eliminar ecos en las
líneas telefónicas), y se
ha usado comercialmente durante décadas desde entonces.
En 1967, Stephen Grossberg (Universidad de Boston) desarrolló la
red Avalancha,
que consistía en elementos discretos con actividad que varía con
el tiempo, que
satisface ecuaciones diferenciales continuas para resolver
actividades tales como
reconocimiento continuo del habla y aprendizaje del movimiento
de los brazos de un
robot.
James Anderson desarrolló en 1977 un modelo lineal, llamado
Asociador Lineal, que
consistía en unos elementos integradores lineales (neuronal) que
sumaban sus
entradas. Este modelo se basa en el principio de que las
conexiones entre neuronas
son reforzadas cada vez que están activadas. Anderson diseñó una
potente extensión
del Asociador Lineal, llamada Brain-State-in-a-box.
En Japón, Kunihiko Fukushima publicó en 1980 el desarrollo del
Neocognitrón, un
modelo de red neuronal para el reconocimiento de patrones
visuales.
En 1982, John Hopfield presentó un trabajo en el que describe
con claridad y rigor
matemático una red que lleva su nombre, que es una variación del
Asociador Lineal.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
I.5 BREVE INTRODUCCIÓN BIOLÓGICA
Figura: Estructura de una neurona típica
El sistema nervioso está compuesto por una red de células
(neuronas), ampliamente
interconectadas entre sí. En las neuronas, la información fluye
desde las dendritas
hacia el axón, atravesando el soma. Se estima que el sistema
nervioso contiene
alrededor de cien mil millones de neuronas.
Desde un punto de vista funcional, las neuronas constituyen
procesadores de
información sencillos. Posee un canal de entrada de información
(las dendritas), un
órgano de cómputo (el soma), y un canal de salida (el axón). En
las interneuronas el
axón envía la información a otras neuronas, mientras que en las
neuronas motoras lo
hace directamente al músculo. Existe otro tipo de neuronas, las
receptoras o
sensoras, que reciben la información directamente del exterior.
Se calcula que una
neurona de la corteza cerebral recibe información, por término
medio, de unas 10,000
neuronas (convergencia) y envía impulsos a varios cientos de
ellas (divergencia).
En el cerebro se aprecia la existencia de una organización
horizontal en capas (se
suelen señalar unas seis capas), coexistiendo además una
organización vertical en
forma de columnas de neuronas. Hay además grupos neuronales,
compuestos de
millones de neuronas pertenecientes a una determinada región del
cerebro, que
constituyen unidades funcionales especializadas en ciertas
tareas (un área visual, un
área auditiva, etc.). Todos los subsistemas juntos forman el
encéfalo. Se tiene
a: Soma b: Axón c: Dendritas
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
evidencia que el procesamiento en el sistema nervioso involucra
la actuación de
muchos de tales subsistemas, que intercambian continuamente
información.
La unión entre dos neuronas se denomina sinapsis. Se habla de
neuronas
presinápticas (que envían señales) y postsinápticas (que las
reciben). Las sinapsis
son direccionales, es decir, la información fluye siempre en un
solo sentido.
Cada neurona recibe impulsos procedentes de otras neuronas
(inputs) a través de las
dentritas, que están conectadas a las salidas de otras neuronas
por las sinapsis. Las
sinapsis, alteran la efectividad con la que la señal es
transmitida a través de un
parámetro, el peso. El aprendizaje resulta de la modificación de
estos pesos, que
unido al procesamiento de información de la neurona determinan
el mecanismo básico
de la memoria. Algunas sinapsis permiten pasar a la señal con
facilidad, mientras que
otras no. El soma de la neurona recibe todos estos inputs, y
emite una señal de salida
(output) si la entrada total supera el valor del umbral. Esta
salida se transmite a través
del axón desde donde se propaga mediante diferencias de
potencial a las dentritas de
otras neuronas
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
CAPÍTULO II
II.1 ESTRUCTURA DE UN SISTEMA NEURONAL ARTIFICIAL Los sistemas
neuronales artificiales imitan la estructura del hardware del
sistema
nervioso, con la intención de construir sistemas de
procesamiento de información
paralelos, distribuidos y adaptativos, que puedan presentar un
cierto comportamiento
“inteligente”.
Estructura jerárquica de un sistema basado en Redes Neuronales
Artificiales
Cada neurona realiza una función matemática. Las neuronas se
agrupan en capas,
constituyendo una red neuronal. Una determinada red neuronal
está confeccionada y
entrenada para llevar a cabo una labor específica. Finalmente,
una o varias redes,
más las interfaces con el entorno, conforman el sistema
global.
En las redes neuronales biológicas, las neuronas corresponden a
los elementos de
proceso. Las interconexiones se realizan por medio de las ramas
de salida (axones)
que producen un número variable de conexiones (sinapsis) con
otras neuronas o con
Σ
ENTRADAS
Parte algorítmica
SAL IDAS
Neurona Capa Red Sistema Neuronal
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
otras partes como músculos y glándulas. Las redes neuronales son
sistemas de
elementos simples de proceso muy interconectados.
La compleja operación es el resultado de abundantes lazos de
realimentación junto
con no linealidades de los elementos de proceso y cambios
adaptativos de sus
parámetros, que pueden llegar a definir fenómenos dinámicos muy
complicados.
Los modelos neuronales se diferencian en la función que
incorpora la neurona, su
organización y forma de las conexiones. Sarle (1994) compara los
modelos neuronales
con los modelos estadísticos más convencionales, encontrando que
la mayoría de los
modelos neuronales tienen un equivalente tradicional.
Formalmente, un sistema neuronal o conexionista está compuesto
de los siguientes
elementos:
• Un conjunto de procesadores elementales o neuronas
artificiales.
• Un patrón de conectividad o arquitectura.
• Una dinámica de activaciones.
• Una regla o dinámica de aprendizaje.
• El entorno donde opera.
II. 2 CARACTERÍSTICAS Debido a su constitución y fundamentos,
las redes neuronales artificiales presentan un
gran número de características similares a las del cerebro. Por
ejemplo, son capaces
de aprender de la experiencia, de generalizar de casos
anteriores a nuevos casos, de
abstraer características esenciales a partir de entradas que
presentan información
irrelevante, etc.
• Procesamiento paralelo:
Esta característica resulta esencial, como se puede deducir de
un sencillo ejemplo.
Un computador convencional tipo PC, que trabaja secuencialmente
las
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
instrucciones, emplearía varios minutos en realizar sobre una
imagen compuesta
por 256 x 256 píxeles, una sencilla tarea de tratamiento en bajo
nivel (acentual
contrastes, extraer contornos, etc.), mucho más simple que la
que lleva a cabo el
sistema visual biológico para reconocer una imagen. Un sistema
basado en 16
DSP (por ejemplo, del modelo TMS32020, clásico DSP de Texas
Instruments)
operando en paralelo emplearía un tiempo del orden de 20
milisegundos en la
misma tarea, puesto que cada uno puede operar en paralelo sobre
diferentes áreas
de la imagen.
Por otra parte, el cerebro tarda aproximadamente lo mismo para
preprocesar una
imagen compuesta por millones de píxeles (los que representan
los conos y
bastones de la retina), extraer sus rasgos característicos,
analizarla e interpretarla.
La clave reside en los miles de millones de neuronas que
intervienen en el proceso
de visión, operando en paralelo sobre la totalidad de la
imagen.
• Memoria Distribuida:
Mientras en un computador la información ocupa posiciones de
memoria bien
definidas, en los sistemas neuronales se encuentra distribuida
por las sinapsis de la
red, de modo que si una sinapsis se daña solamente perdemos una
pequeña parte
de la información.
• Aprendizaje adaptativo:
La capacidad de aprender a realizar tareas basada en un
entrenamiento o en una
experiencia inicial elimina la necesidad de elaborar modelos a
priori o de especificar
funciones de distribución de probabilidad.
Las redes neuronales son sistemas dinámicos auto adaptativos.
Son adaptables
debido a la capacidad de auto ajustarse que tienen las neuronas.
Son dinámicos,
pues son capaces de estarse adaptando constantemente a las
nuevas condiciones.
En el proceso de aprendizaje, los enlaces ponderados de las
neuronas se ajustan
de manera que se obtengan unos resultados específicos. Una red
neuronal no
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
necesita un algoritmo para resolver su problema, ya que puede
generar su propia
distribución de los pesos de los enlaces mediante el
aprendizaje.
La función del diseñador se limita a la obtención de la
arquitectura apropiada. No es
problema del diseñador el cómo la red aprenderá a discriminar,
sin embargo sí debe
desarrollar un buen algoritmo de aprendizaje que proporcione a
la red la capacidad
de discriminar mediante un entrenamiento con patrones.
• Auto organización:
Las redes neuronales utilizan su capacidad de aprendizaje
adaptativo para
organizar la información que reciben durante el aprendizaje y/o
la operación.
Mientras el aprendizaje es la modificación de cada elemento
procesal, la auto
organización consiste en la modificación de la red neuronal
completa para llevar a
cabo un objetivo específico.
Esta auto organización da lugar a la generalización: facultad de
responder
apropiadamente cuando se les presentan datos o situaciones a los
que no habían
sido expuestas anteriormente. El sistema puede generalizar la
entrada para obtener
una respuesta. Esta característica es de especial importancia
cuando se tiene que
solucionar problemas para los cuales la información de entrada
es poco clara;
permite además que el sistema dé una solución incluso cuando la
información de
entrada está especificada en forma incompleta.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
CAPÍTULO III
III. 1 ELEMENTOS DE UNA RED NEURONAL ARTIFICIAL
Las redes neuronales son modelos que intentan reproducir el
comportamiento del
cerebro. Como modelos, son una simplificación de lo que emulan,
incorporando los
elementos relevantes del sistema. Una elección adecuada de sus
características, más
una estructura conveniente, es el procedimiento convencional
utilizado para construir
redes capaces de realizar una determinada tarea.
Un modelo de red neuronal consta de dispositivos elementales de
proceso: las
neuronas. A partir de ellas se pueden generar representaciones
específicas, de modo
que un estado conjunto de ellas puede representar una letra, un
número o cualquier
objeto.
Generalmente se pueden encontrar tres tipos de neuronas:
1. Aquellas que reciben estímulos externos, relacionadas con el
aparato sensorial,
que toman la información de entrada.
2. Esta información se trasmite a ciertos elementos internos que
se ocupan de su
procesamiento. Es en las sinapsis y neuronas de este segundo
nivel donde se
genera cualquier tipo de representación interna de la
información. Puesto que no
tienen relación directa con la información de entrada ni con la
de salida, estos
elementos se denominan unidades ocultas.
3. Una vez que ha finalizado el procesamiento, la información
llega a las unidades de
salida, cuya misión es dar la respuesta del sistema.
La neurona artificial pretende emular las características de las
neuronas biológicas.
Cada neurona i-ésima está caracterizada en cualquier instante
por un valor numérico
denominado valor o estado de activación ai(t). Asociado a cada
unidad, existe una
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
función de salida fi, que transforma el estado actual de
activación en una señal de
salida, yi.
Dicha señal es enviada a través de los canales de comunicación
unidireccionales a
otras unidades de la red. En estos canales la señal se modifica
de acuerdo con la
sinapsis (el peso sináptico, wji) asociada a cada uno de ellos
según una determinada
regla. Las señales moduladas que han llegado a la unidad j-ésima
se combinan entre
ellas, generando así la entrada total, Netj,
∑=i
j jiiwyNet
Una función de activación, F, determina el nuevo estado de
activación aj (t+1) de la
neurona, teniendo en cuenta la entrada total calculada y el
anterior estado de
activación aj (t).
La dinámica que rige la actualización de los estado de las
neuronas (evolución de la
red neuronal) puede ser de dos tipos: asincrónico y sincrónico.
En el primer caso, las
neuronas evalúan su estado continuamente, según les va llegando
información, y lo
hacen de forma independiente. En el caso sincrónico, aunque la
información llega de
forma continua, los cambios se realizan simultáneamente. Los
sistemas neuronales
biológicos muy probablemente actúan de una forma mixta.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Netj F(aj(t), Netj)
= aj (t+1)
fj(aj(t+1)) = yj
yj
Neurona Uh
Neurona Ui
yi
Neurona Ug
yh
wjh
wjg
.
.
.
.
yg
wji
Neurona Uj
III. 1. 1 La Neurona Artificial Si tenemos N unidades
(neuronas), podemos ordenarlas arbitrariamente y designar la
j-ésima unidad como Uj. Su trabajo consiste únicamente en
recibir las entradas de las
neuronas vecinas y calcular un valor de salida, que es enviado a
todas las neuronas
restantes.
Es útil identificar tres tipos de unidades: entradas, salidas y
ocultas.
• Las unidades de entrada reciben señales desde el entorno.
Estas entradas (que
son entradas a la red) pueden provenir de sensores o de otros
sectores del
sistema.
• Las unidades de salida envían la señal fuera del sistema.
Estas pueden controlar
directamente potencias u otros sistemas.
• Las unidades ocultas son aquellas cuyas entradas y salidas se
encuentran dentro
del sistema, es decir, no tienen contacto con el exterior.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Se conoce como capa o nivel a un conjunto de neuronas cuyas
entradas provienen de
la misma fuente, y cuyas salidas van al mismo destino (que
pueden ser en ambos
casos otra capa de neuronas).
III. 1. 2 Estado de Activación
Además del conjunto de neuronas, la representación necesita
considerar los estados
del sistema en un tiempo t. Esto se especifica por un vector de
N números reales A(t),
que representa el estado de activación del conjunto de
neuronas.
Cada elemento del vector representa la activación de la unidad
en el tiempo t. Si la
activación de la unidad Ui en el tiempo t se designa por ai(t),
tenemos:
A(t) = (a1(t), a2(t), ...., ai(t), …, aN(t))
El procesamiento que realiza la red se ve como una evolución de
un patrón de
activación en el conjunto de neuronas que lo componen, a través
del tiempo.
Todas las neuronas que conforman la red se hallan en cierto
estado. Podemos decir
que hay dos posibles estados: reposo y excitado, llamados
genéricamente estados de
activación; a cada uno de los cuales se le asigna un valor.
Estos valores pueden ser a
su vez continuos o discretos.
Es necesario además saber qué criterios o reglas siguen las
neuronas para alcanzar
estos estado de activación. Esto depende de dos factores:
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
• Dado que el comportamiento de las redes no es producto de la
actuación de
cada neurona individualmente, sino del conjunto como un todo, es
necesario
conocer el mecanismo de interacción entre ellas. El estado de
activación estará
influenciado por estas interacciones, dado que el efecto que
producirá una
neurona sobre otra será proporcional a la fuerza, peso o
magnitud de la
conexión entre ambas.
• La señal que envía cada neurona a sus vecinas depende de su
propio estado
de activación.
III. 1. 3 Función de Salida o de Transferencia
Entre las neuronas que componen la red existe un conjunto de
conexiones que las
unen. Cada neurona trasmite señales a aquellas que están
conectadas con su salida.
Asociada a cada unidad Ui hay una función de salida fi(ai(t)),
que transforma el estado
actual de activación ai(t) en una señal de salida yi(t); es
decir:
yi(t) = fi(ai(t))
En consecuencia, el vector que contiene las salidas de todas las
neuronas en un
instante t es:
Y(t) = (f1(a1(t)), f 2(a2(t)), ..., fi(ai(t)), ...,
fN(aN(t)))
En algunos modelos, esta salida es igual al nivel de activación
de la unidad, en cuyo
caso la función fi es la función identidad, fi(ai (t)) = ai (t).
A menudo, fi es de tipo
sigmoidal, y suele ser la misma para todas las neuronas.
Existen cuatro funciones de transferencia típicas que determinan
los distintos tipos de
neuronas:
• Función Identidad
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
• Función Escalón,
• Función lineal y mixta
• Sigmoidal,
• Función gaussiana
La función escalón o umbral únicamente se utiliza cuando las
salidas de la red son
binarias. La salida de una neurona se activa sólo cuando el
estado de activación es
mayor o igual que cierto valor umbral (la función puede ser
desplazada sobre los ejes).
La función lineal o identidad equivale a no aplicar función de
salida, y se usa muy
poco. Las funciones mixta y sigmoidal son las más apropiadas
cuando queremos
como salida una información analógica.
Neurona de Función Escalón
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Neurona de Función Lineal y Mixta
Neurona de Función Continua (sigmoidal)
axexf
−+=
11)(
La importancia de la función sigmoidal (o cualquier otra función
similar) es
que su derivada es siempre positiva y cercana a cero para los
valores grandes positivos o negativos. Además, toma su valor máximo
cuando x es 0. Esto es particularmente útil para definir métodos de
aprendizaje en los cuales se usan derivadas.
y
x 0
1 y
x 0
1/2
-1/2
+>
−<=
casootroencx
cxsi
cxsi
xf
2/1)2/(
1
0
)(
>
−
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Neurona de Función de transferencia gaussiana
III. 1. 4 Conexiones entre Neuronas
Las conexiones entre las neuronas de una red tienen asociado un
peso, que es el que
hace que la red adquiera conocimiento.
Tomemos el valor yi como el valor de salida de una neurona i en
un instante dado. Una
neurona recibe un conjunto de señales que le dan información del
estado de activación
de todas las neuronas con las que se encuentra conectada. Cada
conexión (sinapsis)
entre la neurona i y la neurona j está ponderada por un peso
wji. Normalmente, como
simplificación, se considera que el efecto de cada señal es
aditivo, de forma que la
entrada neta que recibe una neurona (potencial post sináptico)
netj es la suma del
producto de cada señal individual por el valor de la sinapsis
que conecta ambas
neuronas:
Los centros y anchura de estas funciones pueden ser adaptados,
lo cual las hace más adaptativas que las funciones sigmoidales.
Mapeos que suelen requerir dos niveles ocultos (neuronas que se
ubican entre las de entrada y las de salida) con neuronas de
transferencia sigmoidales, algunas veces se pueden realizar con un
solo nivel empleando neuronas de transferencia gaussiana.
. BxeAy −=
y
x
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
∑ •=N
ijij
iywnet
Esta regla muestra el procedimiento a seguir para combinar los
valores de entrada a
una neurona con los pesos de las conexiones que llegan a esa
neurona, y es conocida
como regla de propagación.
Suele utilizarse una matriz W con todos los pesos wji que
reflejan la influencia que la
neurona j tiene sobre la neurona i. W es una matriz de elementos
positivos, negativos
o nulos. Si wji es positivo, significa que la interacción entre
ambas neuronas es
excitadora, es decir, siempre que la neurona i esté activada, la
neurona j recibirá una
señal proveniente de i que tenderá a activarla. Si wji es
negativo, la sinapsis será
inhibidora; es decir, si i está activada, enviará un mensaje a
la neurona j que tenderá a
desactivarla. Por último, si wji es cero, significa que no hay
conexión entre ambas
neuronas.
III. 1. 5 Función o Regla de Activación
Así como es necesario una regla que combine las entradas a una
neurona con los
pesos de sus conexiones, también se requiere una regla que
combine las entradas
con el estado actual de la neurona, para producir un nuevo
estado de activación. Esta
función, F, produce un nuevo estado a partir del estado (ai) que
existía y la
combinación de las entradas con los pesos de las conexiones
(neti).
Dado el estado de activación ai(t) de la neurona Ui, y la
entrada total que llega a ella,
Neti, el estado de activación siguiente, ai(t+1) se obtiene
aplicando la función de
activación F:
ai(t+1) = F(ai(t), Neti)
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
En la mayor parte de los casos, F es la función identidad, por
lo que el estado de
activación de una neurona en t+1 coincide con el Net de la misma
en el tiempo t. En
este caso, la salida de la neurona i (yi) será:
∑=
==+N
jiji
jtywfNetftyi
1))(()()1(
Normalmente la función de activación no está centrada en el
origen del eje que
representa el valor de la entrada neta, sino que existe cierto
desplazamiento debido a
las características internas de la propia neurona, y que no es
igual en todas ellas. Este
valor se denota como θi, y representa el umbral de activación de
la neurona i.
∑=
−=−=+N
j
ijijiii tywfNetfty1
))(()()1( θθ
f
y1 . . . yj . . . yN
wi1
wij
wiN
yj
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
En el caso de neuronas de respuesta todo-nada, este parámetro
representa el umbral
de disparo de la neurona, es decir, el nivel mínimo que debe
alcanzar el potencial post
sináptico para que la neurona se dispare o active.
III. 1. 6 Regla de Aprendizaje
El aprendizaje se entiende como la modificación del
comportamiento inducido por la
interacción con el entorno, y como resultado de experiencias
conducente al
establecimiento de nuevos modelos de respuesta a estímulos
externos.
Biológicamente, se suele aceptar que la información memorizada
en el cerebro está
más relacionada con los valores sinápticos de las conexiones
entre las neuronas, que
con ellas mismas; es decir, el conocimiento se encuentra en las
sinapsis.
En el caso de las redes neuronales artificiales, el conocimiento
se encuentra
representado en los pesos de las conexiones entre neuronas. Todo
proceso de
aprendizaje implica cambios en estas conexiones, es decir, se
aprende modificando
los valores de los pesos de la red.
Durante el proceso de aprendizaje, los pesos de las conexiones
de la red sufren
modificaciones, por lo tanto se puede afirmar que la red “ha
aprendido” cuando los
valores de los pesos permanecen estables (dwij/dt = 0).
Un aspecto importante respecto al aprendizaje de las redes
neuronales es el conocer
cómo es que se modifican estos valores; es decir, cuáles son los
criterios que se
siguen para cambiar los valores asignados a las conexiones
cuando se pretende que
la red aprenda una nueva información.
Estos criterios determinan lo que se conoce como la regla de
aprendizaje de la red. De
modo general, se distinguen:
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
• Redes Neuronales con aprendizaje supervisado.
• Redes neuronales con aprendizaje no supervisado o
autoorganizado.
La diferencia fundamental entre ambos tipos radica en la
existencia o no de un agente
externo (supervisor) que controle el proceso de aprendizaje de
la red.
III. 1. 7 Formas de Conexión entre Neuronas
La conectividad entre los nodos de una red neuronal está
relacionada con la forma en
que las salidas de las neuronas están canalizadas para
convertirse en entradas de
otras neuronas. La señal de salida de un nodo puede ser una
entrada de otro
elemento de proceso, o incluso ser una entrada de sí mismo en
una conexión auto
recurrente.
Cuando ninguna salida de las neuronas de una capa es entrada de
neuronas del
mismo nivel o de niveles precedentes, se dice que la red tiene
propagación hacia
delante. En caso contrario se dice que la red es de propagación
hacia atrás. Las
redes de propagación hacia atrás que tienen lazos cerrados se
dice que son sistemas
recurrentes.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Estructura de una red multinivel con todas las conexiones hacia
adelante
Ejemplos de conexiones con propagación hacia atrás
SALI
DA
S
ENTR
AD
AS
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
I1
I2
Im
O1
O2
Om
Nivel de Entrada
Niveles Ocultos
Nivel de Salida
.
.
.
.
.
.
SALI
DA
S
O1
O2
Om
Red con propagación hacia atrás a nodos de niveles
anteriores
Nodo con propagación hacia atrás sobre sí mismo
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
CAPÍTULO IV
IV. 1 TOPOLOGÍA DE LAS REDES NEURONALES Se denomina topología o
arquitectura de la red a la organización y disposición de las
neuronas en la red formando capas más o menos alejadas de la
entrada y salida de la
red. Así, los parámetros fundamentales de la red son: el número
de capas (monocapa
o multicapa), el número de neuronas por capa, el grado de
conectividad y el tipo de
conexiones entre neuronas (unidireccionales o recurrentes).
IV. 1. 1 Redes Neuronales Monocapa
Se utilizan típicamente en tareas relacionadas con la
autoasociación; por ejemplo para
regenerar informaciones de entrada que se presentan a la red
incompletas o
distorsionadas.
TIPOS DE CONEXIONES MODELO DE RED
Brain-State-In-A-Box
Additive Grossberg (AG)
Shunting Grossberg (SG) Conexiones Autorrecurrentes
Optimal Linear Associative Memory
Hopfield
Boltzmann Machine
Conexiones Laterales Explícitas
No Autorrecurrentes
Cauchy Machine
Crossbar Learning Matrix (LM)
“Redes Neuronales Artificiales”. Hilera, Martínez.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
IV. 1. 2 Redes Neuronales Multicapa
Cuando todas las neuronas de una capa reciben señales de entrada
de otra capa
anterior, más cercana a la entrada a la red, y envían señales de
salida a una capa
posterior, estamos ante una red de conexiones hacia delante o
feedforward. En las
conexiones hacia atrás o feedback las salidas de las neuronas de
capas posteriores se
conectan a las entradas de capas anteriores.
Estas características permiten distinguir dos tipos de redes
entre las multicapa: las
redes con conexión hacia delante o redes feedforward, y redes
que disponen de
conexiones tanto hacia delante como hacia atrás, o redes
feedforward/feedback.
Las redes feedforward son especialmente útiles en aplicaciones
de reconocimiento o
clasificación de patrones.
Por otro lado, la mayoría de las redes multicapa son bicapa.
Este tipo de estructura es
particularmente adecuada para realizar una asociación de una
información o patrón de
entrada con otra información o patrón de salida en la segunda
capa. Una red
multicapa muy particular es la NEOCOGNITRON, en la que las
neuronas se disponen
en planos superpuestos (capas bidimendionales), permitiendo
eliminar las variaciones
geométricas (tamaños, giros, desplazamientos) o distorsiones que
presenten las
informaciones o patrones de entrada a la red.
-
N° de Capas
Tipo de Conexiones Modelo de Red
ADALINE / MADALINE
PERCEPTRON
LINEAR /ASSOC REWAR.PENALTY
LINEAR ASSOCIATIVE MEMORY
OPTIMAL LINEAR ASSOC. MEM.
DRIVE-REINFORCEMENT (DR)
LEARNING VECTOR QUANTIZER
Conexiones hacia delante
FEEDFORWARD
Conexiones laterales implícitas y
autorrecurrentes TOPOLOGY PRESERVING MAP (TPM)
BIDIRECTIONAL ASSOC. MEM. (BAM)
ADAPTIVE BAM.
TEMPORAL ASSOC. MEMORY (TAM)
Sin conexiones laterales
FUZZY ASSOCIATIVE MEMORY (FAM)
COMPETITIVE ADAPTIVE BAM
2 capas
Conexiones hacia adelante / atrás
(FEDDFORWARD / FEEDBACK)
Con conexiones laterales y
autorrecurrentes ADAPTIVE RESONANCE THEORY (ART)
ADAPTIVE HEURISTIC CRITIC (AHC)
Sin conexiones laterales BOLTZMANN / CAUCHY
MACHINE
COUNTERPROPAGATION
Conexiones hacia delante
(FEDDFORWARD) Con conexiones
laterales BOLTZMANN / CAUCHY MACHINE
3
Conexiones adelante / atrás y laterales BOLTZMANN / CAUCHY
MACHINE
Conexiones hacia adelante BACKPROPAGATION (BPN)
N FEEDFORWARD / FEEDBACK
(Jerarquía de niveles de capas bidimensionales)
COGNITRON / NEOCOGNITRON
Redes neuronales Multicapa más conocidas. (“Redes Neuronales
Artificiales”. Hilera,
Martínez.)
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
CAPÍTULO V
V. 1 ALGORITMOS NEURONALES
Los modelos neuronales utilizan varios algoritmos de estimación,
aprendizaje o
entrenamiento para encontrar los valores de los parámetros del
modelo, que en la
jerga de las redes neuronales se denominan pesos sinápticos.
El entrenamiento se realiza mediante patrones-ejemplo, siendo
dos los tipos de
aprendizaje: supervisado y no supervisado.
V. 1. 1 El aprendizaje supervisado
Si la red utiliza un tipo de aprendizaje supervisado debemos
proporcionarle parejas de
patrones entrada-salida y la red neuronal aprende a asociarlos.
En terminología
estadística equivale a los modelos en los que hay vectores de
variables
independientes y dependientes: técnicas de regresión, análisis
discriminante, modelos
de series temporales, etc.
En este tipo de aprendizaje se suelen considerar tres formas:
Aprendizaje por
corrección de error, Aprendizaje por refuerzo y aprendizaje
estocástico.
a.1) Aprendizaje por corrección de error.
Consiste en ajustar los pesos de las conexiones de la red en
función de la
diferencia entre los valores deseados y los obtenidos en la
salida; es decir, en
función del error cometido.
Una regla o algoritmo simple de aprendizaje por error podría ser
como la
siguiente:
∆ wji = α yi (dj – yj)
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Donde:
∆ wji : Variación en el peso de la conexión entre las neuronas i
y j
(∆ wji = wji actual – wji
anterior )
yi : Valor de salida de la neurona i.
dj : Valor de salida deseado para la neurona j.
yj : Valor de salida obtenido de la neurona j.
α : Factor de aprendizaje (0 < α
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
denominado regla delta o regla del error mínimo cuadrado (Widrow
y Hoff,
1960). Se aplica en las redes ADALINE, con una sola neurona de
salida, y
MADALINE, con varias neuronas de salida.
Este error medio se expresa de la siguiente manera:
2)(
1 1
)( )(21 k
j
P
k
N
j
kjglobal dy
PError −= ∑∑
= =
Donde:
N: Número de neuronas de salida
P: Número de informaciones que debe aprender la red
2
1
)(21 k
j
N
j
kj dy −∑
= : Error cometido en el aprendizaje de la información k-
ésima
Por lo tanto, se trata de encontrar unos pesos para las
conexiones de la red
que minimicen esta función de error. Para ello, el ajuste de los
pesos de las
conexiones de la red se puede hacer de forma proporcional a la
variación
relativa del error que se obtiene al variar el peso
correspondiente:
ji
globalji
wErrorkw
∂∂=∆
Mediante este procedimiento, se llega a obtener un conjunto de
pesos con los
que se consigue minimizar el error medio.
Otro algoritmo de aprendizaje por corrección de error, propuesto
en 1986, lo
constituye el denominado regla delta generalizada o algoritmo
de
retropropagación del error (error backpropagation), conocido
también como
regla LMS(Least-Mean-Square Error) multicapa.
Se trata de una generalización de la regla delta para poder
aplicarla a redes
con conexiones hacia delante (feedforward) con capas o niveles
ocultos de
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
neuronas que no tienen relación con el exterior. Son redes con
capa de
entrada, capas ocultas y capa de salida.
Estas redes multicapa pueden utilizarse en muchas más
aplicaciones que las
ya mencionadas Perceptrón, ADALINE y MADALINE, pero su proceso
de
aprendizaje es mucho más lento debido a que durante el mismo se
tiene que
explorar el espacio de posibles formas de utilización de las
neuronas de las
capas ocultas; es decir, se debe establecer cuál va a ser su
papel en el
funcionamiento de la red.
a.2) Aprendizaje por refuerzo.
Es un aprendizaje supervisado más lento que el anterior, que se
basa en no
disponer de un ejemplo completo del comportamiento deseado; es
decir, no
indicar exactamente la salida que se desea que proporcione la
red ante una
determinada entrada.
En este aprendizaje la función del supervisor se reduce a
indicar mediante una
señal de refuerzo si la salida obtenida se ajusta a la deseada
(éxi to = +1 ó
fracaso = -1), y en función de ello se ajustan los pesos.
a.3) Aprendizaje estocástico.
Este tipo de aprendizaje consiste básicamente en realizar
cambios aleatorios a
los pesos de las conexiones de la red y evaluar su efecto a
partir del objetivo
deseado y de distribuciones de probabilidad.
V. 1. 2 El aprendizaje no supervisado o autoorganizado
Si el entrenamiento es no supervisado, únicamente debemos
suministrar a la red los
datos de entrada para que extraiga los rasgos característicos
esenciales. En
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
terminología estadística equivale a los modelos en los que sólo
hay vectores de
variables independientes y buscan el agrupamiento de los
patrones de entrada:
análisis de conglomerados o cluster, escalas multidimensionales,
etc.
Estas redes deben encontrar las características, regularidades,
correlaciones o
categorías que se pueden establecer entre los datos de entrada.
Puesto que no hay un
supervisor que indique a la red la respuesta que debe generar
una entrada concreta,
cabría preguntarse precisamente por lo que la red genera en
estos casos. Existen
varias posibilidades en cuanto a la interpretación de las
salidas, que dependen de su
estructura y del algoritmo de aprendizaje empleado.
En algunos casos, la salida representa el grado de familiaridad
o similitud entre las
entradas y las informaciones que se le han mostrado hasta
entonces (en el pasado).
En otro caso podría realizar una clusterización o
establecimiento de categorías,
indicando a la salida a qué categoría pertenece la información
presentada en la
entrada, siendo la propia red quien debe encontrar las
categorías apropiadas a partir
de correlaciones entre las informaciones presentadas.
Finalmente, algunas redes con aprendizaje no supervisado
realizan un mapeo de
características (feature mapping), obteniéndose en las neuronas
de salida una
disposición geométrica que representa un mapa topográfico de las
características de
los datos de entrada, de tal forma que si se presentan a la red
informaciones similares,
siempre sean afectadas neuronas de salida próximas entre sí, en
la misma zona del
mapa.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
CAPÍTULO VI
VI. 1 LA RED BACKPROPAGATION
De forma simplificada, el funcionamiento de la red
backpropagation (BPN) consiste en
el aprendizaje de un conjunto predefinido de pares de
entradas-salidas dados como
ejemplo, empleando un ciclo propagación – adaptación de dos
fases:
Primero se aplica un patrón de entrada como estímulo para la
primera capa de
neuronas de la red, se va propagando a través de todas las capas
superiores hasta
generar una salida, se compara el resultado obtenido en las
neuronas de salida con la
salida que se desea obtener, y se calcula un valor del error
para cada neurona de
salida.
A continuación, estos errores se trasmiten hacia atrás,
partiendo de la capa de salida,
hacia todas las neuronas de la capa intermedia que contribuyeron
directamente a la
salida, recibiendo el porcentaje de error aproximado a la
participación de la neurona
intermedia en la salida original.
Este proceso se repite capa por capa, hasta que todas las
neuronas de la red hayan
recibido un error que describa su aportación relativa al error
total. Basándose en el
valor del error recibido, se reajustan los pesos de conexión de
cada neurona, de
manera que en la siguiente vez que se presente el mismo patrón,
la salida esté más
cerca de la deseada; es decir, el error disminuya.
La importancia de la red backpropagation consiste en su
capacidad de autoadaptar los
pesos de las neuronas de las capas intermedias para aprender la
relación que existe
entre un conjunto de patrones dados como ejemplo y sus salidas
correspondientes.
Después del entrenamiento, puede aplicar esta misma relación a
nuevos vectores de
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
entrada con ruido o incompletas, dando una salida activa si la
nueva entrada es
parecida a las presentadas durante el aprendizaje.
Esta característica importante, que se exige a los sistemas de
aprendizaje, es la
capacidad de generalización, entendida como la facilidad dar
salidas satisfactorias a
entradas que el sistema no ha visto nunca en su fase de
entrenamiento. La red debe
encontrar una representación interna que le permita generar las
salidas deseadas
cuando se le dan las entradas de entrenamiento, y que pueda
aplicar, además, a
entradas no presentadas durante la etapa de aprendizaje para
clasificarlas según las
características que compartan con los ejemplos de
entrenamiento.
VI. 1. 1 La Regla Delta Generalizada
La regla delta, propuesta por Widrow en 1960 ha sido extendida a
redes con capas
intermedias con conexiones hacia delante (feedforward) y cuyas
células tienen
funciones de activación continuas (lineales o sigmoidales),
dando lugar a un algoritmo
de retropropagación (backpropagation). Estas funciones continuas
son no
decrecientes y derivables, a diferencia de la función escalón
que se utiliza en el
Perceptrón, que no es derivable en el punto de
discontinuidad.
Este algoritmo utiliza también una función o superficie de error
asociada a la red,
buscando el estado estable de mínima energía o de mínimo error a
través del camino
descendente de la superficie del error. Por ello, realimenta el
error del sistema para
realizar la modificación de los pesos en un valor proporcional
al gradiente decreciente
de dicha función de error.
Funcionamiento del algoritmo. -
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Conexión entre una neurona de una capa oculta con una neurona de
salida
El método que sigue la regla delta generalizada para ajustar los
pesos es actualizarlos
de forma proporcional a la delta o diferencia entre la salida
deseada y la obtenida (δ =
salida deseada – salida obtenida)
Dada una neurona Ui y la salida que produce, yi, el cambio que
se produce en el peso
de la conexión que une la salida de dicha neurona con la unidad
Uj (wji) para un patrón
de aprendizaje p determinado es:
pijpji ytw δα=+∆ )1(
donde el subíndice p se refiere al patrón de aprendizaje
concreto y α es la constante o
tasa de aprendizaje.
El punto en que difieren la regla delta generalizada de la regla
delta es en el valor
concreto de δpj. Por otro lado, en la redes multinivel a
diferencia de las redes sin
neuronas ocultas, en principio no se puede conocer la salida
deseada de las neuronas
de las capas ocultas para poder determinar los pesos en función
del error cometido.
Sin embargo, inicialmente sí podemos conocer la salida deseada
de las neuronas de
salida. Según esto, si consideramos la unidad Uj de salida,
entonces definimos
δpj = (dpj – ypj) . f’(net j)
donde dpj es la salida deseada de la neurona j para el patrón p
y netj es la entrada
neta que recibe la neurona j.
yi
Ui Uj
yi yj
wji
Capa Oculta Capa de Salida
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Esta fórmula es como la de la regla delta, excepto en lo que se
refiere a la derivada de
la función de transferencia. Este término representa la
modificación que hay que
realizar en la entrada que recibe la neurona j. En el caso en
que dicha neurona no sea
de salida, el error que se produce estará en función del error
que se cometa en las
neuronas que reciban como entrada la salida de dicha neurona.
Esto es lo que se
denomina el procedimiento de propagación del error hacia
atrás.
Conexiones entre neuronas de capa oculta y de salida
Según esto, en el caso de que Uj no sea una neurona de salida,
el error que se
produce está en función del error que se comete en las neuronas
que reciben como
entrada la salida de Uj:
∑ •=k
jjkpkpj netfw )(')( δδ
donde el rango k cubre todas aquellas neuronas a las que está
conectada la salida de
Uj. De esta forma, el error que se produce en una neurona oculta
es la suma de los
errores que se producen en las neuronas a las que está conectada
la salida de ésta,
multiplicando cada uno de ellos por el peso de la conexión.
Adición de un momento a la regla delta generalizada.-
Capa de Salida
Capa Oculta Capa de entrada (u oculta)
Ui Uj
Uk1
Ukn
yi yj
yj wii
wk1j
wknj
yk1
ykn
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
El método de propagación de error, también conocido como del
gradiente
descendiente, requiere un importante número de cálculos para
lograr el ajuste de los
pesos en la red. En la implementación del algoritmo, se toma una
amplitud de paso
que viene dada por la tasa de aprendizaje α. A mayor tasa de
aprendizaje, mayor es la
modificación de los pesos en cada iteración, con lo que el
aprendizaje será más
rápido, pero, por otro lado, puede dar lugar a oscilaciones.
Rumelhart, Hinton y
Williams (1986) sugirieron que para filtrar esas oscilaciones se
añada en la expresión
del incremento de los pesos un término (momento), β, de manera
que dicha expresión
quede:
)()1(
))1()(()()1(
twyt
twtwytwtw
jipipjji
ijipipjjiji
∆+=+∆=−−++=+
βδα
βδα
donde β es una constante (momento) que determina el efecto en t
+ 1 del cambio de
los pesos mediante el instante t.
Con este momento se consigue la convergencia de la red en menor
número de
iteraciones, ya que si en t el incremento de un peso era
positivo y en t + 1 también,
entonces el descenso por la superficie de error en t + 1 es
mayor. Sin embargo, si en t
el incremento era positivo y en t + 1 es negativo, el paso que
se da en t+1 es más
pequeño, lo cual es adecuado, ya que esto significa que ha
pasado por un mínimo, y
que los pasos deben ser menores para poder alcanzarlo.
Resumiendo, el algoritmo backpropagation queda finalmente:
[ ]
[ ])()()1(
)1()()1(
twtwtw
twtwtw
jipjjiji
jijiji
∆++=+
+∆+=+
βδα
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
donde:
)(')( jpjpjpj netfyd −=δ si Uj es una neurona de salida, y
∑=k
jkjpkpj netfw )(')( δδ
si Uj no es una neurona de salida.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
CAPÍTULO VII
VII. 1 APLICACIONES DE LAS REDES NEURONALES ARTIFICIALES
A continuación una descripción general de las características
que debe poseer un
problema para que su solución con redes neuronales proporcione
buenos resultados,
así como aquellas que sugieren que el empleo de esta técnica
puede no resultar
aconsejable o viable.
a) Características que debe tener el problema:
• No se dispone de un conjunto de reglas sistemáticas que
describan
completamente el problema.
• En cambio, sí se dispone de muchos ejemplos o casos históricos
(esta es una
condición indispensable).
• Los datos procedentes del problema son imprecisos o incluyen
ruido (por
ejemplo, para un OCR las imágenes correspondientes a la misma
letra pueden
presentarse giradas, distorsionadas, etc.)
• El problema es de una elevada dimensionalidad (por ejemplo, la
matriz de
puntos que conforma una imagen puede ser demasiado grande como
para que
un sistema convencional que opera en serie pueda hacer un
análisis de la
imagen en tiempo real).
• Una circunstancia frecuente es que los métodos de redes
neuronales
proporcionan una alternativa mucho más rápida y sencilla de
desarrollar que
otras técnicas convencionales.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
• Si las condiciones de trabajo son cambiantes se puede
aprovechar la
capacidad para adaptarse a estos cambios de las redes
neuronales, re-
entrenando el sistema con nuevos ejemplos.
b) Características que hacen desaconsejable el empleo de redes
neuronales:
• Existe un algoritmo que resuelve con total eficacia el
problema. Es el caso de
los problemas puramente algorítmicos o numéricos (multiplicación
de números,
inversión de matrices, etc.)
• No se dispone de un número adecuado de casos (ejemplos) para
entrenar a la
red.
• Tareas críticas o potencialmente peligrosas, cuya solución
siempre deba ser
perfectamente predecible y explicable. A veces no resulta fácil
interpretar la
operación de la red neuronal o predecir con absoluta fidelidad
el resultado que
pueda proporcionar en todos los casos posibles.
VII. 2 OPERATIVA
La figura siguiente describe el procedimiento para operar con
redes neuronales.
Originalmente la red neuronal no dispone de ningún tipo de
conocimiento útil
almacenado. Para que la red neuronal ejecute una tarea es
preciso entrenarla, en
terminología estadística diríamos que es necesario estimar los
parámetros.
En realidad todo el procedimiento que vemos en la figura es
estadístico: primero se
selecciona un conjunto de datos, o patrones de aprendizaje en
jerga neuronal.
Después se desarrolla la arquitectura neuronal, número de
neuronas, tipo de red. Por
decirlo con otras palabras, se selecciona el modelo y el número
de variables
dependiente e independientes. Se procede a la fase de
aprendizaje o estimación del
modelo y a continuación se validan los resultados.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Modo de trabajo con redes neuronales
VII. 3 Listado de Aplicaciones
Biología:
• Aprender más acerca del cerebro y otros sistemas
• Obtención de modelos de retina.
Empresa:
• Evaluación de probabilidad de formaciones geológicas y
petrolíferas.
• Explotación de bases de datos (minería de datos)
• Optimización de plazas y horarios en líneas aéreas.
• Reconocimiento de caracteres escritos.
Medio ambiente:
• Analizar tendencias y patrones.
• Previsión del tiempo.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Finanzas:
• Previsión de la evolución de los precios.
• Valoración del riesgo de los créditos.
• Identificación de falsificaciones.
Manufactura:
• Sistemas de control automatizados (visión artificial y
sensores de temperatura,
presión, gas, etc.)
• Control de producción en líneas de proceso.
• Control de calidad.
Medicina:
• Analizadores del habla para ayuda en la audición.
• Diagnóstico y tratamiento a partir de síntomas y/o datos
analíticos
(electrocardiograma, encefalograma. Análisis sanguíneo,
etc.)
• Monitorización en cirugía.
• Predicción de reacciones adversas a medicamentos.
• Análisis de las causas de los ataques epilépticos.
• Lectores de rayos X
Militares:
• Clasificación de señales de radar.
• Optimización del uso de recursos escasos.
• Creación de armas inteligentes.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
CAPÍTULO VIII
VIII. 1 CASO PRÁCTICO
Red Neuronal para apoyo a identificación de factores de
mayor
riesgo en hijos de madres con antecedentes de aborto.
OBJETIVO
Averiguar los factores de mayor impacto en el estado al nacer de
los hijos de las
gestantes con antecedente de más de dos abortos previos.
MATERIAL Y MÉTODOS
Para el presente trabajo se empleó datos fuente almacenados en
tablas *.dbf
provenientes de un sistema desarrollado en FoxPro. Esta
información ha sido
capturada mediante un sistema que recoge el perfil de cada
gestante y de cada recién
nacido en una ficha según formato adjunto. Este registro lo
realiza el profesional de
salud a partir de la HC del paciente (madre y niño).
Esta información fue importada a una base de datos MsAccess 2000
para su análisis,
depuración y preprocesamiento para adecuarlos al formato
necesario para el trabajo
con la red neuronal.
La herramienta de simulación de redes neuronales empleada es
EasyNN-plus 1.0g,
que permite crear redes Perceptrón Multicapa con algoritmo de
aprendizaje
backpropagation.
Esta herramienta tiene dos componentes principales: los nodos y
las conexiones.
Los datos de entrenamiento y pruebas se cargan a una grilla
semejante a una hoja de
cálculo, en la que las filas constituyen los patrones ejemplo y
las columnas definen las
entradas y salidas de la red.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
Nodo
Neurona
Net Input: Suma de todas las activaciones * pesos de inputs
hacia el
nodo + Bias (umbral).
Activación: 1.0 / (1.0 + e(-Net Input))
Error en nodo de
salida
Objetivo - activación
Error en nodo oculto: Error + Delta * Peso
Delta: Error * Activación * (1.0 – Activación)
Bias: Bias + Delta Bias
Derivada del Bias Derivada del Bias + Delta
Delta Bias: Ratio de aprendizaje * Derivada del Bias + Momentum
* Delta
Bias
Conexión
Direccionamiento
Desde: El nodo hacia donde va la conexión.
Hacia: El nodo de donde viene la conexión.
Number: Número de la conexión.
Peso:
Tipo: Variable o Fijo.
Peso: Peso + Delta del peso.
Derivada del peso: Derivada del peso + Hacia: Delta * Desde:
Activation.
Delta del peso: Ratio de aprendizaje * Derivada del peso +
Momentum * Delta
del peso.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
En el anexo 1 se muestran los valores obtenidos para cada uno de
estos elementos en
la red neuronal construida.
La data original corresponde a una población de 44,500 casos
presentados en el año
2001 en los hospitales del Seguro Social del Perú, de los cuales
se seleccionaron los
553 casos de mujeres con más de dos abortos previos a la
gestación.
Para los efectos de la presente investigación, de la ficha de
datos básicos (Anexo 3)
hemos cruzado la variable 2 “Antecedentes obstétricos de la
madre”, en el rubro
“Numero de abortos previos” con valor mayor a 2, cruzándola con
la variable 19
“Estado al nacer” , que consta de los siguientes rubros:
• Vivo sin patología (ninguna dolencia o enfermedad)
• Vivo con patología (con alguna dolencia o enfermedad)
• Muerto antes del parto
• Muerto durante el parto
CONCLUSIONES:
Si la gestante ha tenido más de dos abortos antes de la
gestación actual, el estado al
nacer de su hijo estará determinado por los siguientes factores
en orden de prioridad:
1º. Presencia o no de Pre eclampsia (hipertensión inducida por
el embarazo).
2º. Infección urinaria durante la gestación.
3º. La no presencia de otras enfermedades durante el embarazo
diferentes a:
diabetes, hipertensión arterial, asma o cardiopatía.
4º. La presencia o no de rotura prematura de membranas.
5º. Ausencia de otras entidades obstétricas.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
De acuerdo a la técnica de estimación empleada, esta conclusión
tiene un 0.047471
de error promedio.
APLICABILIDAD
• Una mujer con más de dos abortos puede tener un hijo vivo sin
enfermedad al
nacer.
• Cuando se trata de pacientes con el antecedente de abortos
repetidos, deberá
pesquizarse cercanamente y tratarse oportunamente cualquiera de
las
complicaciones señaladas.
-
Las Redes Neuronales Artificiales y su importancia como
herramienta en la toma de decisiones. Villanueva Espinoza, María
del Rosario
Elaboración y diseño en formato PDF, por la Oficina General del
Sistema de Bibliotecas y Biblioteca Central UNMSM
CONCLUSIONES
Tras presentar una visión panorámica de los principios,
desarrollo y aplicaciones de
las Redes Neuronales Artificiales, se hace necesario señalar
algunas conclusiones
importantes que se derivan de lo presentado en el presente
documento, de las
investigaciones realizadas para su preparación, y de la
experiencia en el desarrollo del
caso práctico:
1. Para resolver con eficiencia un problema, éste debe
comprenderse bien. Rara vez
existen soluciones simples a problemas complejos. Si se
comprende bien el
problema, introduciendo explícitamente el conocimiento
apriorístico en el modelo
se obtiene un sistema más eficiente.
2. Todo problema debe descomponerse en partes. En cada parte se
debe ensayar
con distintos métodos, neuronales o no, para quedarse con el más
eficaz. En este
sentido, deben realizarse comparaciones objetivas. Lo habitual
es