-
Red Neuronal Artificial ART2 para la agrupacin d datos
Artificial Neuronal NerVvork ART2 for Clustering Data
Fecha de recepcin: , '30 de marzo de 2007 Fecha de aceptacin: 13
de julio de 2007 .:
Jorge E. Rodrguez'
RESUMEN Es'te artculo se presenta como un avance parcil del
proyecto de investi-
gacin Desarrollo de Herramientas para Minera de Datos-UDMiner,
en el que se muestra la implementacin de una red neuronal tipo
resonancia adaptativa, ART2, empleada para la agrupacin de datos.
Se compara la tcnica implementada con el algoritmo EM y los mapas
autoorganizativos de Kohonen.
Palabras clave Minera de datos, grupo, red de rsonanda
adaptativa, mapasautoorgani-zativos, algoritmo EM.
ABSTRACT yi In this paper, we present a partial advance of the
project of development
investigation of,tools for data mining, which consists on the
implementa-tion of Adaptative Resonance Network (ART2) for the
clustering data. The implemented technique is compared with
Self-Organizing Maps and the algorithm EM (Expectatin Maximization)
with the prpose of measuring the clustering effectiveness.,
Universidad Distrital Francisco_ los de Caldas, Grupo de
Investigacin en Inteligencia Artificial. jrod ri@ ud
istrital.edu.co
261 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO
-
Key words Data mining, cluster, adaptative resonance network,
self-organizing maps, algorithm EM.
INTRODUCCIN El objetivo de la agrupacin de datos es obtener
grupos o conjuntos de ele-
f. mentos entre los elementos de X, de manera que los elementos
,asignados al mismo grupo sean similares. Un grupo es una coleccin
de datos semejantes a otros de un mismo grupo y diferentes a los
objetos de otros grups [1] :
El anlisis de agrupacin es un conjunto de metodologas para
clasificacin automtica de muestras entre un nmero de grupos usando
medidas de aso-ciacin. Es decir, las muestras en un grupo son
similares; las pertenecientes a otros grupos son diferentes
[2].
El anlisis de grupos, tambin llamado segmentacin de datos, tiene
gran variedad de metas, todas referidas a una coleccin de grupos ,o
segmentos de objetos entre subconjuntos "grupos", de modo que los
grupos de un mismo objeto estn estrechamente relacionados entre s,
y difieren notablemente con grupos de otros objetos. Un objeto
puede ser descrito por un conjunto de medidas o por sus relaciones
con otros objetos [3].
El anlisis de grupos puede ser una herramienta estndar para
bneficiar la percepcin en la de la distribucin de los datos, para
observar las caracters-ticas de cada grupo y para enfocarse en una
coleccin particular de grupos con el fin de lograr mayor
exploracin. Alternativamente, puede servir cmo tcnica para
preprocesar datos, tal como caracterizacin y clasifiacin, los
cuales podran operar sobre los grupos descubiertos.
La agrupacin de datos contribuye a reas de investigacin,
incluidos Minera de Datos, estadsticas, aprendizaje computacional,
tecnologa de bases de datos espaciales, biologa, mercadeo, etc.
Como consecuencia de la gran cantidad de informacin de las bases de
datos, el anlisis de grupos ha llegado a ser un tema importante en
la investigacin de Minera de Datos. Como una rama de la estadstica,
el anlisis de grupos ha sido estudiado por varios aos, con-
262 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTFICO
-
centrndose principalmente en la distancia basada en el anlisis
de grupos. Las herramientas basadas en K-means, K-medoids y otros
mtodos tambin han sido construidos dentro de varios paquetes o
sistemas de software de anlisis estadstico, como S-Plus, SPSS y
SAS. En aprendizaje computacional, la agrupacin es un ejemplo de
aprendizaje no supervisado.
En Minera de Datos, algunos esfuerzos se han enfocado en
encontrar mtodos eficientes para el anlisis de grupos en las
grandes bases de datos. Recientes temas de investigacin se estn
orientando en la escalabilidad de los mtodos de agrupacin, mayor
eficiencia de los mtodos para la agrupacin de formas complejas y
tipos de datos, tcnicas de agrupacin de alta dimensionalidad y
mtodos de agrupacin para datos mixtos numricos y categricos en
grandes bases de datos.
En el artculo se muestra el proceso de desarrollo y validacin de
una herra-mienta para la agrupacin de datos, cuyo propsito es
extraer conocimiento til a partir de los datos. Se utiliza como
tcnica de agrupacin una red neuronal artificial, llamada Red de
Resonancia Adaptativa.
El artculo se encuentra estructurado en: 1) Requerimientos y
mtodos de agrupacin de datos, donde se presenta una resea referente
a escalabilidad y capacidad para manejar diferentes tipos de datos.
2) Mtodos de agrupa-cin (basados en particionamiento, jerrquicos,
basados en grid, basados en densidad, y basados en el modelo). 3)
Red de resonancia adaptativa, aqu se presenta la teora utilizada en
la red ART2, junt con su arquitectura, haciendo nfasis en el
subsistema de orientacin y de atencin. 4) Anlisis de resultados.
Para tal fin se toman diferentes conjuntos de datos, provenientes
de la WEB, y se hace la comparacin con Mapas Autoorganizativos de
Kohonen y el al-goritmo EM (Maximizacin de la Esperanza). 5)
Finalmente, se plantean las conclusiones obtenidas del avance
parcial de investigacin y se deja abierta la posibilidad realizar
trabajos futuros.
263 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO
-
REQUERIMIENTOS DE LA AGRUPACIN EN LA MINERA DE DATOS [1]
Escalabilidad Existen algoritmos de agrupacin que funcionan bien
en pequeas coleo- ciones de datos (por ejemplo, 200 datos). Sin
embargo, una gran base de datos contiene millones de objetos. La
agrupacin sobre un patrn"en una gran coleccin de datos puede
conducir a predisponer resultados, es decir, normalmente funcionan
bien con pocos datos.
Capacidad para manejar diferentes tipos de datos Diferentes
algoritmos son diseados para grupos de intervalos de datos
nu-mricos; no obstante, las aplicaciones pueden requerir agrupacin
d 'otros tipos de datos, por ejemplo binarios, nominales, y
ordinales, o mezclas de estos tipos de atributos.
Grupos de formas arbitrarias Algunos algoritmos de agrupacin
estn basados en las medidas de distan!- cia euclidiana o Manhattan.
Estos tienden a encontrar grupos esfricos con similar tamao y
densidad. Sin embargo, un conjunto de datos podra ser de cualquier
forma. Es importante desarrollar algoritmos que puedan descubrir
grupos de forma arbitraria.
Requerimientos mnimos para especificar parmetros Un alto nmero
de algoritmos de agrupacin requieren especificar 'par-metros en el
anlisis de grupos (como el nmero de grupos deseados). La agrupacin
puede ser totalmente sensible a la especificacin de parnetros. Los
parmetros pueden ser, con frecuencia, difciles de determinar, sobre
todo con colecciones de datos contenidas en objetos de alta
dimensionalidad.
Habilidad para tratar con datos ruidosos La mayora de bases de
datos del mundo real contienen datos faltantes, datos sin conocer o
datos errneos. Algunos algoritmos de agrupacin son sensibles a
tales datos y pueden conducir a grupos de baja calidad.
o
264 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO
-
Independencia en el orden de los registros Existen algoritmos
de. agrupacin sensibles al orden de especificacin de los datos; por
ejemplo, la misma coleccin de datos, cuando se presenta con
diferente disposicin en un algoritmo, puede generar diferentes
grupos.
Alta dimensionalidad Una base de datos puede contener diversas
dimensiones o atributos. La mayora de los algoritmos de agrupacin
funcionan bien con datos de baja dimensionalidad, que involucran
solo dos o tres dimensiones. Los humanos somos buenos para juzgar
la calidad de agrupacin por debajo de tres dimen-siones. Esto est
desafiando al anlisis de grupos con alto espacio dimensional, en
especial considerando que tales datos pueden ser escasos.
Interpretabilidad y usabilidad Los que aplican la agrupacin
esperan que los resultados de sta sean inter-pretables,
comprensibles y usables.
MTODOS DE AGRUPACIN Existe un gran nmero de algoritmos de
agrupacin en la literatura. Escoger uno depende del tipo de datos y
del propsito mplicaciti del algoritmo. Si el anlisis de agrupacin
se usa como herramienta descriptiva o explorativa, es posible
probar diferentes algoritmos sobre el mismo dato para ver sus
resultados. En general, los principales mtodos de agrupacin pueden
ser clasificados en las siguientes categoras.
Mtodos de particionamiento Dada una base de datos de n objetos o
registro de datos, un mtodo de par-ticionamiento construye K
particiones sobre los datos, donde cada particin representa un
grupo con k
-
Dado K, el nmero de particiones por construir un mtodo de
particio-namiento crea una particin inicial. Esta usa una tcnica de
relocalizacin iterativa que procura perfeccionarla particin por
movimiento de objetos de un grupo a otro. El criterio general de un
buen particionamiento es que los objetos del mismo grupo son
"cercanos" o relacionados los unos con los otros, mientras que los
objetos de diferentes grupos son "apartados" o muy diferentes.
Para llevar a cabo una buena agrupacin basada en
particionamiento, se podra requerir una numeracin exhaustiva de las
posibles particiones. En cambio, la mayora de aplicaciones adoptan
heursticos: 1) el algoritmo k-means, en el que cada grupo es
representado po'r el valor medio de los objetos en el grupo, y 2)
el algoritmo k-medoids, en el que cada grupo es representado por
uno de los objetos localizado cerca del centro del grupo. Estos
mtodos heursticos funcionan bien con grupos esfricos y con bases de
datos de pequeo y mediano tamao. Si las bases de datos, forma
compleja o son de gran tamao, el mtodo de particionamiento
k-medoids necesita ser extendido [1].
Mtodos jrrqdicos Un mtodo jerrquico crea una' descomposicin
jerrquica de ua'coleccin dada de datos. Considerando que los mtodos
basados en particin inician especificariddun riinero de grupos y
busan, a travs de posibles asignaciones de grupos de puntos,
encontrar una funcin' que perfeccione el grupo, los mtodos
jerrquicos unen gradualmente puntos o dividen supergrripos [4].
Un mtodo jerrquico puede ser clasificado en aglornerativo o`
divisivo, dependiendo de cmo se confrma la descomposicin jerrquica.
La forma aglomerativa tambin llamada fornia bttom-up, comienza
forrriando un grPo separdo. Con cada objet. Este une"
'sucesivamente ls objetos o grupos cercanos a otros hasta que todos
los grupos se unen en uno (el mayor nivel de la jerarqua) o hasta
que se cumple determinada condicin. El mtodo divisivo, tambin
llamado top-down;'comienza con todos los objetos de un mismo
conjunto. En cada iteracin sucesiva, un grupo es dividido en
peque-os grupos hasta que, eventualmente, caa objeto est`Cientro de
un grupo o hasta que se cumpla determinada condicin.
266 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTFICO
-
Mtodos basados en la densidad La mayora de los mtodos de
particionamiento agrupan objetos basados en la distancia entre
stos. Tales mtodos pueden trabajar con grupos de forms esfricas y
encontrar dificultades al descubrir grupos con formas arbitrarias:
Otros mtodos de agrupadn se han desarrollado basados en la nocin de
densidad. Su idea general es continuar extendiendo el grupo dado,
tan extenso como la densidad (nmero de objetos o datos) en la
"vecindad", excediendo algunos umbrales; es decir, por cada dato
sin un grupo dado, la vecindad de un radio contiene un mnimo nmero
de puntos. Tal mtodo puede ser usado para filtrar ruido y descubrir
grupos de formas arbitrarias.
Mtodos basadosenGrid , Cuenta los espacios de objetos dentro de
uri nmero infinito de celdas' que forman una estructura grid. Todas
las operaciones de agrupacin son rea-lizadas sobre la estructura
del grid (ejemplo, la contabilizacin de los espa-cios). Las
principales ventajas de esta forma es que este tiene un tiempo de
procesamient o rpido, generalmente independiente del nmero de
objetos, pues depende solo del nmero de celdas en cada dimensin de
los espacios contabilizados.
Mtodos basados en el modelo Este mtodo encuentra un modelo para
cada grupo y los datos ms ade-cuados para este modelo. Un algoritmo
basado" en el modelo puede localizar grupos para crear una funcin
de densidad que refleje la distribucin espacial de los datos
puntuales. Tambin puede determinar el nmero de grupos basados en
una estadstica estndar, tomando los objetos ruidosos dentro de un
grupo para dar robustez a los mtodos de agrupacin.
RED DE RESONANCIA ADAPTATIVA (ART2) Una de las caractersticas de
la memoria humana consiste en su habilidad para aprender nuevos
conceptos sin olvidar otros aprendidos en el pasado. Sera deseable
que esta misma capacidad se pudiera conseguir en las redes
neuro-nales artificiales. Sin embargo, muchas de stas tienden a
olvidar informacin pasada al tratar de ensearle nueva. En respuesta
Grossberg, Carpenter y otros desarrollaron la denominada teora de
la resonancia adaptativaART [5]. Este
267 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO
-
modelo se basa en la idea de hacer resonar la informacin de
entrada con los prototipos o categoras que reconoce la red. Si
entra en resonancia con alguno (es suficientemente similar), la red
considera que pertenece a dicha categora y se realiza una adaptacin
que incorpora algunas caractersticas de los nuevos datos a la
categora existente. Cuando no resuena con ninguno (no se parece a
ninguna de las categoras existentes), la red se encarga de crear
una nueva categora con el dato de entrada como prototipo de la
misma.
Esta teora se aplica a sistemas competitivos (redes con
aprendizaje compe-titivo) en los cuales, cuando se presenta cierta
informacin de entrada solo se activa una de las neuronas de salida
de la red (o una por cierto grupo de neuronas) alcanzando su valor
de respuesta mximo despus de competir con las otras. Esta neurona
recibe el nombre de vencedora [5].
Existen tres elementos bsicos para el aprendizaje competitivo
[6] :
A. Un conjunto de neuronas iguales, excepto los pesos, definidos
aleatoria-mente, y que por consiguiente responde de manera
diferente a cada de patrn de entrada.
B. Un lmite impuesto a cada neurona.
C. Un mecanismo que permite a las neuronas competir para
responder bien a un subconjunto dado de entradas, tal que solo se
activa una neurona de salida o solo una neurona por grupo.
Una red ART2 consta de dos capas entre las que se establecen
conexiones hacia adelante y hacia atrs (feedforward/feedback). La
estructura general de una red ART2 se muestra en la figura 1.
268 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO
-
269
Subsistema de orientacin Capa F2
1111 I /MIK
O
11/ %I! III E 1 111 1 P " I I I KIW4 .nn Ws [1 KM
Subsistema de atencin
Capa Fl
o El El ] II 01
o +
Vector de entrada
Figura 1 Arquitectura de la red ART2 [7].
A continuacin se har un resumen del funcionamiento de la red
ART2 [7].
La capa F1 se encuentra dividida en seis subcapas: w, x, u, v, p
y q. Todos los nodos marcados con una G (llamadas unidades de
control de ganancia) envan una seal inhibitoria no especfica a
todas las unidades de la capa a la que llegan. Todas las subcapas
de F1, as como la capa r del subsistema de orientacin, tienen el
mismo nmero de unidades. Las subcapas individuales de Fl estn
conectadas de unidad a unidad; esto es, las capas no estn
com-pletamente interconectadas, con la excepcin de las conexiones
ascendentes que llegan a F2 y de las conexiones descendntes de
F2.
El subsistema de orientacin detecta la falta de coincidencia
entre las tramas ascendentes y descendentes de la capa F 1 . Esta
utiliza para determinar la
e: CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO
-
coincidencia, una magnitud que recibe el nombre de parmetro de
vigilancia y suele identificarse mediante el smbolo p. El valor del
parmetro de vigi-lancia mide hasta qu grado discrimina el sistema
entre distintas clases de tramas de entrada.
El control de ganancia se utiliza cuando se implementa una red
Rt2 donde la capa F2 podra recibir entradas de otra capa por encima
de ella (dentro de una jerarqua de redes pertenecientes a un
sistema mayor), as corno de la capa Fl, situada ms abajo. Este
control impide que una trama que entre por encima de la capa F2, se
cruce o se compare con otra trama que ha" entrado al mismo tiempo
por la capa F 1 .
El subsistema de atencin est compuesto por las dos capas de
elementos de procesamiento, Fl y F2, y un sistema de control de
ganancia.
Procesamiento en F1. La actividad de las unidades de la subcapa
F 1 est gobernada por la ecuacin de la forma
Exk = Ax k + ( Bxk )J+k (c Dxk )Jk
donde A, B, C, y D son constantes; eh+ y jk representan e
inhibitorios netos, respectivamente. Las actividades capas de F1 se
pueden resumir mediante las siguientes
= + aui
(1)
factores excitatorios de cada una de las seis
ecuaciones:
(2)
(3)
(4)
(5)
, (6)
( 7 )
e +11wii = f(X;) bf(q) _
p=u+Zg(y)zu
19, qt
270 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO
-
Los factores de las ecuaciones para todas las capas de Fl y para
la capa r son: I, es la i-sima componente del vector de entrada.
Los parmetros a, 17, c, d son constantes. La constante e recibe
tpicamente un valor positivo y conside-rablemente menor que 1,
tiene el efecto de mantener finitas las activaciones cuando no est
presente ninguna entrad en el sistema, y, es la actividad de la
j-sima unidad de la capa F2 y g(y) es la funcin de salida de
F2.
Las tres unidades de control de ganancia de Fl inhiben de manera
no espe-cifica las subcapas x, u y q. La seal inhibitoria es igual
al mdulo del vector de entrada que llega a esas capas..
La forma de la funcin F(x) determina la naturaleza de
mejoramiento de contraste que tiene lugar en F 1 . La eleccin lgica
para esta funcin podra ser una sigmoide; aqu se presenta la opcin
de Carpenter:
f(x) = {0 O x > O (8)
donde O es una constante positiva y menor que 1.
Del anlisis de la capa F1, se puede concluir que esta lleva a
cabo una nor-malizacin y una operacin de mejoramiento de contraste.
Antes de inten-tar buscar coincidencias en s, se deben considerar
los detalles del resto del sistema.
Procesamiento en F2. El procesamiento de F2 est dado por la
siguiente ecuacin:
(9) La competencia de F2 da lugar a un mejoramiento de
contraste, en el cual se selecciona un nico nodo ganador.
La funcin de salida de F2 est dada por:
ci T=max{n}ek g (Y.; ) = to en caso contrario (10)
271 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO C:,
-
La ecuacin 10 supone que el conjunto {T k} contiene nicamente
aquellos nodos que no hayan sido restaurados recientemente por el
subsistema d orientacin.
Ecuaciones de LTM (memoria a largo plazo). Tanto las ecuaciones
ascen-dentes como las descendentes tienen la misma forma:
zi, = g(y,)(p, - z) para los pesos ascendentes cksckv i al FI
hasta v en F2, y
z. = g(Y ;)(p; zu) (12) para los pesos descendentes que van
desde v. en F2 hasta v i en F1.
ZJi = d (u; + dZi., (13) De forma similar
z, , = d(u - 11) (14)
El subsistema de orientacin. La ecuacin de las actividades de
los nodos de la capa r tiene la forma
U, "fcp, 11u 11+11c7911 (15)
La condicin para que produzca la restauracin es
(16) fi > 1 donde p es el parmetro de vigilancia. El valor
del parmetro de vigilancia mide hasta qu grado discrimina el
sistema entre distintas clases de tramas de entrada.
Iniciacin de LTM (memoria a largo plazo) ascendente. Los valores
iniciales para los vectores de pesos ascendentes estn dados por la
ecuacin.
272 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTFICO
-
1 Z ' 5- (1- d),/,14 (17)
donde M es el nmero de unidades de cada subcapa de Fl.
El proceso tambin puede llevarse a cabo mediante la
implementacin de mapas autoorganizativos de Kohonen. ste es un
modelo aceptable para en-contrar relaciones entre grupos complejos
al basarse en el manejo de vecindad para agrupar; sin embargo, una
limitante es el alto costo computacional que implica su ejecucin
[8]. Este modelo fue un desarrollo previo a la implemen-tacin de la
red ART2, presentada como un avance parcial de investigacin, del
cual se muestran los resultados obtenidos para algunos conjuntos de
datos en la tabla 1. Para mayor informacin acerca de este
desarrollo, remtase a [8], donde encontrar la teora empleada en los
mapas autoorganizativos de Kohonen y las especificaciones de la
implementacin.
ANLISIS DE RESULTADOS Para validar el software desarrollado, se
utilizaron diferentes conjuntos de datos (tomados de
http://www.ics.uci.edui mlearn/MLRepository.html). Para cada uno se
realizaron 10 pruebas con el fin de medir la efectividad del modelo
neuronal ART2 en la agrupacin de datos. Se hace una comparacin del
modelo implementado frente al modelo de mapas autoorganizativos de
Kohonen y el algoritmo EM (Expectation Maximization). Para este
ltimo se utiliz la herramienta WEKA (Entorno para el Anlisis de
Conocimiento de la Universidad de Waikato). Ver tabla 1.
En cuanto a la configuracin de la red ART2, luego de realizar
las respectivas pruebas con cada uno de los conjuntos de datos; se
obtiene: el valor medio para el parmetro de vigilancia es 0.4; para
la constate e es 0.2: Para las dems constantes no se pudo
establecer un valor medio.
En trminos generales, la efectividad de agrupacin de la red ART2
es superior a los mapas autoorganizativos de kohonen y al algoritmo
EM al obtener una efectividad promedio del 69.12%.
273 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTFICO C y
-
Tabla 1 Efectividad de la agrupacin.
Conjunto de datos
Algoritmo EM Kohonen
Mapas auto- organizativos de ART2
Efectividad de
agrupacin Tiempo
Efectividad de
agrupacin - Tiempo
Efectividad de
agrupacin ' Tiempo
Soybean 73% 3 min 1 seg 57% in 40 1 meg s 94.7% 11 seg
Contact-lences 33% 1 seg 0% 1 seg 0% 1 seg
Led7_data 100% 4 seg 80% 8 seg 70% ' 3 seg
Vehicle_data 0% 1 min 15 seg 75% 15 seg r .
10b/0 6 seg
Satlmage 83.3% 1 min 50 seg 83% 4 min 50 seg .50% :
1 min 42 - seg
Wine_data 100% 2 seg 67% 2 seg 100% .. , 2 seg
Promedio de la agrupacin 64.88% 60.33% 69.12%
Existen casos particulares en los cuales no se logra obtener una
buena agru- ,
pacin, como el del conjunto de datos CONTACT-LENCES, en el cual
el porcentaje de agrupacin es del 0%. La razn est en que, para
esteejemplo, no se logr determinar una configuracin aceptable para
la red ART2, siendo esta una limitante del modelo implementado.
Adems, se observa que la calidad de agrupacin obtenida oil 'ART2
del conjunto de datos SATIMAGE es inferior a la obtenida con los
otros dos modelos, alcanzndose solo un 50% de agrupacin. La
explicadti x radica en que el funcionamiento de la red ART2 tiende
a degradarse cuando el volumen de instancias es alto (la degradacin
del funcionamiento se puede contrarrestar con una buena
configuracin de la red).
CONCLUSIONES
La red neuronal ART2 es una tcnica viable para la agrupacin" de
datos, dada su alta efectividad; sin embargo, la configuracin del
parmetro de vigilancia debe hacerse utilizando heursticas o, en el
peor de los casos, a travs de la experimentacin. Esto implica que
si el parmetro empleado no es adecuado, la efectividad de agrupacin
es baja.
274 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO
-
El modelo ART2 es una de las redes neuronales artificiales ms
poderosas debido a su capacidad de autoorganizacin, aprendizaje no
supervisado y ONLINE, pero tambin es una de las ms complejas en
cuanto a su imple-'tentacin. Adems, al ser expuesta a una gran
cantidad de datos puede degradarse su buen funcionamiento.
Con el presente desarrollo se observa que la red neuronal ART2
es eficiente para encontrar relaciones entre grupos. Esto se
corrobora con la comparacin hecha con otras tcnicas de agrupacin
(algoritmo EM, mapas autoorganiza-tivos), en los que con el modelo
ART2 se obtuvo la mayor eficiencia (69.12%). Del mismo modo, se
destaca que de las tres tcnicas implementadas, ART2 es la que menor
tiempo emplea para generar grupos.
TRABAJOS FUTUROS 1
Actualmente se est trabajando en un prototipo de software para
la agrupa- cin de datos a partir de la implementacin del algoritmo
GTM (Generative Topographic Mapping) y se tiene previsto la
implementacin de tcnicas evolutivas con el fin de configurar
automticamente los parmetros de la red ART2.
BIBLIOGRAFA [1] Han, J., y Kamber, M., Data Mining: Concepts and
techniques; San Diego USA. Morgan Kaufmann, 2001, pp. 335-346.
[2] Kantardzic, M., Data Mining: Concepts, Models, Methods, and
Algo-rithms, New Jersey USA. Wiley Interscience, 2001, p. 117.
[3] Hastie, T., TIBSHIRANI, R., and FRIEDMAN, J., The Elements
of Statistical Learning. Heidelberg Canada. Springer, 2001, p.
453.
[4] Hand, D., Mannila, H., and SMYTH, P., Principies of Data
Mining, London England. The MIT Press, 2001, p. 308.
[5] Hilera, J., y Martnez, V., Redes neuronales artificiales.,
Wilmington USA. Addison Wesley Iberoamericana, 1995, pp.
219-220.
275 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTFICO
-
[6] Haykin, Neural Networks: "A comprehenSive foundation", New
JereSr USA. Prentice Hall, 1999, p. 58.
[7] Skapura, D. y Freeman, J., Redes noronales, algoritmos,
aplicaciones y tcnicas de progrdmacin, Madrid _Esparia. Daz de
Santos, 1993, pp. 335-343.
[8] Bautista, S., Reyes, A., y Rodrguez, J., "Prototipo de
software para la agrupacin de datos con una red heuronal artificial
con topologa de Kohonen", Bogot Colombia. Tecnura, Ao 8, No. 15.,
2004, p. 65.
276 CENTRO DE INVESTIGACIONES Y DESARROLLO CIENTIFICO