-
SEP SNEST DGEST
INSTITUTO TECNOLGICO DE TOLUCA
SISTEMA PARA LA VERIFICACIN AUTOMTICA DE FIRMAS
AUTGRAFAS
T E S IS
QUE PARA OBTENER EL GRADO DE MAESTRA EN:
CIENCIAS, EN CIENCIAS DE LA COMPUTACIN
PRESENTA:
LUIS MANUEL FLORES SOBERN
ASESOR:
DR. EDUARDO GASCA ALVAREZ
METEPEC, EDO. DE MXICO, OCTUBRE DE 2012
-
i
Agradecimientos
En primer lugar, agradezco a mi esposa por brindarme la
paciencia, apoyo y
motivacin necesarios para poder llevar a cabo este proyecto.
A mis padres, por haber estado presentes en todo momento para
guiarme y
apoyarme. Sin su ejemplo, gua y ayuda, sera simplemente
impensable estar aqu y
ahora.
A mis hermanas por apoyarme incondicionalmente.
Agradezco tambin al Doctor Eduardo Gasca la confianza brindada
al aceptar ser mi
asesor de tesis as como la gua que siempre estuvo dispuesto a
dar para llevar a
buen puerto el desarrollo del presente trabajo.
Este perodo de tiempo me deja un gran aprendizaje, no slo
acadmicamente sino
tambin personalmente y eso slo es posible por la gran calidad
humana de las
personas con las que trat, tanto alumnos como profesores. Es por
ello que tengo
que agradecer a mis revisores de tesis, los doctores Pacheco,
Sergio y No, por
tomarse el tiempo necesario para hacer que creciera mi proyecto
as como a mis
profesores, el Dr. Gasca, la Mtra. Julieta, el Dr. Pacheco, el
Dr. Celso, el Mtro.
Rafael, la Dr. Citlali y la Mtra. Itzel por la amistad brindada,
por compartir sus
conocimientos y experiencia en el saln de clase, por haber
tenido el objetivo tan
claro de hacernos crecer acadmica y profesionalmente y, sin
darse cuenta, por
haber enriquecido mi vida personal al compartir pensamientos,
puntos de vista,
experiencias, ancdotas de sus vidas personales, o simplemente,
por servir como
ejemplo de lo que es hacer bien las cosas.
Por ltimo agradezco a mis amigos Roco, Cesar, Jimmy y Omar con
los cuales
compart esta etapa de mi vida por haberme ofrecido su
amistad.
-
ii
DEDICATORIA
A mis padres, esposa e hijos que vienen en camino.
-
iii
RESUMEN
En el presente proyecto se propone y examinan los resultados de
un sistema que
utiliza para la representacin de firmas autgrafas digitalizadas,
una nueva
caracterstica no reportada en la bibliografa que sirve de base
al presente proyecto,
la cual est formada por los coeficientes de la Transformada
Wavelet obtenidos de
su aplicacin a los puntos borde de distintos trazos de la firma
en conjunto con una
serie de caractersticas existentes en la literatura consultada
las cuales son la
relacin altura-anchura, la entropa, la mxima, la energa, el rea
de la firma, el
nmero de puntos borde y el nmero de puntos de interseccin. Como
clasificador se
ha utilizado una Red Neuronal Artificial del tipo Perceptron
Multicapa con una
topologa de 4 nodos en la capa oculta y 2 nodos en la capa de
salida entrenada
utilizando el algoritmo BackPropagation con un valor de 0.7 como
razn de
aprendizaje y 0.9 como momento.
Las caractersticas existentes utilizadas, han sido tomadas de
distintos trabajos en
los que las han utilizado de manera individual o en conjunto con
caractersticas no
presentadas en el presente proyecto, es decir, la combinacin de
caractersticas
existentes utilizadas no ha sido reportada en la literatura
consultada, por su parte, la
nueva caracterstica propuesta se basa en los puntos iniciales y
finales de los trazos
tomados en cuenta por la grafoscopa siendo stos de inters por su
dificultad para
ser falsificados. Como se ya se mencion, para la representacin
de estos ltimos,
se utiliza la Transformada Wavelet.
Los experimentos realizados dieron mejores resultados para el
uso exclusivo de la
combinacin de caractersticas ya existentes que cuando se hizo
uso de las
caractersticas obtenidas por medio de la Transformada
Wavelet.
-
iv
Abstract
In this project it is proposed and analyzed the results of a
system that represents the
written signatures using a new feature that does not exist in
the literature that was
consulted. This new feature uses the coeficients of the Wavelet
Transform applied to
the final points of the different strokes of the signature. This
new feature is also used
in combination with a set of existing features such as height to
width ratio (aspect
ratio), entropy, maximum, energy, signature area, number of
final points and the
number of intersection points. As a classifier, an Artificial
Neural Network Multilayer
Perceptron was used with a topology of 4 hidden units and two
output units using
BackPropagation Algorithm to train it with a value of 0.7 as
learning rate and 0.9 as
momentum.
The existing features have been taken from different papers,
this means that they
haven't been used in combination before. The new feature
proposed, is based on the
start and end points of the signature strokes used in
graphology. These points are of
interest because of the difficult to be counterfeited. As
already mentioned, these
points are represented using the Wavelet Transform.
The different experiments show better results using exclusively
the set of existing
features than those results showed when including the new
proposed feature.
-
v
NDICE TEMTICO
1 CAPTULO I
.........................................................................................................
1
1.1 INTRODUCCIN
...........................................................................................
1
1.2 OBJETIVOS
...................................................................................................
6
1.3
CONTRIBUCIN............................................................................................
7
1.4
ORGANIZACIN............................................................................................
8
2 CAPTULO II
........................................................................................................
9
2.1 MARCO
TERICO.........................................................................................
9
2.2 WAVELETS
....................................................................................................
9
2.2.1 Wavelet Daubechies
..............................................................................
11
2.3 RECONOCIMIENTO DE PATRONES
......................................................... 13
2.3.1 Enfoque estadstico
...............................................................................
14
2.4 REDES NEURONALES ARTIFICIALES
...................................................... 17
2.4.1 Modelo Biolgico
...................................................................................
19
2.4.2 Neurona Artificial
...................................................................................
21
2.4.3 Perceptron Simple
.................................................................................
23
2.4.4 Perceptron Multicapa
.............................................................................
26
2.5 PROCESAMIENTO DE IMGENES DIGITALES
........................................ 28
2.5.1 Binarizacin
...........................................................................................
29
2.5.2 Esqueletizacin
......................................................................................
30
2.5.3 Correlacin
............................................................................................
34
2.6 GRAFOSCOPA
...........................................................................................
36
-
vi
2.7 SISTEMAS AUTOMTICOS DE VERIFICACIN DE FIRMAS
................... 43
2.7.1 Caractersticas
.......................................................................................
45
2.7.2 Clasificador
............................................................................................
54
3 CAPTULO 3
......................................................................................................
56
3.1 MTODO
.....................................................................................................
56
3.1.1 Base de Datos
.......................................................................................
58
3.1.2 Formacin de los Patrones
....................................................................
59
3.1.3 Definicin de Topologas de las RNA
.................................................... 71
3.1.4 Mtodos de Evaluacin de las RNA
...................................................... 72
4 CAPTULO 4
......................................................................................................
77
4.1 EXPERIMENTOS
.........................................................................................
77
4.1.1 Experimento #1: Uso de una sola RNA con dos clases para
todas las
firmas 77
4.1.2 Experimento #2: Uso de una sola RNA con dos nodos de
salida por firma
77
4.1.3 Experimento #3: Uso de una RNA con dos nodos de salida por
firma .. 78
4.1.4 Experimento #4: Uso de una RNA con dos nodos de salida por
firma
usando nicamente la combinacin de caractersticas existentes
..................... 78
4.2 RESULTADOS
.............................................................................................
79
4.2.1 Experimento #1: Uso de una sola RNA con dos clases para
todas las
firmas 79
4.2.2 Experimento #2: Uso de una sola RNA con dos nodos de
salida por firma
80
4.2.3 Experimento #3: Uso de una RNA con dos nodos de salida por
firma .. 82
-
vii
4.2.4 Experimento #4: Uso de una RNA con dos nodos de salida por
firma
usando nicamente la combinacin de caractersticas existentes
..................... 83
4.3 SISTEMA PROPUESTO
..............................................................................
85
5 CAPTULO 5
......................................................................................................
93
5.1
CONCLUSIONES.........................................................................................
93
5.2 TRABAJOS FUTUROS
................................................................................
94
6 APNDICES
......................................................................................................
96
6.1 APNDICE A - MatLab
................................................................................
97
6.2 APNDICE B - NeuroSolutions
....................................................................
98
6.3 APNDICE C - Microsoft Visual Studio
........................................................ 99
7 REFERENCIAS BIBLIOGRFICAS
.................................................................
100
-
viii
NDICE DE FIGURAS
FIGURA 2.1. GRFICA DE LA FUNCIN COSENO Y DE LA FUNCIN
WAVELET
MADRE DAUBECHIES 20
........................................................................................
10
FIGURA 2.2. WAVELET MADRE DAUBECHIES
...................................................... 12
FIGURA 2.3. FRONTERA DE DECISIN
.................................................................
15
FIGURA 2.4. NEURONA BIOLGICA
......................................................................
19
FIGURA 2.5. NEURONA ARTIFICIAL.
......................................................................
21
FIGURA 2.6. FUNCIN DE ACTIVACIN LINEAL
.................................................. 22
FIGURA 2.7. FUNCIN DE ACTIVACIN ESCALN
.............................................. 23
FIGURA 2.8. FUNCIN DE ACTIVACIN SIGMOIDE
............................................. 23
FIGURA 2.9. ARQUITECTURA DEL PERCEPTRON MULTICAPA
......................... 26
FIGURA 2.10. IMAGEN EN ESCALA DE GRISES E IMAGEN BINARIZADA
.......... 29
FIGURA 2.11. ESQUELETO DE LA LETRA H.
......................................................... 30
FIGURA 2.12. EJEMPLO DE PIXELES CENTRALES Y FINALES
........................... 33
FIGURA 2.13. FIGURA PARA EVALUACIN DE CONDICIONES 3 Y 4
................. 34
FIGURA 2.14. IMAGEN DE 4x5
................................................................................
34
FIGURA 2.15. MSCARA DE 3x3
............................................................................
35
FIGURA 2.16. APLICACIN KERNEL
......................................................................
35
FIGURA 2.17. PROCESO SIGNATRIZ
.....................................................................
37
FIGURA 2.18. PUNTO DE ATAQUE RECTO
........................................................... 40
FIGURA 2.19. PUNTO DE ATAQUE REDONDEADO
.............................................. 41
FIGURA 2.20. PUNTO DE ATAQUE IMPERCEPTIBLE
........................................... 41
FIGURA 2.21. ESTRUCTURA DE UN SISTEMA DE R.P.
........................................ 43
FIGURA 2.22. FACULTAD HOMOTETICA
...............................................................
47
-
ix
FIGURA 2.23. VALORES DE ANCHURA Y ALTURA EN UNA FIRMA DIGITAL
..... 47
FIGURA 2.24. ENTROPA EN IMAGEN DE UN SOLO COLOR
............................... 50
FIGURA 2.25. ENTROPA EN IMAGEN CON DOS COLORES
............................... 50
FIGURA 2.26. MXIMA
.............................................................................................
51
FIGURA 2.27. RESULTADOS DE APLICAR EL ALGORITMO DE MXIMA A
UNA
FIRMA
.......................................................................................................................
52
FIGURA 2.28. PUNTOS BORDE
..............................................................................
53
FIGURA 2.29. PUNTOS DE INTERSECCIN.
......................................................... 53
FIGURA 3.1. EJEMPLOS DE FIRMAS DE LA BASE DE DATOS.
........................... 59
FIGURA 3.2. DIAGRAMA DE ALTO NIVEL DEL PROCESO DE EXTRACCIN
DE
CARACTERSTICAS.
................................................................................................
60
FIGURA 3.3. IMAGEN EN ESCALA DE GRISES.
.................................................... 62
FIGURA 3.4. IMAGEN BINARIZADA CON UMBRAL
0.8.......................................... 62
FIGURA 3.5. IMAGEN BINARIZADA CON UMBRAL
0.95........................................ 62
FIGURA 3.6. IMAGEN BINARIZADA CON UMBRAL
0.91........................................ 63
FIGURA 3.7. IMAGEN EN ESCALA DE GRISES Y SU ESQUELETO
..................... 65
FIGURA 3.8. MSCARA APLICADA PARA OBTENER PUNTOS BORDE Y DE
INTERSECCIN.
......................................................................................................
66
FIGURA 3.9. EJEMPLOS DE ENTROPA EN 4 DIFERENTES IMGENES
............ 67
FIGURA 3.10. EJEMPLO DE OBTENCIN DE PUNTOS BORDE
.......................... 68
FIGURA 3.11. COEFICIENTES DE DAUBECHIES 2 DE UNA IMAGEN DE 20
POR
20 PIXELES
..............................................................................................................
69
FIGURA 3.12. DIAGRAMA DE VALIDACIN CRUZADA
......................................... 73
FIGURA 3.13. ERRORES COMETIDOS POR LA RED EN LOS CONJUNTOS
DE
ENTRENAMIENTO Y DE VALIDACIN CRUZADA
................................................. 75
-
x
FIGURA 4.1. DIAGRAMA DE FLUJO DEL SISTEMA
............................................... 86
FIGURA 4.2. ARQUITECTURA DE ALTO NIVEL DEL SISTEMA
............................ 86
FIGURA 4.3. EJEMPLO DE CONFIGURACIN DEL CATLOGO DE FIRMAS
DEL
SISTEMA...................................................................................................................
88
FIGURA 4.4. PANTALLA INICIAL DEL SISTEMA DE VERIFICACIN DE
FIRMAS 89
FIGURA 4.5. DROP DOWN DE FIRMAS DEL CATLOGO
..................................... 90
FIGURA 4.6. EJEMPLO DE IMAGEN DE MUESTRA ACTUALIZADA AL
CAMBIAR
LA SELECCIN DE FIRMA DEL CATLOGO
......................................................... 90
FIGURA 4.7. EJEMPLO DE SELECCIN DE IMAGEN A VERIFICAR
.................... 91
FIGURA 4.8. IMAGEN A VERIFICAR SE MUESTRA EN LA PARTE DERECHA
DE
LA PANTALLA DEL SISTEMA
..................................................................................
91
FIGURA 4.9. PANEL DE RESULTADOS ACTUALIZADO
........................................ 92
-
xi
NDICE DE TABLAS
TABLA 2.1. VALORES DE PK PARA LA WAVELET MADRE DAUBECHIES
.......... 12
TABLA 2.2. EJEMPLO 1: CLCULO ENTROPA
..................................................... 48
TABLA 2.3. EJEMPLO 2: CLCULO ENTROPA
..................................................... 49
TABLA 2.4. EJEMPLO 3: CLCULO ENTROPA
..................................................... 49
TABLA 3.1. TOPOLOGAS DE RNA A EVALUAR
.................................................... 72
TABLA 3.2. EJEMPLO DE EXPERIMENTOS DE VALIDACIN CRUZADA
............ 74
TABLA 3.3. EJEMPLO DE MATRIZ DE CONFUSIN
.............................................. 76
TABLA 3.4. MATRIZ DE CONFUSIN DE EJEMPLO PARA CLCULO DE FAR
Y
FRR
...........................................................................................................................
76
TABLA 4.1. PORCENTAJE DE ACIERTOS OBTENIDOS PARA EL CONJUNTO
C1
EVALUANDO LA POSIBILIDAD DE UTILIZAR DOS CLASES
................................. 79
TABLA 4.2. PORCENTAJE DE ACIERTOS OBTENIDOS PARA EL CONJUNTO
C2
EVALUANDO LA POSIBILIDAD DE UTILIZAR DOS CLASES
................................. 79
TABLA 4.3. MATRIZ DE CONFUSIN OBTENIDA EN LOS PRIMEROS 4
EXPERIMENTOS
......................................................................................................
80
TABLA 4.4. MATRIZ DE CONFUSIN TOPOLOGAS 7 y 8 SEGUNDO
EXPERIMENTO
........................................................................................................
80
TABLA 4.5. MATRIZ DE CONFUSIN TOPOLOGA 3 SEGUNDO EXPERIMENTO
..................................................................................................................................
81
TABLA 4.6. MATRIZ DE CONFUSIN TOPOLOGA 4 SEGUNDO EXPERIMENTO
..................................................................................................................................
81
TABLA 4.7. MATRIZ DE CONFUSIN TOPOLOGAS 1,2,5 y 6 USANDO UNA
RNA
POR FIRMA
..............................................................................................................
82
-
xii
TABLA 4.8. DESVIACIONES ESTNDAR EXPERIMENTO VALIDACIN SIN
WAVELETES
............................................................................................................
83
TABLA 4.9. RESULTADOS FINALES
.......................................................................
83
TABLA 4.9. RESULTADOS FINALES (Continuacin)
............................................... 84
-
xiii
LISTADO DE ACRNIMOS
A continuacin se listan los acrnimos utilizados a lo largo de
este documento:
Acrnimo Significado
IA Inteligencia Artificial
RP Reconocimiento de Patrones
RNA Red Neuronal Artificial
FRR False Rejection Rate (Porcentaje de Falsos Rechazos)
FAR False Acceptance Rate (Porcentaje de Falsas
Aceptaciones)
HMM Hidden Markov Model (Modelos Ocultos de Markov)
VC Validacin Cruzada
VCM Validacin Cruzada Modificada
DLL Dynamic Link Library
GUIDE Graphical User Interface Development Environment
NS NeuroSolutions
PB Punto Borde
PI Punto de Interseccin
ET Entropa
A rea
EV Energa Vertical
-
xiv
EH Energa Horizontal
W Width
H Height
RHV Relacin entre Energa en Diagonal Izquierda-Derecha y
Relacin entre Energa en Diagonal Derecha-Izquierda
CW Coeficiente Wavelet
-
1
1 CAPTULO I
1.1 INTRODUCCIN
Las computadoras se han utilizado desde sus inicios para asistir
al ser humano en la
realizacin de tareas repetitivas que, realizadas por el ser
humano, resultan tardadas
y propensas a errores.
Con el paso del tiempo, ciencias como la Electrnica, Computacin,
Fsica y
Matemticas, entre otras, avanzan permitiendo utilizar la
computadora para realizar
tareas cada vez ms diversas. Adems del desarrollo que se da en
la capacidad de
almacenamiento y procesamiento por parte de las computadoras, se
da tambin un
avance muy importante dentro de diversas ramas del rea del
software como lo son
la teora de compiladores, bases de datos, grficas por
computadora, algoritmos y
estructuras de datos y computacin cientfica entre otras.
En la dcada de los 40 y 50, surgen los primeros programas que
simulan el
razonamiento humano, originando con ello, el surgimiento de la
Inteligencia Artificial
(IA) [Jones08]. El principal reto de la IA es construir
programas que puedan llevar a
cabo tareas que se perciben como propias del ser humano. Dos de
las
caractersticas principales de los problemas que suelen ser
resueltos mediante
tcnicas de IA son que presenten variabilidad y que no haya
manera de expresar su
solucin como una serie de pasos secuenciales como se hace en los
algoritmos de la
computacin tradicional.
El sistema descrito en el presente proyecto cae precisamente en
esta rea ya que
una persona nunca realiza dos firmas idnticas por lo que
requiere de tcnicas de IA
para poder ser modelado en una computadora.
Desarrollar un sistema automtico de verificacin de firmas
autgrafas es importante
ya que actualmente, uno de los medios ms difundidos de
identificacin personal es
-
2
precisamente la firma, la cual es utilizada ampliamente por toda
la poblacin para dar
fe de acuerdo y conformidad de toda clase de documentos;
contratos, recepcin y
expedicin de documentos entre otros [McCabe08] [Orellana75].
Debido a que es un
medio tan ampliamente utilizado, la verificacin de firmas para
transacciones
importantes supone un gran consumo de tiempo por parte del ser
humano que, al ser
automatizada, se traduce en un aumento en la productividad
[McCabe08].
Los sistemas de verificacin de firmas autgrafas son estudiados
en el campo de la
biometra el cual se enfoca en encontrar mtodos automticos para
la identificacin
de personas basados en rasgos conductuales o fsicos intrnsecos.
El trmino
proviene del griego bios vida y metron medida y la informtica
recurre a ella para
encontrar mtodos de autenticacin de usuarios, como por ejemplo;
lectores de
huellas digitales, lectores de iris, patrones faciales y
geometra de la mano entre
otros [Vaca07].
Los sistemas de verificacin de firmas en particular, se basan en
el hecho de que
cada firma contiene rasgos nicos que identifican de manera
inequvoca a la persona
que la expide. Estos rasgos son principalmente conductuales pero
tambin
intervienen rasgos fisiolgicos como si la persona es zurda o
derecha [Kholmatov03]
[Orellana75]. Pueden funcionar dinmicamente (on-line) o
estticamente (off-line),
estos ltimos con base a imgenes de firmas previamente
digitalizadas. Por el primer
mtodo, se pueden obtener caractersticas de la firma que estn en
funcin del
tiempo como pueden ser la velocidad, el tiempo total en el que
se escribe la firma, el
cambio de presin con respecto al tiempo o a los diferentes
trazos de la firma entre
otros [Leclerc94].
Por el mtodo esttico, las caractersticas dinmicas de la firma se
pierden, por
ejemplo, no se puede saber cunto tiempo se tard la persona en
firmar pero se
conservan caractersticas propias de la imagen como son la
proporcin entre altura y
anchura, el ngulo de orientacin de la firma, entre otras
[Plamondon94], sin
embargo, estos sistemas son los ms prcticos ya que no se
requiere de los
-
3
dispositivos electrnicos necesarios para los sistemas en lnea.
El sistema que se
estudia en esta investigacin, pertenece al grupo de sistemas
off-line o estticos por
lo que requiere ser alimentado por una imagen digital.
Esta particularidad que se presenta de llevar a cabo una
identificacin personal con
base en rasgos conductuales o fsicos, hace que el desarrollo de
este tipo de
sistemas pueda ser tratado de manera eficiente por la rama de la
IA conocida como
Reconocimiento de Patrones (RP) la cual era inicialmente tratada
por la rama de la
teora estadstica pero, con la evolucin del poder de cmputo de
los equipos
modernos, se increment la demanda de aplicaciones prcticas lo
que desemboc
en una necesidad de nuevos desarrollos tericos. En la
actualidad, el
Reconocimiento de Patrones es de gran importancia en
aplicaciones de ingeniera,
medicina, minera de datos y manufactura, entre otros, es decir,
el Reconocimiento
de Patrones es parte integral de la mayora de los sistemas
Inteligentes
[Theodoridis08].
Las tareas de RP consisten en realizar un mapeo de un conjunto
de datos de entrada
con un conjunto de posibles salidas. Por lo general, este mapeo
se modela a travs
de una funcin matemtica que contiene cierto nmero de parmetros
ajustables y
cuyos valores son determinados con la ayuda de datos de ejemplo
denominados
muestras de entrenamiento. Existen bsicamente dos tipos de
tareas de RP las
cuales se denominan de clasificacin y de regresin. En los
problemas de
clasificacin, el objetivo es asignar los datos de entrada a una
clase de un conjunto
discreto de posibles clasificaciones. Por su parte, en los
problemas de regresin, las
posibles salidas representan valores de variables continuas. Un
ejemplo de problema
de clasificacin puede ser el reconocimiento de caracteres
manuscritos mientras que
un ejemplo de un problema de regresin puede ser la prediccin de
la tasa de
cambio de una moneda en el futuro. El sistema descrito en el
presente proyecto, cae
dentro de la categora de problemas de clasificacin.
-
4
Bsicamente, los sistemas de reconocimiento de patrones toman
como entrada un
conjunto de medidas que representan las caractersticas de un
objeto o
comportamiento a ser clasificado y que son obtenidas a partir de
imgenes o
seales. En nuestro caso particular, debemos extraer, a partir de
la imagen digital
que contiene la firma a ser clasificada, un conjunto de medidas
que cuantifiquen las
caractersticas que permitan representar a la firma.
Adicionalmente, los sistemas de
RP pueden realizar algn tipo de procesamiento sobre los datos de
entrada de
manera que se facilite el proceso de clasificacin y por ltimo,
realizan un proceso en
el cul clasifican la entrada en una clase dada.
Existen dos tipos de sistemas, los no supervisados y los
supervisados; la diferencia
entre ambos es que los supervisados, para poder realizar esta
clasificacin, deben
ser previamente entrenados mediante algn algoritmo de
aprendizaje mientras que
los no supervisados no requieren este entrenamiento previo
siendo utilizados para
descubrir relaciones entre los patrones no siempre evidentes a
simple vista. Ya que
los sistemas supervisados requieren ser entrenados previamente,
es indispensable
tener a la mano una serie de ejemplos con los cuales llevar a
cabo dicho
entrenamiento. En el caso de nuestro sistema, se obtuvo una base
de datos de
imgenes digitales de firmas autgrafas con la cual llevar a cabo
el entrenamiento.
Para realizar la clasificacin, los sistemas de RP pueden
utilizar distintos mtodos
como son Funciones Discriminantes Redes Neuronales Artificiales
(RNA). Las RNA
intentan simular el comportamiento de los sistemas nerviosos
biolgicos y son
particularmente tiles para problemas cuya solucin no puede ser
expresada
mediante una serie de pasos bien definidos. Ejemplos de
aplicaciones en las que las
RNA realizan un buen trabajo de acuerdo a [Heaton08] son las
siguientes:
Clasificacin
Agrupamiento
Optimizacin
Prediccin
-
5
El sistema descrito en el presente proyecto, hace uso de tcnicas
de RP para llevar a
cabo la clasificacin de firmas autgrafas utilizando una RNA
entrenada mediante
tcnicas de Aprendizaje Supervisado.
En cuanto a la representacin de las firmas, se ha optado por
utilizar una
combinacin no reportada en la literatura consultada de
caractersticas ya existentes
y adems, se propone una nueva caracterstica basada en el
concepto de puntos
iniciales y finales de trazos encontrada en la grafoscopa.
Para la extraccin de las primeras, se hace uso de tcnicas de
Procesamiento de
Imgenes Digitales mientras que para la caracterstica nueva, se
utiliza la
Transformada Wavelet.
-
6
1.2 OBJETIVOS
La diferencia en el avance que se ha dado entre los sistemas
estticos y dinmicos
es muy grande. Mientras que los sistemas dinmicos han logrado
resultados con
muy bajos porcentajes de error, los estticos siguen an
obteniendo porcentajes de
error ms grandes lo que los hace poco prcticos para aplicaciones
reales
[Leclerc94], sin embargo, son precisamente los sistemas estticos
los que resultan
ms atractivos para aplicaciones prcticas debido a que son ms
fciles de
implementar ya que no requieren dispositivos electrnicos
especiales y slo
necesitan como entrada, una imagen digital de la firma a
analizar.
De esta necesidad, surge el actual proyecto el cul se enfoca en
un mtodo esttico
para la verificacin de firmas explorando el uso de la
Transformada Wavelet en
conjunto con las caractersticas propias de los mtodos estticos a
saber: altura,
anchura y centro entre otras. Como clasificador se emplear una
Red Neuronal
Artificial.
Los objetivos planteados para este proyecto son los
siguientes:
Proponer un sistema que permita clasificar una firma como
autntica o falsa.
Utilizar Wavelets en la Representacin del Patrn de una
Firma.
Proponer una combinacin de caractersticas existentes no
reportada en la
literatura consultada.
Mezclar las caractersticas obtenidas mediante el uso de Wavelets
con la
combinacin propuesta de caractersticas ya existentes.
Utilizar una Red Neuronal Artificial para llevar a cabo la
clasificacin.
-
7
1.3 CONTRIBUCIN
En esta investigacin se ha realizado lo siguiente:
Se propuso encontrar los puntos borde de los diferentes trazos
en la firma
como una nueva caracterstica no encontrada en la literatura
revisada.
La representacin de la nueva caracterstica propuesta se realiz
mediante el
uso de la Transformada Wavelet.
Se propuso una combinacin no reportada en la literatura
consultada de
caractersticas ya existentes.
Se combin la nueva caracterstica con la combinacin propuesta
de
caractersticas tradicionales encontradas en la literatura
revisada.
Se hizo uso de una RNA para llevar a cabo la clasificacin
utilizando, en
concreto, una red de tipo Perceptron Multicapa entrenada
mediante el
algoritmo BackPropagation.
En resumen, en este documento se describe cmo se consigui
implementar la
nueva caracterstica, utilizarla en conjunto con las dems
caractersticas ya
existentes en la literatura consultada para llevar a cabo la
clasificacin de firmas
autnticas o falsas mediante el uso de una Red Neuronal
Artificial.
-
8
1.4 ORGANIZACIN
En el captulo dos se encuentra la teora que soporta la presente
investigacin la cual
comienza con una breve introduccin a las wavelets, definiendo en
particular, las
wavelets de la familia de Daubechies. El captulo contina
exponiendo de manera
breve lo que es el Reconocimiento de Patrones seguido por la
teora de las Redes
Neuronales Artificiales donde se introduce la red ms sencilla
conocida como
Perceptron para dar paso al modelo ms complejo del Perceptron
Multicapa. A
continuacin se trata el Procesamiento de Imgenes Digitales
explicando los
conceptos de binarizacin, filtrado lineal por correlacin y
esqueletizacin; en
particular, describiendo el mtodo propuesto en [Zhang84] para
obtener el esqueleto
de una imagen. Al finalizar con el tema de Procesamiento de
Imgenes Digitales, se
describen los principios de la disciplina de la Grafoscopa y por
ltimo, se da una
introduccin a los Sistemas de Verificacin Automtica de
Firmas.
En el captulo tres y cuatro, se describe el mtodo seguido en la
presente
investigacin as como los resultados obtenidos y la descripcin
del sistema
desarrollado mientras que el captulo cinco, por su parte,
presenta las conclusiones y
sugiere una serie de propuestas para continuar con el
proyecto.
Al final se puede encontrar una serie de apndices donde se
describe el software
utilizado para la realizacin del sistema propuesto.
-
9
2 CAPTULO II
2.1 MARCO TERICO
En este captulo se expone la teora que fundamenta la presente
investigacin
comenzando con una breve introduccin a las wavelets seguida por
la teora de RNA
utilizada para llevar a cabo este proyecto. El resto del captulo
est dedicado al
Procesamiento de Imgenes Digitales, Grafoscopa y Sistemas
Automticos de
Verificacin de Firmas.
2.2 WAVELETS
Las expansiones trigonomtricas surgieron en el siglo 18 durante
estudios de
vibracin de cuerdas y otros fenmenos similares pero no fueron
tratadas de una
manera sistemtica sino hasta que, en 1808, Jospeh Fourier
escribi "Thorie
Analytique de la Chaleur" (Teora Analtica del Cal or) , donde
realiz un estudio
detallado de las series trigonomtricas las cuales utiliz para
resolver varios
problemas relacionados con la conduccin de calor. Su trabajo fue
controversial en
su momento y, an despus de dos siglos, las series de Fourier son
importantes,
tanto prctica como tericamente y siguen siendo objeto de
investigacin.
Una expansin trigonomtrica de una funcin f(x) est dada por una
sumatoria o
serie del tipo:
)()cos()( 0 kxsenbkxaaxf kk k ++=
Mediante la expansin de una seal en su serie trigonomtrica es
posible
manipularla llevando a cabo diversas tareas. Una tarea comn en
el anlisis de
seales es la eliminacin del ruido de alta frecuencia. Un enfoque
para llevar esto a
cabo es expresar la seal como una serie trigonomtrica y poner a
cero los
coeficientes de las frecuencias altas. Otra tarea es la
compresin de datos. Aqu el
-
10
enfoque puede ser, expresar la funcin en trminos de una expansin
trigonomtrica
y conservar slo aquellos trminos cuyos coeficientes sean mayores
que algn
umbral de tolerancia.
A pesar de que la transformada de Fourier ha sido el pilar del
procesamiento de
imgenes basado en transformadas desde la dcada de los aos 50, a
finales de los
aos 80's surgi otro tipo de Transformada llamada Transformada
Wavelet con la
cual es ms fcil realizar tareas de compresin, anlisis y
transmisin de imgenes
[Gonzles08].
Una wavelet es una funcin en forma de "onda" con una duracin
limitada y con un
valor promedio de 0. A diferencia de las funciones sinusoidales
que, tericamente se
extienden de - a +, las wavelets tienen un principio y un fin
[Fugal09]. La figura 2.1
muestra la diferencia entre la funcin coseno y una wavelet
Daubechies 20.
FIGURA 2.1. GRFICA DE LA FUNCIN COSENO Y DE LA FUNCIN WAVELET
MADRE
DAUBECHIES 20
A diferencia de la transformada de Fourier que slo provee
informacin en el dominio
frecuencial, la Transformada Wavelet proporciona informacin
tanto en el dominio
frecuencial como en el temporal, es decir, puede detectar
anomalas o caractersticas
de inters en la seal y, al mismo tiempo, indicar cundo suceden
[Gonzles08].
-
11
Existen diversas familias de wavelets, cada una con diferentes
caractersticas que las
hacen ms o menos adecuadas para diferentes tareas. En general,
la transformada
Wavelet est dada por la siguiente ecuacin:
=
=kj
jjk kxbxf
,
)2()( (1)
Siendo:
b Coeficiente a calcular.
Wavelet Madre.
j y k Factores de escalamiento y traslacin respectivamente.
Cada familia de wavelets cuenta con una wavelet madre la cual es
aplicada a lo largo
de la seal en diferentes posiciones y en diferentes escalas. La
escala y la posicin
de la seal donde ha de ser aplicada la wavelet vienen
especificadas por los valores
en j y k .
2.2.1 Wavelet Daubechies
La wavelet madre para la familia de wavelets de Daubechies se
define mediante la
siguiente ecuacin:
)2/()( 2/2/ Ni
Ni
N ePe = (2)
NP es un polinomio de grado N donde N indica el tipo de wavelet
de Daubechies a
utilizar, por ejemplo: Db2, Db3 Db50 y viene dado por:
=12
2
1:)(
N
k
kkN zpzP (3)
kp , por su parte, toma valores de la Tabla 2.1.
-
12
N se encuentra definida por la siguiente ecuacin:
=
=1
2/ )(2
1)(
j
iNN
j
eP
(4)
TABLA 2.1. VALORES DE PK PARA LA WAVELET MADRE DAUBECHIES
kp 1=N 2=N 3=N 4=N
0p 1 0.683013 0.470467 0.325803
1p 1 1.183013 1.141117 1.010946
2p 0 0.316987 0.650365 0.892200
3p 0 -0.183013 -0.190934 -0.039575
4p 0 0 -0.120832 -0.264507
5p 0 0 0.049817 0.043616
6p 0 0 0 0.023252
7p 0 0 0 -0.014987
En la figura 2.2, se muestra la wavelet madre de Daubechies.
FIGURA 2.2. WAVELET MADRE DAUBECHIES
-
13
2.3 RECONOCIMIENTO DE PATRONES
Podemos definir el trmino patrn como la representacin de un
objeto y el trmino
Reconocimiento de Patrones, de acuerdo a [Tou74], como la tarea
de detectar y
extraer rasgos comunes que describen los objetos pertenecientes
a una misma clase
de patrones y reconocer este patrn en cualquier nuevo ambiente
para clasificarlo
como un miembro de dicha clase.
Existen varios enfoques para el estudio de las tareas de RP
siendo el estadstico y el
sintctico los que mayor atencin han recibido.
El enfoque sintctico intenta encontrar los elementos bsicos de
los patrones para
describirlos as como un conjunto de reglas sintcticas o gramtica
que especifique
la forma en la que estas primitivas se pueden combinar para dar
lugar a un patrn
legtimo dentro de una clase de inters [Gasca10].
El enfoque estadstico, por su parte, reconoce la naturaleza
probabilstica tanto de la
informacin que se busca procesar como de la forma en la que los
resultados se
deberan representar [Bishop95] y se considera que el problema de
decidir si un
patrn pertenece o no a una clase puede ser tratado por la teora
estadstica de la
decisin.
Este enfoque supone que los patrones se pueden representar
mediante vectores y
que en la mayora de los problemas reales, existe un solapamiento
inevitable en la
distribucin de las clases lo que subraya su naturaleza
inherentemente probabilstica.
Esto mismo hace que sea necesario tratar las variables medidas
como cantidades
aleatorias y obliga a aceptar que no siempre es posible una
clasificacin perfecta de
nuevos patrones.
Los sistemas de RP tienen tres etapas fundamentales:
-
14
Preprocesamiento.- Durante esta etapa se trata la informacin
original para
mejorar su calidad.
Seleccin de variables.- Aqu se trata de elegir las variables con
mayor poder
discriminatorio para reducir la dimensin del problema y mejorar
la precisin
del clasificador.
Clasificacin.- Esta etapa se considera, en el enfoque
estadstico, como un
problema que, dado el carcter multidimensional de la informacin
utilizada,
se puede resolver utilizando mtodos de anlisis multivariado como
lo es el
anlisis discriminante.
2.3.1 Enfoque estadstico
De acuerdo a [Gasca10], se le atribuye por primera vez a Chow,
en 1957, la
formulacin rigurosa del problema de RP en trminos de la teora de
decisin
estadstica y su objetivo es encontrar un clasificador ptimo, es
decir, aqul que
tenga la menor probabilidad de cometer errores.
Para este enfoque, el patrn se representa mediante un vector
),...,,,( 321 pxxxx=X
de mediciones el cual se considera como un punto en un espacio
p-dimensional y
diferentes individuos pueden producir diferentes valores para
una misma medicin
sin importar que pertenezcan a la misma clase.
Como ya se mencion en la Introduccin, el RP se puede
formalizar
matemticamente como una funcin, definida con dominio en el
espacio de las
mediciones o atributos y con imagen en el conjunto de clases
presentes en el
problema que se estudia por lo que la entrada al sistema de RP
es un conjunto de p
mediciones y la salida es la etiqueta o cdigo que identifica a
una de las clases que
se consideran. Por lo anterior, se acostumbra representar la
entrada como un vector
X conocido como vector patrn [Gasca10].
-
15
El mapeo entre el vector patrn y las clases dadas se lleva a
cabo mediante una
funcin de la forma:
)(X=c (5)
donde ),...,2,1( mc es la etiqueta correspondiente a una de las
m clases
consideradas en el problema y )(X es la funcin de decisin.
Se trata entonces de poder dividir el espacio de variables en
regiones de decisin,
correspondiendo cada una de esas regiones a una clase dada. El
borde o frontera
entre cada regin se conoce como frontera de decisin y el
objetivo de )(X , por lo
tanto, es asignar X a la clase asociada a una regin dada. En la
figura 2.3 se ilustra
grficamente este concepto utilizando un espacio
bidimensional:
FIGURA 2.3. FRONTERA DE DECISIN
Si no se conoce la clasificacin correcta de los patrones
disponibles se utilizan
mtodos no supervisados o algoritmos de clustering para encontrar
relaciones no
conocidas de antemano entre ellos. Si por el contrario, se
conoce la clasificacin de
un conjunto de patrones disponibles, se pueden utilizar mtodos
supervisados y el
conjunto de patrones disponibles previamente clasificados se
conoce entonces como
Muestra de Entrenamiento y es utilizada para entrenar el
clasificador. Existen dos
tipos de mtodos de entrenamiento supervisados:
-
16
Paramtricos.- Se conoce o se supone que se conoce la funcin de
densidad
del modelo y, mediante la muestra de entrenamiento, se busca
ajustar los
parmetros de la funcin para que se ajuste al modelo.
No Paramtricos.- Estos son independientes de cualquier supuesto
sobre la
estructura probabilstica.
-
17
2.4 REDES NEURONALES ARTIFICIALES
La importancia de las RNA en el contexto mencionado en la seccin
anterior, es que
ofrecen un mtodo muy poderoso y flexible de representar mapeos
no lineales desde
varias variables de entrada hacia varias variables de salida
donde la forma del
mapeo, como se ver ms adelante, se encuentra gobernada por un
nmero de
parmetros ajustables [Bishop05].
Las RNA, son un paradigma de aprendizaje y procesamiento
automtico inspirado en
el sistema nervioso de los animales. Se puede ver como un
sistema de interconexin
de neuronas colaborando para producir un estmulo de salida el
cual tiene diversas
ventajas sobre mtodos de procesamiento de informacin
convencionales como lo
son:
No linealidad.- La respuesta puede ser lineal o no lineal. Esto
es importante ya
que la mayora de los fenmenos en el mundo real no se comportan
de
manera lineal.
Flexibilidad.- Maneja bien el ruido en la seal de entrada.
Auto-organizacin.- Esta propiedad permite a la red distribuir el
conocimiento
en toda la estructura de la red permitiendo que no haya
elementos con
informacin especfica.
Aprendizaje adaptativo.- Son capaces de aprender a travs de la
presentacin
repetitiva de una serie de ejemplos previamente clasificados sin
requerir de un
modelo previo.
Tolerancia a Fallos.- Puede continuar funcionando an cuando
partes de la
red no funcionen correctamente debido a que la informacin se
guarda de
manera redundante.
De acuerdo a [Gurney97], podemos definir el trmino de Red
Neuronal Artificial
como:
-
18
"Un ensamble interconectado de elementos simples de
procesamiento, unidades o
nodos, cuya funcionalidad est vagamente basada en la neurona
animal. La
habilidad de procesamiento de la red, se encuentra ubicada en la
fuerza de la
interconexin entre unidades, o pesos, obtenidos mediante un
proceso de adaptacin
hacia, o aprendizaje desde, un conjunto de patrones de
entrenamiento."
Las unidades o nodos se refieren a las neuronas artificiales o
computacionales que
se encuentran organizadas jerrquicamente en capas y se comunican
entre ellas
mediante conexiones ponderadas por pesos que definen la
importancia de la
conexin particular entre neuronas.
La manera en la que se estructura la RNA, es decir, el nmero de
capas, el nmero
de neuronas por capa y sus conexiones, define su topologa o
arquitectura
permitiendo categorizar a las neuronas en tres tipos; de
entrada, salida y ocultas. Las
neuronas de entrada tienen como funcin principal obtener los
valores del patrn de
entrada con los que se alimenta la red para pasarlas a las
neuronas de las siguientes
capas. Una caracterstica de este tipo de neuronas es que no
realizan procesamiento
alguno sobre los valores de entrada y se limitan a pasar lo que
reciben a las
neuronas de las siguientes capas. Las neuronas ocultas se
encuentran en capas
intermedias, es decir, no tienen contacto con el ambiente
externo a la red y por
ltimo, las de salida, toman como entrada las salidas de las
neuronas de las capas
ocultas y se encargan de notificar la salida de la red al
exterior [Gasca11].
El conocimiento se guarda en los pesos de las conexiones entre
neuronas los cuales
son inicializados de manera aleatoria y, mediante un proceso de
entrenamiento, se
van modificando hasta que la red aprende la tarea para la que
ser utilizada. A estos
procesos de entrenamiento se les denomina Aprendizaje y puede
ser Supervisado o
No Supervisado.
En el Aprendizaje Supervisado, un conjunto de patrones,
previamente clasificados,
es presentado a la red a lo largo de una serie de iteraciones a
travs de las cuales,
se modifican los pesos utilizando una regla de aprendizaje cuyo
objetivo es minimizar
-
19
una funcin de error, por ejemplo, el error cometido en el valor
real de salida de la
red con respecto al valor deseado.
2.4.1 Modelo Biolgico
Las RNA se inspiran en el modelo biolgico del cerebro por lo
cual, necesitamos
tener un entendimiento del funcionamiento bsico del cerebro para
poder
comprender la formulacin de las RNA.
Los sistemas nerviosos poseen diferentes arquitecturas de
diversas complejidades
pero todos ellos estn formados, de manera similar, por bloques
bsicos de clulas
llamadas neuronas. Existen varios tipos de neuronas,
morfolgicamente distintas
dependiendo de las funciones que realizan, sin embargo, todas
ellas tienen en
comn que poseen una gran capacidad de comunicacin [Rojas96].
El funcionamiento bsico de las neuronas es recibir una seal de
entrada y producir
una seal de salida. En la figura 2.4, se muestra la estructura
general de una
neurona:
FIGURA 2.4. NEURONA BIOLGICA
Las Dendritas son los canales de transmisin a travs de los
cuales, la neurona
recibe informacin. En el Soma, o ncleo de la clula, se procesa
produciendo o no,
-
20
una seal de salida que es enviada a travs del Axn mediante un
impulso elctrico
a otras Dendritas. Las Dendritas no tocan fsicamente el Axn, ms
bien, se
comunican por medio de una regin llamada sinapsis a travs de la
cual se
transmiten sustancias qumicas denominadas neurotransmisores
[Gasca11].
Nuestro cuerpo est formado de una gran cantidad de agua,
encontrndose el 55%
de ella dentro del cuerpo de las clulas y el restante 45%
alrededor de ellas por lo
que las clulas mantienen sus componentes biolgicos aislados del
resto del cuerpo
mediante una capa protectora o membrana. En el fluido
extracelular e intracelular,
existen especies inicas de sales como cloruro-, sodio+ y
potasio+ que juegan un
papel fundamental en el intercambio de informacin entre
neuronas. Las membranas
de las clulas cuentan con canales inicos que estn formados por
macromolculas
con formas y cargas especficas para dejar pasar determinadas
cantidades de iones
de un lado a otro de la membrana. Diferentes grados de
permeabilidad a elementos
especficos en la membrana, permiten que haya diferencias en la
distribucin entre
los elementos inicos que se encuentran dentro y fuera de la
membrana haciendo
que exista una diferencia de carga entre el fluido intracelular
y el extracelular. A esta
diferencia de carga se le conoce como potencial en reposo
[Rojas96]. Cuando se
transmite la informacin a travs de la sinapsis, se genera una
variacin en este
potencial conocida como potencial de accin el cual genera una
variacin en la
permeabilidad de la membrana permitiendo el intercambio de los
neurotransmisores.
Las sinapsis pueden ser excitadoras o inhibidoras. Las primeras
producen
disminuciones de potencial, ocasionando con esto la generacin de
impulsos. Las
segundas, por su parte, estabilizan el potencial inhibiendo la
generacin de impulsos
[Gasca11].
Ya que la neurona, a travs de sus dendritas, recibe informacin
de varias neuronas,
la seal total de entrada es la suma ponderada de cada una de las
seales recibidas.
Si el total rebasa cierto umbral, la neurona se activa
[Gasca11].
-
21
Es en base al modelo expuesto anteriormente, que surge dentro
del rea de la IA la
teora de las RNA.
2.4.2 Neurona Artificial
Una RNA, est formada por nodos que mantienen conexiones con
otros nodos o con
su ambiente externo. Cada uno de estos nodos es una neurona
artificial y cada una,
recibe una entrada y genera una salida [Russell96].
Con base al modelo de la neurona biolgica, en la figura 2.5, se
muestra el modelo
tpico de una neurona artificial:
FIGURA 2.5. NEURONA ARTIFICIAL.
El modelo est formado por una serie de conexiones a travs de las
cuales la
neurona recibe una serie de valores de entradas, en especfico, n
entradas ms una
entrada fija con valor de uno llamada bias. Cada conexin se
encuentra ponderada
por un peso y, la entrada neta que recibe la neurona, es la
sumatoria de la
multiplicacin de cada peso por el valor de salida del nodo de la
capa anterior como
se muestra en la siguiente ecuacin:
-
siendo w el vector de pesos aumentado y
anterior. Se dice que los vectores son aumentados por que
incluyen los valores del
bias.
La neurona cuenta tambin con una funcin de activacin la cual
recibe la
neta de la neurona y decide si la neurona se activa o no. Por lo
general, las funciones
de activacin son funciones no lineales que producen valores de
salida en el rango
de 0 a 1, sin embargo, existen diversas funciones de activacin
[Selene09].
Algunas funciones de activacin son:
Lineal.- yxf =)( (Figura
Escaln.- 0=y si
Sigmoide.- xf =)(
FIGURA
=
=n
iijij ownet
0
el vector de pesos aumentado y o el valor de salida del nodo de
la capa
anterior. Se dice que los vectores son aumentados por que
incluyen los valores del
La neurona cuenta tambin con una funcin de activacin la cual
recibe la
neta de la neurona y decide si la neurona se activa o no. Por lo
general, las funciones
de activacin son funciones no lineales que producen valores de
salida en el rango
de 0 a 1, sin embargo, existen diversas funciones de activacin
[Selene09].
Algunas funciones de activacin son:
(Figura 2.6)
si 0
-
FIGURA
FIGURA
2.4.3 Perceptron Simple
El Perceptron Simple es la RNA ms sencilla que existe, creada
por Rosenblat
1958 [Russell96]. Su topologa est
salida [Gasca11].
FIGURA 2.7. FUNCIN DE ACTIVACIN ESCALN
FIGURA 2.8. FUNCIN DE ACTIVACIN SIGMOIDE
Perceptron Simple
El Perceptron Simple es la RNA ms sencilla que existe, creada
por Rosenblat
96]. Su topologa est formada por dos capas, una de entrada y una
de
23
ESCALN
FUNCIN DE ACTIVACIN SIGMOIDE
El Perceptron Simple es la RNA ms sencilla que existe, creada
por Rosenblatt en
formada por dos capas, una de entrada y una de
-
24
El Perceptron simple, separa los patrones de entrada en dos
categoras.
Geomtricamente, estas categoras se pueden ver como regiones en
un espacio n-
dimensional que son separadas por una lnea, plano o hiperplano
[Gurney97]. Cada
patrn, por lo tanto, se puede ver como un punto en ese espacio
n-dimensional,
usando sus valores como coordenadas, es decir, para n entradas,
se tendr un
espacio de n dimensiones.
Como ya se mencion anteriormente, las neuronas de la capa de
entrada no realizan
ningn procesamiento sobre los valores de entrada por lo que su
salida es la misma
que su entrada. Para cualquier otro nodo, su entrada se
determina mediante el
clculo del valor neto descrito mediante la Ecuacin 6.
Este valor neto de entrada, es en realidad una combinacin lineal
de los elementos
de entrada y los pesos de las conexiones como se muestra en la
siguiente ecuacin:
=
++=n
jjjj wxwy
11 1* (7)
1+jw es el peso del elemento bias cuyo valor de salida siempre
es 1 y corresponde en
la interpretacin geomtrica del Perceptron al trmino constante de
la ecuacin de la
recta, plano o hiperplano, que separa el espacio de observacin
en dos. Si no fuera
por este trmino, la recta, plano o hiperplano, pasara siempre
por el origen.
Como ya se mencion, por razones de simplicidad podemos incluir
el bias en los
vectores de pesos y en el vector de entrada, generando as los
vectores aumentados
de pesos y de valores de entrada. Si definimos w como el vector
de pesos
aumentado, tendramos que:
[ ]Tnn wwww 121 ,,..., +=w (8)
Si definimos el vector aumentado de entrada como z tendramos
que:
-
25
[ ]Tnxxx 1,,..., 21=z (9) Con estos dos vectores, podemos
redefinir la funcin discriminante lineal como:
zwT =y (10)
El resultado es entonces evaluado por regla de decisin:
es decir, cuando d= 1, el patrn pertenece a la clase A de lo
contrario, pertenece a la
clase B.
La regla de aprendizaje para el Perceptron Simple, la cual
ajusta los pesos, es la
siguiente:
iiiii dt zww )(1 += (11)
donde t es la salida real de la red en la iteracin i ,
d es la salida deseada en la
iteracin i y es un constante llamada razn de aprendizaje.
El principal problema del Perceptron Simple es que solamente es
eficiente en
problemas con dos clases que sean linealmente separables, lo que
lo hace poco
prctico para la mayora de aplicaciones reales las cuales tienden
a ser de ms de
dos clases y no linealmente separables.
-
26
2.4.4 Perceptron Multicapa
El Perceptron Multicapa es la unin de varios perceptrones
simples [Selene09].
Mediante estas uniones, el Perceptron Multicapa es capaz de
resolver los problemas
con los que se enfrenta el Perceptron Simple pudiendo tratar con
problemas no
separables linealmente. La figura 2.9 ilustra la arquitectura
del Perceptron Multicapa.
FIGURA 2.9. ARQUITECTURA DEL PERCEPTRON MULTICAPA
Adems de la diferencia en topologa entre el Perceptron Simple y
el Multicapa, el
algoritmo de aprendizaje es diferente. La diferencia radica en
que, en este modelo,
se deben ajustar los pesos de las conexiones de los nodos de las
capas ocultas,
tratando de determinar la influencia que tuvo cada uno, en el
error total de la salida
de la red [Gurney97]. A este problema se le conoce como el
problema de la
Asignacin de Crditos y se puede resolver si se cuenta con una
funcin de error
diferenciable con respecto a los pesos, pudiendo as, evaluar las
derivadas del error
con respecto a los pesos y utilizarlas para encontrar los
valores de los pesos que
minimicen el error con algn mtodo como el de gradiente
descendente [Bishop95].
Un algoritmo muy popular que implementa esta solucin es el
algoritmo
BackPropagation que pertenece tambin a la clase de mtodos
supervisados, es
decir, se requiere una muestra de entrenamiento previamente
clasificada. Se llama
as porque propaga el error de adelante hacia atrs a travs de los
nodos de la red.
-
27
El algoritmo se lleva a cabo en dos fases: En la primera, se
evala el error de la red y
en la segunda, se calcula la derivada del error con respecto a
los pesos para calcular
su ajuste de manera que se minimice la funcin de error.
Este algoritmo utiliza el error cuadrtico medio como funcin de
error:
2
12
1 )(=
=S
S
N
i
piNE (12)
siendop
i :
)( pip
ip
i sd = (13)
es decir, el error cometido definido como la diferencia entre la
salida deseada pid y la
salida real de la red pis para el p-simo patrn en la i-simo nodo
de la capa de salida.
sN es la cantidad de nodos de la capa de salida.
Una vez obtenido el error cuadrtico medio, los pesos se ajustan
mediante el uso del
algoritmo de gradiente descendente:
)1()( += twEtw pw (14)
Donde es la razn de aprendizaje, pwE es el gradiente de la
funcin de error con
respecto a los pesos, es el momento y t es el nmero de
iteraciones.
-
28
2.5 PROCESAMIENTO DE IMGENES DIGITALES
Ya que el sistema propuesto en este proyecto toma como entrada
imgenes
digitales, el procesamiento de stas juega un papel fundamental
en el mismo. Una
imagen se puede ver como una funcin de dos variables f(x,y)
donde x y y son
coordenadas espaciales y el valor de f, para cualquier par de
coordenadas x y y es la
intensidad o nivel de gris de la imagen en ese punto
[Gonzles04].
La imagen digital, en los sistemas computacionales, se puede
representar y
manipular a travs de una matriz de M x N donde cada elemento de
la matriz
representa un pixel y su posicin se conoce como coordenada del
pixel. Las
posiciones van de 0 a M-1 y a N-1. A continuacin se ilustra este
concepto a travs
de la siguiente matriz [Gonzles04]:
(15)
Un pixel p con coordenadas (x,y), puede tener hasta 8 pixeles
vecinos como se
muestra a continuacin:
RELACIN DE UN PIXEL CON SUS PIXELES VECINOS
-
29
Estas relaciones son importantes, ya que muchas de las tareas de
procesamiento de
imgenes digitales se pueden llevar a cabo mediante mscaras o
filtros que se
aplican directamente sobre un pixel dado para encontrar cul es
la relacin que
existe entre el valor del pixel central con respecto al de sus
vecinos.
Existen muchas operaciones aplicables a las imgenes digitales
para facilitar su
posterior procesamiento o anlisis, sin embargo, para los fines
de este proyecto, nos
limitaremos a exponer la binarizacin, la obtencin del esqueleto
de una imagen y la
aplicacin de filtros a imgenes digitales conocida como
Correlacin.
2.5.1 Binarizacin
La binarizacin es el proceso mediante el cual se asigna uno de
dos posibles valores
(blanco o negro) a cada pixel de la imagen de manera que un
color sea usado para
los pixeles que representen el fondo de la imagen y el otro para
aquellos que sean
parte del primer plano de la misma. Un mtodo comn para llevar
esto a cabo es
utilizar un umbral y considerar a todos los pixeles con valores
iguales o mayores al
umbral como parte del primer plano de la imagen y a todos
aquellos con valores por
debajo del umbral como parte del fondo. Los pixeles con color
negro formaran parte
del fondo de la imagen, mientras que aquellos con color blanco,
formaran parte de
las figuras contenidas en la imagen. La figura 2.10 muestra un
ejemplo de una
imagen y el resultado de su binarizacin.
FIGURA 2.10. IMAGEN EN ESCALA DE GRISES E IMAGEN BINARIZADA
-
30
2.5.2 Esqueletizacin
El anlisis de trazos es un mtodo efectivo para reconocer ciertos
patrones digitales
como caracteres alfanumricos o ideogrficos [Zhang84].
La esqueletizacin de una imagen es un tipo de operacin
morfolgica de
adelgazamiento mediante la cual se pueden descubrir los pixeles
fundamentales que
forman la estructura bsica de una figura en una imagen digital
[Gonzles08].
Por lo regular los algoritmos de adelgazamiento se aplican a
imgenes binarias,
descritas en la seccin anterior, y funcionan a lo largo de una
serie de iteraciones. En
cada iteracin, se evala cada uno de los pixeles que no forman
parte del fondo y,
aquellos que se determina que no forman parte de la estructura
fundamental de las
figuras contenidas en la imagen son descartados. La imagen
resultante es usada
como entrada para la siguiente iteracin la cual aplica el mismo
procedimiento para
continuar descartando aquellos pixeles que no son fundamentales.
El algoritmo
finaliza cuando pasa una iteracin completa sin que se haya
podido descartar ningn
pixel. En la figura 2.11, se muestra un ejemplo tomado de
[Zhang84] donde se aplica
el proceso de esqueletizacin a una imagen que contiene una
figura de una letra "H"
a lo largo de tres iteraciones:
FIGURA 2.11. ESQUELETO DE LA LETRA H.
-
31
La figura 2.11(c) es el resultado final donde ya se descartaron
todos aquellos pixeles
de los cuales se puede prescindir sin que se pierda la
informacin esencial que
transmite la imagen.
[Zhang84] propone el siguiente algoritmo:
1. Obtener Imagen Binaria I:
2. Sub-iteracin 1: Para cada pixel p de la imagen I que no forma
parte del fondo:
2.1. Evaluar las siguientes condiciones:
2.2. Si se cumplen las condiciones mencionadas anteriormente,
marcarlo para ser
borrado posteriormente.
3. Si no existe ningn pixel qu borrar, finalizar el
algoritmo.
4. Borrar en I todos los pixeles marcados en el paso 2.2.
5. Sub-iteracin 2: Para cada pixel p de la imagen I resultante
del paso 4 que no
formen parte del fondo:
5.1. Evaluar las condiciones:
-
32
5.2. Si cumple con las condiciones mencionadas anteriormente,
marcarlo para ser
borrado posteriormente.
6. Si no existe ningn pixel qu borrar, finalizar el
algoritmo.
7. Borrar en I todos los pixeles marcados en el paso 5.2.
8. Repetir desde el paso 2 tomando como entrada la imagen I
resultante del paso 7
)( 1PB es el nmero de vecinos que forman parte de la imagen, es
decir, que tienen
como valor un 1. Esta condicin permite asegurar que no se borren
pixeles que sean
puntos finales o que sean parte central de las figuras
contenidas en la imagen.
)( 1PA es el nmero de ocurrencias del patrn "01" en el conjunto
ordenado
76,5432 ,,,, PPPPPP y 8P .
nP , por su parte, se refiere a la ubicacin de los pixeles
mostrados en la siguiente
matriz:
Dicha matriz da la relacin de pixeles usada para evaluar
condiciones del algoritmo
de Zhang Suen.
Cabe destacar que el pixel 1P es el pixel p que se est
evaluando.
-
33
A continuacin se ilustra un ejemplo donde )( 1PA dara como
resultado 2 ya que el
patrn "01" se presenta dos veces:
EJEMPLO DE EVALUACIN DE CONDICIN A(P1)
Esta condicin nos permite verificar que no borremos pixeles que
se encuentren en
medio de dos puntos finales.
La figura 2.12 nos da tres ejemplos en los que las condiciones 1
y 2, nos ayudan a
no eliminar pixeles de puntos finales o que son parte central
del esqueleto:
FIGURA 2.12. EJEMPLO DE PIXELES CENTRALES Y FINALES
Las letras A y C indican pixeles finales que no deben ser
borrados. La condicin 1
nos impide borrarlos. La letra B indica un pixel central que es
conservado gracias a la
condicin 2.
-
34
Las condiciones 3 y 4, para ambas sub-iteraciones, nos permiten
evaluar pixeles que
forman parte de bordes en las esquinas noroeste, sureste,
suroeste o noreste de
acuerdo a la figura 2.13:
FIGURA 2.13. FIGURA PARA EVALUACIN DE CONDICIONES 3 Y 4
Contando con el esqueleto de una firma, se pueden obtener varias
de las
caractersticas utilizadas en este proyecto para la formacin del
patrn de la firma de
una manera sencilla.
2.5.3 Correlacin
La Correlacin es una tcnica de filtrado lineal de imgenes que
consta en aplicar
una mscara o filtro a cada pixel en conjunto con sus pixeles
vecinos para obtener la
suma ponderada de los valores de cada uno de los pixeles a ser
evaluados. La
matriz de pesos es precisamente la mscara o filtro aplicada y se
conoce como
kernel o filtro.
A manera de ejemplo, la figura 2.14 muestra los valores de los
pixeles de una
imagen de 4x5 y la figura 2.15 los valores de una mscara de
3x3.
FIGURA 2.14. IMAGEN DE 4x5
-
35
FIGURA 2.15. MSCARA DE 3x3
La figura 2.16 muestra cmo se aplicara el kernel o mscara al
pixel en la fila 2 y
columna 4 con valor 14:
FIGURA 2.16. APLICACIN KERNEL
El resultado sera: 1*8 + 8*1 + 15*6 + 7*3 + 14*5 + 16*7 + 13*4 +
20*9 + 22*2=585.
-
36
2.6 GRAFOSCOPA
La grafoscopa es la disciplina que estudia la autenticidad o
autora de grafismos
como la escritura o la firma. Surge desde 1776 pero no es sino
hasta mediados del
siglo pasado cuando comienza a tomar un carcter cientfico
[Orellana75].
La firma autgrafa es uno de los medios ms aceptados para la
verificacin de la
identidad personal y es utilizada en toda clase de documentos
oficiales como licencia
de conducir y credencial de elector entre otros. La firma es
consecuencia de una
accin grfica producto de un reflejo condicionado cuyo mecanismo
se encuentra
dirigido en gran medida por nuestro inconsciente [Orellana75],
por ello, no slo se
asocia con informacin relacionada con el nombre del firmante
sino que a partir de
ella, se pueden encontrar caractersticas psicolgicas del mismo
las cuales estn
relacionadas especficamente con el sistema psicomotor, motivo
por el cual se
considera como la representacin grfica de la identidad de un
individuo y se acepta
como elemento til para la validacin y autorizacin en diversos
tipos de operaciones
como lo son las financieras y legales entre otras [Baez06].
Un acto reflejo se produce cada vez que se dan las condiciones
de estmulo
adecuadas, siendo stas para el caso de la firma, tctiles,
visuales y fonticas. En
cuanto se toma la decisin de firmar, se pone en marcha el
proceso "signatriz" que
desencadena un conjunto de desenvolvimientos grficos cuyo
resultado es la firma.
La figura 2.17 muestra el proceso signatriz.
[CMGC08] define el proceso signatriz como la sucesin de eventos
que se producen
dentro y fuera de nosotros cuando deseamos ejecutar nuestra
firma y que finaliza en
la ejecucin propiamente dicha.
-
37
FIGURA 2.17. PROCESO SIGNATRIZ
Existen seis etapas dentro del proceso signatriz [GMGC08]:
1. Informacin del consciente al inconsciente del deseo de
firmar.- Este proceso
se desencadena con el simple hecho de querer firmar ocasionando
que el
inconsciente tome el mando y verifique que existan los elementos
necesarios
para pasar a la accin, por ejemplo, cuando la persona
automticamente
busca un lpiz y papel para firmar.
2. Examen de estmulos materiales.- Los estmulos materiales son
analizados a
travs del tacto, por ejemplo, al tomar un lpiz, de manera
inconsciente se
examina el grosor, peso y talla del mismo y si se consideran
aptos, el
inconsciente transmite una sensacin de comodidad que permite
seguir con el
proceso normal de firmado.
3. Examen de estmulos grficos.- En cuanto se tienen los
elementos fsicos, el
inconsciente ordena que se verifique si existen marcas grficas
que den gua y
orientacin a la firma como una lnea o un rectngulo en el rea de
firmado.
Los estmulos grficos ms importantes son los bordes del papel
cuando est
en blanco, lnea expresa para firmar, recuadros especficos para
la firma, texto
-
38
que diga "firma" y marcas especiales como cruces, puntos y
seales
especficas.
4. Ejecucin de los reflejos condicionados.- Cuando un estmulo
grfico es
conocido, se ejecuta el reflejo condicionado de manera
inconsciente como
cuando firmamos en un rectngulo reducido e inmediatamente se
calcula y
reduce la dimensin de la firma para ajustarse al espacio
disponible. Por el
contrario, cuando un estmulo grfico no es conocido, se requiere
mayor
informacin por lo que el control vuelve al consciente para
conseguirla y
continuar con el proceso. Un ejemplo de lo anterior es cuando no
est claro
dnde firmar y el firmante tiene que preguntar dnde hacerlo para
poder
continuar.
5. Proceso motriz.- Los diseos de la firma estn grabados en la
memoria motriz
bajo impulsos sinpticos llamados imgenes motrices. Cuando las
imgenes
motrices se convierten en sus correspondientes movimientos
fsicos, se
produce la accin signatriz cuyo resultado da la firma. Las
imgenes motrices
contienen toda la informacin necesaria para producir la firma:
movimiento de
los msculos, presin sobre el lpiz o pluma, velocidad y tiempo en
el que
deben ejecutarse los movimientos entre otros. Esta informacin se
usa para
almacenar en la memoria motriz la actividad cintica y la
cantidad exacta de
energa que precisan los msculos para llevar a cabo los
desenvolvimientos
fsicos necesarios.
6. Emplazamientos prefijados o colocacin.- Aqu se da la
materializacin del
reflejo grfico condicionado, es decir, la realizacin de la
firma.
La importancia de cada uno de los elementos grficos
constitutivos de la firma se
mide por el valor que estos adquieren cuando se quiere verificar
si la firma es
autntica o no. Los elementos fundamentales son rara vez
percibidos por el
falsificador por lo cual no los reproducir y, en caso de
intentarlo, lo ms probable es
que sean reproducidos de manera errnea ya que slo el titular de
la firma tiene la
capacidad de reproducirlos de manera espontnea y con las mismas
caractersticas.
-
39
La particularidad ms importante de los elementos fundamentales
es que son
numerosos y aparecen todos casi en el mismo momento. Por
ejemplo, al firmar, el
lapicero se desplaza sobre el papel y la firma aparece, a simple
vista se ve el
lapicero recorriendo el papel, lo que no se ve es la cantidad de
presin que imprime
la mano sobre el lapicero o bien, los saltos en el aire del
lapicero que generan trazos
separados.
Los elementos fundamentales se dividen en visibles e invisibles.
Los elementos
visibles son aquellos que de manera relativamente sencilla,
pueden ser observados a
partir de los trazos que quedan en el papel como son la
proporcin, los enlaces, los
desenvolvimientos (la direccin de los diferentes trazos que
forman la firma), la
velocidad y la presin.
Cada uno de estos elementos, aporta informacin valiosa a la hora
de determinar la
autenticidad de una firma, por ejemplo, la velocidad rpida nos
informa que su autor
realiza la firma sin la participacin de su estado consciente y
hace presumir su
autenticad. La presin se encuentra inversamente relacionada con
la velocidad, la
presin intercalada en el desarrollo de los diferentes trazos es
caracterstica de las
firmas autnticas. Una firma con una presin constante a lo largo
de todos sus trazos
indica que es muy probable que la firma sea falsa.
Los elementos invisibles son difciles de ver y se clasifican en
puntos de referencia
intrnsecos y extrnsecos.
Los puntos de referencia extrnsecos son un conjunto de
referencias exteriores a la
firma en s, es decir, no forman parte de la firma y sin embargo,
influencian la manera
en la que la firma es llevada a cabo y se dividen en materiales
y grficos; los
materiales son generalmente percibidos a travs del tacto como
por ejemplo la silla
donde se debe sentar el firmante, la mesa o el papel donde se
debe firmar. Ejemplos
de puntos de referencia grficos son el formato del formulario,
rectngulos
destinados para la firma o inclusive el color del papel.
-
40
Los puntos de referencia intrnsecos son puntos de referencia que
se les toma como
indicadores fiables de la autenticidad o falsedad de la firma y
que se encuentran
escondidos dentro de los desenvolvimientos o trazos de una firma
como son la
configuracin y ubicacin de los puntos de ataque, la forma y
direccin de los rasgos
finales de cada trazo y caractersticas de los signos ortogrficos
de puntuacin.
Para los fines de este proyecto, nos limitaremos a exponer la
importancia de los
puntos de ataque y de los rasgos finales de cada trazo; segn sea
el dinamismo del
movimiento no graficado inicial, ser la configuracin que adopte
el primer contacto
del lapicero con el papel el cual es conocido como punto de
ataque. De igual manera,
cada vez que termina un movimiento graficado queda una marca del
estilo de la
finalizacin. La forma que adquieren los rasgos finales o de
remate, dependen del
tipo de movimiento no graficado final. Lo anterior quiere decir
que la manera en la
que el firmante mueve su brazo y mano en el aire antes y despus
de hacer contacto
con el papel para realizar un trazo determina la forma inicial y
final del mismo.
Ejemplos de puntos de ataque son los rectos, los cuales se
denominan as porque su
inicio es un segmento de recta como se muestra en la figura 2.18
:
FIGURA 2.18. PUNTO DE ATAQUE RECTO
Los puntos de ataque redondeados son aquellos en los cuales el
movimiento inicial
no graficado es lento. El detenimiento del lapicero en el papel
no es tan prolongado y
la presin no es fuerte. La figura 2.19 muestra un ejemplo de
punto de ataque
redondeado:
-
41
FIGURA 2.19. PUNTO DE ATAQUE REDONDEADO
Otro ejemplo de punto de ataque son los imperceptibles en los
cuales, el movimiento
no graficado inicial es muy veloz y la punta del lapicero toca
el papel muy
suavemente haciendo difcil determinar dnde termina el movimiento
no graficado
inicial y dnde comienza el movimiento graficado. Este inicio es
uno de los ms
difciles de imitar por que el falsificador tendra que imitar el
movimiento no graficado
y el grado de velocidad y presin del movimiento graficado. La
figura 2.20 muestra un
ejemplo de punto de ataque imperceptible:
FIGURA 2.20. PUNTO DE ATAQUE IMPERCEPTIBLE
Aunque la escritura y la forma de la firma presentan
caractersticas nicas y propias
de cada persona, estas pueden cambiar tanto voluntaria como
involuntariamente
[Baez06]. Para cambios voluntarios, basta el deseo de la persona
para modificar el
diseo de la firma o de su escritura tanto parcial como
totalmente mientras que para
cambios involuntarios puede haber diversas causas como las
naturales,
determinadas por el proceso vital de la persona como decadencia
fsica por ejemplo,
o bien, causas afectivas como la depresin, emociones o
pasiones.
-
42
Segn [Baez06], la grafoscopa cuenta con diversas tcnicas para
llevar a cabo la
verificacin de una firma:
Mtodo morfolgico de comparacin.- Se trata de realizar cotejos
o
comparaciones entre las letras.
Mtodo grafolgico.- La grafologa permite identificar en la
escritura gestos
idiosincrsicos personales llegando con ello al estudio
psicolgico del hombre,
es decir, consiste en trazar un retrato grafolgico para
determinar el origen de
una firma. Lo anterior quiere decir que a partir del anlisis
grafolgico de una
firma, se puede identificar las caractersticas psicolgicas de
una persona
como lo son su temperamento o sus cualidades intelectuales y
artsticas,
validando con base en ellas, la autenticidad de una firma o
bien, la
identificacin de su autor [Baez06].
Mtodo grafomtrico.- Consiste en la medicin de diferentes
caractersticas de
los trazos como ngulos y espesores utilizando herramientas como
reglillas
micrmetros.
-
43
2.7 SISTEMAS AUTOMTICOS DE VERIFICACIN DE
FIRMAS
Los sistemas de reconocimiento o verificacin de firmas, en su
forma general,
presentan la estructura bsica de los sistemas de reconocimiento
de patrones
mostrada en la figura 2.21, esto es, un sensor o medio de
entrada, un proceso de
extraccin de caractersticas y un clasificador [Azzopardi06]
[Blumenstein07]
[Drouhard96] [Leclerc94] [Papamarkos01] [Plamondon94].
FIGURA 2.21. ESTRUCTURA DE UN SISTEMA DE R.P.
Actualmente los sistemas de reconocimiento de firmas tienen dos
vertientes bien
conocidas; la primera basada en la imagen esttica de la firma
(el resultado de
firmar) y la segunda en el proceso dinmico involucrado (el
proceso de firmar en s
mismo). A estos mtodos se les conoce como sistemas off-line o
estticos y on-line o
dinmicos respectivamente [Leclerc94].
El enfoque esttico es considerado ms difcil debido a que los
mtodos
desarrollados con un enfoque dinmico han obtenido mejores
resultados en trminos
de errores de tipo I y tipo II. Los errores de tipo I, tambin
conocidos por sus siglas
en ingls FRR (False Rejection Rate), se refieren al porcentaje
de firmas vlidas que
son rechazadas por el sistema. Los errores de tipo II, tambin
conocidos como FAR
(False Acceptance Rate), se refieren al porcentaje de firmas
falsas aceptadas por el
sistema [Leclerc94].
-
44
El objetivo principal de estos sistemas es diferenciar las
firmas originales de las
falsificadas. Aunque son ya al menos dos dcadas de trabajo
continuo en esta rea,
no existe en realidad un estndar que defina y clasifique los
tipos de falsificaciones
pero, en general, de acuerdo al nivel de habilidad en la
falsificacin bien, de
acuerdo a la semejanza de las firmas, se aceptan las siguientes
categoras [Babu06]:
Falsificacin Aleatoria: Puede ser la firma genuina de cualquier
persona, la
intencin del firmante no es falsificar otra firma, simplemente,
la firma contra la
cual se compara no es la suya.
Falsificacin Simple o Falsificacin Casual: Este tipo de
falsificacin es
producida sabiendo slo el nombre de la persona cuya firma se
quiere
falsificar.
Falsificaciones especializadas.- stas son las firmas producidas
por
falsificadores profesionales con experiencia.
Los artculos publicados sobre el tema mencionados a lo largo de
este trabajo,
expresan sus resultados en trminos de los errores tipo I y II
sobre alguno o algunos
de los diferentes tipos de falsificaciones mencionados
anteriormente, siendo los
peores resultados siempre aquellos relacionados con
Falsificaciones especializadas
[Plamondon94]. Cabe destacar que el presente proyecto se enfoca
en distinguir
firmas autnticas de falsificaciones especializadas dejando a un
lado las
falsificaciones simples y aleatorias.
Los sistemas dinmicos, utilizan como medio de entrada tabletas
digitales para
capturar la informacin del proceso de la firma, por lo tanto,
requieren de la presencia
del firmante a diferencia de los sistemas estticos, los cuales
tienen como entrada
una imagen digital.
En los sistemas dinmicos, se tienen las siguientes fases:
adquisicin, pre-
procesamiento, comparacin y evaluacin. El proceso de adquisicin
es muy
importante porque la calidad de las seales es crtica para la
optimizacin del
-
45
proceso de comparacin, del mismo modo, si la seal es de buena
calidad, el tiempo
asociado para el pre-procesamiento ser minimizado ya que en los
sistemas
dinmicos, el pre-procesamiento por lo general est destinado a
corregir fallas en el
proceso de adquisicin. El conjunto de seales que pueden ser
procesadas en los
sistemas dinmicos es bastante grande: las coordenadas x y y del
lapicero como
funcin del tiempo, velocidad, aceleracin y presin entre otros y,
por lo mismo,
muchos investigadores se enfocan exclusivamente en este proceso
y proponen
equipos electrnicos especializados para el proceso de
adquisicin.
Como ya se mencion, los sistemas estticos, trabajan en base a
imgenes
digitalizadas de firmas. Su mayor ventaja es que requieren
equipo ms econmico y
no necesitan de la presencia del firmante. Su gran desventaja es
que no tienen
acceso a la informacin dinmica mencionada anteriormente, sin
embargo, en los
ltimos aos se han hecho intentos de obtener caractersticas
dinmicas a partir de
la imagen esttica [Blumenstein09] [Lalican00].
2.7.1 Caractersticas
Existen diversas caractersticas utilizadas segn el enfoque
empleado (on-line y off-
line). Algunas de ellas pueden aplicar a ambos. Se pueden
categorizar en estticas y
dinmicas y a su vez en globales y locales.
Las estticas son las que se pueden extraer de una imagen
mientras que las
dinmicas son las que se pueden extraer durante el proceso de
firmar y tienen que
ver principalmente con la velocidad, el tiempo y la presin
ejercida al momento de
firmar [Plamondon94].
Por globales se clasifica a las caractersticas que toman
informacin de la firma como
un todo, por ejemplo, la *altura de la firma en las estticas o
el tiempo total del
proceso de firmado en las dinmicas mientras que las locales, se
enfocan en un
punto dado de la firma, ya sea en la posicin (las estticas) o en
el tiempo
(dinmicas) [Leclerc94].
-
46
Las caractersticas existentes contempladas para ser usadas en
este proyecto se
listan a continuacin junto con una breve descripcin y se da una
descripcin ms
profunda y detalla en secciones subsecuentes:
Relacin Altura-Anchura.- Es la proporcin entre la altura y la
anchura de la
firma.
Entropa.- Es una medida de la variacin entre los niveles de
grises de la
imagen.
Mxima.- Relacin entre la distancia de dos trazos principales
verticales u
horizontales con respecto a la altura y anchura.
Energa.- Algoritmo propuesto por [Blumenstein09] para
cuantificar la energa
requerida para realizar los diferentes trazos de la firma a
partir de una imagen
esttica.
rea de la firma.- Nmero de pixeles dentro de la imagen que
pertenecen a la
firma.
Nmero de Puntos Borde.- Nmero de pixeles pertenecientes a la
firma que
representan el inicio o fin de un trazo.
Nmero de Puntos de Interseccin.- Nmero de pixeles que
representan la
unin de dos o ms trazos.
De igual forma, se propone la siguiente caracterstica no
reportada en la bibliografa
consultada hasta el momento:
Wavelets de Puntos Borde.- Con esta caracterstica se pretende
representar
los puntos de ataque y de remate descritos en la seccin 2.6.
Relacin Altura-Anchura
Es una caracterstica global que considera la proporcin entre la
altura y anchura de
la firma [Karsligil10]. Se obtiene dividiendo la altura entre la
anchura. Mientras que
entre firma y firma la altura y anchura pueden variar, la
relacin entre estas dos se
mantiene proporcional. En las firmas digitalizadas, bsicamente
se mide la relacin
-
47
entre la anchura y altura en pixeles de la firma. Se inspira la
facultad homottica que
tiene el ser humano de cambiar el tamao de la firma sin alterar
de manera
significativa dicha proporcin [Orellana75], este concepto se
ilustra en la figura 2.22:
FIGURA 2.22. FACULTAD HOMOTETICA
A continuacin se muestra de manera grfica cmo se obtienen los
valores de la
altura y anchura de una firma en una imagen digital:
FIGURA 2.23. VALORES DE ANCHURA Y ALTURA EN UNA FIRMA
DIGITAL
Entropa
Corresponde a una medida de la variacin entre niveles de grises
de la firma. El
trmino Entropa proviene de la teora de la informacin de Shannon.
En el
procesamiento de imgenes digitales, se utiliza para medir la
aleatoriedad o
-
48
incertidumbre en los niveles de grises. La frmula de la entropa
est dada por la
siguiente ecuacin:
=
=
k
i ii p
pxH1
2
1log)( (16)
El trmino ip es la probabilidad de que ocurra el evento i , en
nuestro caso, de que
ocurra el nivel de gris i , por lo tanto,
ip
1
es conocido como "factor sorpresa" o
simplemente como "sorpresa", es decir, a mayor probabilidad de
un evento o nivel de
gris, menor sorpresa y viceversa. Al resultado de la ecuacin
anterior, se le conoce
como bits de incertidumbre.
Ejemplo 1:
Suponiendo que tuviramos una imagen donde fuera posible
encontrar 4 diferentes
niveles de grises A,B,C y D y todos ellos tomaran el valor de B,
tendramos la
siguiente distribucin de probabilidad:
TABLA 2.2. EJEMPLO 1: CLCULO ENTROPA
Nivel de Gris A B C D
Probabilidad 0 1 0 0
Aplicando la frmula de la Entropa tendramos que:
0)0
1(