SISTEMA PARA LA VERIFICACIÓN AUTOMÁTICA DE FIRMAS ... · sep snest dgest instituto tecnolÓgico de toluca sistema para la verificaciÓn automÁtica de firmas autÓgrafas tesis

SEP SNEST DGEST

INSTITUTO TECNOLGICO DE TOLUCA

SISTEMA PARA LA VERIFICACIN AUTOMTICA DE FIRMAS

AUTGRAFAS

T E S IS

QUE PARA OBTENER EL GRADO DE MAESTRA EN:

CIENCIAS, EN CIENCIAS DE LA COMPUTACIN

PRESENTA:

LUIS MANUEL FLORES SOBERN

ASESOR:

DR. EDUARDO GASCA ALVAREZ

METEPEC, EDO. DE MXICO, OCTUBRE DE 2012

i

Agradecimientos

En primer lugar, agradezco a mi esposa por brindarme la paciencia, apoyo y

motivacin necesarios para poder llevar a cabo este proyecto.

A mis padres, por haber estado presentes en todo momento para guiarme y

apoyarme. Sin su ejemplo, gua y ayuda, sera simplemente impensable estar aqu y

ahora.

A mis hermanas por apoyarme incondicionalmente.

Agradezco tambin al Doctor Eduardo Gasca la confianza brindada al aceptar ser mi

asesor de tesis as como la gua que siempre estuvo dispuesto a dar para llevar a

buen puerto el desarrollo del presente trabajo.

Este perodo de tiempo me deja un gran aprendizaje, no slo acadmicamente sino

tambin personalmente y eso slo es posible por la gran calidad humana de las

personas con las que trat, tanto alumnos como profesores. Es por ello que tengo

que agradecer a mis revisores de tesis, los doctores Pacheco, Sergio y No, por

tomarse el tiempo necesario para hacer que creciera mi proyecto as como a mis

profesores, el Dr. Gasca, la Mtra. Julieta, el Dr. Pacheco, el Dr. Celso, el Mtro.

Rafael, la Dr. Citlali y la Mtra. Itzel por la amistad brindada, por compartir sus

conocimientos y experiencia en el saln de clase, por haber tenido el objetivo tan

claro de hacernos crecer acadmica y profesionalmente y, sin darse cuenta, por

haber enriquecido mi vida personal al compartir pensamientos, puntos de vista,

experiencias, ancdotas de sus vidas personales, o simplemente, por servir como

ejemplo de lo que es hacer bien las cosas.

Por ltimo agradezco a mis amigos Roco, Cesar, Jimmy y Omar con los cuales

compart esta etapa de mi vida por haberme ofrecido su amistad.

ii

DEDICATORIA

A mis padres, esposa e hijos que vienen en camino.

iii

RESUMEN

En el presente proyecto se propone y examinan los resultados de un sistema que

utiliza para la representacin de firmas autgrafas digitalizadas, una nueva

caracterstica no reportada en la bibliografa que sirve de base al presente proyecto,

la cual est formada por los coeficientes de la Transformada Wavelet obtenidos de

su aplicacin a los puntos borde de distintos trazos de la firma en conjunto con una

serie de caractersticas existentes en la literatura consultada las cuales son la

relacin altura-anchura, la entropa, la mxima, la energa, el rea de la firma, el

nmero de puntos borde y el nmero de puntos de interseccin. Como clasificador se

ha utilizado una Red Neuronal Artificial del tipo Perceptron Multicapa con una

topologa de 4 nodos en la capa oculta y 2 nodos en la capa de salida entrenada

utilizando el algoritmo BackPropagation con un valor de 0.7 como razn de

aprendizaje y 0.9 como momento.

Las caractersticas existentes utilizadas, han sido tomadas de distintos trabajos en

los que las han utilizado de manera individual o en conjunto con caractersticas no

presentadas en el presente proyecto, es decir, la combinacin de caractersticas

existentes utilizadas no ha sido reportada en la literatura consultada, por su parte, la

nueva caracterstica propuesta se basa en los puntos iniciales y finales de los trazos

tomados en cuenta por la grafoscopa siendo stos de inters por su dificultad para

ser falsificados. Como se ya se mencion, para la representacin de estos ltimos,

se utiliza la Transformada Wavelet.

Los experimentos realizados dieron mejores resultados para el uso exclusivo de la

combinacin de caractersticas ya existentes que cuando se hizo uso de las

caractersticas obtenidas por medio de la Transformada Wavelet.

iv

Abstract

In this project it is proposed and analyzed the results of a system that represents the

written signatures using a new feature that does not exist in the literature that was

consulted. This new feature uses the coeficients of the Wavelet Transform applied to

the final points of the different strokes of the signature. This new feature is also used

in combination with a set of existing features such as height to width ratio (aspect

ratio), entropy, maximum, energy, signature area, number of final points and the

number of intersection points. As a classifier, an Artificial Neural Network Multilayer

Perceptron was used with a topology of 4 hidden units and two output units using

BackPropagation Algorithm to train it with a value of 0.7 as learning rate and 0.9 as

momentum.

The existing features have been taken from different papers, this means that they

haven't been used in combination before. The new feature proposed, is based on the

start and end points of the signature strokes used in graphology. These points are of

interest because of the difficult to be counterfeited. As already mentioned, these

points are represented using the Wavelet Transform.

The different experiments show better results using exclusively the set of existing

features than those results showed when including the new proposed feature.

v

NDICE TEMTICO

1 CAPTULO I ......................................................................................................... 1

1.1 INTRODUCCIN ........................................................................................... 1

1.2 OBJETIVOS ................................................................................................... 6

1.3 CONTRIBUCIN............................................................................................ 7

1.4 ORGANIZACIN............................................................................................ 8

2 CAPTULO II ........................................................................................................ 9

2.1 MARCO TERICO......................................................................................... 9

2.2 WAVELETS .................................................................................................... 9

2.2.1 Wavelet Daubechies .............................................................................. 11

2.3 RECONOCIMIENTO DE PATRONES ......................................................... 13

2.3.1 Enfoque estadstico ............................................................................... 14

2.4 REDES NEURONALES ARTIFICIALES ...................................................... 17

2.4.1 Modelo Biolgico ................................................................................... 19

2.4.2 Neurona Artificial ................................................................................... 21

2.4.3 Perceptron Simple ................................................................................. 23

2.4.4 Perceptron Multicapa ............................................................................. 26

2.5 PROCESAMIENTO DE IMGENES DIGITALES ........................................ 28

2.5.1 Binarizacin ........................................................................................... 29

2.5.2 Esqueletizacin ...................................................................................... 30

2.5.3 Correlacin ............................................................................................ 34

2.6 GRAFOSCOPA ........................................................................................... 36

vi

2.7 SISTEMAS AUTOMTICOS DE VERIFICACIN DE FIRMAS ................... 43

2.7.1 Caractersticas ....................................................................................... 45

2.7.2 Clasificador ............................................................................................ 54

3 CAPTULO 3 ...................................................................................................... 56

3.1 MTODO ..................................................................................................... 56

3.1.1 Base de Datos ....................................................................................... 58

3.1.2 Formacin de los Patrones .................................................................... 59

3.1.3 Definicin de Topologas de las RNA .................................................... 71

3.1.4 Mtodos de Evaluacin de las RNA ...................................................... 72

4 CAPTULO 4 ...................................................................................................... 77

4.1 EXPERIMENTOS ......................................................................................... 77

4.1.1 Experimento #1: Uso de una sola RNA con dos clases para todas las

firmas 77

4.1.2 Experimento #2: Uso de una sola RNA con dos nodos de salida por firma

77

4.1.3 Experimento #3: Uso de una RNA con dos nodos de salida por firma .. 78

4.1.4 Experimento #4: Uso de una RNA con dos nodos de salida por firma

usando nicamente la combinacin de caractersticas existentes ..................... 78

4.2 RESULTADOS ............................................................................................. 79

4.2.1 Experimento #1: Uso de una sola RNA con dos clases para todas las

firmas 79

4.2.2 Experimento #2: Uso de una sola RNA con dos nodos de salida por firma

80

4.2.3 Experimento #3: Uso de una RNA con dos nodos de salida por firma .. 82

vii

4.2.4 Experimento #4: Uso de una RNA con dos nodos de salida por firma

usando nicamente la combinacin de caractersticas existentes ..................... 83

4.3 SISTEMA PROPUESTO .............................................................................. 85

5 CAPTULO 5 ...................................................................................................... 93

5.1 CONCLUSIONES......................................................................................... 93

5.2 TRABAJOS FUTUROS ................................................................................ 94

6 APNDICES ...................................................................................................... 96

6.1 APNDICE A - MatLab ................................................................................ 97

6.2 APNDICE B - NeuroSolutions .................................................................... 98

6.3 APNDICE C - Microsoft Visual Studio ........................................................ 99

7 REFERENCIAS BIBLIOGRFICAS ................................................................. 100

viii

NDICE DE FIGURAS

FIGURA 2.1. GRFICA DE LA FUNCIN COSENO Y DE LA FUNCIN WAVELET

MADRE DAUBECHIES 20 ........................................................................................ 10

FIGURA 2.2. WAVELET MADRE DAUBECHIES ...................................................... 12

FIGURA 2.3. FRONTERA DE DECISIN ................................................................. 15

FIGURA 2.4. NEURONA BIOLGICA ...................................................................... 19

FIGURA 2.5. NEURONA ARTIFICIAL. ...................................................................... 21

FIGURA 2.6. FUNCIN DE ACTIVACIN LINEAL .................................................. 22

FIGURA 2.7. FUNCIN DE ACTIVACIN ESCALN .............................................. 23

FIGURA 2.8. FUNCIN DE ACTIVACIN SIGMOIDE ............................................. 23

FIGURA 2.9. ARQUITECTURA DEL PERCEPTRON MULTICAPA ......................... 26

FIGURA 2.10. IMAGEN EN ESCALA DE GRISES E IMAGEN BINARIZADA .......... 29

FIGURA 2.11. ESQUELETO DE LA LETRA H. ......................................................... 30

FIGURA 2.12. EJEMPLO DE PIXELES CENTRALES Y FINALES ........................... 33

FIGURA 2.13. FIGURA PARA EVALUACIN DE CONDICIONES 3 Y 4 ................. 34

FIGURA 2.14. IMAGEN DE 4x5 ................................................................................ 34

FIGURA 2.15. MSCARA DE 3x3 ............................................................................ 35

FIGURA 2.16. APLICACIN KERNEL ...................................................................... 35

FIGURA 2.17. PROCESO SIGNATRIZ ..................................................................... 37

FIGURA 2.18. PUNTO DE ATAQUE RECTO ........................................................... 40

FIGURA 2.19. PUNTO DE ATAQUE REDONDEADO .............................................. 41

FIGURA 2.20. PUNTO DE ATAQUE IMPERCEPTIBLE ........................................... 41

FIGURA 2.21. ESTRUCTURA DE UN SISTEMA DE R.P. ........................................ 43

FIGURA 2.22. FACULTAD HOMOTETICA ............................................................... 47

ix

FIGURA 2.23. VALORES DE ANCHURA Y ALTURA EN UNA FIRMA DIGITAL ..... 47

FIGURA 2.24. ENTROPA EN IMAGEN DE UN SOLO COLOR ............................... 50

FIGURA 2.25. ENTROPA EN IMAGEN CON DOS COLORES ............................... 50

FIGURA 2.26. MXIMA ............................................................................................. 51

FIGURA 2.27. RESULTADOS DE APLICAR EL ALGORITMO DE MXIMA A UNA

FIRMA ....................................................................................................................... 52

FIGURA 2.28. PUNTOS BORDE .............................................................................. 53

FIGURA 2.29. PUNTOS DE INTERSECCIN. ......................................................... 53

FIGURA 3.1. EJEMPLOS DE FIRMAS DE LA BASE DE DATOS. ........................... 59

FIGURA 3.2. DIAGRAMA DE ALTO NIVEL DEL PROCESO DE EXTRACCIN DE

CARACTERSTICAS. ................................................................................................ 60

FIGURA 3.3. IMAGEN EN ESCALA DE GRISES. .................................................... 62

FIGURA 3.4. IMAGEN BINARIZADA CON UMBRAL 0.8.......................................... 62

FIGURA 3.5. IMAGEN BINARIZADA CON UMBRAL 0.95........................................ 62

FIGURA 3.6. IMAGEN BINARIZADA CON UMBRAL 0.91........................................ 63

FIGURA 3.7. IMAGEN EN ESCALA DE GRISES Y SU ESQUELETO ..................... 65

FIGURA 3.8. MSCARA APLICADA PARA OBTENER PUNTOS BORDE Y DE

INTERSECCIN. ...................................................................................................... 66

FIGURA 3.9. EJEMPLOS DE ENTROPA EN 4 DIFERENTES IMGENES ............ 67

FIGURA 3.10. EJEMPLO DE OBTENCIN DE PUNTOS BORDE .......................... 68

FIGURA 3.11. COEFICIENTES DE DAUBECHIES 2 DE UNA IMAGEN DE 20 POR

20 PIXELES .............................................................................................................. 69

FIGURA 3.12. DIAGRAMA DE VALIDACIN CRUZADA ......................................... 73

FIGURA 3.13. ERRORES COMETIDOS POR LA RED EN LOS CONJUNTOS DE

ENTRENAMIENTO Y DE VALIDACIN CRUZADA ................................................. 75

x

FIGURA 4.1. DIAGRAMA DE FLUJO DEL SISTEMA ............................................... 86

FIGURA 4.2. ARQUITECTURA DE ALTO NIVEL DEL SISTEMA ............................ 86

FIGURA 4.3. EJEMPLO DE CONFIGURACIN DEL CATLOGO DE FIRMAS DEL

SISTEMA................................................................................................................... 88

FIGURA 4.4. PANTALLA INICIAL DEL SISTEMA DE VERIFICACIN DE FIRMAS 89

FIGURA 4.5. DROP DOWN DE FIRMAS DEL CATLOGO ..................................... 90

FIGURA 4.6. EJEMPLO DE IMAGEN DE MUESTRA ACTUALIZADA AL CAMBIAR

LA SELECCIN DE FIRMA DEL CATLOGO ......................................................... 90

FIGURA 4.7. EJEMPLO DE SELECCIN DE IMAGEN A VERIFICAR .................... 91

FIGURA 4.8. IMAGEN A VERIFICAR SE MUESTRA EN LA PARTE DERECHA DE

LA PANTALLA DEL SISTEMA .................................................................................. 91

FIGURA 4.9. PANEL DE RESULTADOS ACTUALIZADO ........................................ 92

xi

NDICE DE TABLAS

TABLA 2.1. VALORES DE PK PARA LA WAVELET MADRE DAUBECHIES .......... 12

TABLA 2.2. EJEMPLO 1: CLCULO ENTROPA ..................................................... 48



TABLA 3.1. TOPOLOGAS DE RNA A EVALUAR .................................................... 72

TABLA 3.2. EJEMPLO DE EXPERIMENTOS DE VALIDACIN CRUZADA ............ 74

TABLA 3.3. EJEMPLO DE MATRIZ DE CONFUSIN .............................................. 76

TABLA 3.4. MATRIZ DE CONFUSIN DE EJEMPLO PARA CLCULO DE FAR Y

FRR ........................................................................................................................... 76

TABLA 4.1. PORCENTAJE DE ACIERTOS OBTENIDOS PARA EL CONJUNTO C1

EVALUANDO LA POSIBILIDAD DE UTILIZAR DOS CLASES ................................. 79

TABLA 4.2. PORCENTAJE DE ACIERTOS OBTENIDOS PARA EL CONJUNTO C2

EVALUANDO LA POSIBILIDAD DE UTILIZAR DOS CLASES ................................. 79

TABLA 4.3. MATRIZ DE CONFUSIN OBTENIDA EN LOS PRIMEROS 4

EXPERIMENTOS ...................................................................................................... 80

TABLA 4.4. MATRIZ DE CONFUSIN TOPOLOGAS 7 y 8 SEGUNDO

EXPERIMENTO ........................................................................................................ 80

TABLA 4.5. MATRIZ DE CONFUSIN TOPOLOGA 3 SEGUNDO EXPERIMENTO

.................................................................................................................................. 81

TABLA 4.6. MATRIZ DE CONFUSIN TOPOLOGA 4 SEGUNDO EXPERIMENTO

.................................................................................................................................. 81

TABLA 4.7. MATRIZ DE CONFUSIN TOPOLOGAS 1,2,5 y 6 USANDO UNA RNA

POR FIRMA .............................................................................................................. 82

xii

TABLA 4.8. DESVIACIONES ESTNDAR EXPERIMENTO VALIDACIN SIN

WAVELETES ............................................................................................................ 83

TABLA 4.9. RESULTADOS FINALES ....................................................................... 83

TABLA 4.9. RESULTADOS FINALES (Continuacin) ............................................... 84

xiii

LISTADO DE ACRNIMOS

A continuacin se listan los acrnimos utilizados a lo largo de este documento:

Acrnimo Significado

IA Inteligencia Artificial

RP Reconocimiento de Patrones

RNA Red Neuronal Artificial

FRR False Rejection Rate (Porcentaje de Falsos Rechazos)

FAR False Acceptance Rate (Porcentaje de Falsas

Aceptaciones)

HMM Hidden Markov Model (Modelos Ocultos de Markov)

VC Validacin Cruzada

VCM Validacin Cruzada Modificada

DLL Dynamic Link Library

GUIDE Graphical User Interface Development Environment

NS NeuroSolutions

PB Punto Borde

PI Punto de Interseccin

ET Entropa

A rea

EV Energa Vertical

xiv

EH Energa Horizontal

W Width

H Height

RHV Relacin entre Energa en Diagonal Izquierda-Derecha y

Relacin entre Energa en Diagonal Derecha-Izquierda

CW Coeficiente Wavelet

1

1 CAPTULO I

1.1 INTRODUCCIN

Las computadoras se han utilizado desde sus inicios para asistir al ser humano en la

realizacin de tareas repetitivas que, realizadas por el ser humano, resultan tardadas

y propensas a errores.

Con el paso del tiempo, ciencias como la Electrnica, Computacin, Fsica y

Matemticas, entre otras, avanzan permitiendo utilizar la computadora para realizar

tareas cada vez ms diversas. Adems del desarrollo que se da en la capacidad de

almacenamiento y procesamiento por parte de las computadoras, se da tambin un

avance muy importante dentro de diversas ramas del rea del software como lo son

la teora de compiladores, bases de datos, grficas por computadora, algoritmos y

estructuras de datos y computacin cientfica entre otras.

En la dcada de los 40 y 50, surgen los primeros programas que simulan el

razonamiento humano, originando con ello, el surgimiento de la Inteligencia Artificial

(IA) [Jones08]. El principal reto de la IA es construir programas que puedan llevar a

cabo tareas que se perciben como propias del ser humano. Dos de las

caractersticas principales de los problemas que suelen ser resueltos mediante

tcnicas de IA son que presenten variabilidad y que no haya manera de expresar su

solucin como una serie de pasos secuenciales como se hace en los algoritmos de la

computacin tradicional.

El sistema descrito en el presente proyecto cae precisamente en esta rea ya que

una persona nunca realiza dos firmas idnticas por lo que requiere de tcnicas de IA

para poder ser modelado en una computadora.

Desarrollar un sistema automtico de verificacin de firmas autgrafas es importante

ya que actualmente, uno de los medios ms difundidos de identificacin personal es

2

precisamente la firma, la cual es utilizada ampliamente por toda la poblacin para dar

fe de acuerdo y conformidad de toda clase de documentos; contratos, recepcin y

expedicin de documentos entre otros [McCabe08] [Orellana75]. Debido a que es un

medio tan ampliamente utilizado, la verificacin de firmas para transacciones

importantes supone un gran consumo de tiempo por parte del ser humano que, al ser

automatizada, se traduce en un aumento en la productividad [McCabe08].

Los sistemas de verificacin de firmas autgrafas son estudiados en el campo de la

biometra el cual se enfoca en encontrar mtodos automticos para la identificacin

de personas basados en rasgos conductuales o fsicos intrnsecos. El trmino

proviene del griego bios vida y metron medida y la informtica recurre a ella para

encontrar mtodos de autenticacin de usuarios, como por ejemplo; lectores de

huellas digitales, lectores de iris, patrones faciales y geometra de la mano entre

otros [Vaca07].

Los sistemas de verificacin de firmas en particular, se basan en el hecho de que

cada firma contiene rasgos nicos que identifican de manera inequvoca a la persona

que la expide. Estos rasgos son principalmente conductuales pero tambin

intervienen rasgos fisiolgicos como si la persona es zurda o derecha [Kholmatov03]

[Orellana75]. Pueden funcionar dinmicamente (on-line) o estticamente (off-line),

estos ltimos con base a imgenes de firmas previamente digitalizadas. Por el primer

mtodo, se pueden obtener caractersticas de la firma que estn en funcin del

tiempo como pueden ser la velocidad, el tiempo total en el que se escribe la firma, el

cambio de presin con respecto al tiempo o a los diferentes trazos de la firma entre

otros [Leclerc94].

Por el mtodo esttico, las caractersticas dinmicas de la firma se pierden, por

ejemplo, no se puede saber cunto tiempo se tard la persona en firmar pero se

conservan caractersticas propias de la imagen como son la proporcin entre altura y

anchura, el ngulo de orientacin de la firma, entre otras [Plamondon94], sin

embargo, estos sistemas son los ms prcticos ya que no se requiere de los

3

dispositivos electrnicos necesarios para los sistemas en lnea. El sistema que se

estudia en esta investigacin, pertenece al grupo de sistemas off-line o estticos por

lo que requiere ser alimentado por una imagen digital.

Esta particularidad que se presenta de llevar a cabo una identificacin personal con

base en rasgos conductuales o fsicos, hace que el desarrollo de este tipo de

sistemas pueda ser tratado de manera eficiente por la rama de la IA conocida como

Reconocimiento de Patrones (RP) la cual era inicialmente tratada por la rama de la

teora estadstica pero, con la evolucin del poder de cmputo de los equipos

modernos, se increment la demanda de aplicaciones prcticas lo que desemboc

en una necesidad de nuevos desarrollos tericos. En la actualidad, el

Reconocimiento de Patrones es de gran importancia en aplicaciones de ingeniera,

medicina, minera de datos y manufactura, entre otros, es decir, el Reconocimiento

de Patrones es parte integral de la mayora de los sistemas Inteligentes

[Theodoridis08].

Las tareas de RP consisten en realizar un mapeo de un conjunto de datos de entrada

con un conjunto de posibles salidas. Por lo general, este mapeo se modela a travs

de una funcin matemtica que contiene cierto nmero de parmetros ajustables y

cuyos valores son determinados con la ayuda de datos de ejemplo denominados

muestras de entrenamiento. Existen bsicamente dos tipos de tareas de RP las

cuales se denominan de clasificacin y de regresin. En los problemas de

clasificacin, el objetivo es asignar los datos de entrada a una clase de un conjunto

discreto de posibles clasificaciones. Por su parte, en los problemas de regresin, las

posibles salidas representan valores de variables continuas. Un ejemplo de problema

de clasificacin puede ser el reconocimiento de caracteres manuscritos mientras que

un ejemplo de un problema de regresin puede ser la prediccin de la tasa de

cambio de una moneda en el futuro. El sistema descrito en el presente proyecto, cae

dentro de la categora de problemas de clasificacin.

4

Bsicamente, los sistemas de reconocimiento de patrones toman como entrada un

conjunto de medidas que representan las caractersticas de un objeto o

comportamiento a ser clasificado y que son obtenidas a partir de imgenes o

seales. En nuestro caso particular, debemos extraer, a partir de la imagen digital

que contiene la firma a ser clasificada, un conjunto de medidas que cuantifiquen las

caractersticas que permitan representar a la firma. Adicionalmente, los sistemas de

RP pueden realizar algn tipo de procesamiento sobre los datos de entrada de

manera que se facilite el proceso de clasificacin y por ltimo, realizan un proceso en

el cul clasifican la entrada en una clase dada.

Existen dos tipos de sistemas, los no supervisados y los supervisados; la diferencia

entre ambos es que los supervisados, para poder realizar esta clasificacin, deben

ser previamente entrenados mediante algn algoritmo de aprendizaje mientras que

los no supervisados no requieren este entrenamiento previo siendo utilizados para

descubrir relaciones entre los patrones no siempre evidentes a simple vista. Ya que

los sistemas supervisados requieren ser entrenados previamente, es indispensable

tener a la mano una serie de ejemplos con los cuales llevar a cabo dicho

entrenamiento. En el caso de nuestro sistema, se obtuvo una base de datos de

imgenes digitales de firmas autgrafas con la cual llevar a cabo el entrenamiento.

Para realizar la clasificacin, los sistemas de RP pueden utilizar distintos mtodos

como son Funciones Discriminantes Redes Neuronales Artificiales (RNA). Las RNA

intentan simular el comportamiento de los sistemas nerviosos biolgicos y son

particularmente tiles para problemas cuya solucin no puede ser expresada

mediante una serie de pasos bien definidos. Ejemplos de aplicaciones en las que las

RNA realizan un buen trabajo de acuerdo a [Heaton08] son las siguientes:

Clasificacin

Agrupamiento

Optimizacin

Prediccin

5

El sistema descrito en el presente proyecto, hace uso de tcnicas de RP para llevar a

cabo la clasificacin de firmas autgrafas utilizando una RNA entrenada mediante

tcnicas de Aprendizaje Supervisado.

En cuanto a la representacin de las firmas, se ha optado por utilizar una

combinacin no reportada en la literatura consultada de caractersticas ya existentes

y adems, se propone una nueva caracterstica basada en el concepto de puntos

iniciales y finales de trazos encontrada en la grafoscopa.

Para la extraccin de las primeras, se hace uso de tcnicas de Procesamiento de

Imgenes Digitales mientras que para la caracterstica nueva, se utiliza la

Transformada Wavelet.

6

1.2 OBJETIVOS

La diferencia en el avance que se ha dado entre los sistemas estticos y dinmicos

es muy grande. Mientras que los sistemas dinmicos han logrado resultados con

muy bajos porcentajes de error, los estticos siguen an obteniendo porcentajes de

error ms grandes lo que los hace poco prcticos para aplicaciones reales

[Leclerc94], sin embargo, son precisamente los sistemas estticos los que resultan

ms atractivos para aplicaciones prcticas debido a que son ms fciles de

implementar ya que no requieren dispositivos electrnicos especiales y slo

necesitan como entrada, una imagen digital de la firma a analizar.

De esta necesidad, surge el actual proyecto el cul se enfoca en un mtodo esttico

para la verificacin de firmas explorando el uso de la Transformada Wavelet en

conjunto con las caractersticas propias de los mtodos estticos a saber: altura,

anchura y centro entre otras. Como clasificador se emplear una Red Neuronal

Artificial.

Los objetivos planteados para este proyecto son los siguientes:

Proponer un sistema que permita clasificar una firma como autntica o falsa.

Utilizar Wavelets en la Representacin del Patrn de una Firma.

Proponer una combinacin de caractersticas existentes no reportada en la

literatura consultada.

Mezclar las caractersticas obtenidas mediante el uso de Wavelets con la

combinacin propuesta de caractersticas ya existentes.

Utilizar una Red Neuronal Artificial para llevar a cabo la clasificacin.

7

1.3 CONTRIBUCIN

En esta investigacin se ha realizado lo siguiente:

Se propuso encontrar los puntos borde de los diferentes trazos en la firma

como una nueva caracterstica no encontrada en la literatura revisada.

La representacin de la nueva caracterstica propuesta se realiz mediante el

uso de la Transformada Wavelet.

Se propuso una combinacin no reportada en la literatura consultada de

caractersticas ya existentes.

Se combin la nueva caracterstica con la combinacin propuesta de

caractersticas tradicionales encontradas en la literatura revisada.

Se hizo uso de una RNA para llevar a cabo la clasificacin utilizando, en

concreto, una red de tipo Perceptron Multicapa entrenada mediante el

algoritmo BackPropagation.

En resumen, en este documento se describe cmo se consigui implementar la

nueva caracterstica, utilizarla en conjunto con las dems caractersticas ya

existentes en la literatura consultada para llevar a cabo la clasificacin de firmas

autnticas o falsas mediante el uso de una Red Neuronal Artificial.

8

1.4 ORGANIZACIN

En el captulo dos se encuentra la teora que soporta la presente investigacin la cual

comienza con una breve introduccin a las wavelets, definiendo en particular, las

wavelets de la familia de Daubechies. El captulo contina exponiendo de manera

breve lo que es el Reconocimiento de Patrones seguido por la teora de las Redes

Neuronales Artificiales donde se introduce la red ms sencilla conocida como

Perceptron para dar paso al modelo ms complejo del Perceptron Multicapa. A

continuacin se trata el Procesamiento de Imgenes Digitales explicando los

conceptos de binarizacin, filtrado lineal por correlacin y esqueletizacin; en

particular, describiendo el mtodo propuesto en [Zhang84] para obtener el esqueleto

de una imagen. Al finalizar con el tema de Procesamiento de Imgenes Digitales, se

describen los principios de la disciplina de la Grafoscopa y por ltimo, se da una

introduccin a los Sistemas de Verificacin Automtica de Firmas.

En el captulo tres y cuatro, se describe el mtodo seguido en la presente

investigacin as como los resultados obtenidos y la descripcin del sistema

desarrollado mientras que el captulo cinco, por su parte, presenta las conclusiones y

sugiere una serie de propuestas para continuar con el proyecto.

Al final se puede encontrar una serie de apndices donde se describe el software

utilizado para la realizacin del sistema propuesto.

9

2 CAPTULO II

2.1 MARCO TERICO

En este captulo se expone la teora que fundamenta la presente investigacin

comenzando con una breve introduccin a las wavelets seguida por la teora de RNA

utilizada para llevar a cabo este proyecto. El resto del captulo est dedicado al

Procesamiento de Imgenes Digitales, Grafoscopa y Sistemas Automticos de

Verificacin de Firmas.

2.2 WAVELETS

Las expansiones trigonomtricas surgieron en el siglo 18 durante estudios de

vibracin de cuerdas y otros fenmenos similares pero no fueron tratadas de una

manera sistemtica sino hasta que, en 1808, Jospeh Fourier escribi "Thorie

Analytique de la Chaleur" (Teora Analtica del Cal or) , donde realiz un estudio

detallado de las series trigonomtricas las cuales utiliz para resolver varios

problemas relacionados con la conduccin de calor. Su trabajo fue controversial en

su momento y, an despus de dos siglos, las series de Fourier son importantes,

tanto prctica como tericamente y siguen siendo objeto de investigacin.

Una expansin trigonomtrica de una funcin f(x) est dada por una sumatoria o

serie del tipo:

)()cos()( 0 kxsenbkxaaxf kk k ++=

Mediante la expansin de una seal en su serie trigonomtrica es posible

manipularla llevando a cabo diversas tareas. Una tarea comn en el anlisis de

seales es la eliminacin del ruido de alta frecuencia. Un enfoque para llevar esto a

cabo es expresar la seal como una serie trigonomtrica y poner a cero los

coeficientes de las frecuencias altas. Otra tarea es la compresin de datos. Aqu el

10

enfoque puede ser, expresar la funcin en trminos de una expansin trigonomtrica

y conservar slo aquellos trminos cuyos coeficientes sean mayores que algn

umbral de tolerancia.

A pesar de que la transformada de Fourier ha sido el pilar del procesamiento de

imgenes basado en transformadas desde la dcada de los aos 50, a finales de los

aos 80's surgi otro tipo de Transformada llamada Transformada Wavelet con la

cual es ms fcil realizar tareas de compresin, anlisis y transmisin de imgenes

[Gonzles08].

Una wavelet es una funcin en forma de "onda" con una duracin limitada y con un

valor promedio de 0. A diferencia de las funciones sinusoidales que, tericamente se

extienden de - a +, las wavelets tienen un principio y un fin [Fugal09]. La figura 2.1

muestra la diferencia entre la funcin coseno y una wavelet Daubechies 20.

FIGURA 2.1. GRFICA DE LA FUNCIN COSENO Y DE LA FUNCIN WAVELET MADRE

DAUBECHIES 20

A diferencia de la transformada de Fourier que slo provee informacin en el dominio

frecuencial, la Transformada Wavelet proporciona informacin tanto en el dominio

frecuencial como en el temporal, es decir, puede detectar anomalas o caractersticas

de inters en la seal y, al mismo tiempo, indicar cundo suceden [Gonzles08].

11

Existen diversas familias de wavelets, cada una con diferentes caractersticas que las

hacen ms o menos adecuadas para diferentes tareas. En general, la transformada

Wavelet est dada por la siguiente ecuacin:

=

=kj

jjk kxbxf

,

)2()( (1)

Siendo:

b Coeficiente a calcular.

Wavelet Madre.

j y k Factores de escalamiento y traslacin respectivamente.

Cada familia de wavelets cuenta con una wavelet madre la cual es aplicada a lo largo

de la seal en diferentes posiciones y en diferentes escalas. La escala y la posicin

de la seal donde ha de ser aplicada la wavelet vienen especificadas por los valores

en j y k .

2.2.1 Wavelet Daubechies

La wavelet madre para la familia de wavelets de Daubechies se define mediante la

siguiente ecuacin:

)2/()( 2/2/ Ni

Ni

N ePe = (2)

NP es un polinomio de grado N donde N indica el tipo de wavelet de Daubechies a

utilizar, por ejemplo: Db2, Db3 Db50 y viene dado por:

=12

2

1:)(

N

k

kkN zpzP (3)

kp , por su parte, toma valores de la Tabla 2.1.

12

N se encuentra definida por la siguiente ecuacin:

=

=1

2/ )(2

1)(

j

iNN

j

eP

(4)

TABLA 2.1. VALORES DE PK PARA LA WAVELET MADRE DAUBECHIES

kp 1=N 2=N 3=N 4=N

0p 1 0.683013 0.470467 0.325803

1p 1 1.183013 1.141117 1.010946

2p 0 0.316987 0.650365 0.892200

3p 0 -0.183013 -0.190934 -0.039575

4p 0 0 -0.120832 -0.264507

5p 0 0 0.049817 0.043616

6p 0 0 0 0.023252

7p 0 0 0 -0.014987

En la figura 2.2, se muestra la wavelet madre de Daubechies.

FIGURA 2.2. WAVELET MADRE DAUBECHIES

13

2.3 RECONOCIMIENTO DE PATRONES

Podemos definir el trmino patrn como la representacin de un objeto y el trmino

Reconocimiento de Patrones, de acuerdo a [Tou74], como la tarea de detectar y

extraer rasgos comunes que describen los objetos pertenecientes a una misma clase

de patrones y reconocer este patrn en cualquier nuevo ambiente para clasificarlo

como un miembro de dicha clase.

Existen varios enfoques para el estudio de las tareas de RP siendo el estadstico y el

sintctico los que mayor atencin han recibido.

El enfoque sintctico intenta encontrar los elementos bsicos de los patrones para

describirlos as como un conjunto de reglas sintcticas o gramtica que especifique

la forma en la que estas primitivas se pueden combinar para dar lugar a un patrn

legtimo dentro de una clase de inters [Gasca10].

El enfoque estadstico, por su parte, reconoce la naturaleza probabilstica tanto de la

informacin que se busca procesar como de la forma en la que los resultados se

deberan representar [Bishop95] y se considera que el problema de decidir si un

patrn pertenece o no a una clase puede ser tratado por la teora estadstica de la

decisin.

Este enfoque supone que los patrones se pueden representar mediante vectores y

que en la mayora de los problemas reales, existe un solapamiento inevitable en la

distribucin de las clases lo que subraya su naturaleza inherentemente probabilstica.

Esto mismo hace que sea necesario tratar las variables medidas como cantidades

aleatorias y obliga a aceptar que no siempre es posible una clasificacin perfecta de

nuevos patrones.

Los sistemas de RP tienen tres etapas fundamentales:

14

Preprocesamiento.- Durante esta etapa se trata la informacin original para

mejorar su calidad.

Seleccin de variables.- Aqu se trata de elegir las variables con mayor poder

discriminatorio para reducir la dimensin del problema y mejorar la precisin

del clasificador.

Clasificacin.- Esta etapa se considera, en el enfoque estadstico, como un

problema que, dado el carcter multidimensional de la informacin utilizada,

se puede resolver utilizando mtodos de anlisis multivariado como lo es el

anlisis discriminante.

2.3.1 Enfoque estadstico

De acuerdo a [Gasca10], se le atribuye por primera vez a Chow, en 1957, la

formulacin rigurosa del problema de RP en trminos de la teora de decisin

estadstica y su objetivo es encontrar un clasificador ptimo, es decir, aqul que

tenga la menor probabilidad de cometer errores.

Para este enfoque, el patrn se representa mediante un vector ),...,,,( 321 pxxxx=X

de mediciones el cual se considera como un punto en un espacio p-dimensional y

diferentes individuos pueden producir diferentes valores para una misma medicin

sin importar que pertenezcan a la misma clase.

Como ya se mencion en la Introduccin, el RP se puede formalizar

matemticamente como una funcin, definida con dominio en el espacio de las

mediciones o atributos y con imagen en el conjunto de clases presentes en el

problema que se estudia por lo que la entrada al sistema de RP es un conjunto de p

mediciones y la salida es la etiqueta o cdigo que identifica a una de las clases que

se consideran. Por lo anterior, se acostumbra representar la entrada como un vector

X conocido como vector patrn [Gasca10].

15

El mapeo entre el vector patrn y las clases dadas se lleva a cabo mediante una

funcin de la forma:

)(X=c (5)

donde ),...,2,1( mc es la etiqueta correspondiente a una de las m clases

consideradas en el problema y )(X es la funcin de decisin.

Se trata entonces de poder dividir el espacio de variables en regiones de decisin,

correspondiendo cada una de esas regiones a una clase dada. El borde o frontera

entre cada regin se conoce como frontera de decisin y el objetivo de )(X , por lo

tanto, es asignar X a la clase asociada a una regin dada. En la figura 2.3 se ilustra

grficamente este concepto utilizando un espacio bidimensional:

FIGURA 2.3. FRONTERA DE DECISIN

Si no se conoce la clasificacin correcta de los patrones disponibles se utilizan

mtodos no supervisados o algoritmos de clustering para encontrar relaciones no

conocidas de antemano entre ellos. Si por el contrario, se conoce la clasificacin de

un conjunto de patrones disponibles, se pueden utilizar mtodos supervisados y el

conjunto de patrones disponibles previamente clasificados se conoce entonces como

Muestra de Entrenamiento y es utilizada para entrenar el clasificador. Existen dos

tipos de mtodos de entrenamiento supervisados:

16

Paramtricos.- Se conoce o se supone que se conoce la funcin de densidad

del modelo y, mediante la muestra de entrenamiento, se busca ajustar los

parmetros de la funcin para que se ajuste al modelo.

No Paramtricos.- Estos son independientes de cualquier supuesto sobre la

estructura probabilstica.

17

2.4 REDES NEURONALES ARTIFICIALES

La importancia de las RNA en el contexto mencionado en la seccin anterior, es que

ofrecen un mtodo muy poderoso y flexible de representar mapeos no lineales desde

varias variables de entrada hacia varias variables de salida donde la forma del

mapeo, como se ver ms adelante, se encuentra gobernada por un nmero de

parmetros ajustables [Bishop05].

Las RNA, son un paradigma de aprendizaje y procesamiento automtico inspirado en

el sistema nervioso de los animales. Se puede ver como un sistema de interconexin

de neuronas colaborando para producir un estmulo de salida el cual tiene diversas

ventajas sobre mtodos de procesamiento de informacin convencionales como lo

son:

No linealidad.- La respuesta puede ser lineal o no lineal. Esto es importante ya

que la mayora de los fenmenos en el mundo real no se comportan de

manera lineal.

Flexibilidad.- Maneja bien el ruido en la seal de entrada.

Auto-organizacin.- Esta propiedad permite a la red distribuir el conocimiento

en toda la estructura de la red permitiendo que no haya elementos con

informacin especfica.

Aprendizaje adaptativo.- Son capaces de aprender a travs de la presentacin

repetitiva de una serie de ejemplos previamente clasificados sin requerir de un

modelo previo.

Tolerancia a Fallos.- Puede continuar funcionando an cuando partes de la

red no funcionen correctamente debido a que la informacin se guarda de

manera redundante.

De acuerdo a [Gurney97], podemos definir el trmino de Red Neuronal Artificial

como:

18

"Un ensamble interconectado de elementos simples de procesamiento, unidades o

nodos, cuya funcionalidad est vagamente basada en la neurona animal. La

habilidad de procesamiento de la red, se encuentra ubicada en la fuerza de la

interconexin entre unidades, o pesos, obtenidos mediante un proceso de adaptacin

hacia, o aprendizaje desde, un conjunto de patrones de entrenamiento."

Las unidades o nodos se refieren a las neuronas artificiales o computacionales que

se encuentran organizadas jerrquicamente en capas y se comunican entre ellas

mediante conexiones ponderadas por pesos que definen la importancia de la

conexin particular entre neuronas.

La manera en la que se estructura la RNA, es decir, el nmero de capas, el nmero

de neuronas por capa y sus conexiones, define su topologa o arquitectura

permitiendo categorizar a las neuronas en tres tipos; de entrada, salida y ocultas. Las

neuronas de entrada tienen como funcin principal obtener los valores del patrn de

entrada con los que se alimenta la red para pasarlas a las neuronas de las siguientes

capas. Una caracterstica de este tipo de neuronas es que no realizan procesamiento

alguno sobre los valores de entrada y se limitan a pasar lo que reciben a las

neuronas de las siguientes capas. Las neuronas ocultas se encuentran en capas

intermedias, es decir, no tienen contacto con el ambiente externo a la red y por

ltimo, las de salida, toman como entrada las salidas de las neuronas de las capas

ocultas y se encargan de notificar la salida de la red al exterior [Gasca11].

El conocimiento se guarda en los pesos de las conexiones entre neuronas los cuales

son inicializados de manera aleatoria y, mediante un proceso de entrenamiento, se

van modificando hasta que la red aprende la tarea para la que ser utilizada. A estos

procesos de entrenamiento se les denomina Aprendizaje y puede ser Supervisado o

No Supervisado.

En el Aprendizaje Supervisado, un conjunto de patrones, previamente clasificados,

es presentado a la red a lo largo de una serie de iteraciones a travs de las cuales,

se modifican los pesos utilizando una regla de aprendizaje cuyo objetivo es minimizar

19

una funcin de error, por ejemplo, el error cometido en el valor real de salida de la

red con respecto al valor deseado.

2.4.1 Modelo Biolgico

Las RNA se inspiran en el modelo biolgico del cerebro por lo cual, necesitamos

tener un entendimiento del funcionamiento bsico del cerebro para poder

comprender la formulacin de las RNA.

Los sistemas nerviosos poseen diferentes arquitecturas de diversas complejidades

pero todos ellos estn formados, de manera similar, por bloques bsicos de clulas

llamadas neuronas. Existen varios tipos de neuronas, morfolgicamente distintas

dependiendo de las funciones que realizan, sin embargo, todas ellas tienen en

comn que poseen una gran capacidad de comunicacin [Rojas96].

El funcionamiento bsico de las neuronas es recibir una seal de entrada y producir

una seal de salida. En la figura 2.4, se muestra la estructura general de una

neurona:

FIGURA 2.4. NEURONA BIOLGICA

Las Dendritas son los canales de transmisin a travs de los cuales, la neurona

recibe informacin. En el Soma, o ncleo de la clula, se procesa produciendo o no,

20

una seal de salida que es enviada a travs del Axn mediante un impulso elctrico

a otras Dendritas. Las Dendritas no tocan fsicamente el Axn, ms bien, se

comunican por medio de una regin llamada sinapsis a travs de la cual se

transmiten sustancias qumicas denominadas neurotransmisores [Gasca11].

Nuestro cuerpo est formado de una gran cantidad de agua, encontrndose el 55%

de ella dentro del cuerpo de las clulas y el restante 45% alrededor de ellas por lo

que las clulas mantienen sus componentes biolgicos aislados del resto del cuerpo

mediante una capa protectora o membrana. En el fluido extracelular e intracelular,

existen especies inicas de sales como cloruro-, sodio+ y potasio+ que juegan un

papel fundamental en el intercambio de informacin entre neuronas. Las membranas

de las clulas cuentan con canales inicos que estn formados por macromolculas

con formas y cargas especficas para dejar pasar determinadas cantidades de iones

de un lado a otro de la membrana. Diferentes grados de permeabilidad a elementos

especficos en la membrana, permiten que haya diferencias en la distribucin entre

los elementos inicos que se encuentran dentro y fuera de la membrana haciendo

que exista una diferencia de carga entre el fluido intracelular y el extracelular. A esta

diferencia de carga se le conoce como potencial en reposo [Rojas96]. Cuando se

transmite la informacin a travs de la sinapsis, se genera una variacin en este

potencial conocida como potencial de accin el cual genera una variacin en la

permeabilidad de la membrana permitiendo el intercambio de los neurotransmisores.

Las sinapsis pueden ser excitadoras o inhibidoras. Las primeras producen

disminuciones de potencial, ocasionando con esto la generacin de impulsos. Las

segundas, por su parte, estabilizan el potencial inhibiendo la generacin de impulsos

[Gasca11].

Ya que la neurona, a travs de sus dendritas, recibe informacin de varias neuronas,

la seal total de entrada es la suma ponderada de cada una de las seales recibidas.

Si el total rebasa cierto umbral, la neurona se activa [Gasca11].

21

Es en base al modelo expuesto anteriormente, que surge dentro del rea de la IA la

teora de las RNA.

2.4.2 Neurona Artificial

Una RNA, est formada por nodos que mantienen conexiones con otros nodos o con

su ambiente externo. Cada uno de estos nodos es una neurona artificial y cada una,

recibe una entrada y genera una salida [Russell96].

Con base al modelo de la neurona biolgica, en la figura 2.5, se muestra el modelo

tpico de una neurona artificial:

FIGURA 2.5. NEURONA ARTIFICIAL.

El modelo est formado por una serie de conexiones a travs de las cuales la

neurona recibe una serie de valores de entradas, en especfico, n entradas ms una

entrada fija con valor de uno llamada bias. Cada conexin se encuentra ponderada

por un peso y, la entrada neta que recibe la neurona, es la sumatoria de la

multiplicacin de cada peso por el valor de salida del nodo de la capa anterior como

se muestra en la siguiente ecuacin:

siendo w el vector de pesos aumentado y

anterior. Se dice que los vectores son aumentados por que incluyen los valores del

bias.

La neurona cuenta tambin con una funcin de activacin la cual recibe la

neta de la neurona y decide si la neurona se activa o no. Por lo general, las funciones

de activacin son funciones no lineales que producen valores de salida en el rango

de 0 a 1, sin embargo, existen diversas funciones de activacin [Selene09].

Algunas funciones de activacin son:

Lineal.- yxf =)( (Figura

Escaln.- 0=y si

Sigmoide.- xf =)(

FIGURA

=

=n

iijij ownet

0

el vector de pesos aumentado y o el valor de salida del nodo de la capa

anterior. Se dice que los vectores son aumentados por que incluyen los valores del

La neurona cuenta tambin con una funcin de activacin la cual recibe la

neta de la neurona y decide si la neurona se activa o no. Por lo general, las funciones

de activacin son funciones no lineales que producen valores de salida en el rango

de 0 a 1, sin embargo, existen diversas funciones de activacin [Selene09].

Algunas funciones de activacin son:

(Figura 2.6)

si 0

FIGURA

FIGURA

2.4.3 Perceptron Simple

El Perceptron Simple es la RNA ms sencilla que existe, creada por Rosenblat

1958 [Russell96]. Su topologa est

salida [Gasca11].

FIGURA 2.7. FUNCIN DE ACTIVACIN ESCALN

FIGURA 2.8. FUNCIN DE ACTIVACIN SIGMOIDE

Perceptron Simple

El Perceptron Simple es la RNA ms sencilla que existe, creada por Rosenblat

96]. Su topologa est formada por dos capas, una de entrada y una de

23

ESCALN

FUNCIN DE ACTIVACIN SIGMOIDE

El Perceptron Simple es la RNA ms sencilla que existe, creada por Rosenblatt en

formada por dos capas, una de entrada y una de

24

El Perceptron simple, separa los patrones de entrada en dos categoras.

Geomtricamente, estas categoras se pueden ver como regiones en un espacio n-

dimensional que son separadas por una lnea, plano o hiperplano [Gurney97]. Cada

patrn, por lo tanto, se puede ver como un punto en ese espacio n-dimensional,

usando sus valores como coordenadas, es decir, para n entradas, se tendr un

espacio de n dimensiones.

Como ya se mencion anteriormente, las neuronas de la capa de entrada no realizan

ningn procesamiento sobre los valores de entrada por lo que su salida es la misma

que su entrada. Para cualquier otro nodo, su entrada se determina mediante el

clculo del valor neto descrito mediante la Ecuacin 6.

Este valor neto de entrada, es en realidad una combinacin lineal de los elementos

de entrada y los pesos de las conexiones como se muestra en la siguiente ecuacin:

=

++=n

jjjj wxwy

11 1* (7)

1+jw es el peso del elemento bias cuyo valor de salida siempre es 1 y corresponde en

la interpretacin geomtrica del Perceptron al trmino constante de la ecuacin de la

recta, plano o hiperplano, que separa el espacio de observacin en dos. Si no fuera

por este trmino, la recta, plano o hiperplano, pasara siempre por el origen.

Como ya se mencion, por razones de simplicidad podemos incluir el bias en los

vectores de pesos y en el vector de entrada, generando as los vectores aumentados

de pesos y de valores de entrada. Si definimos w como el vector de pesos

aumentado, tendramos que:

[ ]Tnn wwww 121 ,,..., +=w (8)

Si definimos el vector aumentado de entrada como z tendramos que:

25

[ ]Tnxxx 1,,..., 21=z (9) Con estos dos vectores, podemos redefinir la funcin discriminante lineal como:

zwT =y (10)

El resultado es entonces evaluado por regla de decisin:

es decir, cuando d= 1, el patrn pertenece a la clase A de lo contrario, pertenece a la

clase B.

La regla de aprendizaje para el Perceptron Simple, la cual ajusta los pesos, es la

siguiente:

iiiii dt zww )(1 += (11)

donde t es la salida real de la red en la iteracin i ,

d es la salida deseada en la

iteracin i y es un constante llamada razn de aprendizaje.

El principal problema del Perceptron Simple es que solamente es eficiente en

problemas con dos clases que sean linealmente separables, lo que lo hace poco

prctico para la mayora de aplicaciones reales las cuales tienden a ser de ms de

dos clases y no linealmente separables.

26

2.4.4 Perceptron Multicapa

El Perceptron Multicapa es la unin de varios perceptrones simples [Selene09].

Mediante estas uniones, el Perceptron Multicapa es capaz de resolver los problemas

con los que se enfrenta el Perceptron Simple pudiendo tratar con problemas no

separables linealmente. La figura 2.9 ilustra la arquitectura del Perceptron Multicapa.

FIGURA 2.9. ARQUITECTURA DEL PERCEPTRON MULTICAPA

Adems de la diferencia en topologa entre el Perceptron Simple y el Multicapa, el

algoritmo de aprendizaje es diferente. La diferencia radica en que, en este modelo,

se deben ajustar los pesos de las conexiones de los nodos de las capas ocultas,

tratando de determinar la influencia que tuvo cada uno, en el error total de la salida

de la red [Gurney97]. A este problema se le conoce como el problema de la

Asignacin de Crditos y se puede resolver si se cuenta con una funcin de error

diferenciable con respecto a los pesos, pudiendo as, evaluar las derivadas del error

con respecto a los pesos y utilizarlas para encontrar los valores de los pesos que

minimicen el error con algn mtodo como el de gradiente descendente [Bishop95].

Un algoritmo muy popular que implementa esta solucin es el algoritmo

BackPropagation que pertenece tambin a la clase de mtodos supervisados, es

decir, se requiere una muestra de entrenamiento previamente clasificada. Se llama

as porque propaga el error de adelante hacia atrs a travs de los nodos de la red.

27

El algoritmo se lleva a cabo en dos fases: En la primera, se evala el error de la red y

en la segunda, se calcula la derivada del error con respecto a los pesos para calcular

su ajuste de manera que se minimice la funcin de error.

Este algoritmo utiliza el error cuadrtico medio como funcin de error:

2

12

1 )(=

=S

S

N

i

piNE (12)

siendop

i :

)( pip

ip

i sd = (13)

es decir, el error cometido definido como la diferencia entre la salida deseada pid y la

salida real de la red pis para el p-simo patrn en la i-simo nodo de la capa de salida.

sN es la cantidad de nodos de la capa de salida.

Una vez obtenido el error cuadrtico medio, los pesos se ajustan mediante el uso del

algoritmo de gradiente descendente:

)1()( += twEtw pw (14)

Donde es la razn de aprendizaje, pwE es el gradiente de la funcin de error con

respecto a los pesos, es el momento y t es el nmero de iteraciones.

28

2.5 PROCESAMIENTO DE IMGENES DIGITALES

Ya que el sistema propuesto en este proyecto toma como entrada imgenes

digitales, el procesamiento de stas juega un papel fundamental en el mismo. Una

imagen se puede ver como una funcin de dos variables f(x,y) donde x y y son

coordenadas espaciales y el valor de f, para cualquier par de coordenadas x y y es la

intensidad o nivel de gris de la imagen en ese punto [Gonzles04].

La imagen digital, en los sistemas computacionales, se puede representar y

manipular a travs de una matriz de M x N donde cada elemento de la matriz

representa un pixel y su posicin se conoce como coordenada del pixel. Las

posiciones van de 0 a M-1 y a N-1. A continuacin se ilustra este concepto a travs

de la siguiente matriz [Gonzles04]:

(15)

Un pixel p con coordenadas (x,y), puede tener hasta 8 pixeles vecinos como se

muestra a continuacin:

RELACIN DE UN PIXEL CON SUS PIXELES VECINOS

29

Estas relaciones son importantes, ya que muchas de las tareas de procesamiento de

imgenes digitales se pueden llevar a cabo mediante mscaras o filtros que se

aplican directamente sobre un pixel dado para encontrar cul es la relacin que

existe entre el valor del pixel central con respecto al de sus vecinos.

Existen muchas operaciones aplicables a las imgenes digitales para facilitar su

posterior procesamiento o anlisis, sin embargo, para los fines de este proyecto, nos

limitaremos a exponer la binarizacin, la obtencin del esqueleto de una imagen y la

aplicacin de filtros a imgenes digitales conocida como Correlacin.

2.5.1 Binarizacin

La binarizacin es el proceso mediante el cual se asigna uno de dos posibles valores

(blanco o negro) a cada pixel de la imagen de manera que un color sea usado para

los pixeles que representen el fondo de la imagen y el otro para aquellos que sean

parte del primer plano de la misma. Un mtodo comn para llevar esto a cabo es

utilizar un umbral y considerar a todos los pixeles con valores iguales o mayores al

umbral como parte del primer plano de la imagen y a todos aquellos con valores por

debajo del umbral como parte del fondo. Los pixeles con color negro formaran parte

del fondo de la imagen, mientras que aquellos con color blanco, formaran parte de

las figuras contenidas en la imagen. La figura 2.10 muestra un ejemplo de una

imagen y el resultado de su binarizacin.

FIGURA 2.10. IMAGEN EN ESCALA DE GRISES E IMAGEN BINARIZADA

30

2.5.2 Esqueletizacin

El anlisis de trazos es un mtodo efectivo para reconocer ciertos patrones digitales

como caracteres alfanumricos o ideogrficos [Zhang84].

La esqueletizacin de una imagen es un tipo de operacin morfolgica de

adelgazamiento mediante la cual se pueden descubrir los pixeles fundamentales que

forman la estructura bsica de una figura en una imagen digital [Gonzles08].

Por lo regular los algoritmos de adelgazamiento se aplican a imgenes binarias,

descritas en la seccin anterior, y funcionan a lo largo de una serie de iteraciones. En

cada iteracin, se evala cada uno de los pixeles que no forman parte del fondo y,

aquellos que se determina que no forman parte de la estructura fundamental de las

figuras contenidas en la imagen son descartados. La imagen resultante es usada

como entrada para la siguiente iteracin la cual aplica el mismo procedimiento para

continuar descartando aquellos pixeles que no son fundamentales. El algoritmo

finaliza cuando pasa una iteracin completa sin que se haya podido descartar ningn

pixel. En la figura 2.11, se muestra un ejemplo tomado de [Zhang84] donde se aplica

el proceso de esqueletizacin a una imagen que contiene una figura de una letra "H"

a lo largo de tres iteraciones:

FIGURA 2.11. ESQUELETO DE LA LETRA H.

31

La figura 2.11(c) es el resultado final donde ya se descartaron todos aquellos pixeles

de los cuales se puede prescindir sin que se pierda la informacin esencial que

transmite la imagen.

[Zhang84] propone el siguiente algoritmo:

1. Obtener Imagen Binaria I:

2. Sub-iteracin 1: Para cada pixel p de la imagen I que no forma parte del fondo:

2.1. Evaluar las siguientes condiciones:

2.2. Si se cumplen las condiciones mencionadas anteriormente, marcarlo para ser

borrado posteriormente.

3. Si no existe ningn pixel qu borrar, finalizar el algoritmo.

4. Borrar en I todos los pixeles marcados en el paso 2.2.

5. Sub-iteracin 2: Para cada pixel p de la imagen I resultante del paso 4 que no

formen parte del fondo:

5.1. Evaluar las condiciones:

32

5.2. Si cumple con las condiciones mencionadas anteriormente, marcarlo para ser

borrado posteriormente.

6. Si no existe ningn pixel qu borrar, finalizar el algoritmo.

7. Borrar en I todos los pixeles marcados en el paso 5.2.

8. Repetir desde el paso 2 tomando como entrada la imagen I resultante del paso 7

)( 1PB es el nmero de vecinos que forman parte de la imagen, es decir, que tienen

como valor un 1. Esta condicin permite asegurar que no se borren pixeles que sean

puntos finales o que sean parte central de las figuras contenidas en la imagen.

)( 1PA es el nmero de ocurrencias del patrn "01" en el conjunto ordenado

76,5432 ,,,, PPPPPP y 8P .

nP , por su parte, se refiere a la ubicacin de los pixeles mostrados en la siguiente

matriz:

Dicha matriz da la relacin de pixeles usada para evaluar condiciones del algoritmo

de Zhang Suen.

Cabe destacar que el pixel 1P es el pixel p que se est evaluando.

33

A continuacin se ilustra un ejemplo donde )( 1PA dara como resultado 2 ya que el

patrn "01" se presenta dos veces:

EJEMPLO DE EVALUACIN DE CONDICIN A(P1)

Esta condicin nos permite verificar que no borremos pixeles que se encuentren en

medio de dos puntos finales.

La figura 2.12 nos da tres ejemplos en los que las condiciones 1 y 2, nos ayudan a

no eliminar pixeles de puntos finales o que son parte central del esqueleto:

FIGURA 2.12. EJEMPLO DE PIXELES CENTRALES Y FINALES

Las letras A y C indican pixeles finales que no deben ser borrados. La condicin 1

nos impide borrarlos. La letra B indica un pixel central que es conservado gracias a la

condicin 2.

34

Las condiciones 3 y 4, para ambas sub-iteraciones, nos permiten evaluar pixeles que

forman parte de bordes en las esquinas noroeste, sureste, suroeste o noreste de

acuerdo a la figura 2.13:

FIGURA 2.13. FIGURA PARA EVALUACIN DE CONDICIONES 3 Y 4

Contando con el esqueleto de una firma, se pueden obtener varias de las

caractersticas utilizadas en este proyecto para la formacin del patrn de la firma de

una manera sencilla.

2.5.3 Correlacin

La Correlacin es una tcnica de filtrado lineal de imgenes que consta en aplicar

una mscara o filtro a cada pixel en conjunto con sus pixeles vecinos para obtener la

suma ponderada de los valores de cada uno de los pixeles a ser evaluados. La

matriz de pesos es precisamente la mscara o filtro aplicada y se conoce como

kernel o filtro.

A manera de ejemplo, la figura 2.14 muestra los valores de los pixeles de una

imagen de 4x5 y la figura 2.15 los valores de una mscara de 3x3.

FIGURA 2.14. IMAGEN DE 4x5

35

FIGURA 2.15. MSCARA DE 3x3

La figura 2.16 muestra cmo se aplicara el kernel o mscara al pixel en la fila 2 y

columna 4 con valor 14:

FIGURA 2.16. APLICACIN KERNEL

El resultado sera: 1*8 + 8*1 + 15*6 + 7*3 + 14*5 + 16*7 + 13*4 + 20*9 + 22*2=585.

36

2.6 GRAFOSCOPA

La grafoscopa es la disciplina que estudia la autenticidad o autora de grafismos

como la escritura o la firma. Surge desde 1776 pero no es sino hasta mediados del

siglo pasado cuando comienza a tomar un carcter cientfico [Orellana75].

La firma autgrafa es uno de los medios ms aceptados para la verificacin de la

identidad personal y es utilizada en toda clase de documentos oficiales como licencia

de conducir y credencial de elector entre otros. La firma es consecuencia de una

accin grfica producto de un reflejo condicionado cuyo mecanismo se encuentra

dirigido en gran medida por nuestro inconsciente [Orellana75], por ello, no slo se

asocia con informacin relacionada con el nombre del firmante sino que a partir de

ella, se pueden encontrar caractersticas psicolgicas del mismo las cuales estn

relacionadas especficamente con el sistema psicomotor, motivo por el cual se

considera como la representacin grfica de la identidad de un individuo y se acepta

como elemento til para la validacin y autorizacin en diversos tipos de operaciones

como lo son las financieras y legales entre otras [Baez06].

Un acto reflejo se produce cada vez que se dan las condiciones de estmulo

adecuadas, siendo stas para el caso de la firma, tctiles, visuales y fonticas. En

cuanto se toma la decisin de firmar, se pone en marcha el proceso "signatriz" que

desencadena un conjunto de desenvolvimientos grficos cuyo resultado es la firma.

La figura 2.17 muestra el proceso signatriz.

[CMGC08] define el proceso signatriz como la sucesin de eventos que se producen

dentro y fuera de nosotros cuando deseamos ejecutar nuestra firma y que finaliza en

la ejecucin propiamente dicha.

37

FIGURA 2.17. PROCESO SIGNATRIZ

Existen seis etapas dentro del proceso signatriz [GMGC08]:

1. Informacin del consciente al inconsciente del deseo de firmar.- Este proceso

se desencadena con el simple hecho de querer firmar ocasionando que el

inconsciente tome el mando y verifique que existan los elementos necesarios

para pasar a la accin, por ejemplo, cuando la persona automticamente

busca un lpiz y papel para firmar.

2. Examen de estmulos materiales.- Los estmulos materiales son analizados a

travs del tacto, por ejemplo, al tomar un lpiz, de manera inconsciente se

examina el grosor, peso y talla del mismo y si se consideran aptos, el

inconsciente transmite una sensacin de comodidad que permite seguir con el

proceso normal de firmado.

3. Examen de estmulos grficos.- En cuanto se tienen los elementos fsicos, el

inconsciente ordena que se verifique si existen marcas grficas que den gua y

orientacin a la firma como una lnea o un rectngulo en el rea de firmado.

Los estmulos grficos ms importantes son los bordes del papel cuando est

en blanco, lnea expresa para firmar, recuadros especficos para la firma, texto

38

que diga "firma" y marcas especiales como cruces, puntos y seales

especficas.

4. Ejecucin de los reflejos condicionados.- Cuando un estmulo grfico es

conocido, se ejecuta el reflejo condicionado de manera inconsciente como

cuando firmamos en un rectngulo reducido e inmediatamente se calcula y

reduce la dimensin de la firma para ajustarse al espacio disponible. Por el

contrario, cuando un estmulo grfico no es conocido, se requiere mayor

informacin por lo que el control vuelve al consciente para conseguirla y

continuar con el proceso. Un ejemplo de lo anterior es cuando no est claro

dnde firmar y el firmante tiene que preguntar dnde hacerlo para poder

continuar.

5. Proceso motriz.- Los diseos de la firma estn grabados en la memoria motriz

bajo impulsos sinpticos llamados imgenes motrices. Cuando las imgenes

motrices se convierten en sus correspondientes movimientos fsicos, se

produce la accin signatriz cuyo resultado da la firma. Las imgenes motrices

contienen toda la informacin necesaria para producir la firma: movimiento de

los msculos, presin sobre el lpiz o pluma, velocidad y tiempo en el que

deben ejecutarse los movimientos entre otros. Esta informacin se usa para

almacenar en la memoria motriz la actividad cintica y la cantidad exacta de

energa que precisan los msculos para llevar a cabo los desenvolvimientos

fsicos necesarios.

6. Emplazamientos prefijados o colocacin.- Aqu se da la materializacin del

reflejo grfico condicionado, es decir, la realizacin de la firma.

La importancia de cada uno de los elementos grficos constitutivos de la firma se

mide por el valor que estos adquieren cuando se quiere verificar si la firma es

autntica o no. Los elementos fundamentales son rara vez percibidos por el

falsificador por lo cual no los reproducir y, en caso de intentarlo, lo ms probable es

que sean reproducidos de manera errnea ya que slo el titular de la firma tiene la

capacidad de reproducirlos de manera espontnea y con las mismas caractersticas.

39

La particularidad ms importante de los elementos fundamentales es que son

numerosos y aparecen todos casi en el mismo momento. Por ejemplo, al firmar, el

lapicero se desplaza sobre el papel y la firma aparece, a simple vista se ve el

lapicero recorriendo el papel, lo que no se ve es la cantidad de presin que imprime

la mano sobre el lapicero o bien, los saltos en el aire del lapicero que generan trazos

separados.

Los elementos fundamentales se dividen en visibles e invisibles. Los elementos

visibles son aquellos que de manera relativamente sencilla, pueden ser observados a

partir de los trazos que quedan en el papel como son la proporcin, los enlaces, los

desenvolvimientos (la direccin de los diferentes trazos que forman la firma), la

velocidad y la presin.

Cada uno de estos elementos, aporta informacin valiosa a la hora de determinar la

autenticidad de una firma, por ejemplo, la velocidad rpida nos informa que su autor

realiza la firma sin la participacin de su estado consciente y hace presumir su

autenticad. La presin se encuentra inversamente relacionada con la velocidad, la

presin intercalada en el desarrollo de los diferentes trazos es caracterstica de las

firmas autnticas. Una firma con una presin constante a lo largo de todos sus trazos

indica que es muy probable que la firma sea falsa.

Los elementos invisibles son difciles de ver y se clasifican en puntos de referencia

intrnsecos y extrnsecos.

Los puntos de referencia extrnsecos son un conjunto de referencias exteriores a la

firma en s, es decir, no forman parte de la firma y sin embargo, influencian la manera

en la que la firma es llevada a cabo y se dividen en materiales y grficos; los

materiales son generalmente percibidos a travs del tacto como por ejemplo la silla

donde se debe sentar el firmante, la mesa o el papel donde se debe firmar. Ejemplos

de puntos de referencia grficos son el formato del formulario, rectngulos

destinados para la firma o inclusive el color del papel.

40

Los puntos de referencia intrnsecos son puntos de referencia que se les toma como

indicadores fiables de la autenticidad o falsedad de la firma y que se encuentran

escondidos dentro de los desenvolvimientos o trazos de una firma como son la

configuracin y ubicacin de los puntos de ataque, la forma y direccin de los rasgos

finales de cada trazo y caractersticas de los signos ortogrficos de puntuacin.

Para los fines de este proyecto, nos limitaremos a exponer la importancia de los

puntos de ataque y de los rasgos finales de cada trazo; segn sea el dinamismo del

movimiento no graficado inicial, ser la configuracin que adopte el primer contacto

del lapicero con el papel el cual es conocido como punto de ataque. De igual manera,

cada vez que termina un movimiento graficado queda una marca del estilo de la

finalizacin. La forma que adquieren los rasgos finales o de remate, dependen del

tipo de movimiento no graficado final. Lo anterior quiere decir que la manera en la

que el firmante mueve su brazo y mano en el aire antes y despus de hacer contacto

con el papel para realizar un trazo determina la forma inicial y final del mismo.

Ejemplos de puntos de ataque son los rectos, los cuales se denominan as porque su

inicio es un segmento de recta como se muestra en la figura 2.18 :

FIGURA 2.18. PUNTO DE ATAQUE RECTO

Los puntos de ataque redondeados son aquellos en los cuales el movimiento inicial

no graficado es lento. El detenimiento del lapicero en el papel no es tan prolongado y

la presin no es fuerte. La figura 2.19 muestra un ejemplo de punto de ataque

redondeado:

41

FIGURA 2.19. PUNTO DE ATAQUE REDONDEADO

Otro ejemplo de punto de ataque son los imperceptibles en los cuales, el movimiento

no graficado inicial es muy veloz y la punta del lapicero toca el papel muy

suavemente haciendo difcil determinar dnde termina el movimiento no graficado

inicial y dnde comienza el movimiento graficado. Este inicio es uno de los ms

difciles de imitar por que el falsificador tendra que imitar el movimiento no graficado

y el grado de velocidad y presin del movimiento graficado. La figura 2.20 muestra un

ejemplo de punto de ataque imperceptible:

FIGURA 2.20. PUNTO DE ATAQUE IMPERCEPTIBLE

Aunque la escritura y la forma de la firma presentan caractersticas nicas y propias

de cada persona, estas pueden cambiar tanto voluntaria como involuntariamente

[Baez06]. Para cambios voluntarios, basta el deseo de la persona para modificar el

diseo de la firma o de su escritura tanto parcial como totalmente mientras que para

cambios involuntarios puede haber diversas causas como las naturales,

determinadas por el proceso vital de la persona como decadencia fsica por ejemplo,

o bien, causas afectivas como la depresin, emociones o pasiones.

42

Segn [Baez06], la grafoscopa cuenta con diversas tcnicas para llevar a cabo la

verificacin de una firma:

Mtodo morfolgico de comparacin.- Se trata de realizar cotejos o

comparaciones entre las letras.

Mtodo grafolgico.- La grafologa permite identificar en la escritura gestos

idiosincrsicos personales llegando con ello al estudio psicolgico del hombre,

es decir, consiste en trazar un retrato grafolgico para determinar el origen de

una firma. Lo anterior quiere decir que a partir del anlisis grafolgico de una

firma, se puede identificar las caractersticas psicolgicas de una persona

como lo son su temperamento o sus cualidades intelectuales y artsticas,

validando con base en ellas, la autenticidad de una firma o bien, la

identificacin de su autor [Baez06].

Mtodo grafomtrico.- Consiste en la medicin de diferentes caractersticas de

los trazos como ngulos y espesores utilizando herramientas como reglillas

micrmetros.

43

2.7 SISTEMAS AUTOMTICOS DE VERIFICACIN DE

FIRMAS

Los sistemas de reconocimiento o verificacin de firmas, en su forma general,

presentan la estructura bsica de los sistemas de reconocimiento de patrones

mostrada en la figura 2.21, esto es, un sensor o medio de entrada, un proceso de

extraccin de caractersticas y un clasificador [Azzopardi06] [Blumenstein07]

[Drouhard96] [Leclerc94] [Papamarkos01] [Plamondon94].

FIGURA 2.21. ESTRUCTURA DE UN SISTEMA DE R.P.

Actualmente los sistemas de reconocimiento de firmas tienen dos vertientes bien

conocidas; la primera basada en la imagen esttica de la firma (el resultado de

firmar) y la segunda en el proceso dinmico involucrado (el proceso de firmar en s

mismo). A estos mtodos se les conoce como sistemas off-line o estticos y on-line o

dinmicos respectivamente [Leclerc94].

El enfoque esttico es considerado ms difcil debido a que los mtodos

desarrollados con un enfoque dinmico han obtenido mejores resultados en trminos

de errores de tipo I y tipo II. Los errores de tipo I, tambin conocidos por sus siglas

en ingls FRR (False Rejection Rate), se refieren al porcentaje de firmas vlidas que

son rechazadas por el sistema. Los errores de tipo II, tambin conocidos como FAR

(False Acceptance Rate), se refieren al porcentaje de firmas falsas aceptadas por el

sistema [Leclerc94].

44

El objetivo principal de estos sistemas es diferenciar las firmas originales de las

falsificadas. Aunque son ya al menos dos dcadas de trabajo continuo en esta rea,

no existe en realidad un estndar que defina y clasifique los tipos de falsificaciones

pero, en general, de acuerdo al nivel de habilidad en la falsificacin bien, de

acuerdo a la semejanza de las firmas, se aceptan las siguientes categoras [Babu06]:

Falsificacin Aleatoria: Puede ser la firma genuina de cualquier persona, la

intencin del firmante no es falsificar otra firma, simplemente, la firma contra la

cual se compara no es la suya.

Falsificacin Simple o Falsificacin Casual: Este tipo de falsificacin es

producida sabiendo slo el nombre de la persona cuya firma se quiere

falsificar.

Falsificaciones especializadas.- stas son las firmas producidas por

falsificadores profesionales con experiencia.

Los artculos publicados sobre el tema mencionados a lo largo de este trabajo,

expresan sus resultados en trminos de los errores tipo I y II sobre alguno o algunos

de los diferentes tipos de falsificaciones mencionados anteriormente, siendo los

peores resultados siempre aquellos relacionados con Falsificaciones especializadas

[Plamondon94]. Cabe destacar que el presente proyecto se enfoca en distinguir

firmas autnticas de falsificaciones especializadas dejando a un lado las

falsificaciones simples y aleatorias.

Los sistemas dinmicos, utilizan como medio de entrada tabletas digitales para

capturar la informacin del proceso de la firma, por lo tanto, requieren de la presencia

del firmante a diferencia de los sistemas estticos, los cuales tienen como entrada

una imagen digital.

En los sistemas dinmicos, se tienen las siguientes fases: adquisicin, pre-

procesamiento, comparacin y evaluacin. El proceso de adquisicin es muy

importante porque la calidad de las seales es crtica para la optimizacin del

45

proceso de comparacin, del mismo modo, si la seal es de buena calidad, el tiempo

asociado para el pre-procesamiento ser minimizado ya que en los sistemas

dinmicos, el pre-procesamiento por lo general est destinado a corregir fallas en el

proceso de adquisicin. El conjunto de seales que pueden ser procesadas en los

sistemas dinmicos es bastante grande: las coordenadas x y y del lapicero como

funcin del tiempo, velocidad, aceleracin y presin entre otros y, por lo mismo,

muchos investigadores se enfocan exclusivamente en este proceso y proponen

equipos electrnicos especializados para el proceso de adquisicin.

Como ya se mencion, los sistemas estticos, trabajan en base a imgenes

digitalizadas de firmas. Su mayor ventaja es que requieren equipo ms econmico y

no necesitan de la presencia del firmante. Su gran desventaja es que no tienen

acceso a la informacin dinmica mencionada anteriormente, sin embargo, en los

ltimos aos se han hecho intentos de obtener caractersticas dinmicas a partir de

la imagen esttica [Blumenstein09] [Lalican00].

2.7.1 Caractersticas

Existen diversas caractersticas utilizadas segn el enfoque empleado (on-line y off-

line). Algunas de ellas pueden aplicar a ambos. Se pueden categorizar en estticas y

dinmicas y a su vez en globales y locales.

Las estticas son las que se pueden extraer de una imagen mientras que las

dinmicas son las que se pueden extraer durante el proceso de firmar y tienen que

ver principalmente con la velocidad, el tiempo y la presin ejercida al momento de

firmar [Plamondon94].

Por globales se clasifica a las caractersticas que toman informacin de la firma como

un todo, por ejemplo, la *altura de la firma en las estticas o el tiempo total del

proceso de firmado en las dinmicas mientras que las locales, se enfocan en un

punto dado de la firma, ya sea en la posicin (las estticas) o en el tiempo

(dinmicas) [Leclerc94].

46

Las caractersticas existentes contempladas para ser usadas en este proyecto se

listan a continuacin junto con una breve descripcin y se da una descripcin ms

profunda y detalla en secciones subsecuentes:

Relacin Altura-Anchura.- Es la proporcin entre la altura y la anchura de la

firma.

Entropa.- Es una medida de la variacin entre los niveles de grises de la

imagen.

Mxima.- Relacin entre la distancia de dos trazos principales verticales u

horizontales con respecto a la altura y anchura.

Energa.- Algoritmo propuesto por [Blumenstein09] para cuantificar la energa

requerida para realizar los diferentes trazos de la firma a partir de una imagen

esttica.

rea de la firma.- Nmero de pixeles dentro de la imagen que pertenecen a la

firma.

Nmero de Puntos Borde.- Nmero de pixeles pertenecientes a la firma que

representan el inicio o fin de un trazo.

Nmero de Puntos de Interseccin.- Nmero de pixeles que representan la

unin de dos o ms trazos.

De igual forma, se propone la siguiente caracterstica no reportada en la bibliografa

consultada hasta el momento:

Wavelets de Puntos Borde.- Con esta caracterstica se pretende representar

los puntos de ataque y de remate descritos en la seccin 2.6.

Relacin Altura-Anchura

Es una caracterstica global que considera la proporcin entre la altura y anchura de

la firma [Karsligil10]. Se obtiene dividiendo la altura entre la anchura. Mientras que

entre firma y firma la altura y anchura pueden variar, la relacin entre estas dos se

mantiene proporcional. En las firmas digitalizadas, bsicamente se mide la relacin

47

entre la anchura y altura en pixeles de la firma. Se inspira la facultad homottica que

tiene el ser humano de cambiar el tamao de la firma sin alterar de manera

significativa dicha proporcin [Orellana75], este concepto se ilustra en la figura 2.22:

FIGURA 2.22. FACULTAD HOMOTETICA

A continuacin se muestra de manera grfica cmo se obtienen los valores de la

altura y anchura de una firma en una imagen digital:

FIGURA 2.23. VALORES DE ANCHURA Y ALTURA EN UNA FIRMA DIGITAL

Entropa

Corresponde a una medida de la variacin entre niveles de grises de la firma. El

trmino Entropa proviene de la teora de la informacin de Shannon. En el

procesamiento de imgenes digitales, se utiliza para medir la aleatoriedad o

48

incertidumbre en los niveles de grises. La frmula de la entropa est dada por la

siguiente ecuacin:

=

=

k

i ii p

pxH1

2

1log)( (16)

El trmino ip es la probabilidad de que ocurra el evento i , en nuestro caso, de que

ocurra el nivel de gris i , por lo tanto,

ip

1

es conocido como "factor sorpresa" o

simplemente como "sorpresa", es decir, a mayor probabilidad de un evento o nivel de

gris, menor sorpresa y viceversa. Al resultado de la ecuacin anterior, se le conoce

como bits de incertidumbre.

Ejemplo 1:

Suponiendo que tuviramos una imagen donde fuera posible encontrar 4 diferentes

niveles de grises A,B,C y D y todos ellos tomaran el valor de B, tendramos la

siguiente distribucin de probabilidad:

TABLA 2.2. EJEMPLO 1: CLCULO ENTROPA

Nivel de Gris A B C D

Probabilidad 0 1 0 0

Aplicando la frmula de la Entropa tendramos que:

0)0

1(

SISTEMA PARA LA VERIFICACIÓN AUTOMÁTICA DE FIRMAS ... · sep snest dgest instituto tecnolÓgico de toluca sistema para la verificaciÓn automÁtica de firmas autÓgrafas tesis

Documents