Top Banner
Autoclasificación de documentos. Buenas Prácticas y Trucos para Obtener el Mayor Rendimiento Enero/2014
14

Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Jun 19, 2015

Download

Technology

Athento

En esta presentación aprenderás:

* Qué características de los documentos nos ayudarán a obtener mejores resultados de clasificación.
* Qué mecanismos de clasificación utiliza Athento para la autoclasificación de documentos.
* Qué son modelos de clasificación.
* Como utilizar palabras clave para obtener mejores resultados de clasificación.


Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Autoclasificación de documentos. Buenas Prácticas y Trucos para Obtener el Mayor Rendimiento

Enero/2014

Page 2: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Índice

Buenas Prácticas

Método 1: Análisis de Imágenes

Método 2: Expresiones Regulares

Ejemplo práctico

Page 3: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Buenas Prácticas

Calidad de la imagen: mínimo 300 DPI (puntos por pulgada

Page 4: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Buenas Prácticas

Calidad de los documentos(manchas, dobleces, mal escaneo)

Page 5: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Buenas Prácticas

Formatos estándares de ImagenPDF, TIFF, PNG24, JPEG etc.

Page 6: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Análisis de Imágenes

Utilizando imágenes: Histograma

Page 7: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Análisis de Imágenes

Histograma de la imagen previa

Page 8: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Análisis de la Imagen

Usando el tamaño (ancho y alto)

Page 9: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Análisis de Imágenes

Redes Neuronales

Page 10: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Expresiones Regulares

Buscamos patrones en el documento(También útil para la keyword extraction)

Page 11: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Cómo clasificar documentos?

Nombre de Empresa (Telefónica, Walt-Disney)Tipo de Documento (Factura, Contrato)RUT ↔ C.I.F.

Page 12: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Cómo definir modelos?

Modelo = Plantilla = Tipo de DocumentoEjemplo: Tickets Starbucks, Tarjeta Embarque American Airlines

Page 13: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Why?

There is a better way to do document

management”

Page 14: Autoclasificación de documentos con Athento: Buenas prácticas y trucos para obtener el mayor rendimiento

Gracias

Preguntas?