Top Banner
Minería de textos Minería textual Text Mining Integrantes: - Samuel Silva Abuhadba - Marcelo Valdivia Paredes
14

Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

Dec 02, 2015

Download

Documents

Samuel Silva
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

Minería de textos Minería textual

Text Mining

Integrantes:- Samuel Silva Abuhadba - Marcelo Valdivia Paredes

Page 2: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

¿ Qué es ?O «La Minería de Textos es una tecnología

emergente cuyo objetivo es la búsqueda de conocimiento en grandes colecciones de documentos no estructurados.»

O El 80% de la informacion de las organizaciones esta almacenada en forma textual no estructurada como : informes , e-mail , actas de reuniones, etc.

Page 3: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

Aplicaciones y UsosO Categorización de la información existente ,

filtrado y enrutado ; e-mails , detección de información similar o duplicada

Page 4: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

O Utilizados en empresas para identificar el contenido de los e-mails enviados por los clientes y redirigirlos a los departamentos correspondientes

O Usos mas avanzados el sistema identifica el contenido de una consulta frecuente hecha por e-mail y envía una respuesta estándar sin necesidad de intervención humana.

Page 5: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

O Vigilancia Tecnológica

O Inteligencia de negocios

Page 6: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo
Page 7: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

Tres pasos fundamentales de la

minera de textos:1.-Recuperación de información, es decir, seleccionar los textos pertinentes.2.-Extracción de la información incluida en esos textos: hechos, acontecimientos, datos clave, relaciones entre ellos, etc.3.-Por ultimo se realizaría lo que antes definíamos como minería de datos para encontrar asociaciones entre esos datos claves previamente extraídos de entre los textos

Page 8: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

¿Como hacer la minera de textos?

O Es una técnica relativamente nueva, cambiante y que puede adaptarse a diferentes situaciones y casos, por lo que no existe un método estricto a seguir siempre. Sin embargo, en términos generales se podría decir que estas son las cuatro etapas principales

Page 9: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

Primera

Determinación de los objetivos. Aclarar que es lo que se esta buscando con esta investigación, acotando hasta que punto se quiere profundizar en la misma y definiendo claramente los limites.

Segunda

Preprocesamiento de los datos, que seria la selección, análisis y reducción de los textos o documentos de los que se extraerá la información. Esta etapa consume la mayor parte del tiempo.

TerceraDeterminación del modelo. Según los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse unas técnicas u otras.

Cuarta

Análisis de los resultados. A partir de los datos extraidos se tratara de ver su coherencia y se buscaran evidencias, similitudes, excepciones, etc, que puedan servir al especialista o al usuario que haya encargado el estudio para extraer conclusiones que pueda utilizar para mejorar algún aspecto de su empresa, compañía, administración u organización en general.

Page 10: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

“Data mining: torturando a los datos hasta que confiesen”

Luis Carlos Molina Félix

Page 11: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

Ejemplo: Migraña

O Se pudieron extraer evidencias a partir de varios artículos de literatura biomédica y algunas de las claves fueron: 

O El estrés está asociado con la migraña.O El estrés puede conducir a la pérdida de magnesio.O Los bloqueadores de canales de calcio previenen algunas

migrañas.O El magnesio es un bloqueador natural del canal de calcio.O La depresión cortical diseminada (DCD) está implicada en

algunas migrañas.O Los niveles altos de magnesio inhiben la DCD.O Los pacientes con migraña tienen una alta agregación

plaquetaria.O El magnesio puede suprimir la agregación plaquetaria

Page 12: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

O Estas evidencias permitieron crear una hipótesis que no existía en la literatura científica como tal pero que se pudo encontrar de manera indirecta haciendo un análisis diferente de los textos. Estudios posteriores probaron experimentalmente esta hipótesis obtenida por text mining con buenos resultados.

O Ejemplo: Las fichas de entrada en una fabrica.O Departamento donde salen mas tarde.O Incidencia de faltas

O Retrasos en función de las fechas.

Page 13: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

ResumenO En resumen, la minería de textos pueden ayudar a

que la información implícita en los documentos más explícitos se puede hallar de manera rápida. Esto hace que ahorremos tiempo y dinero.. El text mining se apoya en otras técnicas como: 

O extracción y recuperación de la informaciónO aprendizaje automáticoO procesamiento de lenguaje naturalO categorización de texto

Page 14: Minería de Textos-silva Abuhadba Samuel , Valdivia Paredes Marcelo

Conclusiones:O La minería de textos es una tecnología recuperación y

organización de la información que aunque todavía es emergente y necesita ser mejor desarrollada, nos sirve para obtener un tipo de información muy útil en cualquier tipo de organización publica o privada. 

O Económicamente es una técnica que puede utilizarse para ahorrar dinero y abrir oportunidades de negocio a las empresas.

O En cualquier organización, las conclusiones a las que se puede llegar a través del text mining pueden ser utilizadas para la toma de decisiones