Top Banner
Los lenguajes controlados en la organización y recuperación de contenidos en la Web Los lenguajes controlados en la organización y recuperación de contenidos en la Web Wilmer Arturo Moyano Grimaldo Catedra para el curso: Organización y acceso a la información Instituto Tecnológico de Monterrey Febrero 21 de 2012
29

Los lenguajes controlados en la organización y recuperación de contenidos

Jun 23, 2015

Download

Education

Presentación realizada al Instituto Tecnológico de Monterrey sobre la evolución de los documentos digitales en la organización de información en febrero de 2012
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Los lenguajes controlados en la organización y

recuperación de contenidos en la Web

Wilmer Arturo Moyano GrimaldoCatedra para el curso:

Organización y acceso a la informaciónInstituto Tecnológico de Monterrey

Febrero 21 de 2012

Page 2: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Agenda a tratar:

1. Organización de la información– Lenguaje y conocimiento– Lenguajes naturales vs. Lenguajes controlados

2. Lenguajes controlados y organización web– Knowledge organization systems y System

Knowledge Organization systems– Folcsonomías y etiquetado

Page 3: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Lenguaje y conocimiento

Lenguaje

Page 4: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Tendencias en la organización

Control Bibliográfico

Estructuralista

• Catalogación tradicional• Estándares bibliográficos• Esquemas de clasificación

• XML• RDF• Ontologías

Organización en la Web Metadatos Web

Semántica

Page 5: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Organización de Información

• Fundamentos– Filosofía de los sistemas

• El todo, las partes y sus relaciones

– Filosofía de la ciencia• Positivismo y dialéctica

– Filosofía del lenguaje• Uso de las palabras

Page 6: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

• Obstáculos – Variedad del universo de información– Cambios políticos

• Estandarización internacional

– Cambios tecnológicos• Componentes

– Humano– Tecnológico

Organización de Información

Page 7: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Lenguajes naturales Vs. Lenguajes artificiales

VIZCAYA, D. A. (2000). Lenguajes documentales. p. 92

Page 8: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Ventajas de los lenguajes controlados

• El apoyo en la coherencia de la indización• El aumento de la probabilidad de adecuación entre los términos

escogidos por los indizadores y aquellos escogidos por el investigador• El proveer una estructura sindética que ayuda a la navegación y al

refinamiento de conceptos• El control de la sinonimia y de la polisemia• La discriminación de las palabras homógrafas• El proveer unas notas de aplicación• El permitir una recuperación más global dentro de un ambiente

multilingüe• El permitir la reagrupación de los elementos dispersos por sus

características comunes (Arsenaut, 2006)

Page 9: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Desventajas de los lenguajes controlados

• La ausencia de expresividad• La limitación de la cantidad de puntos de acceso• La ausencia de exhaustividad• La dificultad de representar nuevos conceptos• La dificultad de representar conceptos complejos• Las limitaciones del aprendizaje de las reglas sintéticas• La representación artificial de la realidad• La incompatibilidad entre los diferentes vocabularios

controlados• El costo de su desarrollo y utilización (Arsenaut, 2006).

Page 10: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Lenguajes naturales y Lenguajes documentales en la organización de información

Fuente: VIZCAYA, D. A. (2000)

Page 11: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Lenguajes documentales de acuerdo a su rol en los catálogos

Universo bibliográfico

Lenguajes de obras Lenguajes de Documentos

De autor

De título

De edición

De materias

De clasificación

De indización

De producción

De soporte

De ubicación

Svenonius, E. (2000). Intellectual foundation of information organization. p. 54

Page 12: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

KOS: Knowledge Organization Systems

• Término propuesto en 1998 por el Networked Knowledge Organization Systems Working Group como remplazo a los Lenguajes documentales.

• Para todo tipo de esquemas de organización de información: Ej. Metadatos, ontologías.

• Características:– Imponen una visión

particular del mundo en una colección y sus elementos.

– Permiten caracterizar las entidades de diferentes formas dependiendo el KOS.

– Facilitan para que una persona pueda asociar el término del KOS con el objeto del mundo real al que representan

Page 13: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Tipos de KOS

1. Listas de términosa. Archivos de autoridadesb. Glosariosc. Diccionariosd. Diccionarios geográficos (Gazeteers)

2. Clasificaciones y categoríasa. Listas de encabezamientosb. Esquemas de clasificación, de categorización y taxonomías

3. Listas de relacionesa. Tesaurosb. Redes semánticasc. Ontologías

Page 14: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

SKOS: Simple Knowledge Organization System

• Recomendación de la W3C• Para la representación de KOS en la Web,

potenciando los lenguajes documentales tradicionales a un ambiente de Web Semántica.– Estructura basada en RDF para representación de

conceptos, sus relaciones y sus definiciones.

Page 15: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

LÉNART, M. SKOS, un langage de représentation de schémas de concepts

SKOS: Simple Knowledge Organization System

AGROVOC

Page 16: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Metadatos

• “Datos sobre datos”• Para la organización, gestión, descripción y

recuperación de información en formato digital. Ej. Fotografía

• No son específicos del ambiente bibliotecario• Para diferentes campos:

– Bibliotecas digitales: Dublin core– Archivos: Encoded Archival Description– Museos: VRA core

Page 17: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Metadatos en la vida diaria

Page 18: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Metadatos en la vida diaria

Page 19: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Ontologías

• Vocabulario común a máquinas y personas– Mejoran la especificidad

en las búsquedas Web– Recuperación de

información automatizada por fuera de los motores de búsqueda.

– Representan la estructura de un documentos a través de la abstracción y relación de conceptos.

Page 20: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

OWL: Web Ontology Language

• OWL= 2004; OWL2 = 2009 (basado en XML)• Para permitir la descripción de clases y las

relaciones entre estas que son inherentes a aplicaciones y documentos en la Web.– OWL2: especialmente para esquemas de clasificación

• Permite describir las clases• Mejora las relaciones entre las clases• Construcción de varias clases de reglas para nuevos números

de clasificación.

• Ejemplo: http://www.regesta.com/xdams/ontologie/owl/Biblioteca.owl

Page 21: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Biblioteca.owl

Page 22: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Folcsonomías

• Por Thomas Vander Wal en 2004– “Taxonomías creadas por la gente”

• Indización social a base de etiquetas– Lenguaje natural– No existen relaciones entre términos– Las etiquetas permiten la organización y

recuperación• Ejemplos de uso: www.delicious.com

Page 23: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Aplicación del etiquetado

Page 24: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Aplicación del etiquetado

Page 25: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

En resumen…

• El lenguaje es el estándar que usa la comunicación para transmitir un mensaje y crear conocimiento.

• La recuperación más efectiva de información depende del uso de los lenguajes naturales y los lenguajes controlados.

• La nueva forma de definir los lenguajes documentales es como Sistemas de Organización de conocimientos (KOS)

Page 26: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

En resumen…

• SKOS es el lenguaje que permite representar los lenguajes documentales en un ambiente Web mejorando la representación del conocimiento como apoyo a la Web Semántica

• Los metadatos y las ontologías son sistemas de organización del conocimiento en un ambiente digital y Web

Page 27: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

En resumen…

• Las folcsonomías son estructuras temáticas basadas en lenguaje natural y creadas por los usuarios finales para la organización, descripción y recuperación de información por medio de etiquetas.

• El etiquetado ha permitido la creación de sistemas y servicios que facilitan la interacción entre el usuario y el sistema.

Page 28: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Wilmer Arturo Moyano

Page 29: Los lenguajes controlados en la organización y recuperación de contenidos

Los lenguajes controlados en la organización y recuperación de contenidos en la Web

Bibliografía recomendada…

• SVENONIUS, E. (2000). The intellectual foundation of information organization. Cambridge: The MIT press, 2000. 255 p. Serie Digital libraries and electronic publishing.

• ARSENAULT, C. (2006). “L’utilisation des langages documentaires pour la recherche d’information” En: Documentation et bibliothèques, avril-juin, 2006, pp. 139-149

• HODGE, G. (2000). Systems of Knowledge Organization for Digital Libraries: Beyond Traditional Authority Files. http://www.clir.org/pubs/reports/pub91

• PETERS, I. (2009). Folksonomies: indexing and retrieval in Web 2.0 (Disponible parcialmente a través de Google Books)