Baeza

Baeza-Yates, R.-Ribeiro-Neto, B. Modern information retrieval. Addison Press: New York, 1999.Capítulo 10:Interfaces de usuario y visualización

Trad. de Ana Sanllorenti

10.1 Introducción

Este capítulo discute las interfaces de usuario para la comunicación entre usuarios humanos que buscan información y los SRI. La búsqueda de información es un proceso impreciso. Cuando los usuarios se acercan a un sistema de acceso a información, tienen a menudo sólo una comprensión difusa acerca de cómo pueden lograr su propósito. Por lo tanto, la interfaz de usuario debería ayudarlo a comprender y expresar su necesidad de información. También debería ayudarlo a formular sus consultas, seleccionar entre las distintas fuentes de información disponible, comprender los resultados de la búsqueda, y seguir el progreso de su búsqueda.

La interfaz hombre-computadora es menos comprendida que otros aspectos del la RI, en parte porque los seres humanos son más complejos que las computadoras, y sus motivaciones y conductas son más difíciles de medir y caracterizar. Como el área está cambiando rápidamente, la discusión en este capítulo enfatizará desarrollos recientes más que conocimientos ya establecidos.

Primero se delineará el lado humano del proceso de búsqueda de información y luego se focalizarán los aspectos de este proceso que puede ser mejor soportados por la interfaz de usuario. La discusión se encaminará hacia la práctica y tecnología actuales, las propuestas recientes de ideas innovadoras y las sugerencias para futuras áreas de desarrollo.

La sección 10.2 presenta los principios del diseño para la interacción hombre-computadora e introduce nociones relacionadas con la visualización de información. La sección 10.3 describe los modelos de búsqueda de información pasados y presente. Las siguientes cuatro secciones describen el soporte de la interfaz de usuario para comenzar el proceso de búsqueda, para la especificación de la consulta, para ver los resultados recuperados en contexto y para la retroalimentación interactivo por relevancia. La sección 10.8 describe las técnicas de interfaz de usuario que apoyan el proceso de acceso a la información como un todo. La sección 10.9 especula sobre futuros desarrollo y la sección 10.10 provee sugerencias para otras lecturas. La figura 10.1 presenta el flujo de los contenidos de los capítulos.

Introducción

Bases de la interacción Hombre-computadora

El proceso de acceso a la información

Los puntos de partida

La especificación de la consulta

Contexto

1

Juicios de relevancia

Soporte de la interfaz

Conclusiones

Figura 10.1 Contenidos de este capítulo

10.2 Interacción Hombre – Computadora

¿Qué es lo que hace efectiva la interfaz hombre .- computadora? Ben Schneiderman, un experto, escribe [725, p.10]:

“Bien diseñados, los sistemas de computadora efectivos generan sensaciones positivas de éxito, competencia, dominio y claridad en la comunidad usuaria. Cuando un istema interactivo está bien diseñado, la interfaz casi desaparece, permitiendo al usuario concentrarse en su trabajo, exploración o placer”.

Como pasos hacia el logro de esas metas, Schneiderman lista los principios para el diseño de interfaces de usuario. Los particularmente importantes para el acceso a la información, incluyen: proveer retroalimentación informativa, permitir acciones inversas sencillas, soportar control interno (internal locus of control) , reducir la carga de la memoria de trabajo, y proveer interfaces alternativas para usuarios iniciales y expertos. Cada uno de estos principios debería ser instanciado de forma diferente en cada aplicación particular de la interfaz. En adelante discutimos estos principios que son de especial interés para los sistemas de acceso a la información.

10.2.1 Principios del Diseño

Ofrecer retroalimentación informativa: Este principio es especialmente importante para las interfaces de acceso a la información. En este capítulo veremos las ideas actuales acerca de cómo proveer a los usuarios con retroalimentación acerca de las relaciones entre la especificación de su consulta y los documentos recuperados, acerca de las relaciones entre los documentos recuperados, y acerca de las relaciones entre los documentos recuperados y los metadatos que describen las colecciones. Si el usuario tiene control sobre cómo y cuándo se provee la retroalimentación, entonces el sistema provee un control interno (internal locus of control)

Reducir la carga de memoria de trabajo: El acceso a la información es un proceso iterativo, cuyas metas cambian a medida que la información es encontrada. Una manera clave en que las interfaces de acceso a la información pueden ayudar en mantener la memoria, es proveer mecanismos para guardar rastros de las elecciones realizadas durante el proceso de búsqueda, permitiendo a los usuarios retornar a las estrategias abandonadas temporariamente, saltar de una estrategia a la siguiente, y retener información y contexto a lo largo de las sesiones de búsqueda. Otro dispositivo para ayudar a la memoria es proveer información revisable que sea relevante en la etapa corriente del proceso de acceso a la información. Esto incluye sugerencias de términos relacionados o de metadatos, y puntos de partida de búsquedas que incluyan listas de fuentes y listas de temas.

Proveer interfaces alternativas para usuarios iniciales y expertos: Un punto de tensión importante en el diseño de interfaces de usuarios es el de la simplicidad versus potencia. Las interfaces simples son fáciles de aprender, a expensas de menor flexibilidad y a veces uso menos eficiente. Las interfaces poderosas permiten a un usuario conocedor hacer más y tener más control sobre la

2

operación de la interfaz, pero pueden consumir más tiempo para ser aprendidas e imponen un esfuerzo de memoria para las personas que usan el sistema de forma intermitente. Una solución común es usar una técnica con un “andamio de apoyo” (scaffolding). Se presenta al usuario inicial una interfaz simple que puede ser aprendida rápidamente y que provee la funcionalidad básica de la aplicación, pero que es restringida en cuanto a potencia y flexibilidad. Se ofrecen interfaces alternativas para usuarios más experimentados, permitiendo más control, más opciones y más características, o eventualmente modelos de interacción completamente diferentes. Los buenos diseños de interfaces proveen puentes intuitivos entre las interfaces simples y las avanzadas.

Las interfaces de acceso a la información deben enfrentar la dificultad del equilibrio entre la simplicidad y la potencia. Una de esas dificultades es la cantidad de información que se muestra acerca de los trabajos del sistema de búsqueda. Los usuarios nuevos de un sistema o de una colección pueden no saber demasiado acerca del sistema o del dominio asociado con la colección, como para hacer elecciones entre características complejas. Pueden no saber cómo pesar o valorar los términos, o, en el caso de retroalimentación por relevancia, no saber cuáles serían los efectos de la revaloración de los términos. Por otra parte, los usuarios que han trabajado con un sistema probablemente sean capaces de elegir entre términos sugeridos para agregar a su consulta mayor información. Determinar cuánta información se debe mostrar al usuario es una de las decisiones principales en el diseño de interfaces de acceso a la información.

10.2.2 El rol de la visualización

Las herramientas del diseño de interfaces de computadora son familiares para la mayoría de los usuarios de hoy: ventanas, menúes, íconos, cajas de diálogos, etc. Estos recursos hacen uso de despliegue de mapas de bits y gráficos para proveer una interfaz más accesible que las visualizaciones basadas en comandos. Un área menos familiar pero en crecimiento es la de la visualización de la información, que intenta proveer representaciones visuales de espacios de información muy grandes.

Los seres humanos están acostumbrados a las imágenes y a la información visual. Los cuadros y los gráficos puede ser cautivantes si están bien diseñados. Una representación visual puede comunicar algunas clases de información mucho más rápida y efectivamente que cualquier otro método. Consideremos la diferencia entre la descripción escrita de la cara de una persona y su fotografía, o la diferencia entre una tabla de números que contienen una correlación y un gráfico que representa la misma información.

La aparición creciente de rápidos procesadores de gráficos y de monitores de color de alta resolución incrementa el interés en la visualización de información. La visualización científica, una rama en rápido avance, mapea fenómenos físicos en representaciones de dos o tres dimensiones. Un ejemplo de este tipo de visualización es la imagen color de patrones de picos y valles en el suelo del océano; esto provee una vista de fenómenos físicos que actualmente la fotografía no puede cubrir. La imagen se construye a partir de datos que representan los fenómenos subyacentes.

La visualización de información abstracta es más difícil y la visualización de información representada textualmente constituye un desafío. El lenguaje es nuestro principal medio de comunicación para las ideas abstractas, para las cuales no hay manifestaciones físicas obvias. ¿Cómo luciría un cuadro que describiera negociaciones en las que una parte demandara concesiones en políticas ambientales mientras que otra parte requiriera su refuerzo?

A pesar de las dificultades, los investigadores están intentando representar aspectos del proceso de acceso a la información utilizando técnicas de visualización de la información. Además de usar

3

iconos y resaltadores de color, las principales técnicas de visualización de información incluyen pintado (brushing) y linking, paneo y zoom, foco – más – contexto, lentes mágicos, y el uso de animación para retener el contexto y ayudar a hacer visible la información oculta. Estas técnicas soportan uso dinámico e interactivo. La interactividad parece ser una propiedad especialmente importante para visualizar información abstracta, a pesar de que no ha tenido un rol destacado en la visualización de información científica.

El pintado (brushing) y linking refieren a la conexión de dos o más vistas de los mismos datos, de modo tal que un cambio en la representación de una vista afecta la representación en las demás. Por ejemplo, imaginemos un vista que consiste en dos partes: un histograma y una lista de títulos. El histograma muestra, para un conjunto de documentos, cuántos documentos fueron publicados cada año. La lista de títulos muestra los títulos de los documentos correspondientes. El pintado (brushing) y linking permitiría al usuario asignar un color, por ejemplo rojo, a una barra del histograma, lo que causaría que también se pintaran de rojo los títulos de la lista correspondientes al año pintado en el histograma.

El paneo y el zoom refieren a acciones de una cámara móvil que puede barrer de lado a lado una escena (paneo) o acercarse y alejarse para conseguir una vista más amplia o más focalizada (zoom). Por ejemplo, el agrupamiento de textos puede ser usado para mostrar una vista de los principales temas en una colección de documentos (Figures 10.7 y 10.8). El zoom puede ser usado para acercarse, y mostrar los documentos individuales como íconos, y aún más cerca para ver el texto asociado con un documento individual.

En la utilización del zoom, cuanto más visibles son los detalles de un ítem en particular, menos puede verse sobre los ítems que lo rodean. Foco – más – contexto se usa para aliviar en parte este efecto. La idea es agrandar una porción de la vista –el foco de la atención- mientras se encogen los objetos circundantes. Cuanto más lejos está un objeto del foco de atención, aparece de modo más pequeño, como el efecto que produce un lente ojo de pescado.

Los lentes mágicos son ventanas transparentes directamente manipulables que, cuando se superponen sobre otros tipos de datos, causan una transformación a ser aplicada a los datos subyacentes que entonces cambian su apariencia (ver Figura 10.13). Una aplicación de los lentes mágicos es para el dibujo de tareas. La mano izquierda puede usarse para posicionar un lente de color sobre un objeto. La mano derecha se utiliza para cliquear sobre el lente, lo que causa la transformación del color del objeto subyacente al especificado por el lente.

Adicionalmente, hay un gran número de métodos gráficos para representar árboles y jerarquías, algunos de los cuales usan animación para desplegar nodos que también pueden ser ocultados.

A veces es útil combinar estas técnicas en un nivel de la interfaz que denominamos vista general más detalles. En una ventana se muestra una vista general, como una tabla de contenido de un manual grande. Un clik en en un capítulo, en una acción de linking produce la aparición del texto del capítulo en otra ventana (Ver Fig. 10.19). El paneo y el zoom o el foco más contexto pueden ser usados para cambiar la vista del contenido en la ventana general.

10.2.3 Evaluación de sistemas interactivos

Desde el punto de vista del diseño de la interfaz de usuario, las personas tienen muy diferentes habilidades, preferencias y predilecciones. Las diferencias importantes incluyen habilidad espacial relativa y memoria, habilidades de razonamiento, aptitud verbal y diferencias de personalidad. La edad y las diferencias culturales pueden contribuir a aceptar o rechazar técnicas de interfaz. Una

4

innovación de la interfaz puede ser útil y plancentera para algunos usuarios, y extraña para otros. Por tanto, el diseño de software debería permitir flexibilidad en el estilo de interacción, y considerar que las nuevas características no serán igualmente útiles para todos los usuarios.

Un importante aspecto de la interacción hombre – computadora es la metodología de evaluación de las técnicas de interfaz de usuario. Las medidas de acierto y precisión han sido ampliamente utilizadas para comparar los resultados de sistemas no interactivos, pero son menos apropiadas para evaluar sistemas interactivos. Las evaluaciones estándares enfatizan altos niveles de acierto; en TREC (Text Retrieval Conferences, foros destinados a promover la investigación en Recuperación de Información para grandes colecciones de texto) los sistemas de tareas son comparados para ver cómo retornan los principales 1000 documentos (Cap.3). Sin embargo, en muchos sistemas interactivos los usuarios requieren sólo unos pocos documentos relevantes y no les importa el acierto alto. La métrica útil sobre acierto y precisión incluye: tiempo requerido para aprender el sistema, tiempo requerido para conseguir las metas de cada tarea, tasas de error, y retención del uso del la interfaz en el tiempo. En este capítulo se muestran resultados empíricos de estudios de usuarios.

Los datos empíricos que implican a los usuarios son el tiempo consumido y la dificultad para extraer conclusiones. Esto se debe en parte a la variación de las características de los usuarios y sus motivaciones, y enparte al amplio alcance de las actividades de acceso a la información. Los estudios psicológicos formales sólo han cubierto conclusiones específicas en contextos muy restringidos. Por ejemplo, cantidades tales como el tiempo que toma al usuario seleccionar un ítem de un menú en varias condiciones. Pero en cambio es difícil cuantificar las variaciones en el comportamiento de la interacción para tareas complejas de acceso a información. Nielsen [605] invoca un enfoque de evaluación más informal (llamada evaluación heurística).

10.3 El proceso de acceso a la información

Una persona involucrada en un proceso de búsqueda de información tiene una o más metas en su mente y utiliza un sistema de búsqueda como herramienta para lograrlas. Las metas requeridas para el acceso a información pueden ser muy variadas, desde encontrar un plomero hasta encontrar información sobre un competidor comercial, desde escribir un artículo académico hasta realizar una investigación para realizar una demanda por fraude.

Para lograr esas metas se llevan a cabo las tareas de acceso a la información. Estas tareas abarcan un amplio espectro que va desde hacer preguntas específicas hasta investigar un tópico de forma exhaustiva. En un estudio llevado a cabo por analistas de negocios [614] se encontraron tres tipos principales de tareas de búsqueda: monitoreo de un tópico conocido a lo largo de un tiempo (tal como investigar las actividades de la competencia cada cierto tiempo); seguir un plan de series específicas de búsqueda para lograr una meta en particular (tal como mantenerse actualizado sobre prácticas de negocios exitosas), y explorar un tópico de un modo indirecto (tal como cuando se logra saber acerca de una industria no conocida). A pesar de que las metas difieren, hay un núcleo común de componentes alrededor de la búsqueda de información.

10.3.1 Modelos de interacción

En general se asume que en el proceso de acceso a la información se da un ciclo de interacción que consiste en la especificación de la consulta, la recepción y el análisis de los resultados; luego se finaliza el proceso o se reformula la consulta y se repite el proceso hasta que se encuentra un conjunto considerado perfecto [700,726]. Más detalladamente, el proceso puede ser descripto de acuerdo a la siguiente secuencia de pasos (ver Figura 10.2):

5

1) Comienzo con una necesidad de información2) Selección de un sistema y de una colección en los que buscar3) Formular la consulta4) Enviar la consulta al sistema5) Recibir los resultados en forma de ítems de información6) Revisar, evaluar e interpretar los resultados7) Finalizar o8) Reformular la consulta e ir al paso 4

Este modelo simple de interacción (utilizado por los motores de búsqueda en la Web) es el que utilizan la mayoría de los que buscan información en la actualidad. Este modelo no toma en consideración que muchos usuarios se disgustan ante una gran lista de resultados desorganizados que no refieren directamente a sus necesidades de información. También incluye un supuesto: la necesidad de información del usuario es estática y el proceso de búsqueda de información es una sucesión de refinamientos de una consulta hasta que se recupera todos y sólo los documentos relevantes a la necesidad de información original.

Figura 10.2 Diagrama simplificado del modelo estándar del proceso de acceso a la información

6

Necesidad

de información

Consulta

Enviar al sistema

Recibir los resultados

Evaluar los resultados

Satisfacción?

Fin

Reformular

Si

No

En realidad, los usuarios aprenden durante el proceso de búsqueda. Ellos revisan la información, leen los títulos en los resultados, leen los documentos recuperados, ven las listas de tópicos relacionados con los términos de búsqueda, y navegan por los sitios Webs relacionados por hipervínculos. El advenimiento de los hipervínculos como parte central del proceso de búsqueda de información, hace imposible ignorar el rol de la revisión (scanning) y de la navegación como partes del mismo proceso. En particular, y mucho más que en las búsquedas bibliográficas hoy es muy común que se intenten aproximaciones utilizando los hipervínculos de la Web, en la espera de encontrar una página útil luego de algunos saltos por diferentes sitios o páginas.

Ese modelo también subestima la interacción que tiene lugar cuando el usuario revisa términos sugeridos como resultado de un proceso de retroalimentación por relevancia, revisa una estructura de tesauro, o visualiza esquemas temáticos de una colección de documentos. Ese modelo tampoco valora suficientemente el rol de la selección de fuentes que está adquiriendo creciente importancia desde que hay disponibles miles de colecciones de información.

Por estas razones, a pesar de que es útil para describir las bases del proceso de acceso a la información, está siendo muy criticado [65,614,105,365,192]. Bates [65]propone el modelo ”recoger granos” (“berry-picking”), que contiene dos puntos principales. El primero es que, como resultado de la lectura y aprendizaje a partir de la información encontrada en el proceso de búsqueda, continuamente cambian tanto la necesidad de información del usuario como la formulación de las consultas. La información encontrada en un punto de la búsqueda puede producir un cambio no previsto de dirección de la misma. La meta original puede lograrse de forma parcial y cambiar la prioridad de una meta en relación con otra. Esto contradice el supuesto de que la necesidad de información del usuario permanece inamovible durante el proceso de búsqueda. El segundo punto de este modelo es que las necesidades de información del usuario no son satisfechas por un único conjunto final de documentos recuperados, sino por una serie de selecciones y bits de información encontrados a lo largo del proceso. Esto contradice el supuesto de que la principal meta de un proceso de búsqueda es encontrar el conjunto perfecto de documentos que satisfacen la necesidad original de información.

El modelo “berry-picking” está respaldado por una cantidad de estudios observacionales [236,105] incluyendo los de O´Day y Jeffries [614]. Ellos encuentran que el proceso de búsqueda de información consiste en una serie de búsquedas interconectadas pero diversas sobre un tema base. También encuentran que los resultados de una búsqueda tienden a plantear nuevas metas y producen cambios de dirección de la búsqueda, pero esto se va produciendo en etapas. También plantean que el principal valor de una búsqueda reside en el aprendizaje acumulado y en la adquisición de información que se produce durante el proceso, más que en el conjunto de resultados finales.

En consecuencia, una interfaz de usuario para el acceso a la información debería permitir a los usuarios cambiar sus metas y ajustar sus estrategias de acuerdo con estos cambios. Puede ocurrir que un usuario encuentre un disparador que produzca un cambio temporario de estrategia, quizás para retornar más tarde a la actividad inicial. Una consecuencia de estas observaciones es que la interfaz debería permitir dejar y seguir rastros de las actividades realizadas. Esto puede lograrse en parte mediante recursos para grabar el progreso de la estrategia y almacenar, encontrar y volver a cargar los resultados intermedios. También debería permitir el seguimiento de varias estrategias de forma simultánea.

La interfaz de usuario debería contener formas de monitorear el estado de la estrategia en relación con las tareas que está realizando el usuario y con las metas que se ha propuesto. Una de las

7

maneras puede ser a través de un análisis de costo / beneficio. Estos análisis suponen que en cualquier punto del proceso de búsqueda, el usuario persigue la estrategia que tiene la mayor expectativa de utilidad. Si, como consecuencia de alguna elección táctica, otra estrategia se presenta como de mayor utilidad, la anterior será temporaria o permanentemente abandonada a favor de la nueva.

Hay algunas teorías que contrastan el browsing, el realizar consultas, el navegar y el revisar (browsing, querying, navigating y scanning). Nosotros asumimos que el usuario revisa una estructura de información, sea en títulos, términos de tesauros, hipervínculos, categorías, o el resultado de clustering (agrupamiento automático), y entonces o selecciona un ítem para algún propósito (lectura en detalle, para usarlo como input de otra consulta, para navegar a otra página), o formula una consulta (utilizando algunas palabras o seleccionando categorías). En ambos casos, se hace visible para su revisión un nuevo conjunto de información. Las consultas tienden a producir colecciones de información que no habían sido reunidas con anterioridad, mientras que la selección de categorías recupera información que había sido previamente compuesta u organizada. La navegación se refiere al seguimiento de una cadena de links, con alguna meta en particular, en una secuencia de operaciones de revisión y selección. El browsing se refiere a una exploración no dirigida y casual, de estructuras de información. Usualmente es realizada en forma conjunta con selecciones, a pesar de que pueden realizarse consultas para crear subcolecciones sobre las que realizar un posterior browsing. Un aspecto importante del proceso de interacción es que la salida producto de una acción debería poder ser utilizada fácilmente como entrada en el paso siguiente.

10.3.2 Las partes no-búsqueda en el proceso de acceso a la información

El estudio O´Day y Jeffries [614] halló que la búsqueda de información es sólo una parte del proceso de trabajo completo que realizan las personas. Durante las sesiones de búsqueda se realizan diferentes clases de trabajo con la información recuperada, por ejemplo leer, anotar y analizar. Esos autores analizaron los pasos de análisis en mayor detalle, encontrando que el 80 % del trabajo puede clasificarse en seis tipos principales: encontrar tendencias, hacer comparaciones, agregar información, identificar conjuntos críticos, valorar, e interpretar. El 20 % restante consiste en realizar referencias cruzadas, sumarizar, encontrar visualizaciones evocativas para los informes, y otras actividades misceláneas. El trabajo de Russell et al [690] “Sensemaking” (construcción de sentido) presenta el trabajo de información como un proceso en el que la recuperación de información es sólo una pequeña parte. Ellos observan que la mayor parte del esfuerzo realizado en Sensemaking se encuentra en la síntesis de una buena representación, o en las vías de pensamiento acerca de algo. Describen el proceso de formular y cristalizar los conceptos importantes para una tarea dada.

A partir de estas observaciones es conveniente dividir el proceso completo de acceso a la información en dos componentes principales: búsqueda y recuperación, y análisis y síntesis de los resultados. Las interfaces de usuario deberían permitir combinar ambos tipos de actividad. Sin embargo, el análisis / síntesis son actividades que pueden ser hechas con independencia de la búsqueda de información, y nos parece útil hacer una distinción entre ambos tipos de actividades.

10.3.3 Primeros Estudios de Interfaces

La mayor parte de la literatura sobre el comportamiento de la búsqueda de información hombre – computadora, se relaciona con los intermediarios de información que usan sistemas en línea que consisten en registros bibliográficos [546,707,104], a veces con costos valorados por unidad de

8

tiempo. Desafortunadamente, muchos de los supuestos de estos estudios no reflejan las condiciones del acceso moderno a la información [335,222] Las diferencias son:

Actualmente el texto buscado es a menudo texto completo y no citas bibliográficas. Como los usuarios tienen acceso al texto completo, más que a sustitutos de los documentos, es más probable que las búsquedas simples encuentren respuestas relevantes como parte del procesos de búsqueda.

Los sistemas modernos usan ranking estadístico (que son más efectivos cuando se dispone de texto completo y de abstracts, que cuando se trata de citas), mientras que la mayoría de estos estudios se realizaron sobre sistemas booleanos.

La mayoría de las búsquedas actuales son realizadas por usuarios finales, más que por profesionales intermediarios, que era el foco de los tempranos estudios.

Hoy hay disponibles decenas de miles de fuentes en línea y en red, y muchos están relacionados por hipervínculos, a diferencia de las colecciones separadas pertenecientes a diferentes servicios. Los primeros estudios generalmente usaron sistemas en los que cambiarse de una colección a otra requería un conocimiento y tiempo considerable.

Finalmente, muchos usuarios tienen acceso a muestras de mapas de bits que permiten la manipulación directa, o pueden llenar formularios. La mayoría de los estudios tempranos y de los sistemas bibliográficos se implementaron con comandos en línea, que requerían una sintaxis y no tenían formas para mostrar el contexto.

A pesar de estas diferencias significativas, algunas estrategias generales de búsqueda de información parecen mantener su valor a través de los diferentes sistemas. Por otra parte, si bien los sistemas modernos ha resuelto muchos de los problemas de los primeros OPACs, también han introducido nuevos problemas.

10.4 Puntos de partida

Las interfaces de usuario deben proveer a los usuarios con buenas formas para iniciar su trabajo. Una pantalla vacía o un formulario en blanco no ayudan al usuario a decidir cómo iniciar el proceso de búsqueda. Por lo general un usuario no comienza con una detallada expresión de su necesidad de información. Los estudios muestran que los usuarios tienden a comenzar con consultas muy breves, analizan el resultado, y luego modifican las consultas en un ciclo de retroalimentación incremental. La consulta inicial puede ser vista como una prueba para ver los resultados y a partir de allí hacerse una idea de cómo reformular la consulta. En consecuencia, una tarea de la interfaz de acceso a la información, es ayudar a los usuarios a seleccionar las fuentes y colecciones en las que buscar información.

Por ejemplo, hay muchas fuentes de información asociadas con el tema cáncer, y son muchas las clases de información que un usuario podría querer conocer acerca del tema. Mediante una correcta guía al usuario, este podría resolver el problema inicial de la formulación. La búsquedas bibliográficas tradicionales suponen que el usuario comienza mirando una lista de nombres de fuentes y elige en cuáles colecciones buscar; en cambio los motores de búsqueda en la Web eliminan las diferencias entre fuentes y arrojan al usuario en medio de un sitio Web con poca información acerca de la relación entre ese acierto de la búsqueda y el resto de la colección. En ninguno de los dos casos la interfaz disponible es demasiado útil.

En esta sección presentaremos cuatro tipos de puntos de partida: listas, vistas generales (overviews), ejemplos, y selección automática de fuentes.

10.4.1 Listas de colecciones

9

Los sistemas en línea típicos, como LEXIS-NEXIS requieren que los usuarios comiencen una búsqueda con una revisión de una larga lista de nombres de fuentes y supongan cuáles serán de interés. Generalmente se provee poca información en línea sobre el contenido de estas fuentes (ver Figura 10.3). Si el usuario no es satisfecho con los resultados de una colección, tiene que redireccionar su búsqueda en otra dirección (colección).

Los usuarios habituales aprenden qué conjuntos de fuentes les son útiles para sus dominios de interés, ya sea a través de la experiencia, la capacitación formal, o por recomendaciones de sus colegas. Las fuentes más utilizadas pueden registrarse en listas de favoritos en la Web. Existen investigaciones que exploran el mantenimiento de perfiles de información personalizados para usuarios o grupos de trabajo, basados en las clases de información que han utilizado anteriormente. [277]

Figura 10.3 Pantalla de selección de LEXIS-NEXIS

Sin embargo, cuando los usuarios quieren buscar fuera de sus dominios de especialidad, no es suficiente una lista de fuentes familiares. Los buscadores de información profesionales, como los bibliotecarios, aprenden a través de la experiencia y años de entrenamiento, cuáles fuentes son apropiadas para diferentes necesidades de información. La naturaleza restrictiva de las interfaces tradicionales desalienta la exploración y descubrimiento de nuevas fuentes. Recientes investigaciones han ideado diferentes mecanismos para ayudar a la comprensión del contenido de las colecciones como forma de iniciar una búsqueda.

10

10.4.2 Vistas generales

¿Como puede comenzar un usuario que se enfrenta con un conjunto grande de colecciones de texto?. Una posibilidad es analizar una vista general del contenido de las colecciones. Tal vista general puede mostrar los dominios temáticos representados en la colección, para ayudar al usuario a seleccionar o eliminar fuentes. Una vista general puede ayudar a los usuarios a comenzar, dirigiéndolos hacia “barrios” temáticos generales, después de lo cual pueden recorrer usando descripciones más detalladas. Shneiderman [724] propone un modelo de interacción en el cual el usuario comienza con una vista general de la información con la que va a trabajar, luego panea (recorre panorámicamente) y realiza zooms para encontrar áreas de interés potencial, y entonces mira los detalles. El proceso se repite tantas veces como sea necesario.En esta subsección se presentan tres tipos de vistas generales. La primera es la muestra y navegación de una jerarquía de categorías temáticas asociada con los documentos de una colección. El segundo tipo lo constituyen las vistas generales construidas de forma automática, generalmente elaboradas mediante técnicas de clustering sobre los textos de los documentos. El tercer tipo de vista general es el que se crea mediante la aplicación de variantes del análisis de co-citación sobre conexiones o vínculos entre diferentes entidades en una colección. Otra clase de vistas generales son las que, por ejemplo, muestran representaciones gráficas de estanterías o pilas de libros [681, 46]

Vistas generales de categorías o directorios

Hoy existen grandes colecciones en línea de colecciones de textos a los que se les han asignado etiquetas con categorías temáticas. Los sistemas bibliográficos tradicionales han asignado por décadas encabezamientos de materia a los libros y otros documentos [752]. MEDLINE, una colección de artículos biomédicos utiliza el Medical Subjects Headings, que contiene aproximadamente 18.000 categorías [523]. Las Association for Computing Machinery (ACM) desarrolló una jerarquía de aproximadamente 1.200 categorías (palabras clave) (http:// www.acm.org/class/). Yahoo [839] organiza las páginas Web en una jerarquía de miles de categorías.

La popularidad de Yahoo y de otros directorios Web sugiere que las categorías organizadas jerárquicamente son puntos de partida útiles para los usuarios que buscan en a Web. Esta popularidad puede reflejar una preferencia respecto de comenzar con un inicio lógico, o puede también denotar el deseo de evitar tener que pensar qué palabras debería ser utilizadas para recuperar la información deseada. (También puede reflejar el hecho de que los servicios con directorios intentan mejorar la calidad de algunos sitios Web).

El significado de las etiquetas de categorías difiere entre las distintas colecciones. La mayoría están diseñadas para ayudar a organizar los documentos y en la especificación de las consultas. Desafortunadamente, los usuarios de los catálogos bibliográficos en línea raramente utilizan los encabezamientos de materia disponibles [335, 222]. Hancock-Beaulieu y Drabenstott y Weller, entre otros, han planteado la pobreza de las interfaces basadas en comandos, para proveer ayuda en la selección de etiquetas temáticas y requerir de los mismos la revisión de largas listas alfabéticas. Aún en las interfaces gráficas de la Web, encontrar el lugar adecuado con una jerarquía de categorías puede ser una tarea que insuma mucho tiempo, y una vez que ha sido encontrada la colección usando ese tipo de representación, se requiere un medio alternativo para buscar en el sitio mismo.

La mayoría de las interfaces que presentan de modo gráfico categorías jerárquicas lo hacen asociando los documentos a la categoría a la que han sido asignados. Por ejemplo, al clikear en una

11

http://www.acm.org/class/

categoría en Yahoo, se despliega la lista de documentos que han sido asignados a esa etiqueta de categoría. Conceptualmente, el documento es almacenado con esa etiqueta. Para utilizar la lista de categorías para realizar búsquedas en Yahoo, el usuario debe elegir la que considere más apropiada para contener referencias de su interés temático. Una elección incorrecta requiere que vuelva atrás y trate nuevamente, recordando qué páginas contienen qué información. Si la información deseada se encuentra en un nivel muy específico de la jerarquía, o no está disponible, esto se convierte en un proceso muy largo y probablemente frustrante. Como conceptualmente los documentos están almacenados “dentro” de las categorías, los usuarios no pueden crear consultas basadas en la combinación de categorías.

Figura 10.4 La interfaz MesHBrowse para ver jerárquicamente las etiquetas de categorías

Es difícil diseñar una buena interfaz que integre la selección de categorías dentro de la especificación de la consulta, en parte porque la visualización de jerarquías de categorías ocupa gran cantidad de espacio en la pantalla. Por ejemplo, Internet Gratefull Med (http://igm.nlm.nih.gov:80/) es un servicio Web que permite una integración de las búsquedas con visualización y selección de categorías MeSH. Después que el usuario tipea el nombre de una categoría, se despliega una larga lista de opciones en una página. Para ver más información acerca de una categoría, el usuario selecciona un link (por ejemplo Radiation Injuries, Lesiones por Radiación). Esto produce que desaparezca el contexto de la consulta y que aparezca una nueva página Web que muestra los ancestros del término y sus descendientes inmediatos. Si el usuario intenta ver los hermanos del término padre (Wound and Injuries, Heridas y Lesiones), aparece una nueva página que cambia otra vez el contexto. Al volver a la consulta, desaparece la ilustración de las categorías.

El sistema MeSHBrowse [453] permite entonces que sólo se muestre el subconjunto relevante de la jerarquía, haciendo más fácil el browsing de una jerarquía total muy extensa. La interfaz tiene las limitaciones de espacio inherentes a las visualizaciones de jerarquías bidimensionales y no provee mecanismos para buscar en una colección de documentos subyacente. Ver Figura 10.4.

El sistema HiBrowse [646] representa metadatos de categorías de un modo más eficiente, permitiendo a los suarios desplegar varios subconjuntos diferentes de metadatos de categorías

12

http://igm.nlm.nih.gov:80/

simultáneamente. El usuario primero selecciona qué tipo de atributos (o facetas, como se llaman los atributos en este sistema) va a visualizar. Por ejemplo, el usuario puede elegir primero ‘ physical disease’ (enfermedad física) como valor para la faceta Disease (Enfermedad). Las categorías que aparecen un nivel por debajo se muestran junto con el número de documentos que contiene cada categoría. El usuario puede entonces seleccionar otro tipo de atributos Therapy and Groups (by age), Terapia y grupos (por edad). Se muestran los números de documentos que contienen atributos de los tres tipos. Si ahora el usuario selecciona un refinamiento de una de las categorías, tal como el valor ‘child’ (‘niño’) del atributo Grupos, entonces se muestra el número de documentos que contienen los tres tipos de facetas seleccionadas. Al mismo tiempo, se actualiza el número de documentos que contienen las subcategorías que se encuentran bajo ‘physical desease’, (‘enfermedad física’) y ‘therapy (general)’, (‘terapia (general)) para reflejar esta especificación. Ver Figura 10.5. Un problema con el sistema HiBrowse es que requiere que el usuario navegue a través de la jerarquía de categorías, más que la especificación directa de las consultas. En otras palabras, la especificación de la consulta no está estrechamente asociada con la visualización de las categorías. Como solución a alguno de estos problemas, se describe la interfaz Cat-a-Cone en la sección 10.8

Figura 10.5 La interfaz HiBrowse para la visualización de etiquetas de categorías jerárquicamente y de acuerdo con facetas

Vistas generales de colecciones, construidas automáticamente

Muchos intentos de mostrar vistas generales de información se han focalizado en la extracción automática de los temas más generales comunes que aparecen en la colección. Estos temas se derivan a través del uso de métodos de análisis automático, generalmente variantes del clustering de documentos. El clustering organiza documentos en grupos basados en algún criterio de similaridad; los centroides de los clusters determinan los temas en la colección.

13

El paradigma de browsing Scatter/Gather (dispersar, reunir)[203,202] agrupa documentos en grupos temáticamente coherentes, y presenta al usuario sumarios textuales descriptivos. Los sumarios consisten en términos temáticos que caracterizan cada cluster, y un conjunto de títulos típicos que aluden al contenido del cluster. Informado a través de los sumarios, el usuario puede seleccionar un subconjunto de clusters que le parecen de interés, y volver a hacer un cluster con su contenido (reclustering). De este modo el usuario puede examinar el contenido de cada subcolección refinando los detalles. El reclustering se efectúa en el momento; diferentes temas se producen dependiendo de los contenidos en la subcolección en la que se aplica el clustering. La elección del algoritmo de clustering influye en qué cluster se obtiene, pero ningún algoritmo se ha mostrado particularmente mejor que otro cuando se produce el mismo número de clusters. [816]

Un estudio de usuarios [640] mostró que el uso de Scatter/Gather en una colección grande de textos expresa algo del contenido y estructura del corpus. Sin embargo, este estudio también mostró que el uso de Scatter/Gather sin una facilidad de búsqueda era menos efectivo que una búsqueda por similaridad estándar. Esto es, las personas que podían navegar solamento (no buscar), en una estructura jerárquica de clasters que cubría la colección completa, encontraban menos documentos relevantes que las personas que podían escribir una consulta y revisar a través de los resultados recuperados. Es posible integrar Scatter/Gather con tecnología de búsquedas convencionales aplicando clustering a los resultados de una consulta para organizar los documentos recuperados (ver Figura 10.6). Una experiencia offline [359] mostró que el clustering puede ser más efectivo si se utiliza de esta manera. El estudio encontró que los documentos relevantes a la consulta tendían a estar principalmente en uno o dos de los cinco clusters, si los clusters eran generados a partir de los documentos recuperados rankeados al principio. El estudio también mostró que el acierto y la precisión eran más altos en el mejor cluster que en todos los resultados como un todo. La consecuencia es que un usuario puede emplear tiempo mirando el contenido de un cluster con la más alta proporción de documentos relevantes, y al mismo tiempo evitar aquellos clusters que contienen muchos documentos no relevantes.

Es probable que los temas generales puedan extraerse mediante el clustering, pero la naturaleza automática del clustering puede resultar en una visualización de tópicos de diferentes niveles de descripción. Por ejemplo, con un clustering en una colección de documentos sobre computación, pueden resultar clusters que contengan documentos acerca de inteligencia artificial, teoría de la computación, gráfica computacional, arquitectura computacional, lenguajes de programación, gobierno, aspectos legales. Los últimos dos temas son más generales que los demás ya que son tópicos que están fuera del alcance de las ciencias de la computación.

14

Figura 10.6 Visualización de los resultados de la recuperación con clustering en Scatter / Gather

Scatter / Gather muestra una representación textual de los cluster de documentos. Los investigadores han desarrollado varios enfoques para mapear documentos en un espacio documental que puede ser en dos dimensiones en la que cada documento es representado como un icono o un glifo (glyph), o en un espacio abstracto de dos dimensiones. Las funciones para transformar los datos en el espacio dimensional más bajo (o inferior) difieren, pero el efecto red consiste en que cada documento es ubicado en un punto representado en el espacio . Los usuarios pueden detectar temas o clusters en los grupos de signos o glifos. Entre los sistemas que utilizan este tipo de visualización gráfica se incluye a BEAD [156], Galaxy of News [671], y ThemeScapes [821]. La visualización de ThemeScapes presenta una representación tridimensional en el resultado del clustering (ver Figura 10.7). El sistema hace uso de un “espacio negativo” para enfatizar las áreas de concentración donde aparecen los clusters. Otros sistemas muestran de modo jerárquico la similaridad inter-documental [529,14], mientras que otros muestran los documentos recuperados en redes basadas en similaridad inter-documental [262,761].

El algoritmo de mapa de características de Kohonen ha sido utilizado para la creación de mapas que caracterizan gráficamente el contenido total de una colección de documentos [520,163] (ver Figura 10.8). Las regiones del mapa en dos dimensiones varían en medida y forma de acuerdo con la frecuencia de los documentos asignados a los temas correspondientes que aparecen en la colección. Las regiones se caracterizan por palabras simples o frases y la adyacencia de regiones refleja relaciones semánticas de los temas de la colección. Al mover el cursor sobre una región, parecen en una ventana de tipo pop-up los títulos de los documentos que se asocian más cercanamente con la región marcada. Los documentos pueden ser asociados con más de una región.

15

Figura 10.7 Vista general en tres dimensiones basada en clustering de documentos [821]

Evaluación de Vistas generales Gráficas

A pesar de su apariencia intuitiva, las vistas generales de grandes espacios documentales deben todavía demostrar que son útiles y comprensibles para los usuarios. De hecho, hay evaluaciones que proveen evidencias negativas al respecto. Un estudio encontró que para usuarios no expertos el resultado del clustering era difícil de usar, y que las presentaciones gráficas (por ejemplo, representar cluster con círculos y líneas que conectan los documentos, eran más difíciles que las representaciones textuales (por ejemplo, mostrar títulos y palabras temáticas como en Scatter / Gather), porque el contenido de los documentos es difícil de representar sin la lectura de algún texto. [443]

Otro estudio reciente compara el mapa Kohonen con una tarea de browsing en Yahoo [163]. En una de las tareas se les pidió a los usuarios que encontraran una página Web interesante en la categoría Entretenimientos de Yahoo y una organización de la mismas páginas Web en un mapa Kohonen. El experimento varió según los usuarios comenzaban en Yahooo o en el mapa gráfico. Después de completar las tareas de browsing, los usuarios debían intentar repetir el browsing utilizando la otra herramienta. En las personas que comenzaron con el mapa Kohonen, 11 de 15 encontraron un página interesante en diez minutos. Ocho de ellas fueron capaces de encontrar la misma página usando Yahoo. En los usuarios que comenzaron con Yahoo, 14 de 16 encontraron páginas interesantes. Sin embargo, sólo dos de 14 pudieron encontrar la página en la visualización gráfica. Esto constituye una fuerte evidencia contra la navegabilidad de esta última y sugiere que la simple vista de etiquetas de Yahoo es más útil. Sin embargo, el mapa puede ser más útil si el sistema es modificado para integrar el browsing con la formulación de la búsqueda.

16

Figura 10.8 Vista general en dos dimensiones creada utilizando el algoritmo de mapeo de características Kohonen, sobre páginas Web, sobre el tema Entretenimiento [163

Las personas prefirieron algunos aspectos de la representación en mapa. En particular algunos mencionaron la facilidad de saltar de un área a la otra sin tener que ir hacia atrás o hacia delante como se requiere en Yahoo; otros mencionaron el hecho de que los mapas tienen viarios niveles de granularidad. Las personas que participaron también expresaron su disconformidad con algunos aspectos de las visualizaciones. Algunos usuarios mencionaron el deseo de una organización jerárquica visible, otros la función de realizar zoom en un área para obtener más detalles, y otros manifestaron su disgusto por tener que mirar en el mapa completo para encontrar un tema, deseando en cambio una lista alfabética. Muchos encontraron que las etiquetas de una única palabra eran confusas o ambiguas. Por ejemplo “BILL” podía interpretarse como el nombre de una persona, además de cómo “Cuenta” en idioma inglés.

Los autores concluyen que esta interfaz es más apropiada para un browsing casual más que para una búsqueda. En general, las vistas generales producidas de modo automático son más útiles para dar al usuario una idea general de la clase de información que puede ser encontrada en una colección de documentos, pero generalmente no es tan útil en un proceso de acceso a la información.

17

Clustering de co-citaciones para Vistas Generales

El análisis de citas ha sido largamente reconocido como forma de mostrar una vista general de los contenidos de una colección [812]. La principal idea es determinar la localización de documentos basándose en patrones de co-citación. Hay diferentes modos de determinar patrones de citación: un método es medir la frecuencia en la que dos artículos son citados conjuntamente por un tercero. Otra alternativa es reunir dos artículos que citan el mismo tercer artículo. En ambos casos existe el supuesto de que los artículos apareados comparten algunos elementos. Después de construir una matriz de co-citaciones, los documentos son reunidos (clustered) en base a la similaridad de sus patrones de co-citación. Los clusters resultantes son interpretados para indicar los temas dominantes en la colección. El clustering puede focalizarse en los autores de los documentos más que en su contenido, para identificar autores centrales en un campo. Esta idea ha sido implantada recientemente en documentos Web en el Referral Web Project [432]. La idea también fue aplicada a páginas Web usando una estructura de vínculos Web para identificar los principales tópicos temáticos en páginas Web [485, 639]. Una idea similar se utilizó para identificar páginas que funcionaban como buenos puntos de partida en tópicos particulares (llamadas “páginas autoridad”, “authority pages”, por Kleinberg [444].

10.4.3 Ejemplos, Diálogos y Expertos (Wizards)

Otra forma de ayudar a los usuarios a comenzar es con un ejemplo de interacción con el sistema. Esta técnica también se conoce como recuperación por reformulación. Una versión de esta idea se encuentra en el sistema Rabbit [818] que provee representaciones gráficas para ejemplos de consultas en bases de datos. Se muestra un marco general para una consulta y el usuario lo modifica para describir lo que quiere. El sistema muestra un ejemplo de la clase de información disponible que se corresponde con esta descripción. Por ejemplo, si un usuario busca en una base de datos de productos de computación e indica su interés en discos, se recupera un ejemplo de un ítem con los descriptores correspondientes a discos en su lugar. El usuario puede usar o modificar los descriptores visualizados e iterar el procedimiento.

La idea de recuperación por reformulación se ha extendido al dominio del desarrollo de las interfaces de usuario [581] y de la ingeniería de software [669]. El sistema Helgon [255] es una variante moderna de esta idea aplicada la las bases de datos bibliográficos. En Helgon, el usuario entra navegando una jerarquía de tópicos desde los cuales selecciona ejemplos estructurados, de acuerdo con su interés. Pero los usuarios tuvieron problemas con la organización de la jerarquía y encontraron tedioso el uso de los ejemplos. Este resultado subraya una dificultad con los ejemplos y diálogos: conseguir que el usuario inicie con el diálogo correcto o el ejemplo correcto es un problema de búsqueda en sí mismo [492,449].

Una variante más dinámica de este tema es el diálogo interactivo. Las interfaces basadas en el diálogo has sido exploradas desde hace mucho tiempo, en un intento de imitar la interfaz humana de un intermediario, por ejemplo un bibliotecario referencista. Oddy trabajó tempranamente en el sistema THOMAS, que proveía una sesión de preguntas y respuestas con una interfaz de comandos [615]. Más recientemente, Belkin et al. Definieron modelos de interacción más elaborados [75], a pesar de que no han sido probados empíricamente.

La interfaz del sistema DLITE usa un diálogo de contexto-más-foco (focus-plus-context) como forma de familiarizar a los usuarios con las secuencias normalizadas de operaciones con el sistema. Al comienzo se muestra una vista de todos los pasos del diálogo en una lista. El usuario puede expandir la explicación de cualquier paso individual mediante un click en su descripción. También

18

puede expandir el diálogo completo para ver qué preguntas son las que siguen, y cerrarlo para focalizarse en la tarea corriente.

Una forma más restrictiva del diálogo que se ha difundido bastante en los productos comerciales es el del Experto (Wizard). Esta herramienta ayuda a los usuarios en tareas de tiempo limitado, pero no intenta enseñar todo el proceso requerido para completar las tareas. El Experto presenta un camino paso a paso, que el usuario puede seguir para realizar un trabajo [636]. Un estudio reciente [145] encontró que los expertos son útiles para metas que requieren muchos pasos, para usuarios que carecen de conocimiento suficiente (por ejemplo un propietario de un restaurante instalando un software para la contabilidad de su negocio), y cuando los pasos deben ser completados en una secuencia fija. Las propiedades de los Expertos incluyen el permitir a los usuarios volver a correr el Experto y modificar su trabajo anterior, mostrar una vista general de las funciones, y proveer descripciones comprensibles para hacer las elecciones correctas. Los Expertos no son útiles cuando la interfaz no resuelve un problema de forma efectiva, cuando la meta es enseñar al usuario cómo usar la interfaz y cuando el Experto no ha sido probado.

Una visita guiada (guided tour) conduce al usuario a través de una secuencia de elecciones de navegación a través de vínculos de hipertexto, presentando los nodos en un orden lógico. En un tour dinámico, sólo se muestran los nodos relevantes [329]. Una aplicación reciente de es el proyecto Walden Paths que permite a docentes definir caminos útiles para el entrenamiento, a través de páginas Web [289]. Este enfoque no ha sido utilizado demasiado en el proceso de acceso a la información, pero puede ser una dirección interesante para familiarizar al usuario con estrategias de búsqueda en grandes sistemas de hipervínculos.

10.4.4 Selección automática de fuentes

Las interfaces que ayudan al usuario a elegir las fuentes de información más apropiadas son una amplia área de investigación. Requiere extraer la necesidad de información de los usuarios y comprender cuales necesidades pueden ser satisfechas por cuáles fuentes. Un ambicioso proyecto es construir un modelo de la fuente y de la necesidad de iinformación del usuario y tratar de determinar cómo se corresponden mejor. Esto se intenta con el uso de sistemas de modelado (modelling systems) y sistemas de tutoreo inteligente, aplicado a dominios generales [204,814] y a sistemas de ayuda en línea [378].

Una alternativa simple es crear una representación del contenido de las fuentes de información y corresponder esta representación contra la especificación de la consulta. Esta aproximación es la que se utiliza en GIOSS, un sistema que intenta determinar la mejor base de datos bibliográfica para enviar un pedido de búsqueda, basada en los términos de la consulta [765]. El sistema usa un análisis simple de las frecuencias combinadas de las palabras de la consulta en las colecciones disponibles. El sistema SavySearch [383]lleva esta idea un paso más allá, usando acciones que realizan los usuarios después de una consulta para decidir cómo incrementar o disminuir el ranking de un motor de búsqueda para una consulta en particular (ver también Capítulo 13).

Otra posibilidad para la selección automática de fuentes es enviar una consulta a múltiples fuentes y combinar los resultados de alguna manera. Esto es lo que realizan muchos metabuscadores en la Web. Un área activa de investigación actual es cómo combinar los resultados de forma efectiva, y se conoce en algunos casos como fusión de la colección [63,767,388].

10.5 La especificación de la consulta

19

Para formular una consulta el usuario debe seleccionar una colección, metadatos o conjuntos de información, contra los que debe ser equiparada la consulta. Y debe especificar palabras, frases, descriptores u otra clase de información que pueda ser comparada con la información en las colecciones. Como resultado, el sistema crea un conjunto de documentos, metadatos u otro tipo de información que se corresponden con la especificación de la consulta en alguna forma y muestra los resultados al usuario.

Shneiderman [725] identifica cinco estilos primarios de interacción hombre – computadora. Son: lenguaje de comandos, llenado de formularios, selección de menúes, manipulación directa y lenguaje natural. (Esta lista omite modalidades no visuales como el audio). Cada técnica ha sido usada en la especificación de interfaces y tienen ventajas y desventajas, que se describen más adelante en el contexto del la especificación de las consultas booleanas.

10.5 1 Búsquedas booleanas

En los sistemas modernos de acceso a la información el proceso de correspondencia generalmente emplea un algoritmo de ranking estadístico. Sin embargo, hasta los más recientes sistemas comerciales de texto completo y la mayoría de los sistemas bibliográficos soportan solamente consultas booleanas. Por lo tanto, el foco de muchos estudios de acceso a la información se refieren a los problemas que tienen los usuarios para especificar las consultas booleanas. Desafortunadamente, los estudios han mostrado que los usuarios tienen enormes dificultades para especificar este tipo de búsquedas y que generalmente tienen expectativas incorrectas acerca de los resultados [111,322,841].

Las búsquedas booleanas son problemáticas por varias razones. Una de ellas es que la mayoría de las personas encuentran la sintaxis básica poco intuitiva. Las personas de habla inglesa suponen que la semántica cotidiana está asociada con los operadores booleanos AND y OR. Para usuarios inexpertos, usar el AND implica ampliar el alcance de una consulta, porque se están pidiendo varias clases de información. Por ejemplo “perros y gatos” puede ser interpretado como un pedido de documentos acerca de perros y de documentos acerca de gatos, más que documentos acerca de los dos tópicos a la vez, que es lo que corresponde al operador AND. “Té o café” puede implicar una elección mutuamente excluyente en el lenguaje cotidiano. Y no es así en el operador lógico OR. Esta clase de problemas conceptuales está bien documentada [111,322,558,841]. Además, la mayoría de los lenguajes de consulta que incorporan operadores booleanos también requieren el uso de sintaxis compleja para otra clase de conectores y para metadatos descriptivos. La mayoría de los usuarios no están familiarizados con el uso de paréntesis ni con las nociones de la precedencia de operadores.

Para servir a una audiencia masiva que posee poca experiencia de especificación de consultas, los diseñadores de los motores de búsqueda de la Web han tenido en cuenta aproximaciones más intuitivas para la especificación de las consultas. Más que forzar a los usuarios a especificar combinaciones complejas de ANDs y Ors, permiten la selcción de maneras simples de combinar términos de consulta, incluyendo expresiones como “todas las palabras” (lo que ubica todos los términos en una conjunción, AND) y “cualquiera de las palabras” (lo que las ubica en una disyunción, OR).

Otra solución basada en la Web es permitir especificación de consultas basadas en la sintaxis para proveer una sintaxis más simple o intuitiva. El prefijo / operador “+” ganó un uso muy amplio como especificador de la obligatoriedad de una palabra en el motor de Altavista. Desafortunadamente, los usuarios pueden pensar erróneamente que funciona como el operador AND y entonces suponer que

20

“gatos + perros” recuperará solamente los artículos que contienen ambos términos, cuando en realidad la consulta requiere perro y deja a gato como opcional.

Otro problema con los sistemas puramente booleanos es que no rankean los documentos recuperados de acuerdo con su grado de correspondencia con la consulta. En un marco booleano un documento satisface o no satisface la consulta. Los sistemas comerciales realizan un orden con los documentos de acuerdo con algún tipo de metadato, por ejemplo, el orden cronológico. Los sistemas basados en la Web generalmente ordenan los resultado de las consultas booleanas utilizando algoritmos estadísticas y heurística específica de la Web.

10.5.2 Desde las líneas de comandos a los formularios y los menúes

Junto con las confusiones acerca del significado lógico del AND y del OR, otra parte del problema con la especificación de las consultas en sistemas booleanos bibliográficos es la arbirtrariedad de la sintaxis y la falta de contexto de las interfaces. Típicamente, debe tipearse algo como lo siguiente:

COMANDO ATRIBUTO valor { OPERADOR BOOLEANO ATRIBUTO valor}*

Ejemplos:

FIND PA darwin AND TW species OR TW descent

(ENCUENTRE en autor el valor darwin AND en el título el valor especies OR en el título el valor descendencia)

FIND TW Mt St. Helens AND DATE 1981

(ENCUENTRE en el título el valor Mt St. Helens AND en fecha el valor 1981)

(estos ejemplos fueron extraídos de la sintaxis de la interfaz telnet del sistema Melvyl de la Universidad de California [526]). El usuario debe recordar los comandos y los nombres de los atributos, que son fácilmente olvidables entre usos del sistema. Y este problema se hace más grave porque comandos y nombres de atributos cambian entre diferentes sistemas.La nueva versión Web del sistema Melvyl provee formularios y menúes de modo que el usuario ya no tiene que recordar los nombres y tipos de atributos disponibles (http://www.melvyl.ucop.edu/). Los usuarios seleccionan tipos de metadatos de listas y se muestran de modo explícito los atributos, permitiendo su selección como una alternativa de especificación. Por ejemplo, el campo “tipo de búsqueda” se encuentra junto a un formulario de entrada en el cual los usuarios pueden ingresar palabras clave y la elección entre los operadores AND y NOT se encuentra junto a la lista de tipos de documentos disponibles. Sólo los metadatos asociados a una colección en particular se muestran en el contexto de esa búsqueda. Desafortunadamente, el sistema puede hacer búsquedas en una base de datos por vez. Sin embargo, provee una facilidad para aplicar una búsqueda ejecutada previamente a una nueva base de datos. Ver Figura 10.9.

Este sistema también permite la retención del contexto entre búsquedas, almacenando los resultados anteriores en tablas y realizando hipervínculos de estos resultados con las listas que contienen la información bibliográfica recuperada. Los usuarios pueden modificar cualquiera de las consultas anteriores marcando un cuadro que se encuentra junto al registro de la consulta. La visualización gráfica hace explícitas e inmediatas muchas de las opciones del sistema que serían difíciles de retener en la versión con comandos.

21

http://www.melvyl.ucop.edu/)

Estas visualizaciones son una mejora sobre las interfaces de comandos, pero no resuelven todos los problemas. Por ejemplo, un formulario en blanco no es mucho mejor porque no provee al usuario con ayudas sobre que clase de términos podría ingresar.

Figura 10.9 Vista de una especificación de consulta en la versión Web del catálogo bibliográfico Melvyl.

10.5.3 Consultas facetadas

Otro problema con las consultas booleanas es que tienden a dar resultados o demasiados grandes (porque los usuarios incluyen muchos términos en una disjunción, o vacíos (porque los usuarios utilizan muchos términos en intersección). Este problemas sucede porque no se conocen los contenidos de la colección o el rol de los términos en esa colección.

Una estrategia común para enfrentar este problema, empleado en sistemas con interfaces de comandos como DIALOG, es hacer una serie de consultas cortas, ver el número de documentos que se recupera en cada una de ellas, y combinar esas consultas, lo que produce un número razonable de resultados. Por ejemplo, en DIALOG cada consulta produce un conjunto de documentos que se identifica por un número. Antes que ver los títulos mismos, DIALOG muestra cada número de conjunto con la cantidad de documentos resultantes en cada uno. Luego pueden verse los títulos de los documentos solicitándolos con el número de conjunto. A su vez, la combinación entre conjuntos también puede hacerse utilizando ese número de conjunto.

Este tipo de formulación de consultas se denomina consulta facetada, para indicar que la consulta se divide en tópicos o facetas [553,348]. Por ejemplo, una consulta sobre drogas para la prevención de la osteoporosis puede consistir en tres facetas:

(osteoporosis OR ´pérdida ósea’)(drogas OR ´productos farmacológicos´)(prevención OR cura)

En este caso el usuario quiere encontrar documentos que contengan a la vez los tres tópicos, con lo que se unirían en AND.Una técnica para dar un orden a los resultados de consultas booleanas es lo que se llama ranking post-coordinado o nivel de quorum [700]. Según este enfoque los documentos se rankean de acuerdo con el subconjunto de términos de consulta que contienen. Dada una consulta sobre

22

“gatos”, “perros”, “peces” y “ratones”, el sistema debería rankear primero un documento con al menos una ocurrencia de perros, gatos y peces, antes que un documento que contenga 30 ocurrencias de gatos y ninguna de los otros términos.

Una combinación de las consultas facetadas y el ranking de quorum podría mostrar una lista de líneas de entrada. Los usuarios entran un tópico por línea, en el que se escriben una lista de términos relacionados semánticamente, que tienen valor equivalente y que son combinado en una disjunción (OR). Como resultado, los documentos que contienen por lo menos un término de cada faceta son rankeados antes que los documentos que contienen sólo términos de una de las facetas.

Esta idea puede ser extendida un poco más allá, permitiendo a los usuarios asignarle un peso a cada faceta, o asignándolo por defecto: la faceta que el usuario listó primero tendrá el peso más alto, la segunda menos peso y así sucesivamente.

10.5.4 Aproximaciones gráficas para la especificación de las consultas

Las interfaces de manipulación directa constituyen una alternativa a la sintaxis de comando. Las propiedades de la manipulación directa son [725]: 1) representación continua del objeto de interés; 2) acciones físicas o presión de botones en lugar de una sintaxis compleja; 3) operaciones incrementales, rápidas y reversibles cuyo impacto sobre el objeto de interés se ve inmediatamente. Estas interfaces generalmente provocan el entusiasmo de los usuarios y por esta razón vale explorar su utilización. A pesar de que tienen inconvenientes, son más fáciles de usar que otros métodos, en muchos contextos.

23

Figura 10.10 Sistema VQuery para visualización de Diagramas de Venn, y especificación de consultas booleanas

Para simplificar la especificación de la sintaxis booleana se han desarrollado muchas variaciones de interfaces gráficas, estáticas o directamente manipulables. Los estudios de usuarios han revelado que estas interfaces son más efectivas que las de comandos. Ejemplos son el Sistema VQuery para visualización de Diagramas de Venn, y especificación de consultas booleanas, por el que aparecen círculos representando a cada término de búsqueda y la intersección de círculos indica el operador AND con los términos. Este sistema tiene el inconveniente de que es limitado en la complejidad de la consulta. (Figura 10.10).

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.5.5 Frases y proximidad

En general la proximidad de la información puede ser bastante efectiva para mejorar la precisión de las búsquedas. En la Web, la diferencia entre una consulta de palabra única y otra de una frase exacta de dos palabras puede significar la diferencia entre una cantidad inmanejable de documentos y una lista corta de documentos relevantes.

24

Se han desarrollado un gran número de métodos para especificar frases. En la sintaxis del sistema LEXIS/NEXIS, para indicar la proximidad entre dos términos se requiere indicar el rango de proximidad con un operador en el medio. Por ejemplo, “casa w/3 blanca” significa: casa y blanca con tres palabras en el medio, con independencia de su orden. La proximidad exacta de frases se especifica escribiendo una palabra junto a la otra, separadas de un espacio. Un método común en algunos motores de búsqueda de la Web para este mismo propósito es encerrar las palabras entre comillas.

La desventaja de estos métodos que requieren la correspondencia exacta de la frase, es que puede ser común el caso de que entre las palabras buscadas puede haber otras, aunque sean pocas. Por ejemplo, en la mayoría de los casos el usuario quiera “presidente” y “Lincoln” como palabras adyacentes, pero también quiere recuperar “Presidente Abraham Lincoln”. Otro aspecto a considerar es si el sistema utiliza algún tipo de stemming para los términos incluidos en la frase. La mejor solución es permitir al usuario que especifique una frase exacta, pero tratarla como si hubiera solicitado esas palabras con un pequeño rango de proximidad [174]. También se ha demostrado que una combinación de ranking de quorum de consultas facetadas, con la restricción de que las facetas aparezcan en un pequeño rango de proximidad, puede mejorar en mucho la precisión de los resultados [356,566].

10.5.6 Lenguaje Natural y Consultas en Texto Libre

Los algoritmos de ranking estadístico tienen la ventaja de permitir a los usuarios la especificación de consultas de un modo natural, sin tener que pensar acerca de operadores booleanos u otros operadores. Pero tienen el inconveniente de brindar al usuario menos retroalimentación y control acerca de los resultados. Generalmente el resultado de un ranking estadístico es la lista de documentos asociados a un puntaje, probabilidad o porcentaje al lado de cada título. A los usuarios se les da poca información acerca de cuál es la razón del ranking y que rol juegan los términos de consulta en el ranking.

Una estrategia de búsqueda que puede ayudar con este particular problema es la especificación de la “mandatoriedad” de algunos términos de la consulta en lenguaje natural. Esto permite al usuario controlar que términos son considerados importantes, más que delegar en el algoritmo de ranking la ponderación de los términos. Pero para especificar esta característica para los términos de búsqueda es necesario conocer el modo de uso de comandos particulares.

La discusión anterior supone que una consulta en lenguaje natural escrita por el usuario es tratada como una bolsa de palabras, con las palabras vacías removidas con el propósito de buscar la correspondencia con los documentos. Sin embargo, algunos sistemas intentan analizar sintácticamente las consultas en lenguaje natural para extraer conceptos y hacerlos corresponder con los conceptos en la colección de textos. [399,552,748].

De modo alternativo, puede usarse la sintaxis de una pregunta en lenguaje natural para intentar responder a la pregunta. Un ejemplo es el sistema Murax [463] determina a partir de la sintaxis de una pregunta si el usuario está preguntando por una persona, lugar o fecha. Luego intenta encontrar oraciones en artículos de una enciclopedia, que contengan las frases nominales que aparecen en la pregunta. Esto se realiza ya que es probable que esas oraciones contengan la respuesta a la pregunta. Por ejemplo, hecha la pregunta ¿Quién fue el ganador novelista del Premio Pulitzer, que se postuló como alcalde de la Ciudad de Nueva York?, el sistema extrae las frases nominales: “Premio Pulitzer”, “novelista ganador”, “Alcalde”, “Ciudad de Nueva York”. Luego busca nombres propios que representen a personas (Ya que “Quién” indica a una persona), y encuentra, entre otras, las siguientes oraciones:

25

Los ejércitos de la noche (1968), narración personal sobre la marcha de la paz en el Pentágono, en 1967, Mailer ganó el Premio Pulitzer y el Premio Nacional del Libro.

En 1969 Mailer se postuló sin éxito como candidato independiente como alcalde de la Ciudad de Nueva York.

Estas dos oraciones vinculan y reúnen las frases nominales relevantes, y el sistema deduce del título del artículo que contiene las dos oraciones, que Norman Mailer es la respuesta.

Otra aproximación a la respuesta automática de preguntas es el sistema que encuentra FAQ (Frequently Asked Questions), buscando la correspondencia de preguntas en varios tópicos [130]. El sistema utiliza una búsqueda standard para encontrar archivos FAQ para las preguntas realizadas.

Un enfoque menos automático para responder a preguntas puede ser encontrado en al sistema AskJeeves [34]. Este sistema hace uso de sitios Web y los hace corresponder con un conjunto predefinido de tipos de preguntas. La consulta del usuario es primero equiparada respecto de los tipos de preguntas. El usuario selecciona la frase más apropiada que se ajuste a su pregunta esta nueva frase el linkeada para sugerir sitios Web. Por ejemplo, la pregunta “ ¿Quién es el líder en Sudan? se mapea con el tipo de pregunta “¿Quién es el jefe del Estado de X?”, donde la variable es reemplazada, a través de una lista de elecciones posibles, por Sudan en este caso. Esto es linkeado a una página Web que tiene los actuales jefes de Estado. La pregunta también se envía a motores de búsqueda estándar.

10.6 Contexto

Esta sección presenta las técnicas de algunas interfaces para ubicar un conjunto corriente de documentos en el contexto de otro tipo de información, con el objetivo de hacerlo más comprensible. Estas técnicas incluyen la muestra de relaciones entre los documentos y los términos de consulta, vistas generales de la colección, metadatos descriptivos, estructura de hipervínculos, estructura de los documentos, y otros documentos en el conjunto.

10.6.1 Sustitutos de los documentos

La forma más común de mostrar los resultados de una consulta es listar información acerca de los documentos en un orden de relevancia en relación con la consulta. Alternativamente, en un ranking puro booleano, los documentos se listan de acuerdo con atributos de metadatos, como or ejemplo, la fecha. Típicamente, una lista de documentos consiste en los títulos de los documentos y un subconjunto de metadatos importantes como la fecha, fuente y largo del artículo. En un sistema con ranking estadístico, puede mostrarse un puntaje o porcentaje junto al título, que indica un grado de correspondencia o probabilidad de relevancia. Esta clase de información es llamada sustituto del documento. Ver Figura 10.14 [824].

Algunos sistemas permiten al usuario la elección entre una visualización breve y otra detallada de los documentos. La vista detallada contiene generalmente un sumario o resumen. En los sistemas bibliográficos, se ve el autor o el servicio de resúmenes. Los motores de búsqueda de la Web generan extractos automáticos, a partir de las primeras líneas del texto en la página Web.

En muchas interfaces, clikear el título del documento o su representación en un icono, produce una vista del documento mismo, ya sea en una nueva ventana o en reemplazo de la lista de resultados.

26

(En los sistemas bibliográficos tradicionales, el texto completo no se encontraba disponible en línea y sólo podía verse el registro bibliográfico).

Figura 10.14 Un ejemplo de una lista rankeada de títulos y otros sustitutos de documentos [824]

10.6.2 Aciertos de los términos de la consulta, dentro del contenido del documento

En los sistemas en los que el usuario puede ver el texto completo de un documento recuperado, es útil resaltar las apariciones de los términos o descriptores que se corresponden con aquéllos que se utilizaron en la consulta. Esto se realiza a través de la utilización de otro color para destacar esas palabras y tiene por finalidad ayudar al usuario a ubicar las partes del texto más relevantes para su consulta. [481,542, 52].

KWIC

Una facilidad relacionada con el resaltar son los sustitutos de documentos del tipo palabras clave en contexto (keyword-in-context, KWIC). Se extraen del texto del documento fragmentos de oraciones, oraciones completas, o grupos de oraciones que contienen los términos de consulta, que se presentan junto con otras partes de los sustitutos de los documentos como el título o el resumen. Debe notarse que una lista KWIC es diferente de un resumen. Un resumen sumariza los principales temas del documento pero puede no contener referencias a los términos de la consulta. Un extracto KWIC muestra las oraciones que sumarizan las formas en que los términos de búsqueda son utilizados en el documento. Esta muestra puede mostrar no sólo qué subconjuntos de los términos de consulta aparecen en los documentos recuperados, sino también el contexto en el que aparecen.

Al respecto deben tomarse decisiones sobre cuántas y cuáles líneas de texto deben mostrarse. Algunos estudios han mostrado que los mejores fragmentos a mostrar son los primeros bajo el título inicial y aquéllos que contienen el mayor conjunto de términos de búsqueda [464]. Si los usuarios han especificado cuáles términos son más importantes respecto de otros, entonces los fragmentos

27

que contengan términos importantes deberían ser mostrados antes que los que contienen los menos importantes. Sin embargo, con el fin de mantener la coherencia de los extractos, las oraciones seleccionadas deberían mostrarse en el orden original del documento que los contiene.

La facilidad de tipo KWIC no suele utilizarse en la muestra de resultados en la Web, lo más probablemente porque para ello el sistema debe tener una copia del documento original de la cual extraer las oraciones que contienen los términos de búsqueda. Los motores de búsqueda Web en general sólo retienen los índices sin la información de la posición de los términos.

TileBars (Barras de baldosas)En estas interfaces los usuarios ingresan una consulta en formato facetado, un tópico por línea. Después que el sistema recupera documentos (utilizando un algoritmo de ranking estadístico o por quorum), se muestra un gráfico de barras por cada título de documento recuperado, en el que puede verse el grado de correspondencia para cada faceta. Las Tile Bars ilustran en un vistazo qué pasajes de cada artículo contienen qué tópicos y la frecuencia con que es mencionado ese tópico (los cuadrados más oscuros representan una correspondencia más frecuente).

Cada documento se representa por una barra rectangular. La Figura 10.15 muestra un ejemplo. La barra se subdivide en filas que se corresponden con la facetas de la consulta. En el ejemplo, la fila superior de cada TileBar corresponde a “osteoporosis”, la segunda fila a “prevención” y la tercera a “investigación”. La barra también se subdivide en columnas, y cada columna representa un pasaje del documento. Los aciertos que se superponen en la misma página probablemente indican un documento relevante, más que los aciertos dispersos a través del documento [356].

La oscuridad de cada cuadrado corresponde al número de veces que los términos de la consulta aparecen en ese segmento del texto, por lo que cuanto más oscuro es un cuadrado, indica que tiene mayor número de aciertos.

Figura 10.15 Ejemplo de visualización de resultados recuperados en una interfaz TileBar

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.6.3 Aciertos de los términos de la consulta, entre los documentos

28

Se han desarrollado otras ideas de visualización para mostrar información de tipo diferente acerca de las relaciones entre los términos de consulta y los documentos recuperados. Más que mostrar cómo aparecen los términos de búsqueda en los documentos individuales (como lo hacen las interfaces KWIC y la TileBars), estos sistemas muestran una vista general o sumario de los documentos recuperados de acuerdo con los diferentes subconjuntos de términos de búsqueda que contienen. Las siguientes subsecciones describen variaciones de esta idea.

Figura 10.17 Muestra de resultados en el sistema InfoCrystal

InfoCrystal

El sistema InfoCrystal muestra cuántos documentos contiene cada subconjunto de términos de consulta [738]. Esto libera al usuario de la necesidad de especificar los operadores AND y NOT, ya que muestra las posibles combinaciones entre los términos que aparecen en los documentos. El sistema InfoCrystal permite la visualización de todas las posibles relaciones entre N “conceptos” especificados por el usuario (aunque una indicación de más de cuatro términos de búsqueda produce un resultado gráfico difícil de comprender). En una extensión del paradigma de los diagramas de Venn, este sistema muestra el número de documentos recuperados que tienen cada posible subconjunto de los N conceptos. La Figura 10.17 muestra los resultados de una consulta de cuatro términos llamados A, B, C, y D. El diamante central indica que sólo un documento contiene los cuatro términos de búsqueda. El triángulo marcado con “12” indica que se encontraron 12 documentos que contienen los atributos A, B y D, etc.

29

Figura 10.18 Ejemplo de la visualización de resultados en VIBE

VIBE y Lyberworld

VIBE [452] y Lyberworld [363] son presentaciones gráficas que operan sobre principios similares. En ellos los términos de consulta se ubican en un espacio gráfico abstracto. Después de la búsqueda, se crean iconos que indican cuántos documentos contiene cada subconjunto de términos de consulta. El estado del subconjunto de cada grupo de documentos se indica a través de la ubicación del icono. Por ejemplo, en el sistema VIBE un conjunto de documentos que contiene tres de los cinco términos de búsqueda se muestra en un eje que conecta esos tres términos, en un punto a mitad de camino entre las representaciones de los tres términos en cuestión (Ver Figura 10.18). Lyberworld presenta esta idea en tres dimensiones.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.6.4 Superbook: Contexto vía Tabla de Contenidos

El sistema Superbook [481, 229, 230] utiliza la estructura de un gran documento para mostrar los aciertos de términos de búsqueda en su contexto. Para un libro o un manual, se muestra la Tabla de Contenido en la parte izquierda de la pantalla, y a la derecha se ve el texto completo de la página o sección. El usuario puede manipular la tabla de contenido para expandir o contraer la vista de las secciones y subsecciones. Se utiliza un mecanismo foco-más-contexto para expandir el área de las secciones que se están viendo y comprimir las anteriores.

30

Figura 10.19 La interfaz SuperBook para mostrar los resultados en un manual en contexto

Después de que el usuario especifica una consulta en el libro, se muestran los resultados en el contexto de la jerarquía de la Tabla de Contenidos. (Ver Figura 10.19). Las secciones que contienen aciertos se agrandan y las demás se achican. Los términos de búsqueda que aparecen en los títulos de capítulos o secciones se resaltan. Cuando el usuario selecciona una página desde la Tabla de contenido, aparece la página misma en la parte derecha de la pantalla, con los términos de consulta resaltados.

10.6.5 Categorías para dar contexto al conjunto de resultados

En la sección 10.4 vimos el uso de categorías o directorios para proveer vistas generales del contenido de la colección de textos. También pueden utilizarse metadatos referidos a categorías para ubicar los resultados de una consulta en contexto.

Por ejemplo, en su versión original el SuperBook permitía la navegación en un documento altamente estructurado, como un manual. El proyecto CORE extendió esta idea principal a una colección de 1000 artículos a texto completo sobre química. Un estudio demostró su superioridad respecto de un sistema de búsqueda estándar, en varios tipos de tareas [228]. Como no hay disponible una tabla de contenidos para toda la colección, el contexto se logra ubicando a los documentos en una jerarquía de categorías que contiene los términos relevantes de la química. Cuando se selecciona una categoría, se listan los documentos asignados a la misma, para ver mayores detalles. Todas las categorías se organizan en una jerarquía, proveyendo una vista jerárquica de la colección.

Otro proyecto que usa categorías predefinidas para dar contexto a los resultados es el sistema DynaCat [650]. Este sistema organiza los documentos recuperados de acuerdo con tipos de categorías, seleccionadas de la taxonomía MESH. DynaCats comienza con un conjunto de tipos de consultas que se conocen como útiles una población de usuarios y una colección dada. Un tipo de consulta puede comprender a varias consultas. Por ejemplo, el tipo de consulta “Efectos adversos del tratamiento” cubre consultas como “¿Cuáles son las complicaciones de una mastectomía?”, o “¿Cuáles son los efectos colaterales de la aspirina?”. Los documentos están organizados de acuerdo con un conjunto de criterios asociados con cada tipo de consulta. Estos criterios especifican qué

31

tipos de categorías son aceptables para organizar los documentos y cuáles deben ser omitidas de la visualización. Una vez que las categorías han sido asignadas a los documentos recuperados, se forma una jerarquía basada en el lugar que las categorías tienen en el MeSH.

Figura 10.20 La interfaz DynaCat para visualizar categorías que se corresponden con los tipos de consultas

La Figura 10.20 muestra los resultados de una consulta sobre prevención del cáncer de mama. La interfaz se distribuye en tres ventanas. La ventana superior muestra la consulta del usuario y el número de documentos encontrados. La ventana de la izquierda muestra los dos primeros niveles de las categorías, proveyendo una vista organizada de los resultados. La ventana derecha muestra todas las categorías de la jerarquía y los títulos de los documentos que pertenecen a esas categorías.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.6.6 Uso de hipervínculos para organizar resultados de la recuperación

A pesar de que los autores del SuperBook lo describen como un sistema de hipertexto, es mejor pensar en él como un medio de mostrar los resultados de una búsqueda en el contexto de una estructura que los usuarios pueden ver y comprender de una vez. El componente hipertextual no es mencionado como la parte más exitosa de su diseño. De hecho, parece ser la causa de uno de los principales problemas de la versión revisada del sistema: los usuarios tienden a extraviarse de las páginas que están leyendo, lo que causa una pérdida de tiempo.

Esta especie de extravío puede ocurrir en parte porque SuperBook usa una clase de hipertexto no estándar, en el cual cualquier palabra es vinculada automáticamente a las ocurrencias de la misma palabra en otras partes del documento. Hoy, los sistemas de hipervínculos y el hipertexto en la Web discriminan mucho más el uso de las conexiones de hipervínculos (en parte porque son generadas por autores más que automáticamente). En un estudio se mostró que los usuarios forman mejores modelos mentales en un sistema de hipertexto pequeño organizado jerárquicamente, que en

32

sistemas que permiten un acceso más flexible [226]. Se han investigado abundantemente los problemas relacionados con la navegación en hipertexto [181, 551, 440, 334].Más recientemente se ha utilizado información hipertextual para dar contexto a los resultados de las búsquedas. A continuación se describen algunos de estos trabajos.

Cha-Cha: SuperBook en la Web

El sistema de búsqueda intranet Cha-Cha [164] extiende la idea de SuperBook a una gran y heterogéneo sitio Web. La Figura 10.21 muestra un ejemplo. Este sistema difiere del SuperBook en varios aspectos. En la mayoría de los sitios Web no existe una verdadera tabla de contenidos o estructura de categorías, y una intranet como las que podemos encontrar en grandes universidades o corporaciones generalmente no están organizadas por una unidad central. El Cha-Cha utiliza la estructura de vínculos presente en el sitio para crear lo que se intenta como una organización significativa sobre el caos subyacente. Después que el usuario ha ingresado una consulta, se registran los caminos más cortos desde la página raíz a cada uno de los aciertos de búsqueda. Se selecciona un subconjunto de estos atajos para mostrarlos como una jerarquía, de modo que cada acierto se muestra una sola vez. Si el usuario utiliza el término “centro médico” en lugar de “centro de salud”, y “médico” aparece como término en un documento en la página Web del centro de salud, aparecerá la home page de este centro, así como aciertos más específicos. La organización que produce este método es sorprendentemente comprensible en el sitio de la UC Berkeley.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

Figura 10.21 La interfaz Cha-Cha mostrando los resultados de una búsqueda intranet, ante la consulta por “medical center” [164

Mapuccino: Presentación gráfica de una estructura de vínculos

El sistema Mappucino (anteriormente WebCutter) [527] permite pedir una consulta sobre un particular sitio Web. El sistema recorre el sitio en tiempo real, chequeando cada página encontrada para verificar su relevancia con la consulta. El subconjunto del sistio Web que ha sido recorrido se presenta gráficamente en una vista de nodos y links (ver Figura 10.22). Este tipo de vista no provee al usuario información acerca del contenido de las páginas, pero muestra su estructura de vínculos.

33

Figura 10.22 Ejemplo de un subconjunto Web visualizado por el sistema Mapuccino

10.6.7 Tablas

La visualización tabular es otra forma de mostrar las relaciones entre los documentos recuperados. un ejemplo de este enfoque es el sistema Envision [273]: permite al usuario organizar los resultados de acuerdo con algunos metadatos como autor o fecha, y utiliza gráficos para mostrar en cada celda los valores de los atributos asociados con los documentos (ver Figura 10.23). El color, la forma y el tamaño de los iconos se utilizan para mostrar el grado de relevancia, el tipo de documento y otros atributos.

34

Figura 10.23 La visualización tabular Envision para organizar gráficamente documentos recuperados [270]

10.7 Utilización de Juicios de Relevancia

Una parte importante del proceso de acceso a la información es la reformulación de las consultas, y una técnica efectiva para esta reformulación es la retroalimentación por relevancia. En su forma original, la retroalimentación por relevancia se refiere al ciclo de interacción en el que el usuario selecciona un pequeño conjunto de documentos que aparece como relevante para una consulta, y el sistema entonces utiliza características derivadas de esos documentos relevantes seleccionados para revisar la consulta original. Esta consulta revisada se ejecuta y se recupera un nuevo conjunto de documentos. Los documentos del conjunto original pueden aparecer en los nuevos resultados, aunque probablemente en otro orden de ranking. La retroalimentación por relevancia en su forma original ha sido mostrado como efectivo mecanismo para mejorar los resultados en muchos estudios [702, 343, 127].

La retroalimentación por relevancia plantea decisiones de diseño importantes, incluyendo cuáles operaciones deben ser realizadas automáticamente por el sistema y cuáles por el usuario. Bates discute ese punto en detalle [66], afirmando que a pesar del énfasis de los sistemas modernos en tratar de automatizar el proceso completo, es preferible un enfoque intermedio en el que el sistema ayuda a automatizar la búsqueda a un nivel estratégico. Bates sugiere una analogía con las cámaras fotográficas automáticas versus las manuales. En algunas ocasiones es apropiado un método rápido

35

que requiere poco entrenamiento. En otras ocasiones, el usuario requiere tener más control sobre la máquina.

10.7.1 Interfaces estándar para retroalimentación por relevancia

Una interfaz estándar para retroalimentación por relevancia consiste en una lista de títulos con un lugar junto a cada titulo para que el usuario pueda marcar los documentos relevantes. Dependiendo del sistema los documentos no marcados pueden entenderse como no relevantes o como que no se ha emitido opinión sobre ellos. Otra opción es proveer la elección entre opciones: relevante o no relevante. En algunos casos los usuarios pueden indicar un valor en una escala de relevancia [73].

Después de que el usuario ha realizado sus juicios de relevancia sobre un conjunto y emite una nueva búsqueda el sistema puede revalorar automáticamente la consulta y re-ejecutar la búsqueda, o generar una lista de términos para que el usuario seleccione y mejorar la consulta original. (Ver Figura 10.25, en el original en inglés).

Después de que la consulta es re-ejecutada, se muestra una nueva lista de títulos. Puede ser útil retener las marcas en los documentos que el usuario ya juzgó. Una difícil decisión de diseño consiste en si deben mostrarse o no los documentos que el usuario ya revisó, al principio de la lista. Mostrar repetidamente el mismo conjunto de documentos al principio puede molestar al usuario que está intentando crear un conjunto mayor de documentos relevantes. Pero, al mismo tiempo, esto puede servir como retroalimentación indicando que la consulta revisada no baja de categoría a estos documentos que ya han sido encontrados especialmente relevantes. Una solución es mantener una ventana separada que muestra los rankings de aquellos documentos que no han sido recuperados o rankeados previamente. Otra solución es utilizar letras más pequeñas o de otro color para los títulos de los documentos que ya fueron vistos.

Los motores de búsqueda en la Web han adoptado la terminología “more like this” (más documentos como éstos), como forma simple de indicar que el usuario està solicitando documentos similares a uno que ha seleccionado. Esta interacción de “un click” es más simple que el diálogo estándar de retroalimentación por relevancia, que requiere que el usuario evalúe y marque un pequeño conjunto de documentos y que luego vuelva a pedir un ranking. Desafortunadamente, en la mayoría de los casos se requieren muchos juicios de relevancia para que la retroalimentación por relevancia funcione bien. Aalbersberg propone un retroalimentación por relevancia incremental que trabaja con sólo un documento relevante por vez.

10.7.2 Estudios de Interacción de Usuario, en los sistemas con retroalimentación por relevancia

La retroalimentación por relevancia estándar supone que el usuario se involucra en la interacción especificando los documentos relevantes. En algunas interfaces los usuarios también pueden seleccionar términos para agregar a la consulta. Sin embargo, esto complica la revaloración y el re-ranking de los documentos.

Un estudio reciente estudia en qué medida es beneficioso que el usuario controle el proceso de retroalimentación. Koneman y Belkin [448] testearon cuatro casos diferentes enel proceso de retroalimentación por relevancia [772]:

Control: No hay retroalimentación por relevancia; las personas sólo podían reformular la búsqueda por sí mismos.

36

Opaco: Las personas simplemente seleccionan documentos relevantes y luego ven los rankings revisados.Transparente: Las personas podían ver cómo el sistema reformulaba las consultas (esto es, ver qué términos eran agregados) y los rankings revisados.Penetrable: El sistema es detenido a mitad de camino en el proceso de re-ranking. Se muestra a las personas los términos que el sistema habría usado para la reformulación opaca y la transparente. Las personas entonces seleccionan cuáles términos desean agregar a la búsqueda. Luego el sistema presenta los rankings revisados.

Las 64 personas que participaron fueron mucho más efectivas (midiendo la precisión en los primeros 5, primeros 10, primeros 30 y primeros 100 documentos) con retroalimentación por relevancia que sin él. El grupo Penetrable logró resultados significativamente mejores que el de Control, mientras que Opaco y Transparente se situaron en el medio. Los tiempos de búsqueda no difirieron significativamente, pero sí hubo diferencias en el número de iteraciones de la retroalimentación. Las personas del grupo Penetrable requirieron mucho menos iteraciones para lograr mejores resultados (un promedio de 5.8 ciclos en el grupo Penetrable, 8.2 ciclos en el grupo Control, 7.7 ciclos en el Opaco y sorprendentemente, el grupo Transparente requirió 8.8 ciclos de promedio). El número promedio de documentos marcados como relevantes osciló entre 11 y 14 para las tres condiciones. Todas las personas prefirieron la retroalimentación por relevancia sobre los sistemas que no lo tienen, y varios señalaron que preferían una aproximación laxa en la que se les sugiriera términos, antes que pensarlos por sí mismos.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.7.3 Extrayendo Información Relevante del Trasfondo

El retroalimentación por relevancia estándar se propone para mejorar las consultas o construir un perfil de los pasos en una consulta. Investigaciones recientes ha comenzado el desarrollo de sistemas que monitorean los progresos y la conducta de los usuarios a lo largo de períodos de interacción con la intención de predecir qué documentos o acciones probablemente querrá el usuario en el futuro. Estos sistemas se llaman asistentes semiautomáticos o agentes, y a menudo utilizan técnicas de aprendizaje por máquina [565]. Algunos de estos sistemas requieren input explícito del usuario en forma de declaración de metas [406] o juicios de relevancia [629], mientras que otros intentan hacer inferencias a partir de las acciones realizadas por los usuarios.

Un sistema desarrollado por Kozierok y Maes [460, 536] hace predicciones sobre cómo manipularán los usuarios mensajes de correo electrónico (en qué orden los leerán, dónde los archivarán) y sobre cómo organizarán encuentros en un administrador de calendario. El sistema registra en una base de datos lo que los usuarios van haciendo y considera relevante. Después de una acumulación suficiente de datos, el sistema usa el método del vecino más próximo [743] para predecir las acciones del usuario basándose en la similaridad de la situación corriente con respecto a situaciones anteriores. Por ejemplo, si el usuario casi siempre guarda los mensajes de una persona en particular en un determinado archivo, el sistema ofrece automáticamente repetir la acción frente a la misma situación [536]. El sistema integra el aprendizaje del retroalimentación implícito y explícito del usuario. Si el usuario ignora la sugerencia del sistema, el sistema trata esto como retroalimentación negativo y lo incorpora. Después de algunas predicciones incorrectas el sistema pregunta al usuario de modo de ajustar las predicciones. Finalmente, el usuario puede entrenar explícitamente al sistema presentando ejemplos hipotéticos de pares de acciones que podría realizar.

Otro sistema, Syskill y Webert [629] intenta aprender a utilizar perfiles de usuario basados en juicios de relevancia explícitos sobre páginas exploradas mientras se realiza browsing en la Web.

37

En cierto sentido, esto se parece al retroalimentación por relevancia estándar, excepto que los juicios del usuario son retenidos a lo largo de las sesiones y también difiere el modelo de interacción: cuando el usuario revisa una nueva página Web los vínculos sobre la página son anotados automáticamente, sean o no sean relevantes para el interés del usuario.

Letizia [518] es un sistema relacionado, trae a la atención del usuario un porcentaje de los próximos movimientos disponibles que más probablemente sean de su interés, dadas las acciones anteriores del usuario. Bajo pedido, Letizia provee recomendaciones para acciones ulteriores por parte del usuario, generalmente en forma de sugerencias de vínculos a seguir. El sistema monitorea el comportamiento del usuario mientras navega y lee páginas Web, y en forma paralela evalúa los vínculos alcanzables desde la página corriente. De ese modo, el grabar una página como favorito se toma como una evidencia positiva en relación con la página marcada, y los vínculos dejados de lado se toma como acciones negativas para la información alcanzable a través de esos vínculos. Los links seleccionados pueden indicar evidencia positiva o negativa, dependiendo del tiempo que el usuario utiliza en su revisión y si la decisión de dejar rápidamente una página no es revisada más tarde. Adicionalmente, la evidencia del interés del usuario debe persistir durante la sesión de browsing. El sistema utiliza una estrategia de búsqueda y heurística para determinar cuáles páginas recomendar.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.7.4 Juicios de relevancia grupal

En forma reciente se ha manifestado mucho interés en usar juicios de relevancia de un número importante de diferentes usuarios para rankear información de interés general [672]. Algunas variantes de este enfoque de recomendación social utilizan la similaridad de juicios de relevancia exclusivos de personas con similares intereses. Esto se ha encontrado como altamente efectivo para evaluar información en la que el gusto juega un rol importante, tal como recomendaciones de películas y de música. Más recientemente se ha combinado juicios de relevancia grupales con información de contenido [64]-

10.8 Ayuda para el proceso de búsqueda desde la Interfaz

El diseñador de la interfaz debe tomar decisiones acerca de cómo organizar varias clases de información en la pantalla y cómo estructurar las posibles secuencias de interacciones. Este es un problema serio en una actividad compleja como el acceso a la información. En esta sección presentamos las opciones de diseño para el despliegue de información en sistemas de información complejos, e ilustramos las ideas con ejemplos de interfaces existentes. Comenzamos con la discusión de interfaces muy simples, aquellas utilizadas para búsquedas de cadenas de caracteres y progresamos hacia interfaces multiventanas y espacios sofisticados de trabajo. Luego continúa una discusión de la integración de la exploración, selección y realización de consultas en interfaces de acceso a la información, y concluimos con las ayudas de interfaces para retener la historia del proceso de búsqueda.

10.8.1 Interfaces para correspondencia de cadenas de caracteres (string matching)

Una necesidad común y simple de búsqueda necesita una operación “encontrar”, generalmente ejecutada sobre el contenido de un documento que se está viendo. Generalmente esta función no produce una salida rankeada, ni permite combinaciones booleanas de términos: la principal operación es una correspondencia simple de caracteres (sin capacidad para expresiones regulares). En forma típica, se crea una ventana para ese propósito especial, que contiene pocos y simples controles (por ej. Coincidir mayúsculas y minúsculas, y búsquedas hacia delante y hacia atrás) El

38

usuario tipea la cadena buscada en un formulario de entrada y las cadenas que se corresponden se resaltan en el texto del documento (ver Figura 10.26).

Figura 10.26 Ejemplo de una interfaz simple para correspondencia de cadenas de caracteres, del Netscape Communicator 4.05

El grado siguiente de complejidad es la función “encontrar” aplicada a pequeñas colecciones, como archivos en el disco rígido de una computadora personal, o en la lista histórica de un navegador Web. Este tipo de función también se implementa como correspondencia simple de cadenas de caracteres. Como en el caso anterior, los controles y configuraciones de parámetros se muestran arriba de una ventana especial de búsqueda y las opciones se establecen a través de marcado y de formularios de entrada. La diferencia en estos casos es que se muestra una lista de resultados (ver Figura 10.27/.

Figura 10.27 Ejemplo de correspondencia de cadenas de caracteres con una lista de resultados, en este caso, la historia de las páginas Web recientemente visitadas, del Netscape Communicator 4.05

Estas interfaces simples pueden ser mejoradas aumentando su funcionalidad para ayudar a formular la consulta inicial. Los errores de tipeo son la principal causa de resultados vacíos. Puede ser útil una función de control de ortografía que sugiera alternativas para los términos de consulta que tienen baja frecuencia en la colección. Otra opción es sugerir términos de un tesauro asociados con los términos de consulta. Generalmente esta clase de información se muestra después de que ha sido entrada la consulta y han sido recuperados los documentos, pero una alternativa es proveer esta información cuando el usuario entra la consulta, en forma de una vista previa de la misma.

10.8.2 Administración de Ventanas

39

Para las tareas de búsqueda más complejas que la de correspondencia de caracteres, el diseñador de la interfaz debe decidir cómo desplegar las varias opciones y tipos de información.

Como se discutió más arriba, los sistemas bibliográficos tradicionales utilizan interfaces basadas en comandos o menúes. Cuando el sistema responde a un comando el resultado nuevo oculta lo anterior, exigiendo que el usuario recuerde el contexto. Por ejemplo, el usuario puede ver solamente un nivel de una jerarquía temática por vez, y debe dejar de ver esta presentación temática para ver la consulta o ver los documentos.

En las interfaces gráficas modernas el sistema de ventanas puede utilizarse para dividir funcionalmente las diferentes vistas, que pueden observarse de modo simultáneo [582]. En los sistemas de acceso a la información, a menudo es útil vincular la información de una ventana con la información de la otra, por ejemplo, vincular documentos con su posición en la Tabla de Contenidos, como el SuperBook. Los usuarios pueden también usar la selección para cortar y pegar información de una ventana en la otra, por ejemplo, copiar una palabra de una vista del tesauro y pegarla en el formulario de especificación de la consulta.

Cuando se ordena información en ventanas, el diseñador debe elegir entre una vista monolítica, en la que todas las ventanas están dispuestas en posiciones predefinidas y son vistas simultáneamente, ventanas “armables”, y ventanas superpuestas.

Las interfaces de tipo monolítico tienen varias ventajas. Permiten al diseñador controlar la organización de las varias opciones, hacen que toda la información sea vista simultáneamente, y ubica las características en posiciones familiares, haciendo que sean fáciles de encontrar. Pero también tienen desventajas. Generalmente trabajan mejor si ocupan la pantalla completa, y esto se encuentra limitado por la cantidad de espacio disponible en la pantalla [644].

Un problema común en cualquier tipo de interfaz de acceso a la información es el de cuántas clases de información puede mostrarse de una vez. Los sistemas de acceso a la información siempre deben reservar espacio para el área de visualización del texto, y esto lleva una proporción importante del espacio de la pantalla para que el texto sea legible. Una buena disposición, gráficos y el tamaño de las letras pueden mejorar estas situaciones.

Las ventanas superpuestas brindan flexibilidad en la organización, pero rápidamente pueden convertirse en una visualización abigarrada y desorganizada. Los investigadores han observado que parte importante de la actividad del usuario consiste en el movimiento entre una ventana y otra. Bannon et al. [54] define la noción de espacio de trabajo –el agrupamiento de conjuntos de ventanas funcionalmente referidas a alguna actividad o meta- con el fundamento de que esta clase de organización se corresponde más cercanamente con la estructura de metas del usuario que con ventanas individuales [96]. Card et al. [140] encontraron que el uso de ventanas debería ser categorizado de acuerdo con un modelo de “conjunto de trabajo”. Revisaron las relaciones entre las demandas de la tarea y el número de ventanas en uso, y encontraron que el mayor número de ventanas en uso se producía cuando los usuarios transitaban de una tarea a otra.

Basados en estas y otras observaciones, Henderson y Card [420] construyeron un sistema que intenta facilitar a los usuarios moverse entre múltiples espacios de trabajo virtuales [96]. El sistema usa una metáfora espacial de tres dimensiones, donde cada espacio de trabajo es una “habitación”, y la transición entre uno y otro se realiza mediante “puertas” virtuales. En este cambio los usuario pueden cambiar de un contexto al otro. En cada contexto de trabajo, los programas de aplicación y los archivos de datos que están asociados con ese contexto se hacen visibles y disponibles para su apertura y uso. La noción de espacio de trabajo de este modo enfatiza la importancia de que las

40

sesiones de trabajo persisten a través del tiempo. Los usuarios deberían poder dejar una habitación dedicada a una tarea, trabajar en otra tarea, y tres días después volver a la primera habitación y ver todas las aplicaciones en el mismo estado que las dejaron. Esta noción de vincular aplicaciones y datos para cada tarea ha sido ampliamente adoptado en los programas operativos que utilizan ventanas.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.8.3 Ejemplos de Sistemas

Las siguientes secciones describen el despliegue de información y los enfoques empleados en varias interfaces de modernas de acceso a la información.

InfoGrid

Es un ejemplo de despliegue monolítico ,[667]. En él se asume que la visualización se divide en un lado izquierdo y uno derecho (ver Figura 10.28). El lado izquierdo a su vez se subdivide en un área superior que contiene formularios de entrada estructurados para especificar las propiedades de la consulta, una columna de controles con iconos limitando el lado izquierdo, y un área para retener documentos de interés en la parte inferior. El área central principal se utiliza para ver los resultados recuperados, o representaciones reducidas de los documentos originales, o organizaciones derivadas de los documentos, tales como clusters Scatter / Gather. Los usuarios pueden seleccionar documentos desde esta área y almacenarlos en el área inferior, o verlos en el lado derecho. La mayor parte del lado derecho es utilizada para ver documentos seleccionados. El área inferior a la visualización del documento se destina a mostrar gráficamente la historia de las interacciones anteriores.

Parámetros de búsqueda Hoja de propiedades

Panel de control

Panel de

Imágenes Texto del

Tabla de

Subconjunto de la TOC

control reducidas documento Contenidos(TOC) Texto

Area de retención Pasos de búsqueda

Parámetros de búsqueda

del documento

Figura 10.28 Diagramas de distribución monolítica para interfaces de acceso a la información

Los diseñadores deben decidir qué tipos de información mostrar en la vista primaria. Si InfoGrid fuera usada en una visualización pequeña, o el área de visualización de documentos o el área de los resultados deberían ser mostrados en una ventana pop-up superpuesta; de otro modo el usuario tendría que moverse entre dos vistas. Si el sistema sugiriera términos para retroalimentación por relevancia, una de las vistas existentes debería ser suplantada con esta información o debería usarse una ventana pop-up para mostrar los términos candidatos. El sistema no provee información detallada para la selección de fuentes, a pesar de que esto podría conseguirse fácilmente con un menú pop-up en el panel de control.

SuperBook

41

La disposición de InfoGrid es similar a la de SuperBook (ver sección 10.6). La principal diferencia es que SuperBook retiene la vista tipo Tabla de Contenido en el panel principal izquierdo, junto con la indicación de cuántos documentos que contienen aciertos de búsqueda aparecen en cada nivel de la Tabla. El principal panel del lado derecho, como en InfoGrid, se utiliza para ver los documentos seleccionados. La formulación de la consulta se realiza justo debajo de la vista de la Tabla de Contenido. Los términos relacionados con la consulta del usuario también se muestran en esta ventana. Las imágenes grandes aparecen en ventanas pop-up superpuestas.

La disposición SuperBook es el resultado de varios ciclos de diseño iterativo [481]. Las versiones anteriores usaban ventanas superpuestas en lugar de una vista monolítica. La nueva caja de texto tiene su propio conjunto de botones que permiten a los usuarios saltar a las ocurrencias de palabras resaltadas en otros documentos o a la Tabla de Contenidos. SuperBook fue rediseñado después de varios estudios experimentales [530, 532] que mostraron que los usuarios eran más eficientes si se les daba pocos pero bien elegidos pasos de interacción. Un estudio reciente encontró que a pesar de que los usuarios son más eficientes con una interfaz flexible, prefieren sin embargo una interfaz más rígida pero más predecible [801]. Los diseñadores también consideraron lo registrado en los logs de interacciones de los usuarios. Antes del rediseño, los usuarios tenían que elegir ver la frecuencia total de un acierto, mover el mouse a la ventana de la Tabla de Contenidos, clickear el botón y esperar la actualización de los resultados. Como se observó que este patrón ocurría con frecuencia, el nuevo sistema ejecuta automáticamente esta secuencia de acciones inmediatamente después que es ejecutada una búsqueda.

Los diseñadores de SuperBook también intentaron que la intefaz corriera en pantallas más pequeñas. El rediseño hace uso de ventanas pequeñas y superpuestas.

DLITE

El sistema [193, 192] divide la funcionalidad en dos partes: control del proceso de búsqueda y muestra de los resultados. La parte de control es una vista de manipulación directa gráfica con animación (ver Figura 10.29). Las consultas, fuentes, documentos y grupos de documentos recuperados se representan como objetos gráficos. El usuario crea una consulta llenando los campos editables en un objeto constructor de consultas. El sistema manufactura un objeto de consulta, que es representado por un pequeño icono que puede ser arrastrado hasta una representación icónica de un conjunto de servicios de búsqueda. Si el servicio esta activo, responde creando un objeto conjunto vacío de resultados al que le agrega la consulta. El conjunto de resultados recuperados se representa con un círculo y los documentos recuperados se representan con iconos distribuidos en el interior del perímetro del círculo. Los documentos pueden ser arrastrados desde este círculo y llevados hacia otros servicios, como un sumarizador de documentos o un traductor. Mientras tanto, el usuario puede hacer una copia del icono de la consulta y arrastrarla a otro servicio de búsqueda. Las consultas pueden ser almacenadas y reutilizadas más tarde.

42

Figura 10.29 La interfaz DLITE [193]

Una arquitectura de interfaz flexible libera al usuario de la restricción de los comandos. Por otra parte, provee guías para ayuda al usuario a comenzar, brinda orientaciones para los procedimientos válidosy previene de los errores. La parte gráfica de DLITE hace uso de la animación para guiar al usuario.

DLITE usa una ventana Web separada para mostrar información detallada sobre los documentos recuperados, como las citas bibliográficas y el texto completo. Esta ventana también se utiliza para mostrar resultados clusters Scatter / Gather y permitir a los usuarios seleccionar los documentos para un retroalimentación por relevancia. De ese modo DLITE separa la parte de control del proceso de acceso a la información de la parte de revisión y lectura. Esta separación permite una construcción reutilizable de las consultas, y al mismo tiempo permite una vista legible de los documentos y las relaciones entre los mismos. La selección que se realice en la vista, se vincula con la parte gráfica de control, de modo que un documentos revisado en la vista puede ser utilizado como parte de una consulta en el constructor de consultas.

DLITE también incorpora la noción de espacio de trabajo, o “centro de trabajo”, como se lo denomina en ese sistema. Se crean diferentes espacios de trabajo para diferentes tipos de tareas. Por ejemplo, un espacio de trabajo para comprar software puede ser equipado con iconos que representen fuentes de revisión de software y buenos sitios Web para buscar información sobre precios.

SketchTrieve

El principio subyacente a esta interfaz [365] es la concepción del acceso a la información como un proceso informal, en el que ideas a medio terminar y caminos parcialmente explorados pueden retenerse para un uso posterior. Los resultados pueden ser combinados mediante operaciones sobre objetos gráficos. Como se observó que los usuarios utilizan la disposición física de la información en una hoja para organizar esa información [584, 722]. Esto motivó a los diseñadores del

43

SketchTrieve para permitir a los usuarios que organicen los resultados de las búsquedas de modo de facilitar su comparación y recombinación (Ver Figura 10.30).

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

Figura 10.30 La interfaz SketchTrieve [365]

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.8.4 Retención de la historia de la búsqueda

La sección 10.3 presentó las estrategias de búsqueda de información y los comportamientos que han sido observados por los investigadores en este campo. Esta discusión sugiere que la interfaz del usuario debería mostrar cuáles son las opciones disponibles en un punto dado, tanto como qué movimientos se han realizado anteriormente, tácticas de corto y de largo plazo respecto de estrategias para el uso de los términos, y permitir al usuario anotar las decisiones tomadas y la información encontrada durante todo el proceso. Los usuarios deberían ser capaces de reunir diferentes sesiones de búsqueda, grabar partes de una sesión, acceder y modificar flexiblemente todas ellas. También hay un interés creciente por incorporar la información sobre el uso y las preferencias personales tanto en la formulación de las consultas como en el uso de los resultados de una búsqueda [277].

En general estas estrategias no están bien aplicadas en las interfaces actuales; sin embargo se han introducido algunos mecanismos en ese sentido. En particular son útiles los mecanismos para retener la historia de las búsquedas. Usualmente estos mecanismos consisten en ver una lista de comandos que fueron ejecutados anteriormente, En desarrollos más recientes, se ha introducido la historia de la búsqueda en forma gráfica, grabando tanto las secuencias de comandos como los resultados obtenidos. Kim y Hirtle [440] presentan un sumario de los mecanismos de presentación de historia de la búsqueda en forma gráfica. En forma reciente, una interfaz gráfica que muestra la historia del acceso a páginas Web en una estructura jerárquica, permite ahorrar tiempo cuando se vuelve a visitar los páginas accedidas anteriormente. [370].

44

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.8.5 Integración de la revisión, la selección y la realización de las consultas

En general, las interfaces de usuario para el acceso a la información no son buenas en soportar las secuencias de movimientos desde una operación a la otra. Aún algo tan simple como tomar la salida de los resultado de una consulta y usarlos como entrada para otra consulta no está bien resulto.

Hertzum y Frkjaer [368] encontraron que los usuarios prefieren una integración de la revisión y la especificación de las consultas en las interfaces. Sin embargo, no observaron mejores resultados en tales interacciones. La hipótesis de estos autores es que si la interacción es demasiado libre se producen acciones erróneas, y que la interacción entre dos modos diferentes requiere más guía. Sugieren que se necesita más flexibilidad pero también límites.

Hay excepciones. La nueva versión Web del sistema Melvyl provee formas de tomar la salida de una consulta y modificarlas más tarde para su re-ejecución (ver Figura 10.32). El sistema DLITE y su concepto de habitaciones permite el almacenamiento y reutilización de estados previos. Sin embargo, estos sistemas no integran bien el proceso general con la revisión y la selección de información desde estructuras auxiliares.

Figura 10.32 Vista de la revisión de la historia de la búsqueda en la versión Web del catálogo bibliográfico Melvyl

La interfaz Cat-a-Cone integra la consulta y el browsing de una extensa jerarquía de categorías y sus colecciones de texto asociadas. El sistema prototipo utiliza la animación en tres dimensiones del Information Visualizer [144] (ver Figura 10.33). Un componente clave de la interfaz es la separación de la representación gráfica de la jerarquía de categorías de la representación gráfica de los documentos. Esta separación permite una interacción flexible y fluida entre el browsing y la búsqueda, y entre las categorías y los documentos. También provee un mecanismo por el que un conjunto de categorías asociadas a un documento puede ser visto junto con su contexto jerárquico.

Otra componente clave del diseño es la asignación de un estatus muy importante a la representación del contenido de texto. Los documentos recuperados son almacenados en una representación animada de un libro en tres dimensiones [144] que permite una visualización compacta de un número moderado de documentos. Asociado a cada documento recuperado hay una página de

45

vínculos a la jerarquía de categorías y una página de texto que muestra los contenidos del documento.

El sistema permite diferentes puntos de partida. Los usuarios pueden comenzar tipeando el nombre de una categoría y mirar qué partes de la jerarquía de categorías se corresponde. Por ejemplo, la Figura 10.34 muestra el resultado de una búsqueda sobre “Radiación” en los términos del MeSH. La palabra aparece bajo cuatro encabezamientos principales (Ciencias físicas, Enfermedades, Diagnóstico y Ciencias Biológicas). Se muestra entonces por qué “Radiación” aparece bajo Enfermedades (como parte de una rama sobre accidentes ocupacionales). Ahora el usuario puede seleccionar uno o más de estas categorías como entradas de la especificación de la consulta.

Figura 10.33 La interfaz Cat-a-Cone que integra la revisión de categorías y de documentos con la búsqueda [358]

Otra forma en que el usuario puede comenzar es tipeando una consulta en texto libre. Esta consulta es equiparada con la colección. Los documentos relevantes son recuperados y ubicados en un formato de libro. Cuando el usuario “abre” el libro de un documento recuperado, se muestran las partes de la jerarquía de categorías en la representación jerárquica. De ese modo, se muestran varias categorías simultáneamente, en su contexto. Esta interfaz combina la manipulación de extensos y complejos metadatos, puntos de partida, revisión y realización de consultas en una misma interfaz. También permite una retroalimentación por relevancia mediante la sugerencia de categorías adicionales que están relacionadas con los documentos que han sido recuperados.

46

Figura 10.34 Interfaz Cat-a-Cone: puntos de partida para buscar en las categorías [358]

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.9 Tendencias y temas de investigación

La importancia de la interacción hombre computadora está recibiendo un creciente reconocimiento en el campo de la informática [587]. Como debería ser evidente a partir de los contenidos de este capítulo, el rol de la interfaz del usuario en el acceso a la información ha recibido muy recientemente la atención que merece. Se espera que la investigación en esta área crezca rápidamente, especialmente por la expansión de la Web. La Web ha hecho repentinamente disponibles en forma global a grandes cantidades de información, produciendo un interés creciente por el problema del acceso a la información. Esto ha llevado a la creación de nuevos paradigmas de acceso a la información., tales como el uso innovador de la retroalimentación por relevancia tal como se ve en la interfaz Amazon.com. Como la Web provee una interfaz independiente de cualquier plataforma, se espera que las inversiones en el diseño de mejores interfaces tengan un gran impacto a nivel de la población.

Otra tendencia que puede preverse es un interés creciente en la organización y búsqueda en colecciones de información personal. Muchos investigadores están proponiendo que en el futuro la vida completa de una persona sería registrada utilizando multimedia. Una motivación para esta posibilidad es habilitar la búsqueda de todo lo que una persona ha hecho o escrito. Otra motivación es permitir las búsquedas utilizando nexos contextuales, tales como “encuentre el artículo que yo estaba leyendo en el encuentro que tuve el 1º. de julio con María y Pedro”.

47

También hay un interés creciente en identificar el comportamiento de individuos y grupos, tanto para evaluar la calidad de los ítems de información como para sugerir puntos de partida para la búsqueda. Los sistemas que recomiendan crecerán en diversidad e importancia. Las interfaces de usuario necesitarán guiar a los usuarios a ítems recomendados apropiados basados en sus necesidades de información.

El campo de la visualización de la información necesita algunas nuevas ideas sobre cómo disponer espacios de información grandes y abstractos, de forma intuitiva. Hasta que eso suceda el rol de la visualización de información estará confinada a proveer vistas generales temáticas y mostrar grandes jerarquías de categorías en forma dinámica.

48

Baeza

Documents

bsqueda de informacin

interfaz hombre

visualizacin de informacin

proceso de bsqueda

informacin pasados

interfaz de usuario

necesidad de informacin

interfaces de usuario