1 Information Science 2005 Tefko Saracevic, PhD School of Communication, información and Library Studies Rutgers University New Brunswick, New Jersey USA http://www. scils . rutgers . edu/~tefko
Jan 28, 2016
1
Information Science 2005
Tefko Saracevic, PhDSchool of Communication, información and Library StudiesRutgers UniversityNew Brunswick, New Jersey USA
http://www.scils.rutgers.edu/~tefko
2
Organización de la presentación
1. El paisaje – problemas, soluciones, lugar social
2. Estructura – áreas principales de investigación y práctica
3. Tecnología – Recuperación de la información – la mayor parte
4. Información – representación; bibliometría
5. Gente – usuarios, uso, búsqueda, contexto
6. Ruptura paradigmática – distanciamiento de las áreas de investigación
7. Bibliotecas digitales – ¿de quiénes son?
8. Conclusiones – grandes cuestiones para el futuro
3
Parte 1. El gran paisaje
Problemas abordados
Un poco de historia: Vannevar Bush (1945):Definió el problema como “... La tarea
masiva de hacer más accesible el enorme repositorio del conocimiento.”
Un problema que sigue con nosotros y sigue creciendo.
Tabla de contenidos
4
… solución
Bush sugirió una máquina: “Memex ... Asociación de ideas … que duplique los procesos mentales artificialmente.”
Una solución tecnológica al problemaTodavía con nosotros:
determinante tecnológico
5
En la base de la Ciencia de la Información: un problema
Intentar controlar el contenido en: La explosión de la información
El crecimiento exponencial de los artefactos informativos, si no de la propia información
Y hoy ADEMÁS
La explosión de la comunicación El crecimiento exponencial de los medios y modos de
comunicación, transmisión, acceso y uso de la información
6
solución tecnológica, PERO …
Aplicar la tecnología para solucionar los problemas en el uso efectivo de la información
PERO:Desde una perspectiva
HUMANA & SOCIAL Y no solo
TECNOLOGICA
7
o un modelo simbólico
Información
Tecnología
Gente
8
Problemas & soluciones: CONTEXTO SOCIAL
Práctica profesional E investigación científica relacionada con:Comunicación efectiva de los registros del
conocimiento - ‘literatura’ - entre humanos en el contexto de las necesidades y usos sociales, organizaciones e individuales
Con la ventaja de las nuevas tecnologías de la información
9
Características generales
Interdisciplinariedad - relaciones con un conjunto de campos, algunos más o menos predominantes
Imperativo tecnológico - fuerza impulsora como en muchos campos modernos
Sociedad de la información - contexto social y papel social en su evolución - compartido con muchos otros campos
Tabla de contenidos
10
Parte 2. Estructura
Composición del campo Como muchos campos, la ciencia de la
información tiene muchas áreas diferentes de concentración y especialización
Que cambian y evolucionan a lo largo de tiempose acercan y se separanse ignoran, más o menos, entre sí
11
más importante aún, las diferentes áreas…
reciben más o menos financiación & énfasis produciendo grandes desequilibrios en el trabajo y el
progreso atrayendo diferentes audiencias y campos
esto incluye vastas diferencias en los niveles de soporte para la
investigación e inversiones y aplicaciones enormes en el campo comercial
12
¿Cómo encontrar una estructura?descomponiendo áreas y esfuerzos en la
investigación y práctica, enfatizando
Tecnología
Información
oGente
o
Tabla de contenido
13
Identificada con la recuperación de información (RI)con mucho se lleva los mayores esfuerzos e
inversioneses internacional y global los intereses comerciales subyacentes son grandes
y crecientes
Parte 3.
Tecnología
14
Recuperación de información – definición & objetivo
“ RI: ... aspectos intelectuales de la descripción de información, ... búsqueda, ... & sistemas, máquinas...”
Calvin Mooers, 1951
¿Cómo proporcionar a los usuarios información relevante de forma efectiva?
Para ese fin:1. ¿Cómo organizar la información intelectualmente?2. ¿Cómo especificar la búsqueda & la interacción
intellectualmente?3. ¿Qué técnicas & sistemas usar efectivamente?
15
Investigación contemporánea en RI
Ahora principalmente dentro de la Informática e.g Special Interest Group on RI, Association for Computing
Machinery (SIGIR,ACM)
Extendida globalmente v.g. grandes comunidades de investigación han emergido en
China, Corea y Singapur Sacada fuera de la Ciencia de la Información - “todo el
mundo hace recuperación de información” minería de datos, aprendizaje automático, procesamiento del
lenguaje natural, inteligencia articial, gráficos por ordenador …
16
Text REtrieval Conference (TREC) Principal esfuerzo de investigación experimental Comenzó en 1992, ahora probablemente
terminando “para soportar la investigación de la comunidad RI
proporcionando la infraestructura necesaria para la evaluación en gran escala”
Métodos proporciona grandes bases de documentos, consultas, juicios de
relevancia y análisis comparativos usando esencialmente la metodología que uso Cranfield en los
sesenta organizada en varios temas que han ido evolucionando
17
El impacto de TREC
Internacional – gran impacto en crear comunidades de investigación
Conferencias anuales informes, intercambio de resultados, cooperación
Resultados principalmente en informes, disponibles en
http://trec.nist.gov/pubs.html estados de la cuestión pero solo una parte publicada en revistas y libros
18
Líneas TREC 2004103 grupos de 21 países
Genómica con 4 sub líneas HARD (High Accuracy Retrieval
from Documents) Novelty (nueva información no
redundante) Respuestas a consultas Robust (mejorando temas en los
que la recuperación es deficiente) Terabyte (colecciones muy
grandes) Web
Líneas anteriores: ad-hoc (1992-1999) routing (92–97) interactive (94-02) filtering (95-02) cross language (97-02) speech (97-00) Spanish (94-96) video (00-01) Chinese (96-97) query (98-00) y unas pocas más que solo
tuvieron dos años de duración
19
Ampliación del RI – siempre cambiando y con nuevas áreas añadidas
RI a través de diferentes idiomas (CLIR) Procesamiento del lenguaje natural (NLP RI) RI de música (MIR) Imagen, vídeo y multimedia Lenguaje oral RI en Bioinformática y Genómica Resumen; extracción de texto Respuesta de consultas Interacción hombre/máquina XML RI RI en la Web; buscadores web RI en contexto – gran área para los grandes buscadores e
investigación más reciente
20
RI comercial
Buscadores basados en la RI Pero añadiendo muchas elaboraciones e innovaciones
significativas gestionando enormes cantidades de páginas rápidamente interesantes juegos de algoritmos de spamming & page rank –
IR competitivo- combate de algoritmos incluyendo el contexto en la búsqueda
Extensión e impacto mundial unos 2000 buscadores en más de 160 países El inglés fue dominante, pero ya no
21
RI comercial : “un mundo feliz” Grandes inversiones & sector económico
Esperanzas de grandes beneficios, aunque todavía cuestionables
Conduce a RI propietaria y secreta Con un fichaje agresivo de los mejores talentos Nuevos centros comerciales de investigación en diferentes
países (v.g. MS en China)
La financiación de la investigación académica está cambiando Fuga de cerebros de la academia
Los motores de búsqueda comerciales tienen que hacer frente a grandes retos Perspectiva de: Amit Singhal
22
La RI puso en marcha con éxito
La emergencia y desarrollo de la INDUSTRIA de la información
La evolución de la CI como PROFESIÓN y CIENCIA Muchas APLICACIONES en muchos campos
Incluyendo la Web – motores de búsqueda Mejoras en la INTERACCIÓN PERSONAS -
COMPUTADORAS La evolución de la INTEDISCIPLINARIEDAD
La RI tiene una larga y orgullosa historia
Tabla de contenidos
23
Parte 4.
Información Varias áreas de investigación
Como un fenómeno básico – no demasiado progreso• Medidas como las de Shannon no han tenido éxito• Concentrada en sus manifestaciones y efectos• No hay progreso reciente en este tema de investigación
básicaRepresentación de la información
• Gran área conectada con RI, biblioteconomía• Metadatos
Bibliometría• Estructuras de la literatura
24
¿Qué es la información?Bien comprendida intuitivamente, pero mal formulada
formalmente Han emergido varios puntos de vista y modelos
Shannon: fuente - canal -destino señales no son contenido – no es realmente aplicable, a pesar
de muchos intentos
Cognitivo: cambios en las estructuras cognitivas Procesamiento y efectos del contenido
Social: contexto, situación Búsqueda de información, tareas
25
La información en la Ciencia de la Información: Tres sentidos (del más estrecho al más amplio)
1. información en términos de la decisión, sin tener en cuenta prácticamente los procesos cognitivos
señales, bits, datos simples - v.g.. Teoría de la Información (Shanon), Economía,
2. información incluyendo el procesamiento cognitivo y la comprensión
comprensión, emparejamiento de textos, Brookes3. información también en relación al contexto, la
situación, el problema a resolverβ USUARIOS, USO, TAREA
Para la Ciencia de la Información (incluyendo la recuperación de información):
la tercera interpretación, la más amplia, es necesaria
26
Parte 5.
Gente Servicios profesionales
en la organización – moviéndose hacia la gestión del conocimiento y la inteligencia competitiva
en la industria – vendedores, agregadores, Internet, Investigación
Usuarios & estudios de usuario Estudios de interacción Ampliando el campo a los estudios de búsqueda de la
información, contexto social, colaboración Estudios de relevancia Social informatics
27
Uso y estudios de usuarios
El área más antiguacubre muchos temas, métodos y orientacionesmuchos estudios están relacionados con la RI
• v.g. búsqueda, multitarea, visualización, navegación
Introduciéndose en los estudios de usuarios de la webEstudios cuantitativos y cualitativosEmergencia de la webmetría
28
Interacción
El modelo tradicional de la RI se concentra en el emparejamiento, pero no en el lado del usuario y la interacción
Diversos modelos de interacción han sido sugeridos
• Ingwersen’s cognitive, Belkin’s episode, Saracevic’s stratified model
Difícil de realizar experimentos y de confirmarlos Se consideran clave para proporcionar
• las bases de un diseño mejor • la comprensión sobre el uso de los sistemas
Las interacciones en la Web: una nueva área clave
29
Búsqueda de información
Se concentra en el contexto más amplio, no solo en la RI o la interacción: en la gente según se comporta en la vida y el trabajo
Ha proporcionado varios modelos v.g. Las etapas de Kuhlthau’s stages, o el modelo basado en tareas
de Järvelin Incluye estudios sobre la vida real, construcción del sentido,
localización de la información, vida laboral, descubrimiento de información
Basado en el concepto de la construcción social de la información
Tabla de contenidos
30
Parte 6. Ruptura del paradigma entre sistemas y gente
Desde principios de los años ochenta se ha producido una ruptura entre dos enfoques:
centrado en los sistemas algoritmos, TREC, motores de búsqueda continua el modelo tradicional de RI
centrado en los humanos (usuarios) cognitivo, situacional, estudios de usuarios modelos de interacción, algunos comenzados en TREC
31
Lado humano vs. sistema
Lado humano (usuario) : a menudo crítico, incluso unilateral propone un mantra de implicaciones para el diseño pero no proporciona resultados en la práctica
Lado del sistema: ignora los estudios H ‘dinos que hacer y lo haremos’
El tema NO es H o S ni siquiera menos H vs. S sino como pueden H y S trabajar juntos uno de los principales retos para el futuro
32
Llamadas vs soporte
Muchas llamadas a un diseño, enfoque y evaluación centrados en el usuario/humano
Conjunto de obras que lo discuten, pero pocas proponen soluciones concretas
Sin embargo, la mayor parte del soporte se va al trabajo de sistemas en la era digital el soporte es para lo digital
Un intento reciente de combinar ambas perspectivas:Book: Ingerwersen, P. and Järvelin, K. (2005). The turn:
Integration of información seeking and retrieval in context. Springer.
Tabla de contenidos
33
Parte 7. Bibliotecas digitales
Área ENORME & creciente Área “caliente” in I&D
con un número importante de becas y proyectos en los EE. UU., Europa y otros países
pero en ellos lo “DIGITAL” es grande & “bibliotecas“ pequeño
Área “caliente” en la prácticaSe están construyendo colecciones digitales y
bibliotecas híbridasExisten muchos proyectos por todo el mundo
34
Problemas técnicos
Sustanciales - mayores y más complejos que lo anticipado: representación, almacenamiento y recuperación de los
objetos bibliotecarios digitales• particularmente si fueron originalmente diseñados para ser
impresos y luego se digitalizaron gestionar operacionalmente grandes colecciones - temas
de escala tratar con colecciones diversas y distribuidas
• interoperabilidad asegurar la preservación y la persistencia incorporar la gestión de derechos
35
EEUU: Digital Library Initiatives
Consorcios dependientes de la financiación de la National Science Foundation DLI 1: 1994-98, 3 agencias, $24M, 6 grandes proyectos DLI 2: 1999-2006, 8 agencias, $60+M, 77 proyectos grandes y
pequeños en varias categorías proyectos internacionales conjuntos National Science, Mathematics, Engineering, and Technology
Education Digital Library• cerca de 200 proyectos de demostración & desarrollo
La financiación terminada en 2005 ahora desviada a áreas relacionadas
36
Unión europea: DELOS
DELOS Network of Excellence on Digital Librariesmuchos proyectos a lo largo de la Unión Europea
• de carácter muy tecnológicomuchas reuniones y talleres hasta cierto punto recuerda a las DLIs de los EE.
UU:bien financiados, a largo plazoa diferencia de lo que ocurre en los EE. UU. el
soporte continúa
37
Temas de investigación comprender los objetos en las BD
representados en muchos formatos
metadatos, catalogación, indización conversión, digitalización organización de grandes colecciones gestión de colecciones, escalamiento preservacion, archivo interoperabilidad, estandarización acceso, uso, búsqueda
búsqueda federada en colecciones distribuidas
evaluación de bibliotecas digitales
38
Proyectos de BD en la práctica Muy orientados a las instituciones y sus
misionesen bibliotecas, pero también en otras
• museos, sociedades, gobiernos, empresas• en muchas variantes
Extendidos globalmenteincluyendo la digitalización
U California, Berkeley’s Libweb “lista más de
7300 páginas de bibliotecas de más de 125 países” Extendiéndose a gran velocidad
a menudo a costa de otros recursos
39
¿En conexión?
La investigación y la práctica actual en BD son desarrolladas actualmente mayormente de forma independiente
una de otra informando mínimamente a la otra
parte y con una conexión mútua ligera o
inexistente Son en el momento actual
universos paralelos con escasas conexiones e interación no es bueno ni para la investigación
ni para la práctica
Tabla de contenido
40
Parte 8. Conclusiones
Las contribuciones de la CI
Puso en marcha la gestión de la información en la sociedad
Desarolló un cuerpo organizado de conocimiento y de competencias profesionales
Aplicó la interdisciplinariedad Alcanzó un estado de madurez
penetró muchos campos y actividades humanas Acentuó el factor HUMANO en la interacción
hombre-máquina
41
Retos Ajustarse al papel organizacional y social creciente y
cambiante de la información y de la infraestructura informacional relacionada
Jugar un papel positivo en la globalización de la información
Responder al imperativo tecnológico en términos humanos
Responder a los cambios que se han producido desde la explosión de la información a la de la comunicación convirtiendo las propias experiencias en soluciones,
especialmente en el campo de la web Unir competitividad y calidad Reunir lo DIGITAL con las BIBLIOTECAS
42
Momento crítico
La CI está en un momento crítico de su evolución Muchos grupos y campos… se están desplazando al campo
de la información fuerte competencia entrada de jugadores poderosos lucha por el control
Para ser un jugador de primera, la CI necesita progresar en: investigación & desarrollo competencias profesionales esfuerzos educacionales relaciones interdisciplinares
Es necesaria una re-examinación
43
Gracias Miró!
44
45
Bibliografía
Bates, M. J. (1999). Invisible Substrate of información Science. Journal of the American Society for información Science,50, 1043-1050.
Bush, V. (1945). As We May Think. Atlantic Monthly, 176, (11), 101-108. Available: http://www.theatlantic.com/unbound/flashbks/computer/bushf.htm
Hjørland, B. (2000). Library and información Science: Practice, Theory, and Philosophical Basis. información Processing & Management, 36 (3), 501-531.
Pettigrew, K.E. & McKechnie, L.E.F. (2000). The use of theory in información science research. Journal of the American Society for información Science and Technology, 52 (1), 62 - 73.
Saracevic, T. (1999). información Science. Journal of the American Society for información Science, 50 (9) 1051-1063. Available: http://www.scils.rutgers.edu/~tefko/JASIS1999.pdf
Saracevic, T. (2005). How were digital libraries evaluated? Presentation at the course and conference Libraries in the Digital Age (LIDA)30 May-3 June 2005, Dubrovnik, Croatia. Available: http://www.scils.rutgers.edu/~tefko/DL_evaluation_LIDA.pdf
Webber, S. (2003) información Science in 2003: A Critique. Journal of información Science, 29, (4), 311-330.
White, H. and Mc Cain, K. (1998). Visualizing a Discipline: An Author Co-citation Analysis of información Science 1972-1995. Journal of the American Society for información Science, 49 (4), 327-355.