Anuario ThinkEPI 2012 175 Informe de situación 2011, un gran año para las bibliotecas virtuales Xavier Agenjo Agenjo, Xavier. “2011, un gran año para las bibliotecas virtuales”. Anuario ThinkEPI, 2012, v. 6, pp. 175-183. H. WEB SEMÁnTICA Y BIBLIOTECAS VIRTUALES Resumen: Se exponen los avances del proyecto Europeana y se destaca su impor- tancia entre otras líneas estratégicas de la Comisión Europea. En 2011 se han pu- blicado importantes documentos de recomendaciones y estándares que clarifican el futuro desarrollo de Europeana. Se destacan los documentos elaborados por el W3C. Se describe las aportaciones españolas, en especial desde Hispana. Se cita la colaboración entre Europeana y la Digital Public Library of America. Se establece la distinción entre los conceptos open access, open data y open source. Palabras clave: Europeana, Bibliotecas virtuales, Bibliotecas digitales, Estándares, LOD-LAM, Linked open data, Open data, Hispana, W3C, Digital Public Library of America. Title: 2011, a great year for virtual libraries Abstract: The Europeana project progress is presented, emphasizing its importance among other stra- tegies of the European Commission. In 2011 important recommendations and standards were published that clarify the future development of Europeana. Documents produced by the W3C are highlighted and Spanish contributions, particularly from Hispana, are listed. The collaboration between Europeana and the Digital Public Library of America is mentioned. Finally, the differences between various concepts like open access, open data and open source are explained. Keywords: Europeana, Digital libraries, Virtual libraries, Standards, LOD-LAM, Linked open data, Open data, Hispana, W3C, Digital Public Library of America. Introducción El año 2011, malísimo desde todos los puntos de vista relacionados con la economía –y, por lo tanto con la biblioteconomía– ha sido, sin embar- go, un gran año para las bibliotecas virtuales. Sin duda, esta excepción debería mover a una reflexión profunda sobre dónde se encuentra la salida de la crisis 1 . Europeana Ya lejos de los principios de Lund o de la res- puesta de la excepción cultural francesa al proyec- to Google Books, Europeana se ha consolidado definitivamente, tanto desde un punto de vista técnico, como desde el político-administrativo. La inclusión de Europeana como la acción clave número 15 de la Agenda Digital Europea 2 publi- cada en el Diario Oficial de la Unión Europea el 26 de agosto de 2011, aunque elaborada bajo el semestre de la presidencia española, junto con otras acciones clave, dirigía a Europeana hacia la línea estratégica de linked open data, que tanta repercusión está teniendo y tendrá en la sociedad europea y mundial. Así, Europeana se une a otras líneas capitales como la eJustice 3 , el eCommerce 4 , el eGovernment 5 , la eHealth 6 y otras grandes líneas estratégicas sociales, que no son sino un avance de la democracia, mediante el control efectivo de los ciudadanos a través de la Web de toda la actividad social, y una fuerte optimización de todos los procesos de I+D+i 7 . La Agenda Digital Europea define un Esque- ma Europeo de Interoperabilidad 8 y una forma de intercambiar información que va mucho más allá de la compatibilidad de los estándares y se dirige directamente a la vinculación de los datos mediante las tecnologías de linked open data 8 . 2011, un gran año para las bibliotecas virtuales – Xavier Agenjo
9
Embed
H. WEB SEMÁnTICA Y BIBLIOTECAS VIRTUALES Informe de ......2011, un gran año para las bibliotecas virtuales – Xavier Agenjo. Anuario ThinkEPI 2012 176 Que Europeana figure junto
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Palabrasclave:Europeana,Bibliotecasvirtuales,Bibliotecasdigitales,Estándares,LOD-LAM, Linked open data, Open data, Hispana, W3C, Digital Public Library ofAmerica.
Elaño2011,malísimodesdetodoslospuntosdevistarelacionadosconlaeconomía–y,porlotantoconlabiblioteconomía–hasido,sinembar-go, un gran año para las bibliotecas virtuales.Sin duda, esta excepción debería mover a unareflexiónprofundasobredóndeseencuentra lasalidadelacrisis1.
Europeana
YalejosdelosprincipiosdeLundodelares-puestadelaexcepciónculturalfrancesaalproyec-to Google Books, Europeana se ha consolidadodefinitivamente, tanto desde un punto de vistatécnico, como desde el político-administrativo.La inclusióndeEuropeana como laacción clavenúmero15delaAgendaDigitalEuropea2publi-
cadaenelDiarioOficialdelaUniónEuropeael26deagostode2011,aunqueelaboradabajoelsemestre de la presidencia española, junto conotrasaccionesclave,dirigíaaEuropeanahacialalíneaestratégicadelinkedopendata,quetantarepercusiónestáteniendoytendráenlasociedadeuropeaymundial.Así,EuropeanaseuneaotraslíneascapitalescomolaeJustice3,eleCommerce4,el eGovernment5, la eHealth6 y otras grandeslíneas estratégicas sociales, que no son sino unavance de la democracia, mediante el controlefectivodelosciudadanosatravésdelaWebdetodalaactividadsocial,yunafuerteoptimizacióndetodoslosprocesosdeI+D+i7.
La Agenda Digital Europea define un Esque-ma Europeo de Interoperabilidad8 y una formade intercambiar informaciónquevamuchomásallá de la compatibilidad de los estándares y sedirigedirectamentealavinculacióndelosdatosmediante las tecnologías de linked open data8.
Que Europeana figure junto a la eJustice, eleCommerce,eleGovernment,olaeHealthesunaclarísimamuestradelvalorquelaUniónEuropeadaalosarchivos,bibliotecasymuseos,loqueestáenclaraoposiciónconlasfrecuentesafirmacionesacerca del desamparo que experimentan estasinstituciones.
– la publicación del Europeana linked opendataPilotProject13y
– lacreacióndecincogruposdetrabajoden-trodelCouncilofContentProvidersandAggre-gators14, a los que se les encomendó una tareaprecisa.
Los resultados han sido visibles. Uno de losaspectos más difíciles de solucionar, el de losderechos de autor, se ha visto valientementeaclarado gracias al Europeana Data ExchangeAgreement15, conocido por sus siglas en inglésDEA. La última semanadeoctubrede2011 violapublicacióndecuatrodocumentos16referidosa Europeana y, concretamente a su modelo dedatos, el Europeana Data Model, que no sóloprecisaban extraordinariamente este auténticosabordelinkedopendatasinoqueelúltimodeellos,elFinaltechnical&logicalarchitectureandfutureworkrecommendations17(publicadoel31oct. 2011) establecía la situación actual y sobretodo las perspectivas de futuro del proyecto.ConvieneseñalarqueEuropeanaalcanzóel6deenero de 2012 los 20 millones de objetos digi-tales, o más precisamente, de cultural heritageobjects(CHO)18.Sehaestablecidodeformamuyclara cuálesdeben ser lasaportacionesde cadauno de los 27 países miembros para que en el201519, cumpliendoasíelPlanestratégicomen-cionado, sealcancen los30millonesdeobjetosdigitales.
Ynosólocuántos,sinosobretodo,cómo.Véaseen la tabla1 las aportacionesde cada
paísmiembro,obtenidasdelnuevorecursosobreEuropeana denominado pro.europeana.eu, degran utilidad20. El lector hará bien consultandoconfrecuenciaestesitio.
Enesesentidopuededecirse, sinruboralgu-no, que España está jugando un gran papel enla construcción de Europeana, aunque fieles anuestrasesencias, alparecer congénitas,de for-
ma muy diversa. Así, mientras las bibliotecas, ymedianteHispana,constituyenunodelosmayo-resproveedoresaEuropeana,noocurrelomismoconlosarchivos,pueselproyectoApenet,delquenopuededecirsequehayafracasado,hapropor-cionado a Europeana 555.370 objetos digitalesprocedentes de Archives Portal Europe, que secorresponden en su totalidad con la aportacióndelNationaalArchief holandés.AunqueEspañaliderabaelproyectoApenet,sucontinuadorApexserá coordinado por una institución holandesa.Parece extraño que el país que cuenta, segúnla Unesco, con el segundo patrimonio culturaldel mundo, después de Italia, esté escasamenterepresentado en Europeana y sólo la participa-ción de los museos españoles, reunidos en labasededatosCer.es21y,agregadosporHispanay posteriormente recolectadas por Europeana,estén efectivamente presentes. Pero lo que ver-daderamente sorprende es la comprobación deque la fuente que proporciona mayor númerodeobjetosdigitalesaEuropeana,esdecirAthe-na (4.012.663 CHOs) –diseñada para facilitar laaportacióndelosmuseosyqueutilizaLIDO(lig-htweightinformationdescribingobjects),especi-ficadoporelICOM(InternationalCommitteeforDocumentation),comoesquemademetadatos–,
Undíaantesde lapublicaciónde tresde losdocumentos referidos al Europeana data model(EDM),aparecióellargamenteesperadoinformefinaldelWC3LibraryLinked IncubatorGroup22.En realidad el documento vino acompañado deotros dos, dedicado uno de ellos a los casos deestudio23 entre los que figuraban la Polymathvirtual library24 (Biblioteca virtualdepolígrafos)y en el apartado de datos heterogéneos, el delaOntologíadelpatrimoniodeCantabria25,porcierto,juntoaEuropeana26.
Laimportanciadeestedocumentoesenorme,no solo se establecen unas directrices flexiblespero sumamente indicativas sobre cómo handecrearse losnuevos ILSo sistemasdegestiónbibliotecaria, sinoqueademás, tantomedianteloscasosdeusocomoconlavinculacióndecon-juntosdedatosavocabulariosdevalores,y,engeneral,aotrosrecursosinformativosajustados,establececlaramenteunahojaderutaalaquedeberíanceñirselosdesarrollosinformáticosvin-culadosconlasbibliotecasasícomo,yelinformelodiceexpresamente,alosarchivosymuseos.Dehecho, frutodeestosdosacrónimos,LODparalinkedopendatayLAMpara libraries,archivesandmuseums[einclusoaunquenoparecehabertenidotantafortunaGLAM,siendoGgaleries],sehacreadoelnuevoacrónimoLOD-LAM27que,sin duda, dominará profesionalmente durantetoda esta década, lo que es un periodo previs-ible,almenosmientras linkedopendataseaelparadigmaquedominelaWorldWideWeb.
Quizá convenga señalar aquí que cuandoeste artículo esté impreso ya podrá consultarsela traducción española de los tres documentosen la web de la Fundación Ignacio Larramendi,lo que tiene su lógica pues tanto por nuestrocaso de estudio como por los trabajos realiza-dos en Europeana, incluyendo obviamente losque Digibís ha realizado para la mayoría de lasbibliotecasdigitalesovirtualesquecumplen losestándareseuropeosoparaelpropioagregadornacional,Hispana.Siaesolesumamoslacomu-nicación presentada al 77º Congreso de IFLA,tituladoDataaggregationanddisseminationofauthority records through linked open data28 yque aparecerá próximamente actualizado en larevistaCatalogingandclasificationquarterly,laspiezasencajanclaramente.
AportaciónespañolaaEuropeana.
Yasehaseñaladoqueesdesigual,puessibienresultacuantiosaenloqueserefiereabibliote-cas (1.648.000) es menor lo relacionado con losmuseos (124.000) y muy reducida en el caso delosarchivos.
Nopuedeomitirseuncomentarioquedesearíaque fuera tomado sin acritud y que hace refe-rencia a dos de los proyectos fundamentales yquizáde losmás conocidosde losexistentesenEspaña.PorunladolaBibliotecaDigitalHispáni-ca30(23.547objetos),promovidaporlaBibliotecaNacional,yporotro,laBibliotecaVirtualMigueldeCervantes31(19.062),promovidaporlabiblio-tecaquellevasunombre.Tampocoesdemasiadolucida la aportación de la Memòria Digital deCatalunya32 (14.084). Estos tres proyectos estánseparadospordosórdenesdemagnituddeHis-pana. Mientras que de ella hay que hablar demillonesderegistros,lastresmencionadasapor-tandecenasdemiles.
LaDigital Public Library of America
Quienes tuvimos la suerte de asistir, en micasocomomiembrodelEuropeanaCCPATehnicalCoreGroup,alareunióncelebradaenVienaconel nombre de European Tech, pudimos asistir aunapresentacióndelestadodelacuestióndelaDigitalPublicLibraryofAmerica (DPLA)33–crea-daendiciembrede2010-que impulsadapor laHarvard University– ¿debe recordarse que es lanúmerounoenelrankingdeShanghai?-seapoyaentrespilaresmuysólidos:laLibraryofCongress,laSmithsonian Institutiony laNationalArchivesandRecordsAdministration34.
Enesamismasemanadeoctubrede2011enlaqueaparecieronlosinformesdelestadoactualy futuro de EDM, los objetivos cuantitativos deEuropeanaylosinformesdelW3CLibrayLinkedDataIncubatorGroup,sehizopúblicoelacuerdoentrelaDPLAyEuropeana35,dadalagraniden-tidad y convergencia de su normativa y de susobjetivos. Cabe destacar que una herramienta
desarrollada en Europa como MINT (Metadatainteroperability services)36 está siendo utilizadapor la DPLA lo cual es, al menos en lo que yorecuerdotrascasi30añosdedesarrolloprofesio-nal,unodelospocoscasosenlosqueenEuropasehageneradouna tecnologíaqueesutilizadaenlosEstadosUnidos.
dounproyectodegranmagnitudyqueimplicanadamenosquealaAdministraciónGeneraldelEstado con unos requisitos funcionales absolu-tamentediversosdelosquemarcalanormativaeuropea,ode losqueestableceelW3C esmuypreocupante (y sintomático), como lo es que elresultado de muchos de estos proyectos sea laimplementación de un servidor Z39.50 y no deunservidorSRU/SRW37.Elaño2011vioqueunade lasmás,quizá,poderosas y conocidas imple-mentaciones de Z39.50, el catálogo Melvyl, secerrabaparadarpasoaunSRU.Elfindeunaera,comentó un destacado bibliotecario americano,y,sinembargo,enEspañaparecequevaaserelprincipio de otra. Todavía estamos a tiempo decorregireseenormeerrorestratégico.
Open access, open data, open source
En mi opinión existe una gran confusión enrelación a estos tres conceptos fundamentales.ConfíoenquelamayordifusióndelatraducciónespañoladelosinformesfinalesdelW3CLibraryLinkedDataIncubatorGroupdisipealgunascon-fusiones verdaderamente costosas para el con-tribuyente,para losprofesionalesy, sobretodo,–yestoesimperdonable–paraloslectores.Lanocomprensióndeestosconceptossepuedevolvercompletamenteencontranuestra.
Openaccessyopendatanosignificanenmodoalguno lo mismo. El movimiento open accesses fundamentalmente una estrategia político-administrativaparaoptimizarlosrecursosqueseutilizan en la adquisición de publicaciones digi-tales.Esclaroquesilapublicacióndecadaunadeesasrevistasymonografíasfueradeúnicamente1euro,elmovimientoopenaccessnosehubierapuestoenmovimiento.
Open data permite, en cambio, el uso deuna tecnología, la tec-nología de linked opendata.Esdecir,setratadedisponerdelosdatos,deforma talque sean sus-ceptibles de vincularseunos con otros para suuso o su reutilización.Pongamos un ejem-plo claro. Fruto de unapolítica combinada deopen access se podríaacceder a una publi-cación o conjunto depublicaciones, aunqueestasseencontraranporejemplo en un formatopropietario, no utiliza-sen latecnologíaRDFo
Nosepodríaresumirdeunamaneramáspreci-saybreveelobjetivopolíticoyeconómicoúltimode la Agenda Digital Europea; es decir, no sólonoquedarseatráseneldesarrollodelasTIC,sinotomarladelantera.OjaláenloscamposyacitadoscomolaeJustice,eleCommerce,eleGovernment,olaeHealthsedencircunstanciasanálogas.Es,sinduda,comoyaheinsinuadoalprincipio,unadelas pocas salidas que tiene la vieja Europa pararectificar su declive. Sólo la ciencia da buenasnoticias.
En cualquier caso, asombra la rapidez conque laDPLA,quecuentaconaproximadamentelamitaddeproveedoresdedatosqueEuropea-na, ha logrado armar su proyecto. Sin duda elrespeto prácticamente sagrado a la normativatienemuchoqueverconesto.Y tambiénsurgela misma reflexión cuando aplicamos idénticotamiz a los resultados de bibliotecas, archivos ymuseosespañoles.Esevidentequeaquellosquese ajustan a LOD LAM van adelante y que losquenolohacenseestancanoinclusotiendenadesaparecer.ElqueenEspañaseestédesarrollan-
También existe una confusión notable sobreopensource.Cuandoescriboestaslíneasestáreci-entelacelebraciónenGranada,el12deenero,deunasjornadasdelW3C.Unodelosresúmenesquecorríaentrelosasistentesdejabacompletamenteclaro que una cosa es el código gratuito y otraelcódigoabierto.Noesqueunprogramaopensource haya de ser gratis, eso sería free source,sinoquedebeserabiertodeformatalquepuedaserreutilizado,reescritoportercerosparalograrunos objetivos determinados. Sorprende, si sesiguendeterminadaslistasdediscusión,observarno las decenas sino los centenares de profesio-nales –tanto informáticos como bibliotecarios,archiveros y museólogos– dedicados a desar-rollar aplicaciones quepodrían adquirirse porun precio equivalentea la anualidad de unosolo de esos profesion-ales y que, por supues-to, podría ser reescritopara ajustarse a unasnecesidades específicassifueranecesario.Todoese esfuerzo dedicadoal desarrollo de herra-mientas informáticas, yno siempre de la mejorcalidad, se hurta a laslabores de adquisición,al proceso técnico, a lainformación bibliográ-ficaoa lapreservación,bien de los originalesen papel, bien de los
objetos digitales. Son muy pocas las bibliotecasqueofrecenensucatálogoaccesoa la inmensacantidad de objetos disponibles para la lecturadeformagratuita;lapobrezadelacatalogacióny sobre todo de la asignación de materias (enSKOS38,porsupuesto)sonrojan.Apenasseinfor-masobrelosenormesrepositoriosdeinformaciónque existen en todo el mundo, gran parte deellosgratuitos,ydesde luegonoexisteningunapolítica sistemática ni para la preservación detodoslosmaterialesbibliográficosimpresosdesdemediados del siglo XIX en papel ácido, ni parala creación de repositorios de preservación alargoplazo.EldesinterésporlasRDAdelagranmayoríade losLAMespañolesesbuenapruebadeello.
Por las cifras de la contribución española aEuropeana podría parecer que la creación decolecciones digitales, al menos, goza de buenasalud, pero si miramos las cifras en detalle, lacosacambia.
Es obvio que la categoría “objeto digital”está unificando ítems compuestos por una únicaimagenconotros compuestospor centenaresdepáginas. Aun así es una muestra muy ilustrativadeltamañodelascoleccionesdigitalesespañolas.
En la figura 1 (pág. 178) puede verse quesólo cuatro coleccionesespañolasenEuropeanaestánporencimadelos50.000objetosdigitales(Galiciana,Cer.es,BibliotecaVirtualdeAndalucíay Gredos). Obsérvese que para que el gráficofuera ilustrativosehaeliminadodelmismoa laBiblioteca Virtual de Prensa Histórica (956.496objetos digitales). 9 colecciones se sitúan entrelos 10.000-50.000 objetos digitales (BibliotecaDigital de Madrid, Biblioteca Digital de CastillayLeón,BibliotecaDigitaldeCastilla-LaMancha,Archivo de la Imagen de Castilla La Mancha,BibliotecaNacionaldeEspaña,BibliotecaVirtualMigueldeCervantes,CentrodeDocumentacióndeFundaciónMapfre,BibliotecaVirtualdelPatri-monioBibliográficoyBibliotecadeCatalunya).21coleccionesestánentrelos1.000y10.000objetosdigitalesyotras21pordebajodelos1.000.
ticas de ventas son abrumadoras. Desciendendrásticamente lasventasdePCsde sobremesaydeportátiles,mientrasquesedisparanlosdelastabletasylosdelosteléfonosinteligentes.Todoslosanalistascoincidenquelascifrasdeestosdosúltimos,oquizáunhíbridodeestosdos,semul-tiplicaránporveintealolargodeladécada.LosinformesdelaOCLCsobrequéesloquequierenlos bibliotecarios y qué es lo que quieren loslectores40 son concluyentes. Éstos buscan lo quehan buscado siempre, el libro objeto de interésy cuando digo “libro” me refiero a cualquiermaterialbibliográfico,archivísticoomuseológico.El lectordeseaaccederal libro,siesposiblecondatos asociados como índices, resúmenes, valo-raciones;esdecir,datosenlazadosaotrosdatosabiertos.Poreso,elprocesodedigitalizacióndelos fondos o de producción digital (“born digi-tal”) debe incluir, de forma creciente, el mayornúmero posible de metadatos que informen allectordelamaneramássimpleposible,pormuycomplejaque sea la tecnologíaqueestédetrás,de otros libros escritos por ese mismo autor, oquetratendelmismoasunto,delasreseñasquepuedehaberdeeselibro,delosresúmenesqueexistan, de las valoraciones que proporcionenotros lectores, de las anotaciones de otros lec-tores41... Todo ello lo proporciona linked opendata.Porlotanto,lasbibliotecasdebendedejardeproducirdigitalizacionesqueseconsultenenunapantalladeunordenadorclásico,sinvincu-
lar aotrosobjetosdigitalesanálogos. Sedebenpoderdescargarenformadeepubomobiaunatabletaoaunteléfonointeligente.latripletaqueconformahtml5,css3yjavascripthadesterradoyaaflashyprontoloharáconpdf.Losbibliotecariosdebemos empezar a hacer lo mismo. Todo estodebería hacer, así mismo, la industria editorial,peroenestecasoseráelmercadoelqueeliminea quienes no pongan su fondo editado de unamanera ágil y atractiva y vinculada temática,espacialytemporalmenteoporautores,etc.,conotroslibrosdigitales.
Alaseditorialesineficaceslasbarreráelmer-cado; a las bibliotecas, a los archivos y a losmuseos loseliminaránde lospresupuestos sinoseadecuanalW3Clinkedopendataysidespre-cianlamagníficaoportunidadquealmenosparalos próximos ocho años Europeana pone frentea ellos. Desde luego ni el mundo se detendrá,ni se adecuará a ideas periclitadas y a prácticasineficaces.
notas
1. Por qué prefiero "biblioteca virtual" a "bibliotecadigital" seha tratadoenelartículoLabibliotecavir-tual:funciónyplanteamiento,alquemeremito.http://eprints.rclis.org/handle/10760/14352
37. Search/retrieveweb (SRW)esunservicio web para la búsqueda y re-cuperación. SRW proporciona unainterfaz SOAP (simple object accessprotocol)paralasconsultas,paraau-mentar la interfaz de proporciona-da por el protocolo Search/retrievevia URL (SRU). Las consultas de SRUySRWseexpresanmedianteContex-tualquerylanguage(CQL).
38. Remito al lector a la versión nooficial de la comunicación que pre-sentamos Francisca Hernández yyoalXCapítuloEspañoldeISKOquepuedeconsultarseenDigiclic.http://www.slideshare.net/DIGIBIS/skos -desde -e l -punto -de -v i s ta -epistemolgico-de-xavier-agenjo-bulln-y-francisca-hernndez-carrascal
39. Porejemplo, la recoleccióndemetadatosdeRe-colectaparecequeserealizasobredeterminadossetsporque, sin irmás lejos,GredosapareceenRecolectacon16.711registros,mientrasqueenEuropeanaapa-rececon91.599yenHispanacon92.143.