Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
PADICAT, el archivo web de
Cataluña ... y algunos apuntes
sobre Depósito legal electrónico
Eugènia SerraDirectora
Biblioteca de [email protected]
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Información general� Fundada en 1907
� Más de 3.000.000 documentos
� Crecimiento anual de 129.000
documentos
� 229 puestos de lectura en 3.060 m2
� Presupuesto 2013: 6,9 M€
� 160 plantilla
� 65 km de depósito + 1 depósito
cooperativo (GEPA)
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Uso� 2.596.180 consultas a documentos
digitalizados
� 4.618.579 consultas al catálogo
� 171 sesiones de formación/visitas
3.086 personas
� 252.000 reproducciones
(papel+digital)
� 142.000 documentos consultados
presencialmente
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Contrato-Programa 2013-2016� La Biblioteca, centro cultural de referencia
del patrimonio escrito, musical, sonoro,
audiovisual, gráfico y editorial.
� Identificación y compleción del patrimonio
bibliográfico y documental de Catalunya.
� El patrimonio bibliográfico y documental de
Catalunya accesible, al día y preservado
� Internacionalitzación
� Participación de la sociedad y agentes del
patrimonio (crowdsourcing)
� Consolidación de un sistema de
preservación digital nacional
Estrategia Planes estratégicos 2004-2008,
2009-2012 y Contrato-
Programa 2013-2016 →
especial atención al contexto
digital
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
A par;r de 2004 → tres líneas de actuación:
� Digitalización, a través de iniciativas en
colaboración (a nivel catalán e internacional,
de carácter selectivo y masivo).
� Creación del archivo web de Catalunya
� Impulso a los servicios virtuales
A par;r del 2009 → preservación digital más allá del
archivo web
Lineas de actuación
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Digitalización
• ARCA: Archivo de Revistas Catalanas Antiguas
http://www.bnc.cat/digital/arca
• MDC: Memoria Digital de Catalunya http://mdc.cbuc.cat
• Google Libros http://books.google.es/
• Europeana http://europeana.eu
Preservación digital
- PADICAT: Patrimonio Digital de Catalunya
http://www.padicat.cat
- COFRE: COnservamos para el Futuro Recursos
Electrónicos + Depósito Legal electrónico online
Acciones
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Del patrimonio bibliográfico al
patrimonio digital
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
“ Son objeto de depósito legal los escritos, estampas, imágenes y composiciones musicales, producidas en territorio nacional, en
ejemplares múltiples, con fines de difusión, hechos por procedimientos mecánicos o químicos. Comprenderá por tanto:
Libros, sea cualquiera la índole de su contenido y la forma de impresión y estén o no destinados a la venta.
Folletos, o sea escritos cuyo número de páginas sea mayor de cuatro y no exceda de 50, y con características semejantes
a las señaladas en el párrafo anterior, incluyéndose en este concepto las separatas de artículos de revista que tengan la acotada
extensión. Hojas impresascon fines de difusión y que no constituyan propaganda esencialmente comercial.
Publicaciones periódicas(revistas y diarios).Partituras musicales. Grabados: láminas sueltas,
láminas de calendario, estampas, cromos, "chrismas", anuncios artísticos. Mapas y planos. Cartelesanunciadores de espectáculos, fiestas y demás actos públicos, tanto religiosos como profanos; anunciadores de artículos
comerciales, siempre que lleven grabados artísticos; bandos y edictos. Postales ilustradas. Naipes. “Slides"destinadas a difusión y venta. Impresiones o grabaciones sonorasrealizadas por cualquier procedimiento o sistema empleado en la actualidad o en el futuro. Producciones cinematográficas, tanto de tipo argumental como documental, y "filmlets”.
Fuente: Orden de 30 de octubre de 1971, por la que se aprueba el Reglamento del Instituto Bibliográfico Hispánico
La producción bibliográfica en 1971
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
La producción digitalInternet Domain Survey, July, 2012
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Libros, Folletos, Hojas impresas, Publicaciones periódicas,
Grabados, Mapas y planos, Carteles, Postales, “Slides“,
Impresiones o grabaciones sonoras, Producciones
cinematográficas...
Pàgines web: Libros digitales, Diarios en línea, Sedes web,
Weblogs, Webcams, Votacions en línea, Chats, Webs
corporativas, Comercio en línea, Webs personales, Artículos y
ponenciass digitales, Documentación de software...
La producción “bibliográfica” el 2013
+
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
2020?
¿Cuándo desaparecerán los periódicos de papel? Seguramente, en veinte años. Bill Gates dice que en cinco años.Steve Ballmer (Microsoft), El País 22 octubre 2006
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
El patrimonio digital consiste en recursos únicos que son fruto del
saber o la expresión de los seres humanos. Comprende recursos de
carácter cultural, educativo, científico o administrativo e
información técnica, jurídica, médica y de otras clases, que se
generan directamente en formato digital o se convierten a éste a partir de material analógico ya existente. Los productos “de origen
digital” no existen en otro formato que el electrónico.
Los objetos digitales pueden ser textos, bases de datos, imágenes
fijas o en movimiento, grabaciones sonoras, material gráfico,
programas informáticos o páginas Web, entre otros muchos formatos
posibles dentro de un vasto repertorio de diversidad creciente.
El patrimonio digital Unesco 2003
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
El patrimonio nacido digital es extenso y creciente
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
1999 2001 2003 2009
El patrimonio nacido digital es efímero
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Experiencias en preservació digital pre 2005
Alemania, 1997
Australia, 1996
Áustria, 1999
Canadá, 1994
Dinamarca, 1998
EUA, 2000
Estonia, 2004
Finlandia, 1997
Francia, 2000
Grecia, 2003
Islandia, 1997
Japón, 2002
Lituania, 2002
Noruega, 2001
Nueva Zelanda, 1999
Holanda, 1995
Quebec, 2000
Reino Unido, 2004
República Checa, 2001
Suecia, 1996
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Experiencias en preservación digital
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
PADICAT
Patrimonio Digital de Catalunyaacceso permanente
a la Web catalana
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
PADICAT exhaustivo
� Webs dominio .CAT
� Webs en servidores de Catalunya
� Webs en lengua catalana bajo otros dominios
(.ES, .ORG, .NET, .COM, .INF, ...)
� Webs de autoría catalana
� Otras webs relacionadas temáticamente con
Catalunya que no corresponden a las
categorías anteriores
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
PADICAT selectivo
Selección de 2.000 instituciones
representativas de la sociedad catalana
� Ayuntamientos y administración local
� Partidos políticos y sindicatos
� Colegios y asociaciones profesionales
� Sector cultural
� Empresas
460 convenios firmados desde 2006/09
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
PADICAT focalizado: elecciones 2006
• Partidos (CIU, PSC, ERC, ICV, PP + Partit Blau, Lliga
antitaurina, Escons insubmisos…)
• Candidatos (Montilla, Carod, Saura, Sirera…)
• Fundaciones (Jordi Pujol, Rafael Campalans…)
• Parlamento + Administración
(eleccions2006.cat…)
• Blocs personales (ciberpolítica de Joselito…)
• Medios de comunicación (e-noticies.com,
vilaweb…)
652 capturas de 83 webs diferentes
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
PADICAT focalizado: elecciones 2006
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
PADICAT focalizado: elecciones 2007
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
PADICAT Resumen de Datos � Inicio: junio 2005
� Hardware: 7 servidores ProLiant DL360 G4p,
Robot Scalar i2000, 19 TB
� Software: Heritrix, NutchWax, Wera, Wayback /
ARCindexer
� Presupuesto: 1,6M € (2006-12)
� Equipo de trabajo: 4
(bibliotecarios/informáticos) + dedicación puntual
de técnicos de BC i CESCA
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
PADICAT En línea, abierto
www.padicat.cat
Búsqueda por texto
libre, URL, categorías
58.787 webs
diferentes
262.937 versiones
372 millones de
ficheros
13 TB de espacio
10 monográficos
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
PADICAT divulgación
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
PADICAT en red
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
“ El patrimonio bibliográfico, sonoro, visual, audiovisual y digital de las culturas de España es uno de los más ricos y representativos del mundo y debe ser preservado en beneficio de las generaciones presentes y futuras.”
3. “El depósito legal comprenderá los siguientes tipos de publicaciones y recursos, o la combinación de varios de ellos formando una unidad:
ñ) sitios web fijables o registrables cuyo contenido pueda variar en el tiempo y sea susceptible de ser copiado en un momento dado”.
8.2. “Se habilita a los centros de conservación, tanto de titularidad estatal como autonómica, a detectar y reproducir documentos electrónicos que hayan sido objeto de comunicación pública y los sitios web libremente accesibles a través de redes de comunicaciones que puedan resultar de i nterés para los fines del depósito legal, respetando en todo caso la legislación sobre protección de datos y propiedad intelectual.
La nueva Ley del DL, julio de 2011
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Operativo desde 2011
Obje;vo → preservar
- documentos digitalizados
(másters)
- copia periódica de PADICAT
- documentos de DL nacidos
digitales
Repositorio para otras instituciones catalanasMódulo de depósito de DLMódulo de consulta en la BC (documentos con derechos vigentes)
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Esquema COFRE
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
COFRE Módulo de carga DL online
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
COFRE Módulo de carga DL online
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
COFRE Módulo de carga DL online:
flujo de la aplicación
2013 → pruebas de carga de documentos desde la BC2014 → piloto con editores
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Reflexiones finales
Sistemas de preservación nacional
→ coopera;vos (protocolo) y distribuidos
→ adaptables y evolu;vos
Web y depósito legal nacido digital
→ no podemos ser exhaus;vos (aunque lo intentemos)
→ cambiante y creciente
→ imprevisible: nuevos ;pos de documentos (unidades
documentales) y formatos
Jornada internacional sobre archivos web y depósito legal electrónicoMadrid, Biblioteca Nacional de España, 9 de julio de 2013
Biblioteca de Catalunya
Eugènia Serra
¡Gracias!