Banderas y Estandartes. Semanario, 1906.

El Proyecto

Este proyecto se inició con dos objetivos fundamentales: por una parte, preservar unos materiales bibliográficos que, por la propia naturaleza del soporte, se encuentran y se encontrarán cada día en más grave peligro de desaparición y, por otra, difundir de la manera más amplia posible unos recursos informativos muy solicitados por investigadores y ciudadanos en general.

Aunque no es muy conocido el efecto de la acidez del papel, fruto de su obtención a partir de la pasta de celulosa, al contacto con el aire se degrada hasta el punto de llegar a quebrarse. Si sumamos a la acidez del papel, su escasa calidad (puesto que se imprimía para su consumo inmediato) y el uso constante (y exposición de los materiales a la luz) por parte de los usuarios de las hemerotecas, nos encontramos con un grave problema de preservación que hace más que aconsejable la digitalización de la prensa histórica.

Así, en el año 2003, fruto de un esfuerzo de planificación cooperativa entre el entonces Ministerio de Cultura y las Comunidades Autónomas, comienzan los trabajos de digitalización de prensa histórica, pero no fue hasta el año 2006 que la biblioteca fuera presentada al público. Desde entonces no han parado los trabajos y año tras año se han ido llevando a cabo proyectos de digitalización, coordinados por la Subdirección General de Coordinación Bibliotecaria, que han permitido que se hayan ido añadiendo contenidos a la colección, de modo que hoy en día, en marzo de 2021, esta hemeroteca digital ofrece cerca de 9 millones de páginas de 2.485 cabeceras y 4.070 artículos que provienen de colecciones de 103 instituciones.

La colección comprende fondos de todas las comunidades autónomas escritos en las distintas lenguas oficiales españolas, también podemos encontrar fondos publicados en las antiguas colonias españolas de América, África y Filipinas. Se trata, en muchos casos, de colecciones únicas de gran interés para investigadores y público en general. La  temática de la colección es muy variada, incluyendo una extensa colección de boletines oficiales, revistas ilustradas, publicaciones satíricas, hojas del lunes, prensa femenina, revistas culturales, periódicos de corte político, prensa clandestina, etc.

 

Gerunda. Revista quincenal de ciencias, artes y literatura. 1901.

Características técnicas

Los trabajos de digitalización de la Biblioteca Virtual de Prensa Histórica no se limitan a un mero escaneado de los documentos, los fondos pasan un profundo tratamiento bibliográfico mediante el que se les asignan los metadatos necesarios para posibilitar las funciones de búsqueda y recuperación.

Como formato central de catalogación, la BVPH trabaja y carga los registros en el formato MARC21 (https://www.loc.gov/marc/ ), utilizando tres de sus variantes: marc21 bibliográfico, de fondos y de autoridades.

A partir de los registros en MARC21, la aplicación realiza automáticamente una serie de mapeos a diversos formatos permitiendo a los usuarios la descarga de todas estas variantes de los metadatos: Dublin Core, Ficha, ISBD, MODS, MARCXML, MARC etiquetado, Bibtex, Jisc, Mets, EDM, SKOS, ALTO, etc.

Si para catalogar las obras se usa el formato MARC21, para describir, intercambiar y cargar los objetos digitales se usa el formato METS (http://www.loc.gov/standards/mets/), para el proceso de reconocimiento óptico de caracteres el formato ALTO (http://www.loc.gov/standards/alto/) y para la preservación en nuestro sistema de preservación (http://travesia.mcu.es/portalnb/jspui/handle/10421/9003 ) el formato PREMIS (http://www.loc.gov/standards/premis/ ).

En cuanto a los formatos de imagen, la BVPH ofrece para su descarga copias digitales de difusión en una calidad media en formato JPG y PDF, y para preservación utiliza el formato TIF.

La hemeroteca digital ofrece en su web numerosas opciones de búsqueda, visualización y descarga de contenidos que permiten una investigación profunda a sus usuarios. Además de estas opciones, la BVPH ofrece la posibilidad de buscar sus registros mediante un servidor SRU (http://prensahistorica.mcu.es/es/estaticos/contenido.cmd?pagina=estaticos/sru), y de recolectar sus registros mediante el protocolo OAI-PMH (https://www.openarchives.org/pmh/ ).


Respecto a este último protocolo, la Biblioteca Virtual De Prensa Histórica cuenta con un repositorio OAI-PMH (http://prensahistorica.mcu.es/i18n/oai/oai.cmd), que permite que sus registros estén siendo recolectados por repositorios  o agregadores OAI-PMH como HISPANA (http://hispana.mcu.es/es/estaticos/contenido.cmd?pagina=estaticos/presentacion ), EUROPEANA (http://www.europeana.eu/portal/es ), WordCat (https://www.worldcat.org/), etc.  El repositorio figura como proveedor de datos en el registro de proveedores OAI-PMH de la Open Archives Iniciative (http://www.openarchives.org/Register/BrowseSites) y en OAISter (http://www.oaister.org/viewcolls.html).

En cuanto a la difusión, aparte de los metadatos y objetos digitales, la BVPH ofrece un apartado de noticias y un canal RSS que ayuda a los usuarios a mantenerse informados de las actualizaciones que se vayan produciendo en la aplicación o en la colección.

La Biblioteca Virtual de Prensa Histórica corre sobre el programa de biblioteca digital Digibib, de la empresa Digibis S.L. y está gestionada por la Subdirección General de Coordinación Bibliotecaria del Ministerio de Cultura y Deporte.


La Física Moderna. Revista mensual ilustrada. 1887.

El formato ALTO

El formato ALTO (Analyzed Layout Text Object), un formato gratuito y abierto y debidamente documentado y mantenido por la Library of Congress desde 2009, permite que se pueda ofrecer de forma facsimilar la imagen de la prensa digitalizada y, por otro lado, por debajo, que se registren en archivos de texto los textos y las coordenadas de todos y cada uno de los caracteres reconocidos en una página, lo que posibilita su indexación y permite la búsqueda en el contenido de las páginas.

Con esta funcionalidad el ciudadano tiene a su disposición una herramienta que le facilita enormemente la investigación de la prensa histórica -uno de los recursos de información más ricos, variados y característicos de los últimos siglos-, volviendo el trabajo mucho más profundo y eficiente.

 

 

Ver vídeo de presentación en YouTube