Biblioteca Virtual de
Prensa Histórica

Presentación

Banderas y Estandartes. Semanario, 1906.

El Proyecto

La Biblioteca Virtual de Prensa Histórica constituye uno de los principales proyectos de digitalización que se han realizado en España y tiene a nivel internacional un peso considerable, tanto por su volumen como por sus funcionalidades.

El proyecto es el resultado de la cooperación de la Dirección General del Libro, Archivos y Bibliotecas, a través de la Subdirección General de Coordinación Bibliotecaria, con las Comunidades Autónomas así como de diversas instituciones de carácter científico o cultural como ateneos, fundaciones, universidades, e incluso empresas periodísticas que perviven a partir de cabeceras fundadas en el s. XIX o a principios del XX.

En septiembre de 2009, se dispone de casi 2.000 cabeceras, 50 bibliotecas, correspondientes a casi cinco millones de páginas, de 145 localidades en las que se imprimió prensa.

Se trata, en su mayoría, de colecciones únicas de interés para investigadores y público en general. Son de temática variada y abarcan un amplio período histórico que se remonta a finales del siglo XVIII.

Están representadas en la base de datos dieciséis Comunidades Autónomas (Andalucía, Aragón, Asturias, Canarias, Castilla-La Mancha, Castilla-León, Cataluña, Comunidad Valenciana, Extremadura, Galicia, Islas Baleares, La Rioja, Madrid, Navarra, País Vasco y Región de Murcia), 47 provincias y 145 localidades. El Ministerio de Cultura tiene previsto ir incluyendo progresivamente colecciones de las Comunidades Autónomas y provincias que aún no están representadas en la base de datos.

Preservación y difusión

El proyecto se inició con dos objetivos fundamentales: por una parte, preservar unos materiales bibliográficos que, por la propia naturaleza del soporte, se encuentran y se encontrarán cada día en más grave peligro de desaparición y, por otra, difundir de la manera más amplia posible unos recursos informativos muy solicitados por investigadores y ciudadanos en general.

Aunque no es muy conocido el efecto de la acidez del papel, fruto de su obtención a partir de la pasta de celulosa, al contacto con el aire se degrada hasta el punto de que en los centros internacionales de preservación y conservación se denomina fuego lento o slow fire al efecto que produce.

Además de esta circunstancia de la acidez del papel, tampoco su calidad en términos generales es muy buena puesto que cuando se imprimía en su momento se pensaba en un procedimiento de consumo inmediato y no en una previsión de conservación a largo plazo.

Por último, el uso constante por parte de investigadores, curiosos y público en general ha deteriorado aún más estos materiales bibliográficos que con frecuencia no solo son los más consultados en las bibliotecas sino también los más reproducidos con lo que ello supone de un fuerte impacto de luz en un material ya de por sí muy deteriorado.

Justamente esta demanda del público, junto a la precariedad del soporte, aconsejaba más que nunca utilizar todas las herramientas que proporcionan las tecnologías de la información para la búsqueda, recuperación y visibilidad de la información e incluso la reproducción a partir de las copias digitales accesibles en la World Wide Web.
Gerunda. Revista quincenal de ciencias, artes y literatura. 1901.

Gerunda. Revista quincenal de ciencias, artes y literatura. 1901.

Características técnicas

Por lo tanto, fue necesario emprender junto a la digitalización en si misma de los materiales un proceso completo de asignación de datos y metadatos que facilitasen el recurso de la búsqueda y recuperación de la información en un entorno virtual. Así, al formato MARC habitual en las aplicaciones de los sistemas de información bibliográfica se le añadieron, con distintos objetivos, un amplio conjunto de esquemas de metadatos que van desde el MARC XML, para la descripción bibliográfica, a Dublin Core/ISO 15836:2003, para la recuperación de la información, a METS http://www.loc.gov/standards/mets/ para la transmisión de los metadatos, e, incluso. a PREMIS http://www.oclc.org/research/projects/pmwg/ para las políticas futuras de preservación a largo plazo.

Con el estándar MARC21XML se han catalogado los registros bibliográficos y los fondos y localizaciones en un nivel que rara vez aparece reflejado en los catálogos tradicionales, pero que en este caso sí era posible haciendo coincidir la descripción bibliográfica con la digitalización y validación de todas y cada una de las hojas que componen cada ejemplar de cada publicación periódica, en los hasta seis niveles de numeración y cronología que la normativa MARC prevé basándose tanto en la norma ISO 10324 como en la Z39.71 de NISO.

La creación de los ficheros de esquemas Dublin Core permite alimentar o actualizar permanentemente el repositorio OAI-PMH con que cuenta la Biblioteca Virtual de Prensa Histórica lo que hace que sea recolectable por los recolectores más importantes y así figura como proveedor de datos de OAI http://www.openarchives.org/Register/BrowseSites y OAISter http://www.oaister.org/viewcolls.html.

Además, la estructura de OAI-PMH y Dublin Core permite que se establezcan SiteMaps con los buscadores como Google o Yahoo lo que da una alta visibilidad no a la base de datos de la Biblioteca Virtual de Prensa Histórica sino a cada uno de los registros que la componen y que se pueden recolectar directamente por los buscadores.

También los METS que se utilizan para el intercambio de colecciones de metadatos, encapsulando en ellos la descripción de datos en formato MARC, las direcciones de los ficheros multipágina que componen el conjunto de las imágenes digitales, la gestión de los derechos a través del esquema METSRigth y, como importante aportación, los esquemas de metadatos PREMIS se ven, a su vez, complementados por el uso de un servidor SRU/SRW, pionero en España tras el de la Biblioteca Virtual del Patrimonio Bibliográfico http://bvpb.mcu.es y acorde con las iniciativas internacionales de acceso a la información que permiten superar la arquitectura cliente servidor Z39.50 y que recientemente se están definiendo por OAIS como un web service más.

Existe, además, la posibilidad de establecer importantes sinergias entre el repositorio OAI y el servidor SRU y en esa línea se está trabajando actualmente.

Por último, hay que citar tres importantes mejoras que se han añadido en el último año.

Por un lado, el acceso multilingüe a la información que si bien es muy visible en la BVPB no lo es tanto en la BVPH aunque si se da en los casos en los que ha sido posible establecer equivalencias siguiendo la normativa MARC y la metodología VIAF al proyecto.

La segunda es la incorporación de ficheros PDF que permiten la consulta diferenciada de la presentación JPEG y que para determinadas consultas y finalidades resultan a veces más útiles.

La tercera es el inicio de proyecto de reconocimiento óptico de caracteres sujeta al estándar METS / ALTO que se utiliza asimismo en los principales proyectos de digitalización de prensa histórica como los realizados en Estados Unidos, Reino Unido, Holanda o Australia.
La Física Moderna. Revista mensual ilustrada. 1887.

La Física Moderna. Revista mensual ilustrada. 1887.Muy útiles resultarán para el usuario los nuevos sistemas de agregadores de contenidos RSS que le permitirán mantenerse informado de las actualizaciones que se vayan produciendo en la base de datos y que en un futuro y dada la estrategia de creación de repositorios digitales en toda España, promovido por la Dirección General del Libro, Archivos y Bibliotecas, a través de la Subdirección General de Coordinación Bibliotecaria, y recolectados a través del Recolector de colecciones digitales y recursos electrónicos http://hispana.mcu.es podrán incorporarse a la biblioteca virtual de una forma más habitual o más continua que las hasta ahora habituales cargas masivas.

El usuario tiene, por tanto, una herramienta que le permite aproximarse a uno de los recursos de información más ricos y variados y característicos de la contemporaneidad, una verdadera sociología de lo cotidiano que, sin duda, ahorrará mucho tiempo, esfuerzo y dinero a los usuarios, al mismo tiempo que permite la pervivencia de unos materiales bibliográficos particularmente frágiles.

El amplio conjunto de nuevos proyectos, nuevos desarrollos y mejora de funcionalidades permite predecir que esta base de datos crecerá no solo en volumen sino también en riqueza de manejo consiguiendo la mayor difusión de estos materiales a la vez que su preservación.

Para concluir, hay que volver a hacer hincapié en la naturaleza completamente cooperativa de este proyecto, resultado de una política de desarrollo de las colecciones digitales impulsada al unísono por las Comunidades Autónomas y el Ministerio de Cultura.

Las colecciones y los ejemplares de las publicaciones periódicas alcanzan en muchas ocasiones varias decenas de años, manteniéndose líneas de publicación que no es raro que superen el medio siglo continuado. Se ha llevado a cabo una catalogación exhaustiva, hoja por hoja, de periódicos que se han mantenido en circulación durante 20, 30 o 40 años seguidos indicando todas las incidencias que se han podido producir y que el proceso de digitalización refleja. De esta manera, el usuario puede tener un conocimiento muy preciso acerca de lo que consulta y no caer en la incertidumbre de no saber si ha obtenido la información que buscaba porque no se encontraba en unos números determinados de un periódico o porque esos números determinados de un periódico no formaban parte de la colección.

Con una iniciativa de estas características, la Subdirección General de Coordinación Bibliotecaria y las Comunidades Autónomas que colaboran en el proyecto dan un importante impulso a la participación española en la iniciativa digital libraries que promueve la Unión Europea en su VII Programa Marco pues cumplen con la totalidad de las condiciones técnicas requeridas por el proyecto y en algunos casos, aún más, y suponen un volumen verdaderamente significativo si se establecen las oportunas comparaciones con otros proyectos europeos o incluso extraeuropeos de similares características.

ALTO y otras nuevas funcionalidades

En agosto de 2009 la Library of Congress por medio de la Network Development and MARC Standards Office decidió adoptar ALTO como norma y creó un comité editorial en el que participan las bibliotecas que promueven los mayores proyectos de digitalización en el mundo, CCS Content Conversion Specialists GmbH, British Library, National Library of Finland, University of Kentucky, Library of Congress, Schlukbier Consultants, OCLC, Koninklijke Bibliotheek. Y lo que es más importante, imbricarlo con un amplio conjunto de normativas, tanto norteamericanas (a través de NISO) como internacionales (a través de ISO y de IFLA). Desde este punto de vista, destaca la posibilidad de utilizar METS (Metadata Encoding & Transmission Standard) para, mediante una extensión, transmitir en forma de metadatos los caracteres presentados y organizados conforme a ALTO.

ALTO permite, por un lado, mantener de forma facsimilar la imagen de la prensa digitalizada y, por otro lado, indicar las coordenadas de todos y cada uno de los caracteres reconocidos en una página, lo que posibilita su indexación y posterior búsqueda a texto completo.

La posibilidad de intercambiar, utilizando METS, información digital entre distintas bibliotecas se ha probado extraordinariamente útil en el caso de la Biblioteca Virtual de Patrimonio Bibliográfico dónde se hace uso de estos metadatos de forma habitual.

Conviene destacar igualmente la posibilidad de utilizar diversos gestores de referencias bibliográficas, por ejemplo Zotero, para descargar las descripciones y los vínculos a las páginas gracias a la implementación de COinS, estructura de metadatos que transmite la información y la referencia bibliográfica mediante una familia de estilos de citas bibliográficas, lo que sin duda facilita considerablemente el uso por investigadores, especialistas y por lectores de todo tipo de la amplísima información que ya recoge la Biblioteca Virtual de Prensa Histórica en esta versión 6.0 del programa que la gestiona.

Las aproximadamente 5 millones de páginas que en 25 de marzo de 2010 recoge la Biblioteca Virtual de Prensa Histórica, fecha de presentación de Hispana, a través de la cual se contribuirá al gran proyecto Europeana, cuentan además, con nuevas funcionalidades que se describen someramente, tales como las nuevas herramientas para la web 2.0 o la actualización de las estructuras de datos al nuevo estándar de catalogación MARC 21/RDA.

También se incluye un nuevo visor de imágenes que permite la consulta de imágenes como las que se obtienen al digitalizar a su tamaño original periódicos de gran formato

Ver vídeo de presentación en YouTube

Icono de conformidad con el Nivel Doble-A de las Directrices de Accesibilidad para el Contenido Web 1.0 del W3C-WAI. Este enlace abre una ventana nueva

© Ministerio de Educación, Cultura y Deporte

www.digibis.com