Biblioteca Virtual de
Prensa Histórica

Presentación

Banderas y Estandartes. Semanario, 1906.

O Proxecto

A Biblioteca Virtual de Prensa Histórica constitúe xa un dos principais proxectos de dixitalización que se realizaron en España e ten, no ámbito internacional, un peso considerable, tanto polo seu volume como polas súas funcionalidades. As estatísticas que posúe o Ministerio de Cultura poñen de manifesto o seu elevado uso ao longo destes anos e o amplo conxunto de descargas que se veñen realizando.

O proxecto é o resultado da cooperación da Dirección Xeral do Libro, Arquivos e Bibliotecas, a través da Subdirección Xeral de Coordinación Bibliotecaria, coas Comunidades Autónomas así como diversas institucións de carácter científico ou cultural como universidades, ateneos e incluso empresas periodísticas que subsisten a partir de cabeceiras fundadas nos inicios do século pasado.

No mes de setembro de 2009, disponse de case 2.000 cabeceiras de 50 bibliotecas, correspondentes á case cinco millóns de páxinas, de 145 localidades nas que se imprimiu en prensa.

Trátase, na súa maioría, de coleccións únicas de interese para investigadores e público xeral. Son de temática variada e abarcan un amplo período histórico que se remonta a finais do século XVIII.

Están representadas na base de datos 16 Comunidades Autónomas (Andalucía, Aragón, Asturias, Canarias, Castela-A Mancha, Castela-León, Cataluña, Madrid, Comunidade Valenciana, Estremadura, Galicia, Illas Baleares, A Rioxa, Navarra, País Vasco e Rexión de Murcia), 47 provincias e 145 localidades. O Ministerio de Cultura ten previsto ir incluíndo progresivamente coleccións das Comunidades Autónomas e provincias que aínda non están representadas na base de datos.

Preservación e difusión

Este proxecto iniciouse por dúas circunstancias fundamentais, unha a da preservación dos materiais bibliográficos, é dicir hemerográficos, que pola propia natureza do soporte se atopan e se atoparán cada día máis, en grave perigo de desaparición.

Aínda que non é moi coñecido o efecto da acidez do papel, froito da súa obtención a partir da pasta de celulosa, en contacto co aire este degrádase enormemente ata o punto de que dende os centros internacionais de preservación e conservación denomínaselle fogo lento ou slow fire ao efecto que produce.

Ademais desta circunstancia da acidez do papel tampouco a súa calidade en termos xerais é moi boa posto que cando se imprimía no seu momento pensábase nun procedemento de consumo inmediato e non nunha previsión de conservación a longo prazo.

Por último, o uso constante por parte de investigadores, curiosos e público en xeral deteriorou aínda máis estes materiais bibliográficos que con frecuencia son, non só os máis consultados nas bibliotecas, senón tamén os máis reproducidos co que isto supón un forte impacto de luz nun material xa de por si deleterio.

Xustamente esta demanda do público xunto á precariedade do soporte aconsellaba máis que nunca utilizar todas as ferramentas que proporcionan as tecnoloxías da información para a busca, recuperación e visibilidade da información e incluso a reprodución a partir das copias dixitais accesibles na World Wide Web.

Gerunda. Revista quincenal de ciencias, artes y literatura. 1901.

Gerunda. Revista quincenal de ciencias, artes y literatura. 1901.

Características técnicas

Polo tanto, foi necesario emprender xunto á dixitalización en si mesma dos materiais un proceso completo de asignación de datos e metadatos que facilitasen o recurso da busca e recuperación da información nun medio virtual. Así, ao formato MARC habitual nas aplicacións dos sistemas de información bibliográfica engadíronselle, con distintos obxectivos, un amplo conxunto de esquemas de metadatos que van dende o MARC XML para a descrición bibliográfica ao Dublín Core/ISO 15836:2003 para a recuperación da información aos METS http://www.loc.gov/standards/mets/ para a transmisión dos metadatos e incluso aos PREMIS http://www.oclc.org/research/projects/pmwg/ para as políticas futuras de preservación a longo prazo.

Co estándar MARC21XML catalogáronse os rexistros bibliográficos e os fondos e localizacións nun nivel que rara vez aparece reflectido nos catálogos tradicionais, pero que neste caso si era posible facendo coincidir a descrición bibliográfica coa dixitalización e validación de todas e cada unha das follas que compoñen cada exemplar de cada publicación periódica nos ata seis niveis de numeración e cronoloxía que a normativa MARC prevé baseándose tanto na norma ISO 10324 como na Z39.71 de NISO.


A creación dos arquivos de esquemas Dublin Core permite alimentar ou actualizar permanentemente o almacén OAI-PMH co que conta a BVPH o que fai que sexa recolleitable polos recolleitadores máis importantes e así figura como data provider en OAI http://www.openarchives.org/Register/BrowseSites e OAISter http://www.oaister.org/viewcolls.html.

Ademais, a estrutura de OAI-PMH e Dublin Core permite que se establezan SiteMaps cos buscadores como Google e Yahoo o que dá unha alta visibilidade non á base de datos da Biblioteca Virtual de Prensa Histórica senón a cada un dos rexistros que a compoñen e que se poden recoller directamente a través dos buscadores.

Tamén os METS que se utilizan para o intercambio de coleccións de metadatos, encapsulando neles a descrición de datos en formato MARC, os enderezos dos arquivos multipáxina que compoñen o conxunto das imaxes dixitais, a xestión dos dereitos a través do esquema METSRigth e, como importante achega, os esquemas de metadatos PREMIS vense a súa vez complementados polo uso dun servidor SRU/SRW, pioneiro en España tras o da Biblioteca Virtual do Patrimonio Bibliográfico http://bvpb.mcu.es e perfectamente acorde coas iniciativas internacionais de acceso á información que permiten superar a arquitectura cliente servidor Z39.50 e que recentemente se están definindo por OAIS como un web service máis.

Existe, ademais, a posibilidade de establecer importantes sinerxías entre o almacén OAI e o servidor SRU e nesa liña estase a traballar actualmente.

Por último, hai que citar tres importantes melloras que se engadiron no último ano. Por un lado, o acceso multilingüe á información, que se ben é moi visible na Biblioteca Virtual do Patrimonio Bibliográfico non o é tanto na Biblioteca Virtual de Prensa Histórica aínda que si se dá nos casos nos que foi posible establecer equivalencias seguindo a normativa MARC e a metodoloxía VIAF ao proxecto.

A segunda é a incorporación de arquivos PDF que permiten a consulta diferenciada da presentación JPEG e que para determinadas consultas e finalidades resultan ás veces máis útiles.

A terceira é o inicio do proxecto de OCR suxeita loxicamente a un estándar, neste caso METS / ALTO que se utiliza así mesmo nos principais proxectos de dixitalización de prensa histórica como os realizados nos Estados Unidos, Reino Unido, Francia, Holanda ou Australia.

La Física Moderna. Revista mensual ilustrada. 1887.

La Física Moderna. Revista mensual ilustrada. 1887.Moi útiles resultarán para o usuario os novos sistemas de agregadores de contidos RSS que lle permitirán se manter informado das actualizacións que se vaian producindo na base de datos e que nun futuro, e dada a estratexia de creación de almacéns dixitais en toda España, promovido pola Subdirección Xeral de Coordinación Bibliotecaria e recollidos a través do Recolleitador de coleccións dixitais e recursos electrónicos http://hispana.mcu.es poderán incorporarse á biblioteca virtual dunha forma máis habitual ou máis continua que as ata agora habituais cargas masivas.

O usuario ten, polo tanto, unha ferramenta que lle permite aproximarse a un dos recursos de información máis ricos e variados e característicos da contemporaneidade, unha verdadeira socioloxía do cotián que, sen dúbida, lles aforrará moito tempo, esforzo e diñeiro aos usuarios, ao mesmo tempo que permite a pervivencia duns materiais bibliográficos particularmente fráxiles.

O amplo conxunto de novos proxectos, novos desenvolvementos e mellora de funcionalidades permite predicir que esta base de datos crecerá, non só en volume, senón tamén en riqueza de manexo logrando respectar dinamicamente os dereitos do usuario á información e os dereitos do documento a súa subsistencia.

Para concluír, hai que volver a facer fincapé na natureza completamente cooperativa deste proxecto, froito dunha política de desenvolvemento das coleccións dixitais que impulsada ao unísono polas Comunidades Autónomas e o Ministerio de Cultura, a través da Subdirección Xeral de Coordinación Bibliotecaria, deron probas de como un proxecto con obxectivos e formulacións coherentes sempre chega a bo porto que non é outro, loxicamente, que o usuario do sistema bibliotecario español.

As coleccións e os exemplares das publicacións periódicas alcanzan en moitas ocasións varias decenas de anos, manténdose liñas de publicación que non é raro que superen o medio século continuado. A diferenza doutras bases de datos de publicacións periódicas, levouse a cabo unha catalogación exhaustiva, folla por folla, de periódicos que se mantiveron en circulación durante 20, 30 ou 40 anos seguidos, indicando todas as incidencias que se puideron producir e que o proceso de dixitalización reflicte. Desta maneira, o usuario pode ter un coñecemento moi preciso acerca dos que consulta e non caer na incerteza de non saber se obtivo a información que buscaba porque non se atopaba nuns números determinados dun periódico ou porque eses números determinados dun periódico non formaban parte da colección.

Cunha iniciativa destas características, a Subdirección Xeral de Coordinación Bibliotecaria e as Comunidades Autónomas que colaboran no proxecto dan un importante impulso á participación española na iniciativa digital libraries que promove a Unión Europea no seu VII Programa Marco pois cumpren coa totalidade das condicións técnicas requiridas polo proxecto e nalgúns casos, aínda máis, e supoñen un volume verdadeiramente significativo se se establecen as oportunas comparacións con outros proxectos europeos ou incluso extraeuropeos de similares características.

ALTO e outras novas funcionalidades

En agosto de 2009 a Library of Congress por medio da Network Development and MARC Standards Office decidiu adoptar ALTO como norma e creou un comité editorial no que participan as bibliotecas que promoven os maiores proxectos de dixitalización no mundo, CCS Content Conversion Specialists GmbH, British Library, National Library of Finland, University of Kentucky, Library of Congress, Schlukbier Consultants, OCLC, Koninklijke Bibliotheek. E o que é máis importante, imbricalo cun amplo conxunto de normativas, tanto norteamericanas (a través de NISO) como internacionais (a través de ISO e de IFLA). Desde este punto de vista, salienta a posibilidade de empregar METS (Metadata Encoding & Transmission Standard) para, mediante unha extensión, transmitir en forma de metadatos os carácteres presentados e organizados conforme a ALTO.

ALTO permite, por un lado, manter de forma facsimilar a imaxe da prensa dixitalizada e, por outro lado, indicar as coordenadas de todos e cada un dos carácteres recoñecidos nunha páxina, o que posibilita a súa indexación e posterior busca a texto completo.

A posibilidade de intercambiar, empregando METS, información dixital entre distintas bibliotecas comprobouse extraordinariamente útil no caso da Biblioteca Virtual de Patrimonio Bibliográfico onde se fai uso destes metadatos de forma habitual.

Cómpre salientar igualmente a posibilidade de empregar diversos xestores de referencias bibliográficas, por exemplo Zotero, para descargar as descricións e as vínculos ás páxinas grazas á implementación de COinS, estrutura de metadatos que transmite a información e a referencia bibliográfica mediante unha familia de estilos de citas bibliográficas, o que sen dúbida facilita considerablemente o uso por parte de investigadores, especialistas e lectores de todo tipo da amplísima información que xa recolle a Biblioteca Virtual de Prensa Histórica nesta versión 6.0 do programa que a xestiona.

As aproximadamente 5 millóns de páxinas que no 25 de marzo de 2010 recolle a Biblioteca Virtual de Prensa Histórica, data de presentación de Hispana, a través da cal se contribuirá ao gran proxecto Europeana, contan ademais, con novas funcionalidades que se describen superficialmente, tales como as novas ferramentas para a web 2.0 ou a actualización das estruturas de datos ao novo estándar de catalogación MARC 21/RDA.

Tamén se inclúe un novo visor de imaxes que permite a consulta de imaxes como as que se obteñen ao dixitalizar ao seu tamaño orixinal xornais de gran formato

Ver vídeo de presentación en CanalMCU de YouTube

Icono de conformidad con el Nivel Doble-A de las Directrices de Accesibilidad para el Contenido Web 1.0 del W3C-WAI. Este enlace abre una ventana nueva

© Ministerio de Educación, Cultura y Deporte

www.digibis.com