Banderas y Estandartes. Semanario, 1906.

O Proxecto

Este proxecto iniciouse con dous obxectivos fundamentais: por unha banda, preservar uns materiais bibliográficos que, pola propia natureza do soporte, se encontran e se encontrarán cada día en máis grave perigo de desaparición e, por outra, difundir do xeito máis amplo posible uns recursos informativos moi solicitados por investigadores e cidadáns en xeral.

Aínda que non é moi coñecido o efecto da acidez do papel, froito da súa obtención a partir da pasta de celulosa, ao contacto co aire degrádase ata o punto de que nos centros internacionais de preservación e conservación se denomina ‘lume lento’ ou slow fire ao efecto que produce. De sumarmos á acidez do papel a súa escasa calidade (posto que se imprimía para o seu consumo inmediato) e o uso constante (e exposición dos materiais á luz) por parte dos usuarios das hemerotecas, encontrámonos cun grave problema de preservación que fai máis que aconsellable a dixitalización da prensa histórica.

Así, no ano 2003, froito dun esforzo de planificación cooperativa entre o entón Ministerio de Cultura e as comunidades autónomas, comezan os traballos de dixitalización de prensa histórica, pero houbo que esperar ata o ano 2006 para que a biblioteca se presentara ao público. Dende entón, non pararon os traballos de dixitalización e, ano tras ano, foron engadindo contidos á colección, de xeito que hoxe, en agosto de 2017, esta hemeroteca dixital ofrece 7.541.157 páxinas de 2.369 cabeceiras e 4.070 artigos que proveñen de coleccións de 97 institucións.

A colección abrangue fondos de todas as comunidades autónomas escritos nas distintas linguas oficiais españolas; tamén podemos encontrar fondos publicados nas antigas colonias españolas de América, África e Filipinas. Trátase, en moitos casos, de coleccións únicas de grande interese para investigadores e público en xeral. A temática da colección é moi variada e inclúe unha extensa colección de boletíns oficiais, revistas ilustradas, publicacións satíricas, prensa feminina, revistas culturais modernas, periódicos de corte político, prensa clandestina, etc.


Gerunda. Revista quincenal de ciencias, artes y literatura. 1901.

Características técnicas

A Biblioteca Virtual de Prensa Histórica utiliza o programa de biblioteca dixital Digibib, da empresa Digibis S.L. Os traballos de dixitalización non se limitan a un mero escaneado dos documentos, os fondos pasan un profundo tratamento bibliográfico mediante o cal se lles asignan os metadatos necesarios para posibilitar as funcións de busca e recuperación.

Como formato central de catalogación, a BVPH traballa e carga os rexistros no formato MARC21 (https://www.loc.gov/marc/ ), utilizando tres das súas variantes: marc21 bibliográfico, de fondos e de autoridades.

A partir dos rexistros en MARC21, a aplicación realiza automaticamente unha serie de mapeos a diversos formatos, o que permite aos usuarios a descarga de todas estas variantes dos metadatos: Dublin Core, Ficha, ISBD, MODS, MARCXML, MARC etiquetaxe, Bibtex, Jisc, Mets, EDM, SKOS, ALTO, etc.

Se, como dixemos, para catalogar as obras úsase o formato MARC21, para cargar os obxectos dixitais úsase o formato METS (http://www.loc.gov/standards/mets/), para o proceso de recoñecemento óptico de caracteres, o formato ALTO (http://www.loc.gov/standards/alto/) e para a preservación no noso sistema de preservación (http://travesia.mcu.es/portalnb/jspui/handle/10421/9003), o formato PREMIS (http://www.loc.gov/standards/premis/).

En canto aos formatos de imaxe, a BVPH ofrece para a súa descarga copias dixitais de difusión nunha calidade media en formato JPG e PDF, e para preservación utiliza o formato TIF.

A hemeroteca dixital ofrece na súa web numerosas opcións de busca, visualización e descarga de contidos que permiten unha investigación profunda aos usuarios da BVPH. Ademais destas opcións, a BVPH ofrece a posibilidade de buscar os seus rexistros mediante un servidor SRU (http://prensahistorica.mcu.es/gl/estaticos/contenido.cmd?pagina=estaticos/sru), e co protocolo OAI-PMH (https://www.openarchives.org/pmh/).

Respecto a este último protocolo, a Biblioteca Virtual de Prensa Histórica conta cun repositorio OAI-PMH (http://prensahistorica.mcu.es/i18n/oai/oai.cmd), que permite que os seus rexistros estean a ser recollidos por repositorios ou agregadores OAI-PMH, como HISPANA (http://hispana.mcu.es/gl/estaticos/contenido.cmd?pagina=estaticos/presentacion), EUROPEANA (http://www.europeana.eu/portal/es), WordCat (https://www.worldcat.org/), etc.  O repositorio figura como provedor de datos no rexistro de provedores OAI-PMH da Open Archives Iniciative (http://www.openarchives.org/Register/BrowseSites) e en OAISter (http://www.oaister.org/viewcolls.html).

En canto á difusión, á parte dos metadatos e obxectos dixitais, a BVPH ofrece un apartado de novas e unha canle RSS que permite aos usuarios manterse informados das actualizacións que se vaian producindo na aplicación ou na colección.


La Física Moderna. Revista mensual ilustrada. 1887.

O formato ALTO

Aínda que as primeiras versións da BVPH non ofrecían a opción de buscar no contido das publicacións (no texto das imaxes dixitalizadas), a evolución tecnolóxica e a demanda dos usuarios levounos a implantar esta funcionalidade que permite buscar calquera palabra de calquera páxina de calquera periódico dixitalizado. Para iso, seleccionouse o formato de OCR (Optical Character Recognition) ALTO (Analyzed Layout Text Object), un formato gratuíto e aberto e debidamente documentado e mantido pola Library of Congress dende 2009.

 O formato ALTO permite que se ofreza de forma facsimilar a imaxe da prensa dixitalizada e, por outro lado, por debaixo, que se rexistren, en arquivos de texto, os textos e as coordenadas de todos e cada un dos caracteres recoñecidos nunha páxina, o que posibilita a súa indexación e permite a busca no contido das páxinas.

Con esta funcionalidade, o cidadán ten á súa disposición unha ferramenta que lle permite a investigación da prensa histórica, un dos recursos de información máis ricos, variados e característicos dos últimos séculos, dun xeito moito máis profundo e eficiente.


Ver vídeo de presentación en YouTube