Banderas y Estandartes. Semanario, 1906.

El projecte

Aquest projecte es va iniciar amb dos objectius fonamentals: d’una banda, preservar uns materials bibliogràfics que, per la naturalesa del suport, estan i estaran cada vegada en més perill de desaparició, i, d’altra banda, difondre de la manera més àmplia possible uns recursos informatius molt sol·licitats per investigadors i ciutadans en general.

Tot i que no és molt conegut l’efecte de l’acidesa del paper, fruit de la seua obtenció a partir de la pasta de cel·lulosa, al contacte amb l’aire es degrada fins al punt que, als centres internacionals de preservació i conservació, a l’efecte que produeix se l’anomena foc lent o slow fire. Si a l’acidesa del paper sumem la qualitat escassa (ja que s’imprimia per al consum immediat) i l’ús constant (i exposició dels materials a la llum) que en fan els usuaris de les hemeroteques, ens trobem amb un problema greu de preservació que fa que la digitalització de la premsa històrica siga més que aconsellable.

Així doncs, en 2003, fruit d’un esforç de planificació cooperativa entre el que era aleshores el Ministeri de Cultura i les comunitats autònomes, comencen els treballs de digitalització de premsa històrica, tot i que fins a 2006 la biblioteca no es va presentar al públic. Des d’aleshores els treballs de digitalització no han parat i any rere any s’hi han anat afegint continguts a la col·lecció, de manera que hui dia, agost de 2017, aquesta hemeroteca ofereix 7.541.157 de pàgines de 2.369 capçaleres i 4.070 articles que procedeixen de col·leccions de 97 institucions.

La col·lecció comprén fons de totes les comunitats autònomes escrits en les diferents llengües oficials espanyoles. També hi podem trobar fons publicats en les antigues colònies espanyoles d’Amèrica, l’Àfrica i les Filipines. En molts casos es tracta de col·leccions úniques de gran interés per a investigadors i públic en general. La temàtica de la col·lecció és molt variada; n’inclou una d’extensa de butlletins oficials, revistes il·lustrades, publicacions satíriques, premsa femenina, revistes culturals modernes, diaris de caire polític, premsa clandestina, etc.


Gerunda. Revista quincenal de ciencias, artes y literatura. 1901.

Característiques tècniques

La Biblioteca Virtual de Premsa Històrica utilitza el programa digital Digibib, de l’empresa Digibís SL. Els treballs de digitalització no es limiten a un mer escanejat dels documents; els fons passen un tractament bibliogràfic profund mitjançant el qual se’ls assignen les metadades necessàries per a possibilitar-ne les funcions de cerca i recuperació.

Com a format central de catalogació, la BVPH treballa i carrega els registres en el format MARC 21 (https://www.loc.gov/marc/), utilitzant-ne tres de les variants: MARC 21 bibliogràfic, de fons i d’autoritats.

A partir dels registres en MARC 21, l’aplicació fa automàticament una sèrie de mapatges a diversos formats, de manera que permet als usuaris la descàrrega de totes aquestes variants de les metadades: Dublin Core, Fitxa, ISBD, MODS, MARCXML, MARC etiquetatge, BibTeX, JISC, METS, EDM, SKOS, ALTO, etc.

Si, com hem dit, per a catalogar les obres s’usa el format MARC 21, per a carregar els objectes digitals s’usa METS (http://www.loc.gov/standards/mets/); per al procés de reconeixement òptic de caràcters, el format ALTO (http://www.loc.gov/standards/alto/), i per a la preservació en el nostre sistema de preservació (http://travesia.mcu.es/portalnb/jspui/handle/10421/9003), el format PREMIS (http://www.loc.gov/standards/premis/).

Pel que fa als formats d’imatge, la BVPH ofereix per a descarregar còpies digitals de difusió en una qualitat mitjana en format JPG i PDF, i per a la preservació utilitza el format TIF.

L’hemeroteca digital ofereix en la web nombroses opcions de cerca, visualització i descàrrega de continguts que permeten que els usuaris facen una investigació profunda de la BVPH. A més d’aquestes opcions, la BVPH ofereix la possibilitat de buscar els registres mitjançant un servidor SRU (http://prensahistorica.mcu.es/va/estaticos/contenido.cmd?pagina=estaticos/sru), i amb el protocol OAI-PMH (https://www.openarchives.org/pmh/).

Pel que fa a aquest últim protocol, la Biblioteca Virtual de Premsa Històrica té un repositori OAI-PMH (http://prensahistorica.mcu.es/i18n/oai/oai.cmd), que permet que els seus registres s’estiguen recol·lectant per mitjà de repositoris o agregadors OAI-PMH com ara Hispana (http://hispana.mcu.es/va/estaticos/contenido.cmd?pagina=estaticos/presentacion), Europeana (http://www.europeana.eu/portal/es), WordCat (https://www.worldcat.org/), etc. El repositori figura com a proveïdor de dades en el registre de proveïdors OAI-PMH de l’Open Archives Iniciative (http://www.openarchives.org/Register/BrowseSites) i en OAISter (http://www.oaister.org/viewcolls.html).

Pel que fa a la difusió, a banda de les metadades i els objectes digitals, la BVPH ofereix un apartat de notícies i un canal RSS que permet que els usuaris es mantinguen informats de les actualitzacions que es produïsquen en l’aplicació o en la col·lecció. 


La Física Moderna. Revista mensual ilustrada. 1887.

El format ALTO

Tot i que les primeres versions de la BVPH no oferien l’opció de buscar en el contingut de les publicacions (en el text de les imatges digitalitzades), l’evolució tecnològica i la demanda dels usuaris ens va dur a implementar-hi aquesta funcionalitat que permet buscar qualsevol paraula de qualsevol pàgina de qualsevol periòdic digitalitzat. Per a fer-ho es va seleccionar el format d’OCR (Optical Character Recognition) ALTO (Analyzed Layout Text Object), un format gratuït i obert que la Library of Congress documenta i manté degudament des de 2009.

El format ALTO permet que s’oferisca a manera de facsímil la imatge de la premsa digitalitzada i, d’altra banda, per davall, que es registren en arxius de text els textos i les coordenades d’absolutament tots els caràcters reconeguts en una pàgina, cosa que en possibilita la indexació i en permet la cerca en el contingut de les pàgines.

Amb aquesta funcionalitat, el ciutadà té a la seua disposició una ferramenta que li permet la investigació de la premsa històrica, un dels recursos d’informació més rics, variats i característics dels últims segles, d’una manera molt més profunda i eficient.

 

Veure vídeo de presentació en YouTube