Banderas y Estandartes. Semanario, 1906.

El projecte

Aquest projecte es va iniciar amb dos objectius fonamentals: d'una banda, preservar uns materials bibliogràfics que, per la naturalesa del suport, estan i estaran progressivament en més perill de desaparició, i, d'altra banda, difondre de la manera més àmplia possible uns recursos informatius molt sol·licitats per investigadors i ciutadans en general.

Tot i que no és gaire conegut l'efecte de l'acidesa del paper, fruit de la seva obtenció a partir de la pasta de cel·lulosa, al contacte amb l'aire es degrada fins al punt que en els centres internacionals de preservació i conservació s'anomena foc lent o slow fire a l'efecte que produeix. Si a l'acidesa del paper hi sumem la seva escassa qualitat (ja que s'imprimia per al consum immediat) i el seu ús constant (i l'exposició dels materials a la llum) per part dels usuaris de les hemeroteques, ens trobem amb un problema greu de preservació que fa que la digitalització de la premsa històrica sigui més que aconsellable.

Així doncs, l'any 2003, fruit d'un esforç de planificació cooperativa entre el que era llavors el Ministeri de Cultura i les comunitats autònomes, comencen els treballs de digitalització de premsa històrica, tot i que fins a l'any 2006 la biblioteca no es va presentar al públic. Des de llavors, els treballs de digitalització no han parat i any rere any s'han anat afegint continguts a la col·lecció, de manera que avui dia, agost de 2017, aquesta hemeroteca ofereix 7.541.157 pàgines de 2.369 capçaleres i 4.070 articles que procedeixen de col·leccions de 97 institucions.

La col·lecció comprèn fons de totes les comunitats autònomes escrits en les diferents llengües oficials espanyoles. També hi podem trobar fons publicats en les antigues colònies espanyoles d'Amèrica, d'Àfrica i les Filipines. En molts casos es tracta de col·leccions úniques de gran interès per a investigadors i públic en general. La temàtica de la col·lecció és molt variada; inclou una extensa col·lecció de butlletins oficials, revistes il·lustrades, publicacions satíriques, premsa femenina, revistes culturals modernes, diaris de caire polític, premsa clandestina, etc.


Gerunda. Revista quincenal de ciencias, artes y literatura. 1901.

Característiques tècniques

La Biblioteca Virtual de Premsa Històrica utilitza el programa digital Digibib, de l'empres Digibís SL. Els treballs de digitalització no es limiten a un mer escanejat dels documents; els fons passen un tractament bibliogràfic profund mitjançant el qual se'ls assignen les metadades necessàries per a possibilitar les funcions de cerca i recuperació.

Com a format central de catalogació, la BVPH treballa i carrega els registres en el format MARC 21 (https://www.loc.gov/marc/), utilitzant-ne tres de les variants: MARC 21 bibliogràfic, de fons i d'autoritats.

A partir dels registres en MARC 21, l'aplicació fa automàticament una sèrie de mapatge a diversos formats, de manera que permet als usuaris la descàrrega de les variants de les metadades següents: Dublin Core, Fitxa, ISBD, MODS, MARCXML, MARC etiquetatge, BibTeX, Jisc, METS, EDM, SKOS, ALTO, etc.

Si, com hem dit, per a catalogar les obres es fa servir el format MARC 21, per a carregar els objectes digitals s'usa el format METS (http://www.loc.gov/standards/mets/); per al procés de reconeixement òptic de caràcters, el format ALTO (http://www.loc.gov/standards/alto/), i per a la preservació en el nostre sistema de preservació (http://travesia.mcu.es/portalnb/jspui/handle/10421/9003), el format PREMIS(http://www.loc.gov/standards/premis/).

Pel que fa als formats d'imatge, la BVPH ofereix per a descarregar còpies digitals de difusió en una qualitat mitjana en format JPG i PDF, i per a la preservació fa servir el format TIF.

L'hemeroteca digital ofereix al seu web nombroses opcions de cerca, visualització i descàrrega de continguts que permeten que els usuaris de la BVPH facin una investigació profunda. A més d'aquestes opcions, la BVPH ofereix la possibilitat de cercar els registres mitjançant un servidor SRU (http://prensahistorica.mcu.es/ca/estaticos/contenido.cmd?pagina=estaticos/sru), i amb el protocol OAI-PMH (https://www.openarchives.org/pmh/).

Pel que fa a aquest darrer protocol, la Biblioteca Virtual de Premsa Històrica té un repositori OAI-PMH (http://prensahistorica.mcu.es/i18n/oai/oai.cmd), que permet que els seus registres s'estiguin recol·lectant per mitjà de repositoris o agregadors OAI-PMH com ara Hispana (http://hispana.mcu.es/ca/estaticos/contenido.cmd?pagina=estaticos/presentacion), Europeana (http://www.europeana.eu/portal/es), WordCat (https://www.worldcat.org/), etc. El repositori figura com a proveïdor de dades en el registre de proveïdors OAI-PMH de l'Open Archives Iniciative (http://www.openarchives.org/Register/BrowseSites) i a OAISter (http://www.oaister.org/viewcolls.html).

Pel que fa a la difusió, a banda de les metadades i els objectes digitals, la BVPH ofereix un apartat de notícies i un canal RSS que permet que els usuaris es mantinguin informats de les actualitzacions que es produeixen en l'aplicació o en la col·lecció.


La Física Moderna. Revista mensual ilustrada. 1887.

El format ALTO

Tot i que les primeres versions de la BVPH no oferien l'opció de cercar en el contingut de les publicacions (en el text de les imatges digitalitzades), l'evolució tecnològica i la demanda dels usuaris ens va dur a implementar aquesta funcionalitat que permet cercar qualsevol paraula de qualsevol pàgina de qualsevol diari digitalitzat. Per a fer-ho es va seleccionar el format d'OCR (Optical Character Recognition) ALTO (Analyzed Layout Text Object), un format gratuït i obert que la Library of Congress documenta i manté degudament des de 2009.

El format ALTO permet que s'ofereixi en forma de facsímil la imatge de la premsa digitalitzada i, d'altra banda, per sota, que es registrin en arxius de text els textos i les coordenades d'absolutament tots els caràcters reconeguts en una pàgina, cosa que en possibilita la indexació i permet la cerca en el contingut de les pàgines.

Amb aquesta funcionalitat, el ciutadà té a la seva disposició una eina que li permet la investigació de la premsa històrica, un dels recursos d'informació més rics, variats i característics dels darrers segles, d'una manera molt més profunda i eficient.

 

Veure vídeo de presentació a YouTube