

La Biblioteca Virtual de Premsa Històrica constitueix ja un dels principals projectes de digitalització que s'han realitzat a Espanya i té un pes considerable, a nivell internacional, tant pel seu volum com per les seves funcionalitats.
El projecte és el resultat de la cooperació de la Direcció General del Llibre, Arxius i Biblioteques, a través de la Sotsdirecció General de Coordinació Bibliotecària, amb les comunitats autònomes, així com diverses institucions de caràcter científic o cultural com ara universitats, ateneus i fins i tot empreses periodístiques que perviuen a partir de capçaleres fundades en el segle XIX o a principis del XX.
A data d'avui, setembre de 2009, disposem de gairebé 2.000 capçaleres de 50 biblioteques, correspondents a gairebé cinc milions de pàgines, de 145 localitats en què es va imprimir premsa.
Es tracta majoritàriament de col·leccions úniques d’interès per a investigadors i públic en general. Són de temàtica variada i abasten un ampli període històric que es remunta a finals del segle XVIII.
A la base de dades estan representades 16 comunitats autònomes (Andalusia, Aragó, Astúries, Canàries, Castella- La Manxa, Castella i Lleó, Catalunya, Madrid, Comunitat Valenciana, Extremadura, Galícia, Illes Balears, la Rioja, Navarra, País Basc i Regió de Múrcia), 47 províncies i 145 localitats. El Ministeri de Cultura té previst anar incloent progressivament col·leccions de les comunitats autònomes i províncies que encara no estan representades a la base de dades.
Aquest projecte es va iniciar amb dos objectius fonamentals, per una part, preservar uns materials bibliogràfics que, per la pròpia naturalesa del suport es troben i es trobaran cada dia més en greu perill de desaparició i, per un altre, difondre de la manera més àmplia possible uns recursos informatius molt sol·licitats per investigadors i ciutadans en general.
Encara que no és molt conegut l'efecte de l'acidesa del paper, fruit de la seva obtenció a partir de la pasta de cel·lulosa, al contacte amb l'aire es degrada enormement fins al punt que des dels centres internacionals de preservació i conservació es denomina foc lent o slow fire a l’efecte que produeix.
A més d'aquesta circumstància de l'acidesa del paper, la seva qualitat en termes generals tampoc és molt bona ja que quan s'imprimia, en el seu moment, es pensava en un procediment de consum immediat i no en una previsió de conservació a llarg termini.
Finalment, l'ús constant per part d'investigadors, curiosos i públic en general, ha deteriorat encara més aquests materials bibliogràfics que ben sovint són no sols els més consultats a les biblioteques sinó també els més reproduïts, amb el que això suposa de fort impacte de llum en un material ja de per si fet malbé.
Precisament aquesta demanda del públic, junt amb la precarietat del suport, aconsellava més que mai utilitzar totes les eines que proporcionen les tecnologies de la informació per a la recerca, recuperació i visibilitat de la informació i, fins i tot, la reproducció a partir de les còpies digitals accessibles a la World Wide Web.
Gerunda. Revista quincenal de ciencias, artes y literatura. 1901.

Per tant, fou necessari emprendre, junt amb la digitalització en si mateixa dels materials, un procés complet d'assignació de dades i metadades que facilitessin el recurs de la recerca i recuperació de la informació en un entorn virtual. Així, al format MARC habitual en les aplicacions dels sistemes d'informació bibliogràfica se li van afegir, amb distints objectius, un ampli conjunt d'esquemes de metadades que van des del MARC XML per a la descripció bibliogràfica al Dublin Core/ISO 15836:2003 per a la recuperació de la informació, als METS http://www.loc.gov/standards/mets/ per a la transmissió de les metadades, i fins i tot, als PREMIS http://www.oclc.org/research/projects/pmwg/ per a les polítiques futures de preservació a llarg termini.
Amb l'estàndard MARC21XML s'han catalogat els registres bibliogràfics i els fons i localitzacions en un nivell que poques vegades apareix reflectit en els catàlegs tradicionals, però que, en aquest cas, sí que era possible si es feia coincidir la descripció bibliogràfica amb la digitalització i validació de tots i cada un dels fulls que componen cada exemplar de cada publicació periòdica en els fins a sis nivells de numeració i cronologia que la normativa MARC preveu basant-se tant en la norma ISO 10324 com en la Z39.71 de NISO.
La creació dels fitxers d'esquemes Dublin Core permet alimentar o actualitzar permanentment el repositori OAI-PMH amb els quals compta la Biblioteca Virtual de la Premsa Històrica, el que fa que sigui recol·lectable pels recol·lectors més importants i, així, figura com data provider a OAI http://www.openarchives.org/Register/BrowseSites i OAISter http://www.oaister.org/viewcolls.html.
A més, l'estructura d'OAI-PMH i Dublin Core permet que s'estableixin SiteMaps amb els cercadors com Google o Yahoo, la qual cosa dóna una alta visibilitat no a la base de dades de la Biblioteca Virtual de la Premsa Històrica, sinó a cadascun dels registres que la componen i que es poden recol·lectar directament pels cercadors.
També els METS que s'utilitzen per a l'intercanvi de col·leccions de metadades, encapsulant en ells la descripció de dades en format MARC, les adreces dels fitxers multi-pàgina que componen el conjunt de les imatges digitals, la gestió dels drets a través de l'esquema METSRigth i, com a important aportació, els esquemes de metadades PREMIS, es veuen complementats per l'ús d'un servidor SRU/SRW, pioner a Espanya, després del de la Biblioteca Virtual del Patrimoni Bibliogràfic http://bvpb.mcu.es perfectament d'acord amb les iniciatives internacionals d'accés a la informació que permeten superar l'arquitectura client servidor Z39.50 i que, recentment, s'estan definint per OAIS com un web service més.
Existeix, a més, la possibilitat d'establir importants sinergies entre el repositori OAI i el servidor SRU i en aquesta línia s'està treballant actualment.
Finalment, cal citar tres importants millores que s'han afegit en l'últim any. D’una banda, l'accés multilingüe a la informació que si bé és molt visible en la Biblioteca Virtual del Patrimoni Bibliogràfic no ho és tant en la Biblioteca Virtual de la Premsa Històrica encara que sí es dóna en els casos en què ha estat possible establir equivalències seguint la normativa MARC i la metodologia VIAF al projecte.
La segona és la incorporació de fitxers PDF que permeten la consulta diferenciada de la presentació JPEG i que, per a determinades consultes i finalitats, resulten a vegades més útils.
La tercera és l'inici del projecte d'OCR sotmès lògicament a un estàndard, en aquest cas METS / ALT que s'utilitza així mateix en els principals projectes de digitalització de premsa històrica com els realitzats als Estats Units, Regne Unit, França, Holanda o Austràlia.
La Física Moderna. Revista mensual ilustrada. 1887.
Molt útils resultaran per a l'usuari els nous sistemes d'agregadors de continguts RSS que li permetran mantenir-se informat de les actualitzacions que es vagin produint a la base de dades i que en un futur, i donada l'estratègia de creació de repositoris digitals a tot Espanya, promoguts per la Sotsdirecció General de Coordinació Bibliotecària i recol·lectats a través del Recol·lector de col·leccions digitals i recursos electrònics http://hispana.mcu.es podran incorporar-se a la biblioteca virtual d'una forma més habitual o més contínua que les, fins ara habituals, càrregues massives. L’usuari té, per tant, una eina que li permet aproximar-se a un dels recursos d'informació més rics, variats i característics de la contemporaneïtat, una veritable sociologia de la quotidianitat que, sens dubte, estalviarà molt de temps, esforç i diners als usuaris, alhora que permet la pervivència d'uns materials bibliogràfics particularment fràgils.
L’ampli conjunt de nous projectes, nous desenvolupaments i millora de funcionalitats permet predir que aquesta base de dades creixerà no sols en volum, sinó també en riquesa de maneig, i aconseguirà respectar dinàmicament els drets de l'usuari a la informació i els drets del document a la seva pervivència.
Per a concloure, cal tornar a fer incidència en la naturalesa completament cooperativa d'aquest projecte, fruit d'una política de desenvolupament de les col·leccions digitals que, impulsada a l'uníson per les comunitats autònomes i el Ministeri de Cultura, a través de la Sotsdirecció General de Coordinació Bibliotecària, ha donat proves de com un projecte amb objectius i plantejaments coherents sempre arriba a bon port, que no és un altre, lògicament, que l'usuari del sistema bibliotecari espanyol.
Les col·leccions i els exemplars de les publicacions periòdiques comprenen moltes vegades diverses desenes d'anys, mantenint-se línies de publicació que no és estrany que superin el mig segle continuat. A diferència d'altres bases de dades de publicacions periòdiques, s'ha dut a terme una catalogació exhaustiva, full per full, de periòdics que s'han mantingut en circulació durant 20, 30 o 40 anys continuats on s’indiquen totes les incidències que s'han pogut produir i que el procés de digitalització reflexa. D’aquesta manera, l'usuari pot tenir un coneixement molt precís sobre quins consultar i no caure en l'incertesa de no saber si ha obtingut la informació que cercava perquè no es trobava en uns números determinats d'un periòdic o perquè aquests números determinats d'un periòdic no formaven part de la col·lecció.
Amb una iniciativa d'aquestes característiques, la Sotsdirecció General de Coordinació Bibliotecària i les comunitats autònomes que col·laboren en el projecte donen un important impuls a la participació espanyola en l'iniciativa digital libraries, que promou la Unió Europea en el seu VII Programa Marc, ja que compleixen amb la totalitat de les condicions tècniques requerides pel projecte i en alguns casos, encara més, i suposen un volum veritablement significatiu si s'estableixin les oportunes comparacions amb altres projectes europeus o, fins i tot, extra-europeus de característiques semblants.
A l’agost de 2009 la Library of Congress mitjançant la Network Development and MARC Standards Office va decidir adoptar ALTO com a norma i va crear un comitè editorial en el que participen les biblioteques que promouen els majors projectes de digitalització en el món, CCS Content Conversion Specialists GmbH, British Library, National Library of Finland, University of Kentucky, Library of Congress, Schlukbier Consultants, OCLC, Koninklijke Bibliotheek. I el que és més important, imbricar-lo amb un ampli conjunt de normatives, tant nord-americanes (a través de NISO) com internacionals (a través de ISO i de IFLA). Des d’aquest punt de vista, destaca la possibilitat d’utilitzar METS (Metadata Encoding & Transmission Standard) per a, mitjançant una extensió, transmetre en forma de metadades els caràcters presentats i organitzats conforme a ALTO.
ALTO permet, per una banda, mantenir en forma de facsímil la imatge de la premsa digitalitzada i, per una altra, indicar les coordenades de tots i cadascun dels caràcters reconeguts en una pàgina, el que possibilita la seva indexació i posterior cerca a text complet.
La possibilitat d’intercanviar, utilitzant METS, informació digital entre diferents biblioteques s’ha aprovat extraordinàriament útil en el cas de la Biblioteca Virtual del Patrimoni Bibliogràfic on es fa ús d’aquestes metadades de forma habitual.
Convé destacar igualment la possibilitat d’utilitzar diversos gestors de referències bibliogràfiques, per exemple Zotero, per descarregar les descripcions i els vincles a les pàgines gràcies a la implementació de COinS, estructura de metadades que transmet la informació i la referència bibliogràfica mitjançant una família d’estils de cites bibliogràfiques, el que sens dubte facilita considerablement el seu ús per investigadors, especialistes i per lectors de tot tipus de l’amplíssima informació que ja recull la Biblioteca Virtual de Premsa Històrica en aquesta versió 6.0 del programa que la gestiona.
Les aproximadament 5 milions de pàgines que a data de 25 de març de 2010 recull la Biblioteca Virtual de Premsa Històrica, data de la presentació d’Hispana, a través de la qual es contribuirà al gran projecte Europeana, compta a més a més, amb noves funcionalitats que es descriuen somerament, tals com les noves eines per a la web 2.0 o a l’actualització de les estructures de dades al nou estàndard de catalogació MARC 21/RDA.
També s’inclou un nou visor d’imatges que permet la consulta d’imatges com les que s’obtenen al digitalitzar a la mida original periòdics de gran format.