Biblioteca Virtual de
Premsa Històrica

Presentació
El projecte
La Biblioteca Virtual de Premsa Històrica constitueix ja un dels principals projectes de digitalització que s'han realitzat a
Espanya i té un pes considerable, a nivell internacional, tant pel seu volum com per les seves funcionalitats.
El projecte és el resultat de la cooperació de la Direcció General del Llibre, Arxius i Biblioteques, a través de la Sotsdirecció
General de Coordinació Bibliotecària, amb les comunitats autònomes, així com diverses institucions de caràcter científic o cultural com
ara universitats, ateneus i fins i tot empreses periodístiques que perviuen a partir de capçaleres fundades en el segle XIX o a
principis del XX.
A data d'avui, setembre de 2009, disposem de gairebé 2.000 capçaleres de 50 biblioteques, corresponents a
gairebé cinc milions de pàgines, de 145 localitats en què es va imprimir premsa.
Es tracta majoritàriament de col·leccions úniques dinterès per a investigadors i públic en general.
Són de temàtica variada i abasten un ampli període històric que es remunta a finals del segle XVIII.
A la base de dades estan representades 16 comunitats autònomes (Andalusia, Aragó, Astúries, Canàries,
Castella-La Manxa, Castella i Lleó, Catalunya, Madrid, Navarra, Comunitat Valenciana, Extremadura, Galícia,
Illes Balears, la Rioja, País Basc i Regió de Múrcia), 47 províncies i 145 localitats. El Ministeri de
Cultura té previst anar incloent progressivament col·leccions de les comunitats autònomes i províncies que
encara no estan representades a la base de dades.
Preservació i difusió
Aquest projecte es va iniciar amb dos objectius fonamentals, per una part, preservar uns materials
bibliogràfics que, per la pròpia naturalesa del suport es troben i es trobaran cada dia més en greu
perill de desaparició i, per un altre, difondre de la manera més àmplia possible uns recursos informatius
molt sol·licitats per investigadors i ciutadans en general.
Encara que no és molt conegut l'efecte de l'acidesa del paper, fruit de la seva obtenció a partir de
la pasta de cel·lulosa, al contacte amb l'aire es degrada enormement fins al punt que des dels centres
internacionals de preservació i conservació es denomina foc lent o slow fire a lefecte que produeix.
A més d'aquesta circumstància de l'acidesa del paper, la seva qualitat en termes generals tampoc
és molt bona ja que quan s'imprimia, en el seu moment, es pensava en un procediment de consum immediat
i no en una previsió de conservació a llarg termini.
Finalment, l'ús constant per part d'investigadors, curiosos i públic en general, ha deteriorat
encara més aquests materials bibliogràfics que ben sovint són no sols els més consultats a les
biblioteques sinó també els més reproduïts, amb el que això suposa de fort impacte de llum en un
material ja de per si fet malbé.
Precisament aquesta demanda del públic, junt amb la precarietat del suport, aconsellava més
que mai utilitzar totes les eines que proporcionen les tecnologies de la informació per a la recerca,
recuperació i visibilitat de la informació i, fins i tot, la reproducció a partir de les còpies
digitals accessibles a la World Wide Web.
Característiques tècniques
Per tant, fou necessari emprendre, junt amb la digitalització en si mateixa dels materials,
un procés complet d'assignació de dades i metadades que facilitessin el recurs de la recerca i
recuperació de la informació en un entorn virtual. Així, al format MARC habitual en les aplicacions
dels sistemes d'informació bibliogràfica se li van afegir, amb distints objectius, un ampli conjunt
d'esquemes de metadades que van des del MARC XML per a la descripció bibliogràfica, al Dublin Core/ISO
15836:2003 per a la recuperació de la informació, als METS
http://www.loc.gov/standards/mets/ per a la transmissió
de les metadades, i fins i tot, als PREMIS http://www.oclc.org/research/projects/pmwg/
per a les polítiques futures de preservació a llarg termini.
Amb l'estàndard MARC21XML s'han catalogat els registres bibliogràfics i els fons i localitzacions
en un nivell que poques vegades apareix reflectit en els catàlegs tradicionals, però que, en aquest cas,
sí que era possible si es feia coincidir la descripció bibliogràfica amb la digitalització i validació de
tots i cada un dels fulls que componen cada exemplar de cada publicació periòdica en els fins a sis nivells
de numeració i cronologia que la normativa MARC preveu basant-se tant en la norma ISO 10324 com
en la Z39.71 de NISO.
La creació dels fitxers d'esquemes Dublin Core permet alimentar o actualitzar permanentment el
repositori OAI-PMH amb els quals compta la Biblioteca Virtual de la Premsa Històrica, el que fa que
sigui recol·lectable pels recol·lectors més importants i, així, figura com data provider a OAI
http://www.openarchives.org/Register/BrowseSites i OAISter http://www.oaister.org/viewcolls.html.
A més, l'estructura d'OAI-PMH i Dublin Core permet que s'estableixin SiteMaps amb els
cercadors com Google o Yahoo, la qual cosa dóna una alta visibilitat no a la base de dades de
la Biblioteca Virtual de la Premsa Històrica, sinó a cadascun dels registres que la componen
i que es poden recol·lectar directament pels cercadors.
També els METS que s'utilitzen per a l'intercanvi de col·leccions de metadades, encapsulant
en ells la descripció de dades en format MARC, les adreces dels fitxers multi-pàgina que componen
el conjunt de les imatges digitals, la gestió dels drets a través de l'esquema METSRigth i, com a
important aportació, els esquemes de metadades PREMIS, es veuen complementats per l'ús d'un servidor
SRU/SRW, pioner a Espanya, després del de la Biblioteca Virtual del Patrimoni Bibliogràfic
http://bvpb.mcu.es, perfectament d'acord amb les iniciatives
internacionals d'accés a la informació que permeten superar l'arquitectura client servidor Z39.50
i que, recentment, s'estan definint per OAIS com un web service més.
Existeix, a més, la possibilitat d'establir importants sinergies entre el repositori OAI i el
servidor SRU i en aquesta línia s'està treballant actualment.
Finalment, cal citar tres importants millores que s'han afegit en l'últim any. Duna banda,
l'accés multilingüe a la informació que si bé és molt visible en la Biblioteca Virtual del Patrimoni
Bibliogràfic no ho és tant en la Biblioteca Virtual de la Premsa Històrica encara que sí es dóna en
els casos en què ha estat possible establir equivalències seguint la normativa MARC i la metodologia
VIAF al projecte.
La segona és la incorporació de fitxers PDF que permeten la consulta diferenciada de la presentació
JPEG i que, per a determinades consultes i finalitats, resulten a vegades més útils.
La tercera és l'inici del projecte d'OCR sotmès lògicament a un estàndard, en aquest cas
METS / ALT que s'utilitza així mateix en els principals projectes de digitalització de premsa
històrica com els realitzats als Estats Units, Regne Unit, França, Holanda o Austràlia.
Molt útils resultaran per a l'usuari els nous sistemes d'agregadors de continguts RSS que
li permetran mantenir-se informat de les actualitzacions que es vagin produint a la base de dades
i que en un futur, i donada l'estratègia de creació de repositoris digitals a tot Espanya, promoguts
per la Sotsdirecció General de Coordinació Bibliotecària i recol·lectats a través del Recol·lector
de col·leccions digitals i recursos electrònics http://hispana.mcu.es,
podran incorporar-se a la biblioteca virtual d'una forma més habitual o més contínua que les, fins ara habituals,
càrregues massives. Lusuari té, per tant, una eina que li permet aproximar-se a un dels recursos d'informació més rics,
ariats i característics de la contemporaneïtat, una veritable sociologia de la quotidianitat que, sens dubte,
estalviarà molt de temps, esforç i diners als usuaris, alhora que permet la pervivència d'uns materials
bibliogràfics particularment fràgils.
Lampli conjunt de nous projectes, nous desenvolupaments i millora de funcionalitats permet predir
que aquesta base de dades creixerà no sols en volum, sinó també en riquesa de maneig, i aconseguirà respectar
dinàmicament els drets de l'usuari a la informació i els drets del document a la seva pervivència.
Per a concloure, cal tornar a fer incidència en la naturalesa completament cooperativa d'aquest projecte,
fruit d'una política de desenvolupament de les el Ministeri de Cultura, a través de la Sotsdirecció General de
Coordinació Bibliotecària, ha donat proves de com un projecte amb objectius i plantejaments coherents sempre
arriba a bon port, que no és un altre, lògicament, que l'usuari del sistema bibliotecari espanyol.
Les col·leccions i els exemplars de les publicacions periòdiques comprenen moltes vegades diverses desenes
d'anys, mantenint-se línies de publicació que no és estrany que superin el mig segle continuat. A diferència d'altres
bases de dades de publicacions periòdiques, s'ha dut a terme una catalogació exhaustiva, full per full, de periòdics
que s'han mantingut en circulació durant 20, 30 o 40 anys continuats on sindiquen totes les incidències que s'han
pogut produir i que el procés de digitalització reflexa. Daquesta manera, l'usuari pot tenir un coneixement molt
precís sobre quins consultar i no caure en l'incertesa de no saber si ha obtingut la informació que cercava perquè
no es trobava en uns números determinats d'un periòdic o perquè aquests números determinats d'un periòdic no formaven
part de la col·lecció.
Amb una iniciativa d'aquestes característiques, la Sotsdirecció General de Coordinació Bibliotecària i les comunitats
autònomes que col·laboren en el projecte donen un important impuls a la participació espanyola en l'iniciativa digital libraries,
que promou la Unió Europea en el seu VII Programa Marc, ja que compleixen amb la totalitat de les condicions tècniques requerides
pel projecte i en alguns casos, encara més, i suposen un volum veritablement significatiu si s'estableixin les oportunes
comparacions amb altres projectes europeus o, fins i tot, extra-europeus de característiques semblants.
Veure vídeo de presentació
© Ministeri de Cultura