Archivos en abierto. Sistema de información del patrimonio

1 / OPEN ARCHIVES
2 / OPEN DATA
3 / OPEN SOURCE
4 / LINKED DATA
Los distintos datasets se gestionan
Es un sistema que, además de
Todo la plataforma tecnológica se ha
Se aplican conceptos y técnicas
en un repositorio OAI-PMH
cumplir con los
desarrollado
de
garantiza
accesibilidad
la
y
que
interoperabilidad,
descripción
reutilización
permite
de
todos los registros y sus metadatos
la
e
estándares de
interoperabilidad,
libre
descarga
y
disponibilidad de todos los datos
soluciones
con
open
diferentes
source,
y
la
web
semántica,
Los
con
descriptores de personas, lugares
recursos y medios propios. No se ha
y materias están enlazados a
utilizado ningún software propietario.
VIAF, Geonames y Dbpedia
archivos
en abierto
Sistema de información del patrimonio documental y cultural de Arganda del Rey
El concepto de acceso abierto hace referencia a
“la disponibilidad de los recursos para su acceso,
descarga, copia, distribución, impresión, enlazado
de sus metadatos y, el elemento diferencial
respecto a los sistemas convencionales, los
metadatos
están
normalizados
y
son
recolectables
a
través
de
procesos
automatizados,
facilitando por tanto su
reutilización sin ninguna barrera financiera,
técnica o semántica”
“
Gracias al uso de un repositorio OAI-PMH se
garantiza
la
interoperabilidad
de
los
recursos digitales. Una decidida apuesta por
las soluciones en abierto y con muy bajo
coste de implementación
”
1. INTRODUCCIÓN
El Archivo de la Ciudad de Arganda del Rey conserva los documentos producidos y recibidos
por la administración local a lo largo de sus más de ochocientos años de existencia. Es de los archivos
con fondos de mayor antigüedad de la Comunidad de Madrid (1306). Conserva además un notable
fondo documental, y en muy distintos soportes: bibliográficos, gráficos, audiovisuales, y participa en
los procesos de implantación de la administración electrónica.
Desde sus inicios ha intentado ser un centro innovador en la aplicación de soluciones
tecnológicas. En 1999 fue de los primeros archivos en crear un OPAC que diera acceso web tanto a
los registros descriptivos como a sus imágenes digitales. La Web fue rediseñada en 2006,
incorporando utilidades de las entonces nacientes redes sociales, como un chat en línea para
consultas, o una plataforma de acceso a su a su colección de vídeos documentales que suma en la
actualidad más de 350.000 visitas. En 2012 volvió a renovar por completo su web, siempre con
recursos y medios propios, apostando como eje rector la filosofía open y utilidades de la Web 3.0.
2. ARCHIVOS EN ABIERTO. INTEROPERABILIDAD TÉCNICA Y SEMÁNTICA. WEB 3.0.
En el presente año 2015 se ha ultimado un nuevo proyecto para hacer accesibles todos los datos
y registros con una única hoja de ruta: cumplir los estándares para la descripción e intercambio de
recursos electrónicos y hacer posible la interoperabilidad de todos sus datos, metadatos y recursos
de uso público. Una estrategia que podemos encuadrar dentro de los sistemas open access (acceso
abierto).
Toda la tecnología utilizada es aplicable en cualquier dato de carácter público. La arquitectura
del sistema se articula en torno al protocolo de archivos abiertos para la recolección de metadatos
(OAI-PMH), un tipo de repositorio que ha incrementado exponencialmente la disponibilidad,
accesibilidad y reutilización de los distintos datasets. Es un complemento a la búsqueda en el portal
web convencional, que sigue existiendo, y que se diferencia de la opción de “descarga de ficheros ”
fundamentalmente en que la infraestructura técnica del OAI obliga a cumplir unos requisitos de
normalización para poder acceder a los datasets de su repositorio. Es imprescindible la codificación e
identificación de sus metadatos y disponer de un formato común para los ficheros XML (XML-DC,
XML-EAD y XML-ESE), una información normalizada que hace posible que la institución se convierta
en proveedora de contenidos ya que los datasets pueden ser recolectados automáticamente por
otros portales y agregadores como Hispana, Europeana y OAIster.
Una vez que los datos son “interoperables” y que son reutilizados, la visibilidad de los recursos
digitales de la entidad se multiplica, consiguiendo una difusión y posicionamiento web inimaginable
hace unos años. Se comparten los metadatos, las vías para acceder a la información, pero los
recursos digitales siguen estando alojados en los servidores de la institución, por lo que en ningún
caso se resta visibilidad a la organización. En el trabajo de normalización de los datos se han
vinculado los descriptores a recursos externos y vocabularios estructurados como Geonames
(nombres geográficos) Dbpedia (materias) y VIAF (personas) y a la creación de bases de datos en RDF
(Resource Description Framework). Una contextualización de los registros que nos aproxima a la
Web Semántica y a las técnicas de Linked Open Data.
3. ¿CÓMO FUNCIONA EL PROTOCOLO OAI-PMH?
OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting) es
en
un protocolo para la comunicación de metadatos, nacido inicialmente para la comunicación y acceso
de documentos científicos pero que se ha extendido en los últimos años como un estándar para la
comunicación de metadatos. Podríamos señalar tres características fundamentales del protocolo:
1. Simplicidad: Se concibió bajo la premisa de la sencillez. Los creadores buscaron una fórmula
simple que estuviera al alcance de cualquier potencial implementador.
2. Normalización: Basado en estándares ampliamente utilizados en Internet como son el
protocolo http (HiperText Transfer Protocol) para la transmisión de datos y órdenes y XML
(Extended Markup Language) para la codificación de los metadatos.
3. Recolección. Frente a otros sistemas de agregación de contenidos como la los sistemas
de sindicación de contenidos vía RSS, OAI-PMH ha optado por la recolección de metadatos.
En este caso, existe una entidad, normalmente agregadores de contenidos o empresas
infomediarias que recogen periódica y sistemáticamente todos o parte de los metadatos
expuestos en los distintos OAI y poder así desarrollar servicios de valor añadido.
OAI-PMH sigue el principio de que existen múltiples organizaciones que son potenciales
proveedoras de datos (PD) y que desean compartir su información con múltiples proveedores de
servicios (PS) a través de un protocolo común. Los primeros son entidades que proporcionan los
metadatos de los documentos que gestionan y los segundos son los recolectores o agregadores de
contenidos, que toman los datos con el objetivo de incorporarles algún valor añadido y ofrecerlos a
los usuarios finales. Pueden ser empresas infomediarias o sistemas públicos de difusión como
Hispana (Ministerio de Cultura) o Europeana (Comunidad Europea), o cualquier otra organización
pública o privada que cuente con este tipo de repositorios.
La comunicación entre el proveedor de datos (PD) y el proveedor de servicios(PS) se realiza
utilizando transacciones http para emitir preguntas y obtener repuestas. Mediante estas peticiones
se pueden filtrar y seleccionar el envío de determinados metadatos según determinados criterios
como por ejemplo la fecha de creación de los registros, o una determinada materia o concepto. En
respuesta, el proveedor de datos devuelve un conjunto de registros en formato XML codificado y
estructurado. Las peticiones se emiten a través de los métodos GET y POST del protocolo http,
existen seis tipos de peticiones que se pueden realizar a un repositorio OAI-PMH:
1. Identify: Recupera información sobre el proveedor de datos: nombre, versión del protocolo
que utiliza, dirección del administrador, etc.
[Ejemplo: http://archivo.ayto-arganda.es:8080/repox/OAIHandler?verb=Identify ]
2. ListMetadataFormats: Devuelve la relación de los formatos normalizados de metadatos que
se han utilizado en los datasets del repositorio
[Ejemplo: http://archivo.aytoarganda.es:8080/repox/OAIHandler?verb=ListMetadataFormats
3. ListIdentifiers: Recupera los identificadores o códigos de referencia de los registros. Tiene un
argumento obligatorio (metadataprefix) para especificar el formato de metadatos en el que
se quiere obtener la respuesta. Además permite introducir otros comandos como el rango
de fechas de los datos que queremos recuperar.
Ejemplo: [http://archivo.aytoarganda.es:8080/repox/OAIHandler?verb=ListIdentifiers&metadataPrefix=oai_dc
4. ListRecords: Ofrece una información de conjunto de todos los datos y metadatos del
repositorio.
[Ejemplo: http://archivo.aytoarganda.es:8080/repox/OAIHandler?verb=ListRecords&metadataPrefix=oai_dc ]
5. GetRecord: Recupera un registro concreto. Necesita dos argumentos: identificador del
registro solicitado (identifier) y especificación del formato de metadatos (metadataprefix) .
Ejemplo: http://archivo.aytoarganda.es:8080/repox/OAIHandler?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai
:archivo.aytoarganda.es:1Biblioteca_Digital:e5694e7a-6c12-4bda-b94c-6b662715fa02
6. ListSets: Informa de los dataset que integran el OAI-PMH. Es el más utilizado ya que, además
de dar una visión global del repositorio, se pueden seleccionar los identificadores y los
registros de cada uno de los conjuntos de datos .
Ejemplo: http://archivo.ayto-arganda.es:8080/repox/OAIHandler?verb=ListSets
Hemos utilizado el software open source para la creación de repositorios OAI-PMH
“Repox”, utilizado también por Europeana. A pesar de ser una solución de código abierto no
es el software de este tipo con más instalaciones en España. La práctica totalidad de los OAIPMH en funcionamiento han sido implementados por empresas especializadas. En nuestro
caso ha sido puesto en funcionamiento con recursos y medios propios.
Al tratarse de una solución de código abierto permite la personalización o agregación de
nuevas funcionalidades. Gracias a ello hemos añadido una hoja de estilo XSLT a las respuestas en
XML del OAI. De este modo, se ha conseguido que la presentación de los datos sea accesible para los
navegadores y por tanto mucho más amigable para los usuarios.
XML - RESPUESTA DEL OAI sin hoja de estilo XSLT
XML – RESPUESTA DEL OAI con hoja de estilo XSLT
<?xml version="1.0" encoding="UTF-8" ?>
1.
<oai_dc:dc schemaLocation="http://www.openar
chives.org/OAI/2.0/oai_dc/
http://www.openarchives.org/OAI/2.0/oai_dc.xs
d">
1. <dc:title>El Colegio Imperial,
fundador de una Cátedra en
Arganda</dc:title>
2. <dc:description>El Colegio Imperial,
fundador de una Cátedra en Arganda
34. 319-336. Madrid: Consejo
Superior de Investigaciones
Científicas, 1994</dc:description>
4. EXPLOTACIÓN Y PUBLICACIÓN DE CONTENIDOS
Independientemente de la interoperabilidad de los datos gracias al uso del protocolo OAIPMH, y el acceso a los registros desde plataformas como Hispana, Europeana y el Portal de Archivos
Europeos, el proyecto tenía también como objetivo transformar por completo el sistema de
recuperación del OPAC.
Funcionalidades básicas:
1
Se ha mejorado el OPAC WEB con nuevas soluciones
que permiten realizar filtros y búsquedas sobre los
resultados, búsquedas facetadas, y representación de
la información en tablas y galerías, con las librerías
open source datatables y fisotope
Gestión de imágenes y objetos digitales.
2
Dada la diversidad de tipos de recursos digitales se ha
creado un módulo específico que incorpora: Gestión
de objetos digitales multimedia. Visor de imágenes
multipágina. Visor de imágenes de publicaciones
periódicas.
[open
source:
openseadragon]
Reproductor de vídeo flv y audio. Generación
dinámica de PDFs con datos y metadatos. Posibilidad
de incluir el visualizador de un recurso en una web
externa.
3
Geolocalización de la información sobre mapas
interactivos con utilidades de búsqueda y filtrado,
realizadas íntegramente con Open Source: Open Geo
Suite
4
Multidispositivo. Diseño web adaptable o adaptativo,
conocido por las siglas RWD (Responsive Web Design)
que permite adaptar la apariencia de las páginas web
al dispositivo que se esté utilizando para visualizarla.
5
Generación dinámica de código QR, vinculado a los
enlaces persistentes, que han sido situados en todos
los bienes culturales, y que dan acceso a los registros
descriptivos de cada bien.
6
Geolocalización del usuario y generación de
itinerario, distancia, rutas, etc. utilizando la API de
Google Maps.
7
Generación dinámica de metadatos. XML-EAD / XMLDC /XML-ESE
8
Open Linked data. Incorpora soporte básico para el
reconocimiento y la visualización de enlaces a datos
Linked Open Data procedentes de fuentes como
VIAF, DBpedia, GeoNames y data.bne.es.
Se utilizan tecnologías de Web Semántica utilizando
RDF (Resource Description Framework), el
estándar para la descripción conceptual o modelado
de la información vinculada a recursos web.
9
Interacción con los usuarios. Cada uno de los
registros incorpora un formulario para que los
ciudadanos puedan hacer aportaciones o sugerencias.
10
Bibliografía-Recursos electrónicos. Todos los recursos
bibliográficos que aparecen en las descripciones son
libros virtuales realizados con una adaptación
personalizada del proyecto open source Archive.org,
una iniciativa de Internet Archive.
Ejemplo: http://archivo.aytoarganda.es/digital/object.aspx?id=03000001#page/1+
/mode/2up
11
Realidad aumentada. Se ha comenzado a desarrollar
una APP de realidad aumentada con la herramienta
open source ARToolKit NFT
12
Accesibilidad de todos los recursos desde las más
importantes plataformas como Hispana, Europeana y
el Portal de Archivos Europeos. Por el momento es la
única administración no vinculada a la Administración
General del Estado que está presente, gracias a la
interoperabilidad que proporciona la generación
dinámica de metadatos.
5. ANEXOS
Ver vídeo del proyecto: https://www.youtube.com/watch?v=ECd49BpTd28
. Home: http://archivo.ayto-arganda.es/patrimonio/Index.aspx
. Mapa interactivo: http://geoarchivo.ayto-arganda.es/ga/patrimonio.html
. Búsquedas documentales. http://archivo.ayto-arganda.es/B%C3%BAsquedas.aspx
. Acceso desde Hispana: http://hispana.mcu.es/es/consulta/busqueda.cmd?
. Acceso desde Europeana: http://www.europeana.eu/portal/search.html?
. Acceso desde el Portal de Archivos Europeos: http://www.archivesportaleurope.net/es/
. OAI-PMH: http://hispana.mcu.es/es/recoleccion/datos.cmd?
. Interoperabilidad. Registro tipo con datos enlazados:
http://archivo.ayto-arganda.es/digital/person.aspx?id=009700100001&p=Felipe%20III
http://archivo.ayto-arganda.es/digital/place.aspx?id=DD0001230397&l=Alicante
. Acceso desde Europeana, APP de Europeana e Hispana: