Objetos culturales y metadatos: hacia la liberación de datos en Wikidata

Jesús Tramullas
Departamento de Ciencias de la Documentación
Universidad de Zaragoza

"Fauconnier, Sandra; Lemmens, Bert; Direickx, Barbara (2015). Wikidata: Flemish art collections, Wikidata and Linked Open Data/Whitepaper. Disponible en:  https://www.wikidata.org/wiki/Wikidata:Flemish_art_collections,_Wikidata... [Consulta: 29/03/2016]".
 
 
Generalmente, los proyectos de desarrollo GLAM se asocian a la liberación de materiales textuales, gráficos o sonoros, que se ponen a disposición de todos los posibles usuarios, bajo licencias libres, sin que existan cortapisas para su reaprovechamiento y uso, sea comercial o no (nota para incautos: poner en el web reproducciones de alta calidad que sólo se pueden usar para disfrute privado e individual no es un proyecto GLAM de liberación y uso de contenidos culturales; puede ser estéticamente agradable, pero resulta baladí).

Sin embargo, en los próximos años se va a apreciar un creciente número de proyectos que van a acompañar a la liberación de contenidos con la liberación de los datos semánticos correspondientes. Y es que las obras culturales, en el entorno digital, no son nada si no van acompañadas de su correspondiente conjunto de metadatos. Europeana lo tuvo claro desde sus mismos inicios: el potencial de uso y reaprovechamiento del patrimonio cultural debía basarse en la publicación y reutilización de los datos semánticos de los objetos, y de los esquemas de datos necesarios para su interpretación1Wikipedia ha desarrollado desde 2012 Wikidata, “una base de datos secundaria libre, colaborativa y multilingüe, que recopila datos estructurados para dar soporte a Wikipedia...”2. El uso de Wikidata crece exponencialmente: es el origen de los grafos que Google presenta como fichas destacadas en sus respuestas, y de la mayoría de las infoboxes de los artículos de Wikipedia. Por definición, Wikidata trabaja con open data3, lo que hace posible la reutilización de datos sin limitaciones.

Al hilo de todo esto, los museos flamencos han sido de los primeros en iniciar un proyecto de integración y aportación de los datos de unos 25.000 objetos culturales de sus colecciones a Wikidata. El proyecto Flemish art collections, Wikidata and Linked Open Data4, iniciado en 2015, es coordinado por el PACKED vzw (Expertisecentrum Digitaal Erfgoer), y en el mismo participan cuatro wikimedistas expertos, seis museos, y dos colecciones virtuales. Como uno de los resultados entregables del proyecto, los participantes publicaron en octubre de 2015 un whitepaper5, que es el objeto de estos párrafos.

El documento se estructura en cuatro partes principales y un anexo. La primera parte se dedica a explicar, a nivel introductorio, los conceptos de WikimediaWikipedia Wikidata (en particular, los dos primeros se confunden a menudo). La parte dedicada a Wikidata es la más extensa y, realmente, resulta ser una concisa y necesaria explicación de Wikidata. Tras explicar lo que es un ítem y sus componentes, entra en materia sobre las características que deben tener los datos. Éstos deben ser (y se incluye textualmente porque es la explicación más clara y concisa):

  • Free, and more specifically licensed under CC0, for easy use, reuse, and manipulation without legal hassles.
  • Notable, as in relatable to entities featured or qualifying to be featured in Wikimedia projects.
  • Referenced, allowing verification of data and publication of multiple values according to different sources.
  • Queryable, enabling tools to perform publication and maintenance processes as automatically as possible.
  • Editable, like the rest of Wikimedia content, which implies that you must be open to integrate improvements on your data.
  • Maintained, as opposed to dumped once and forgotten – Wikidata is here for a long term relationship.

Cada una de estas cuestiones es explicada con mayor detalle en el propio documento. Una vez acabada esta sección, la segunda parte del documento desgrana los beneficios y los costes que estos proyectos tienen para las instituciones participantes. En particular, se debe llamar la atención sobre el apartado dedicado a la “

Loss of data exclusivity”, donde, y se cita textualmente, “Museums distance themselves explicitly from any form of exclusivity over the data they publish to the Wikidata platform. Once the data has been published under CC0, this license is irrevocable. Through Wikidata, museums donate data to society. By doing so, museums discard any possible model of gain/benefit based on making data available for re-use to third parties. Specifically this means for example that a museum can not gain revenue by selling licenses on the collection data.

No deja de resultar curioso, a la par que ridículo, que pueda haber instituciones que se sientan tentadas de hacer negocio con algo como “Autor=Goya, Título=La familia de Carlos IV”, máxime cuando son datos públicos, y tecleados y almacenados merced al uso de dinero público. El análisis muestra que los beneficios para la sociedad son muchos, mientras que el coste es, precisamente, el uso de fondos públicos para producir los datos; un coste que, además, es técnicamente mínimo.

Es importante llamar la atención sobre la licencia elegida:

 CC0 1. Universal Public Domain Dedication6. Se trata de una licencia apropiada para los productos culturales libres, en todos los sentidos, y como tal es señalada por Creative Commons: “The person who associated a work with this deed has 

dedicated the work to the public domain...” Y es que, a veces, se olvida que no todas las licencias CC son libres ni suponen dominio público...

La tercera parte propone un ejemplo de estructura de datos para obras culturales, indicando metadatos obligatorios, opcionales, el elemento correspondiente dentro del esquema general de Wikidata, y unas indicaciones para cada elemento. Incluye, además, una orientación sobre los formatos de fichero que deben usarse para la importación y carga de datos. La conclusión, última parte del documento, es un breve (demasiado breve) resumen de posición. Un último valor añadido es que el documento incorpora como anexo informativo las referencias a las guías de uso de datos abiertos que aplican tres instituciones de gran prestigio, como The Museum of Modern Art (MoMA), The Tate Gallery, y The Smithsonian Cooper-Hewitt, National Design Museum. En su conjunto, un documento que sirve como punto de partida para plantear proyectos deCultural Linked Open Data, y para detenerse a pensar si realmente merece la pena afrontar el descrédito y rechazo que supone la mercantilización del patrimonio cultural.