Foto: Chains and life. Henrique Pinto. CC0.
Hur kan man åstadkomma interoperabilitet mellan informationsmängder som finns hos olika kulturarvsorganisationer, vare sig de tillhör arkiv-, bibliotek- eller museisektorn? Vilka är de gemensamma nämnarna? Och går det att länka ihop informationen så att en slutanvändare, som söker efter en viss slags information, enklare kan komma åt den och hitta relevant information på samma tema över domängränserna? Det är exempel på frågor som ställs i Digisams pilotprojekt om aggregering och länkad data, som nu är i full gång. Pilotprojektet beslutades av Digisams styrgrupp redan innan årsskiftet, då Digisam bytte organisationstillhörighet från Riksarkivet till Riksantikvarieämbetet, och vi ser fram emot resultaten. Marie Gustafsson Friberger, PhD i datavetenskap, håller som konsult i projektet.
I veckan hade vi en första workshop med representanter från ABMK-sektorn för att kartlägga modeller och vokabulär som finns idag, och vad dessa faktiskt beskriver. Som förväntat finns det en bred flora modeller. Vi diskuterade också möjligheten att använda modellen CIDOC CRM RDF som gemensam ontologi för kulturarvsinformation, eftersom den skapar förutsättningar för semantiska länkar. Genom CIDOC-CRM, som också är en ISO-standard, strukturas information utifrån händelser och relationer. Till exempel kan en konferens som har gått av stapeln ses som en händelse. Likaså kan skapandet av ett specifikt dokument under konferensen ses som en händelse. Och kopplat till dessa händelser kan man skapa relationer mellan händelserna och annan information, till exempel att en viss person ’deltog under’ konferensen eller att konferensen ’skedde på’ en specifik plats. På så sätt kan en större helhet skapas. För dig som vill fördjupa dig finns en handledning på engelska till standarden här.
Några av de modeller som används idag. Foto: Moa Ranung, CC0.
Ett axplock av diskussionerna handlade om att en analys av användarnas behov och användning av informationen bör komma före eventuella försök att låta modellen styra arbetet framåt i olika domäner (arkiv, bibliotek, museer etc.). Samtidigt ses idén om att kunna aggregera allt i ett och samma format som väldigt intressant, liksom att hitta gemensamma nämnare och kanske besluta om gemensamma förhållningsregler vid strukturering av information för hela ABMK-området. Diskussionerna handlade också i hög grad om hur man idag väljer att strukturera information inom olika domäner. Till exempel kan viss arkivinformation vara svår att koppla till en specifik händelse rent praktiskt. Vikten av infrastruktur togs upp, eftersom sådan är grundläggande för framtida länkningar, liksom frågan om information som inte är tillräckligt gammal och därför hamnar under personuppgiftslagen och sekretesslagen.
I nästa steg kommer tester av öppna verktyg för strukturering av information att göras, och i steg tre diskuterar vi för- och nackdelar med en gemensam API eller SPARQL-endpoint för sökning av distribuerade länkbara data. Projektet kommer att pågå fram till slutet av året, då en slutrapport ska vara färdig.
Moa Ranung