Sammanlänkning av data

Kulturarvsinformation har skapats över lång tid och är under ständig förändring. Den digitala utvecklingen har gett oss verktyg för att visa institutionernas samlingar på ett sätt som går utöver fysiska begränsningar och därmed nå en mycket bredare publik än någonsin tidigare. Tekniken har också gett kulturarvsinstitutionerna möjligheter att skapa digitala berättelser och engagera användare på den digitala kulturarvsarenan.

För att kunna öka användbarheten behöver vi fokusera på att strukturera och öka kvaliteten på kulturarvsinformation. Idag finns de tekniska förutsättningarna för detta, men tekniken är bara ett medel och det är viktigt att fokus ligger på vad vi vill uppnå med tekniken och inte på tekniken i sig. Ett grundläggande krav för att öka potentialen i kulturarvsinformationen är användning av standarder.

Det finns flera olika typer av metadatastandarder som idag används för att hantera digital kulturarvsinformation. Metadata som begrepp syftar på den information som beskriver ett objekt, dvs ”data om data” som skapas utifrån de traditioner (för t ex katalogiseringar) som var gällande vid tiden då respektive samling skapades. Det innebär att objekt och dokument som från början kunde vara del av samma samling eller institution idag kan vara splittrade över flera typer av organisationer eller inom olika delar av samma organisation.

På så sätt kan t ex en karta hanteras som ett föremål i ett museisystem med tillhörande metadatastandarder och möjligheter till tillgängliggörande och bevarande, samtidigt som en karta av samma typ hanteras som arkivmaterial med helt andra beskrivningar och enligt andra rutiner och förordningar vid en annan institution.

b2ap3_thumbnail_kartor.jpg

Ett övergripande mål för den nationella digitaliseringsstrategin är att kulturarvsinstitutionerna ska öka digitalisering och tillgängliggörande av den digitala kulturarvsinformationen. Hur vi tillgängliggör och använder information har drastiskt ändrats i och med tillgången till nya digitala metoder, tjänster och verktyg. Idag kan vi föra samman kulturarvsinformation som förvaras på olika institutioner och i olika domäner, men för att med hög kvalitet få ut den fulla potentialen är det fortfarande mycket som behöver göras.

Den digitala informationen skapas och tillgängliggörs idag utifrån de strukturer som har skapats för olika domäner och det finns ett antal olika sökmöjligheter. På en mer generell nivå skapas interoperabilitet i Europeana, men är man intresserad av lite mer specifik information finns det flera sökvägar.

När det gäller arkiv kan man hitta information i Nationella Arkivdatabasen (NAD) och på den europeiska nivån genom Europeiska arkivportalen/Archives Portal Europe. I båda fallen är informationen strukturerad enligt arkivstandarder.

bibliotekssidan är det Libris på nationell och TEL (The European Library) på europeisk nivå som är ingångarna. En samsökningsfunktion har utvecklats för biblioteks- och arkivdata, Sondera.

Museisamlingar görs idag tillgängliga på olika sätt, exempelvis genom museernas hemsidor, museisystemens portaler med information från alla institutioner som använder samma samlingssystem, eller regionala portaler. Hur beskrivningar och metadata ser ut varierar beroende på vilka standarder som används vid institutionerna eller i museisystemen. De museer som levererar metadata till K-samsök gör det i K-samsöks format och informationen blir då sökbar genom applikationen Kringla. Det finns också flera museer i Sverige idag som leverar informationen direkt till Europeana genom olika EU-finansierade projekt. Deras metadata struktureras då enligt LIDO-format.

Att informationen är strukturerad på olika sätt, med metadata som har skapats och hanterats i en rad olika standarder och system, gör att sökningarna inte resulterar i optimala svar. Komplexiteten i detta är en av de bakomliggande orsakerna för det stora intresset för sammanlänkning av information som finns i olika domäner genom den semantiska webbens möjligheter, s k ”länkad öppen data”.

Det finns idag flera initiativ för att lägga ut data som länkbar öppen data i maskinläsbart format (rdf). Även om det finns en del exempel på publicerad länkbar data så finns det få exempel där sammankopplingar har gjorts så att länkad öppen data har skapats.

Auktoritetsfiler som tillgängliggörs online är ett exempel på länkbar öppen data. Stöd för hantering av dessa resurser/källmaterial kan t ex byggas i registreringsprocessen. Det finns initiativ kring detta på europeisk nivå där man bl a har tagit fram en handbok kring hantering av terminologier ”Your terminology as a part of the semantic web: recommendations for design and management”, där rekommendationer kring hantering av terminologier för kulturarvsdata i RDF/SKOS-format finns. För närvarande pågår uppbyggnad av en plattform för hantering av terminologier (auktoritetslistor, tesaurier, m m), ”Terminology Management Platform”, inom ramen för Athena Plus-projektet.

Även om länkad data inte innebär en fullständig optimering av sökmöjligheterna är det ändå ett första steg i sammanlänkningen av idag spridda kulturarvsdata. Maskinläsbarhet ger dessutom fler möjligheter till praktiska tillämpningar, exempelvis i form av virtuella utställningar, applikationer för utbildning, m m.

Sammanfattningsvis finns det ett starkt behov av konceptuell harmonisering av information mellan olika domäner och ett stöd för detta vid registrering och/eller aggregering. Länkbar öppen data i kombination med implementering av vedertagna internationella standarder är ett första steg i den processen.

/Sanja Halling

 

2 thoughts on “Sammanlänkning av data


Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

*