Sammanlänkning av data

b2ap3_thumbnail_kartor.jpg

Kulturarvsinformation har skapats över lång tid och är under ständig förändring. Den digitala utvecklingen har gett oss verktyg för att visa institutionernas samlingar på ett sätt som går utöver fysiska begränsningar och därmed nå en mycket bredare publik än någonsin tidigare. Tekniken har också gett kulturarvsinstitutionerna möjligheter att skapa digitala berättelser och engagera användare på den digitala kulturarvsarenan.

För att kunna öka användbarheten behöver vi fokusera på att strukturera och öka kvaliteten på kulturarvsinformation. Idag finns de tekniska förutsättningarna för detta, men tekniken är bara ett medel och det är viktigt att fokus ligger på vad vi vill uppnå med tekniken och inte på tekniken i sig. Ett grundläggande krav för att öka potentialen i kulturarvsinformationen är användning av standarder.

Det finns flera olika typer av metadatastandarder som idag används för att hantera digital kulturarvsinformation. Metadata som begrepp syftar på den information som beskriver ett objekt, dvs ”data om data” som skapas utifrån de traditioner (för t ex katalogiseringar) som var gällande vid tiden då respektive samling skapades. Det innebär att objekt och dokument som från början kunde vara del av samma samling eller institution idag kan vara splittrade över flera typer av organisationer eller inom olika delar av samma organisation.

På så sätt kan t ex en karta hanteras som ett föremål i ett museisystem med tillhörande metadatastandarder och möjligheter till tillgängliggörande och bevarande, samtidigt som en karta av samma typ hanteras som arkivmaterial med helt andra beskrivningar och enligt andra rutiner och förordningar vid en annan institution.

b2ap3_thumbnail_kartor.jpg

Ett övergripande mål för den nationella digitaliseringsstrategin är att kulturarvsinstitutionerna ska öka digitalisering och tillgängliggörande av den digitala kulturarvsinformationen. Hur vi tillgängliggör och använder information har drastiskt ändrats i och med tillgången till nya digitala metoder, tjänster och verktyg. Idag kan vi föra samman kulturarvsinformation som förvaras på olika institutioner och i olika domäner, men för att med hög kvalitet få ut den fulla potentialen är det fortfarande mycket som behöver göras.

Den digitala informationen skapas och tillgängliggörs idag utifrån de strukturer som har skapats för olika domäner och det finns ett antal olika sökmöjligheter. På en mer generell nivå skapas interoperabilitet i Europeana, men är man intresserad av lite mer specifik information finns det flera sökvägar.

När det gäller arkiv kan man hitta information i Nationella Arkivdatabasen (NAD) och på den europeiska nivån genom Europeiska arkivportalen/Archives Portal Europe. I båda fallen är informationen strukturerad enligt arkivstandarder.

bibliotekssidan är det Libris på nationell och TEL (The European Library) på europeisk nivå som är ingångarna. En samsökningsfunktion har utvecklats för biblioteks- och arkivdata, Sondera.

Museisamlingar görs idag tillgängliga på olika sätt, exempelvis genom museernas hemsidor, museisystemens portaler med information från alla institutioner som använder samma samlingssystem, eller regionala portaler. Hur beskrivningar och metadata ser ut varierar beroende på vilka standarder som används vid institutionerna eller i museisystemen. De museer som levererar metadata till K-samsök gör det i K-samsöks format och informationen blir då sökbar genom applikationen Kringla. Det finns också flera museer i Sverige idag som leverar informationen direkt till Europeana genom olika EU-finansierade projekt. Deras metadata struktureras då enligt LIDO-format.

Att informationen är strukturerad på olika sätt, med metadata som har skapats och hanterats i en rad olika standarder och system, gör att sökningarna inte resulterar i optimala svar. Komplexiteten i detta är en av de bakomliggande orsakerna för det stora intresset för sammanlänkning av information som finns i olika domäner genom den semantiska webbens möjligheter, s k ”länkad öppen data”.

Det finns idag flera initiativ för att lägga ut data som länkbar öppen data i maskinläsbart format (rdf). Även om det finns en del exempel på publicerad länkbar data så finns det få exempel där sammankopplingar har gjorts så att länkad öppen data har skapats.

Auktoritetsfiler som tillgängliggörs online är ett exempel på länkbar öppen data. Stöd för hantering av dessa resurser/källmaterial kan t ex byggas i registreringsprocessen. Det finns initiativ kring detta på europeisk nivå där man bl a har tagit fram en handbok kring hantering av terminologier ”Your terminology as a part of the semantic web: recommendations for design and management”, där rekommendationer kring hantering av terminologier för kulturarvsdata i RDF/SKOS-format finns. För närvarande pågår uppbyggnad av en plattform för hantering av terminologier (auktoritetslistor, tesaurier, m m), ”Terminology Management Platform”, inom ramen för Athena Plus-projektet.

Även om länkad data inte innebär en fullständig optimering av sökmöjligheterna är det ändå ett första steg i sammanlänkningen av idag spridda kulturarvsdata. Maskinläsbarhet ger dessutom fler möjligheter till praktiska tillämpningar, exempelvis i form av virtuella utställningar, applikationer för utbildning, m m.

Sammanfattningsvis finns det ett starkt behov av konceptuell harmonisering av information mellan olika domäner och ett stöd för detta vid registrering och/eller aggregering. Länkbar öppen data i kombination med implementering av vedertagna internationella standarder är ett första steg i den processen.

/Sanja Halling

 

Nätverksgruppen kring EU-projekt

b2ap3_thumbnail_eunatverk.gif

Nätverksgruppen kring EU-projekt handlar om samverkan och kunskapsutbyte om digitalisering, tillgängliggörande och bevarande av digitalt kulturarvsmaterial.
 
Hur kan vi gemensamt dra nytta av erfarenheterna och kunskapen som samlas hos de institutioner som deltar i olika EU-projekt med bäring på digitalt kulturarv? Och vilka strategier kan vi samverka kring för ett ökat deltagande i EU-projekt? Detta har varit utgångspunkterna i nätverksgruppen för EU-projekt som Digisam tagit initiativ till.
 
EU-nätverksgruppen kommer att träffas några gånger per år för att lyfta fram nyttan som uppstår vid samverkan kring kunskaper och erfarenheter av EU-samarbete, bl a vad gäller standarder, mappnings- och aggregeringsfrågor, länkad öppen data, beständiga identifierare, digitalt bevarande, m m. På detta sätt blir nätverket en plattform för kunskapsutbyte, problemlösningar och engagemang i EU-samverkan. Syftet är att diskutera strategiska frågor både ur ett nationellt och europeiskt perspektiv och lägga grunden för framtida projekt.

b2ap3_thumbnail_eunatverk.gif
 
Det projektet som de flesta känner till är EU-kommissionens initiativ Europeana med den snabbt växande sökportalen för digitalt kulturarvsdata, som en mängd olika projekt och aggregatorer levererar data till, men det  finns idag representanter från Sverige i både EU-expertgrupper och EU-finansierade projekt där man satsar betydande resurser på forskning kring digitalisering, digitalt tillgänglighet och bevarande. Dessa samarbeten har utvecklats under längre tid och inte sällan har det utifrån större sammanhang också uppstått flera mindre tematiska projekt.
 
Diskussionerna under de första två nätverksmötena ledde till att gemensamma frågor och samarbetsområden definierades, som t ex:

  • metadatastandarder och format (SPECTRUM, LIDO, mappning, MINT, objekt/dokument.
  • aggregering (poster som saknar bild inte kommer med, relationerna försvinner, hur får man tillbaka berikad data/UGC till databaser, beständiga identifierare)
  • semantiken och terminologier (auktoritetsposter, länkad data, länkad öppen data, m m)

Alla dessa gemensamma frågor och samarbetsområden kommer också att vara en naturlig del i Digisams pågående arbete med modellering av en samordnad informationshantering och digital infrastruktur som vi kommer att berätta mer om i en kommande bloggpost.

/Sanja Halling, Digisam

DISKA-projektet efter inventeringen

b2ap3_thumbnail_6942860334_201d972b5d_c.jpg

Nu har inventeringen av de 24 medverkande myndigheterna genomförts och DISKA-projektet går in i en ny fas. Inventeringen gick ut på att undersöka vilka parallella register som finns på de olika institutionerna. Alltså register som inte är över själva samlingarna utan mer av referensart som skulle kunna fungera som auktoritetslistor. Nu har alltså projektet gått in i ett nytt stadium och en expertgrupp med representanter från alla delar inom kulturarvssektorn har diskuterat fram ett första urval. Parallellt håller ett verktyg på att utvecklas på KTH för att kunna användas för att omvandla dessa register till RDF-format, vilket gör det möjligt att länka dem som öppen data.

Inventeringen resulterade i 122 register, ytterligare fyra register har tillkommit senare. De flesta myndigheterna presenterade fyra register eller färre, några mellan 10 och 15 register och en myndighet presenterade 23 register. Drygt hälften är helt analoga eller delvis analoga, resten är digitala. Se hela listan här (Word-fil, uppdaterad 19 augusti). Expertgruppen har nu gjort ett första urval som vi ska gå vidare med och vi håller på att undersöka de tekniska möjligheterna för dem. Gemensamt för de utvalda registren är att de alla är över personnamn, att de är digitala i någon form och att de kompletterar varandra för att täcka så stor del av kulturarvssektorn som möjligt. Kontaktpersonerna för de aktuella registren på respektive myndighet är kontaktade. Tyvärr finns inte möjlighet att bearbeta alla register inom detta projekt, däremot har vi nu samlat in vad som finns på de olika institutionerna och har en bättre överblick för eventuella framtida projekt. I och med att de utvalda registren blir publicerade kommer det också finnas möjlighet för fler institutioner att använda och länka till dessa öppna resurser. 

 

b2ap3_thumbnail_6942860334_201d972b5d_c.jpg

Dishwashing 1951
Mennonite Board of Missions. Photographs. Illinois, Eureka, Home for the Aged, 1950-1956.
No known copyright restrictions 

 

Vi kommer att presentera det slutliga resultatet och de dokument som rör projektet här på Digisams hemsida, vilket kommer att ske löpande. Vi börjar med en övergripande lista på inventeringens resultat och vilka register som finns på de olika myndigheterna. DISKA-projektet ska vara avslutat till årsskiftet 2014.  

Delrapport till VINNOVA 2013-05-30 (pdf-fil)

Jag vill även passa på att tacka för den kunskap, det engagemang och vänliga mottagande jag fått i samband med mina besök, utan vilket det inte hade varit möjligt att genomföra projektet. 

Med önskan om en trevlig sommar!

/Helena Lundin

DISKA rullar igång

Kopparna diskas, Hotel de Gink ca 1910. Fotograf: okänd, Library of Congress, US (pd)

Vi har tidigare berättat om vårt DISKA-projekt som under 2013 ska leda till att vi alla får tillgång till vissa väsentliga auktoritetslistor som länkbar, öppen data via webben. Projektet inleds med en inventering, och vi är glada att kunna presentera en ny medarbetare som kommer att ansvara för den. Välkommen Helena!

Jag heter Helena Lundin och har idag börjat på mitt nya jobb här på Digisam i projektet DISKA (digitala, semantiska kulturarvsauktoriteter). Mitt arbete går ut på att inventera Digisams 24 medverkande myndigheter på register, listor, databaser, kartotek eller liknande som kan tänkas finnas på personer, organisationer eller annat som inte direkt knyter an till enstaka föremål, men som ändå kan vara intressant för att fördjupa kunskapen om det. Alltså handlar det inte om direkta samlingar utan snarare om parallella register som kanske tidigare använts internt. Till en början kommer jag att undersöka vad som finns och sedan kommer en referensgrupp ta ställning till vad som är intressant att gå vidare med och länka som öppen data. Inventeringen är planerad att ta två månader. Min arbetsplats är på Krigsarkivet, men jag kommer troligen att röra mig ute på de olika myndigheterna mycket.

 

Jag kommer tidigare från museibranschen och har arbetat på flera museer med bland annat katalogisering av museiföremål. Nu närmast har jag dock de senaste tre åren arbetat med en inventering av svenska träleksaker för en kommande utställning med Bard Graduate Center, New York som uppdragsgivare.

 

Har ni några frågor eller andra funderingar kring DISKA-projektet och inventeringen tveka inte att höra av er till mig på helena.lundin@riksarkivet.se.

 

Helena Lundin

 

 

Länkad öppen data-workshop på Riksarkivet

Förra veckan (21 – 25 januari) hölls en workshop på temat öppen länkad data på Riksarkivet i Marieberg. Det hela sparkades igång på måndagen med att riksarkivarie Björn Jordell hälsade alla välkomna. Öppen data-evangelisten Peter Krantz berättade för en fullsatt hörsal vad öppen länkad data är och varför det är bra (Peters presentation finns här).

Peter Krantz visar den femstjärniga modellen för öppen data.

Personal från Kungliga biblioteket, Riksarkivet och Riksantikvarieämbetet arbetade tillsammans under veckan med att öppna och länka samman dataset som är av stort intresse också för många aktörer utanför de tre myndigheterna. Det dataset som det fokuserades mest på var auktoritetsposter (uppgifter om personer och organsiationer) från Riksarkivets NAD och ARKIS.

Arbetet tog avstamp från de poster som fanns både hos KB, RAÄ och RA. Man fokuserade på personposter eftersom dessa ofta är lättare att matcha mot varandra än t ex platser. ”Sven Hedin” på Riksarkivet kan enkelt matchas och identifieras som samma person som KBs ”Sven Hedin”.

Rent praktiskt innebar det bl a att några aukoritetsposter för kända personer länkades till så kallade URIer. En URI är en kodsträng som identifierar en unik resurs. Två stora URI-källor är VIAF och DBPedia. Om vi fortsätter med exemplet ”Sven Hedin” så är NADs post om Sven numera länkad till DBPedias Sven Hedin-URI. Till DBPedia pekar redan ett stort antal länkar från andra öppna datakluster. Genom DBPedia är man säker på att det är samma ”Sven Hedin” som andra som länkat till posten avser.

Under veckan så identifierade man också vilka olika typer av auktoriteter som Riksarkivet har, och man tilldelade dessa typer lämpliga kodspråk, s k ontologier. För auktoritetstypen personer använde man ontologin FOAF (Friend Of A Friend – beskriver personer, deras aktiviteter, och hur de förhåller sig till andra personer och objekt). Förutom FOAF användes SKOS för att beskriva ämnesord och hierarkier, Dublin Core för allmänna bibliografiska begrepp, samt DBPedias egen ontologi för att med dess generella klasser och begrepp beskriva ytterligare detaljer, såsom födelseår och platser.

Matchning av RAs auktoritetstyper med lämpliga ontologier.

Det sattes även upp SPARQL-endpoints till den länkade data från RA som skapats under veckan, samt till RAÄs redan publicerade öppna data. En SPARQL-endpoint låter andra få åtkomst till datat så att t ex samsökningar i många datalager går att göra utan att först behöva importera/aggregera allt till en och samma databas.

Veckan avslutades på fredagen inför en åter smockfull åhörarsal med att Martin Malmsten presenterade vad som hade åstadkommits. Riksarkivarien och riksbibliotekarien var på plats, riksantikvarien hade representation närvarande. Alla tre var eniga om att öppen länkad data är bra och något som ska jobbas med i framtiden. Nu kommer Riksarkivet, Kungliga biblioteket och Riksantikvarieämbetet att gå vidare i arbetet med att publicera länkad öppen data till nytta för användare, informationsförvaltare och samhället i stort.

/Susanne

Auktoriteter för kulturarvsdata, ett steg på vägen

Kvinnor badar i Stilla havet vid Moclips 23 augusti 1913. Fotograf: okänd. University of Washington Libraries/Mountaineers Collection

På Digisam är vi glada att ha fått del av Vinnovas satsning på Öppna datakällor 2012. I projektet DISKA (Digitala Semantiska Kulturarvsauktoriteter) vill vi under 2013 inventera den referensinformation över t ex geografiska namn, historiska personer och organisationer som finns på våra 24 medverkande myndigheter.
Eftersom denna information är av stort potentiellt intresse för många aktörer utanför respektive förvaltande myndighet vill vi, med utgångspunkt i inventeringen, bearbeta och tillgängliggöra sagda uppgifter som öppen rdf-data. På det viset blir de möjliga att sammanlänka med andra öppna reurser och kan komma till nytta i en bredare kontext.

För mer information om beviljade ansökningar, se Vinnova.

Uppdaterad 10/12: Här är ansökan som pdf

Johanna Berg

Workshop om Europas digitala kulturarv

Foto: Caspar Almelander





Den 23 maj 2012 organiserade Digisam tillsammans med EU-projektet Linked Heritage en workshop på Riksarkivet i Stockholm på temat “European Cultural Heritage online. Aggregation and semantic web”. Workshopen samlade ett 70-tal deltagare från över 20 länder.

Workshopen inleddes med ett välkomsttal av Börje Justrell, avdelningschef på IT-avdelningen på Riksarkivet som är den svenska partnerinstitutionen i Linked Heritage-projektet. Börje gjorde en kortare presentation av projektet som har som huvuduppdrag att tillföra den flerspråkiga och tvärsektoriella kulturarvsportalen Europeana nytt material från både offentlig och privat sektor, att höja kvaliteten på den metadata som finns i Europeana och att förbättra sökning, åtkomst och användning av innehållet i Europeana.


Breandán Knowlton, programme manager vid Europeana Foundation, gjorde därpå en presentation av Europeana projektet, som är EU-kommissionens initiativ, och som de flesta idag känner till just genom Europeana, deras snabbt växande sökportal till Europas digitaliserade kulturarv. Breandán fäste uppmärksamheten på vikten av länkad öppen data, vilket förutsätter att de digitala filerna som levereras till Europeana får publiceras med licensiering för fri användning.

Därefter berättade Rolf Källman om Digisam och vårt arbete med samordning av digitalisering, digitalt bevarande och digitalt tillgängliggörande av kulturarvet.

Christophe Dessaux från det franska Kulturministeriet illustrerade aggregeringen av kulturarvsdata till sökportalen Europeana genom exempel från olika europeiska projekt, i synnerhet Linked Heritage-projektet. Exempel på hur data från Sveriges kulturarvsinstitutioner levereras till Europeana gavs av Henrik Summanen från Riksantikvarieämbetet, som berättade om deras K-samsök initiativ, och Peder Andrén från Riksarkivet, som rapporterade om EU-projektet APE-net och den portal för arkivens metadata (Archives Portal Europe) som nu byggs upp för att bl a fungera som aggregator till Europeana.

Diskussionen handlade mycket om användningen av standarder, i första hand LIDO-standarden, som idag anses vara en av de mest använda metadatastandarder bland europeiska museer. LIDO presenterades detaljerat av Regine Stein från German Documentation Center for Art History.

Under workshopens andra tema, semantiska webben, diskuterades det hur sökmöjligheterna till den kulturarvsinformation som idag presenteras via olika söktjänster kan optimeras. Gordon McKenna från CollectionsTrust talade om det arbete med länkad öppen data som man bedriver inom Linked Heritage, och som på sikt kommer att göra det enklare att koppla digitala filer så man lättare får fram relevanta sökresultat vilket underlättar både användningen och återanvändningen av digitalt material. Marie-Véronique Leroi, från det franska Kulturministeriet, berättade om Linked Heritage projektets arbete med terminologier och flerspråkighet för kulturarvssektorn. Samarbetet med Wikipedia diskuterades och Jakob Hammarbäck gjorde en presentation av Wikimedia Sverige.

Alla presentationer från workshopen finns på följande länk.

Workshopen om Europas digitala kulturarv följdes av en mindre workshop kring virtuella utställningar, som anordnades av MICHAEL Culture Foundation working group on innovative services. Där presenterades exempel på virtuella utställningar och hur man arbetar med dessa inom kulturarvssektorn i Europa. Mer information finns på denna länk: workshop om virtuella utställningar.

Workshop i Stockholm: “European Cultural Heritage online. Aggregation and semantic web”

Automatrestaurang omkr år 1905, interiör, Stockholm
Spårvägsmuseets samlingar
                 Photograph by: unknown                       
Digisam – samordningssekretariatet för digitalisering, digitalt bevarande och digitalt tillgängliggörande av kulturarvet organiserar tillsammans med EU-projektet Linked Heritage workshopen “European Cultural Heritage online. Aggregation and semantic web” den 23 maj 2012 på Riksarkivet i Stockholm.

Workshopen har två huvudteman, ”Cultural Heritage Aggregation in Europe” och ”Semantic web”.

I den första delen av workshopen kommer aggregeringen av data till sökportalen Europeana att behandlas, belyst genom exempel från olika europeiska projekt som t.ex. Linked Heritage projektet,APE-net projektet (Archives Portal Europe) samt K-samsök, webbservice och den nationella aggregatorn för musei- och kulturarvsinformation. Vi kommer att diskutera dagens vägar för att lämna data till Europeana, hur man använder sig av standarder och möjligheterna att utveckla aggregeringsprocessen.

Workshopens andra tema tar upp hur kulturarvsinformationen presenteras i söktjänster och på olika portaler idag och på vilket sätt sökmöjligheterna i informationen skulle kunna optimeras. Vi kommer också att diskuterar vilka möjligheter som användningen av öppen länkad data och den semantiska webben har för kulturarvssektorn och hur Wikipedia kan fungera som en aktör i detta sammanhang

Målgruppen för workshopen är dels Linked Heritage-konsortiet och dels alla som arbetar med digitaliseringsfrågorna på kulturarvsinstitutionerna i Sverige.

Workshopen kommer att hållas på engelska.

Ett program kommer att läggas ut inom kort.

Antalet platser är begränsat. Är du intresserad av att delta i workshopen? Skicka i så fall e-post till digisam@riksarkivet.se innan den 14 maj 2012.

Sanja Halling, Digisam

Linked Open Data

I ett tidigare blogginlägg berättade vi om att vi har börjat arbeta med frågor om den semantiska webben och Linked Open Data. Redan under vårt första arbetsmöte stod det klart att det finns mycket kring dessa begrepp som behöver tydliggöras. Det finns få exempel men desto fler frågor. Vad är det som egentligen behövs för att kulturarvsinformationen ska kunna bli en del av länkad öppen data?
Under de senaste åren har digitaliseringsarbetet såväl i Sverige som internationellt handlat mycket om att uppnå en kritisk massa information på Internet bl a för att kunna bygga innehållsrika portaler och tematiska applikationer som drar till sig användarnas intresse.
Idag – när det digitala kulturarvet ökar alltmer – framgår det tydligt att kulturarvsinformationen måste bli presenterad på ett sätt som optimerar potentialen i informationen. Detta innebär bl a att sökning efter kulturarvsinformation på nätet måste övergå från att användarna bara får slumpmässiga sökresultat till att förse dem med sökresultat som är anpassade och strukturerade utifrån individuella sökbehov och sökmönster Det är också viktigt att effekten av den ökande mängden kulturarvsinformation inte ger en mättnadseffekt så att man slutar leta om det man söker inte finns bland de första sökträffarna.  Det fordras alltså fungerande system för att länka information, bygga applikationer och göra sökningar i kulturarvsinformationen så relevanta och användbara som möjligt, och det är just det man försöker uppnå med länkad öppen data. Idag är de praktiska exempel få men visionerna många om vad som skulle uppnås.
Det verkar också råda oenighet kring begreppet länkad öppen data och vad det egentligen innebär i fråga om öppenhet. Det är, som oftast, viktigt att förtydliga begreppen. Vad menas egentligen med att tillgängliggöra kulturarvsinformation på Internet som en del av Linked Open Data? Att använda Internet för att distribuera data är t.ex. inte detsamma som att data blir tillgänglig för alla webbanvändare (även e-post kommunikation sker via nätet).
På samma sätt blir data som tillgängliggörs på Internet inte ”öppen” automatiskt bara för att den finns där, lika lite som det blir möjligt att länka den till annat material. För att vara ”öppen” måste informationen kunna lyftas från sitt ursprungliga sammanhang för att utan hinder användas och återanvändas i andra kontexter. Open data handbok som getts ut av Open Knowledge Foundation beskriver de legala, sociala, och tekniska aspekter av länkad öppen data och ger följande definition: ”Open data is data that can be freely used, reused and redistributed by anyone – subject only, at most, to the requirement to attribute and sharealike”.
Sedan förra året har jag varit engagerad i ett EU-projekt som heter Linked Heritage – Coordination of Standards and Technologies for the enrichment of Europeana. Linked Heritage har som huvuduppdrag att tillföra kulturarvsportalen Europeana nytt material från både offentlig och privat sektor, att höja kvaliteten på den metadata som finns i Europeana och att förbättra sökning, åtkomst och användning av innehållet i Europeana. Arbetet i Linked Heritage grundar sig i stor utsträckning på resultaten från ett tidigare EU-projekt kallat Athena.
Linked Heritage har nyligen gett ut publikationen ” Your terminology as a part of the semantic web recommendations for design and management”, (som kan laddas ner från projektets webbplats). Den vänder sig i första hand till dem som arbetar vid europeiska kulturarvsinstitutioner (framförallt museer) med rekommendationer kring terminologier och flerspråkighet (dvs hur man kan hantera bl a flerspråkigt kulturarvsdata för att göra det möjligt att samma begrepp kan länkas till varandra).
Vikten av att använda sig av vedertagna standarder, metoder och format för det digitaliserade materialet framgår allt tydligare ju mer man fördjupar sig i frågan om förbättrad sökning och åtkomst. Man måste se den övergripande bilden; även om ett visst kulturarvsmaterial är säreget och en egen lösning för standarder eller format vid en första anblick verkar vara att föredra, så är det sällan att föredra i längden. Användning av vedertagna standarder gör det lättare att utveckla kopplingar till datamodeller och att ta del av befintligt arbete med enhetligt standardiserat material som är i ständig utveckling. Allt detta främjar i längden största möjliga tillgång till och användningen av kulturarvsmaterial.
Sättet som kulturarvsinstitutionerna digitaliserar och hanterar sina digitala kulturarvsdata är den viktigaste förutsättningen för att informationen från kulturarvsinstitutioner ska kunna anpassas till att vara en del av Linked Open Data både i Europeana och i den semantiska webben. Med kulturarvslyftet och andra satsningar på digitalisering runt hörnet hastar det att starta en mer omfattande diskussion i frågan.
”Om vi på allvar bestämde oss för att bli avsevärt mycket bättre på att publicera öppen data skulle det innebära fler och bättre tjänster”, sade Anna-Karin Hatt, It- och energiminister, i sitt tal häromdagen på Regional Digital Agenda Skåne och det gäller även tjänster för kulturarvsdata.
/Sanja Halling, Digisam

En mer avancerad form av länkning

Visualiseringsdiagram av Anja Jentzsch 

Semantik – det låter bra och många pratar om det, men vad är det egentligen? För några veckor sedan ordnade vi på Digisam vårt första problemformuleringsmöte på temat. Många som jobbar i kulturarvssektorn har efterlyst verifierade auktoritetslistor till stöd för institutionernas arbete, men listorna gör inte mycket nytta utan sammanhang och det är därför vi behöver tänka semantiskt. Vi kände att vi behövde hjälp med att hitta de gemensamma utvecklingsområdena och formulera de mest trängande behoven på det område inom sektorn som vetter mot semantik och LOD (linked open data).
Efter en innehållsrik dag med smarta deltagare från KB (Göran Konstenius, Martin Malmsten, Miriam Säfström & Lisa Winberg), Riksarkivet (Martin Bjersby & Mårten Johansson) och RAÄ (Henrik Summanen) kan vi konstatera att det finns flera saker att ta tag i. Vi behöver:
  • Sprida kännedom om semantik och LOD i minnessektorn, i linje med Tim Berners-Lee’s guldstjärnor.
  • Arbeta för fler öppet tillgängliga auktoritetslistor för entiteter av gemensamt intresse, i synnerhet historiska personer.
  • Fundera över Wikipedias roll och funktion i ett utbyggt semantiskt informationssystem.
  • Sammanställa konkreta exempel på hur semantifiering och LOD fungerar i praktiken.
Hör gärna av dig om du har synpunkter på hur vi bäst kan jobba tillsammans för att maximera den gemensamma nyttan av den utveckling som redan pågår.
Johanna Berg, Digisam