Linked Open Data

I ett tidigare blogginlägg berättade vi om att vi har börjat arbeta med frågor om den semantiska webben och Linked Open Data. Redan under vårt första arbetsmöte stod det klart att det finns mycket kring dessa begrepp som behöver tydliggöras. Det finns få exempel men desto fler frågor. Vad är det som egentligen behövs för att kulturarvsinformationen ska kunna bli en del av länkad öppen data?
Under de senaste åren har digitaliseringsarbetet såväl i Sverige som internationellt handlat mycket om att uppnå en kritisk massa information på Internet bl a för att kunna bygga innehållsrika portaler och tematiska applikationer som drar till sig användarnas intresse.
Idag – när det digitala kulturarvet ökar alltmer – framgår det tydligt att kulturarvsinformationen måste bli presenterad på ett sätt som optimerar potentialen i informationen. Detta innebär bl a att sökning efter kulturarvsinformation på nätet måste övergå från att användarna bara får slumpmässiga sökresultat till att förse dem med sökresultat som är anpassade och strukturerade utifrån individuella sökbehov och sökmönster Det är också viktigt att effekten av den ökande mängden kulturarvsinformation inte ger en mättnadseffekt så att man slutar leta om det man söker inte finns bland de första sökträffarna.  Det fordras alltså fungerande system för att länka information, bygga applikationer och göra sökningar i kulturarvsinformationen så relevanta och användbara som möjligt, och det är just det man försöker uppnå med länkad öppen data. Idag är de praktiska exempel få men visionerna många om vad som skulle uppnås.
Det verkar också råda oenighet kring begreppet länkad öppen data och vad det egentligen innebär i fråga om öppenhet. Det är, som oftast, viktigt att förtydliga begreppen. Vad menas egentligen med att tillgängliggöra kulturarvsinformation på Internet som en del av Linked Open Data? Att använda Internet för att distribuera data är t.ex. inte detsamma som att data blir tillgänglig för alla webbanvändare (även e-post kommunikation sker via nätet).
På samma sätt blir data som tillgängliggörs på Internet inte ”öppen” automatiskt bara för att den finns där, lika lite som det blir möjligt att länka den till annat material. För att vara ”öppen” måste informationen kunna lyftas från sitt ursprungliga sammanhang för att utan hinder användas och återanvändas i andra kontexter. Open data handbok som getts ut av Open Knowledge Foundation beskriver de legala, sociala, och tekniska aspekter av länkad öppen data och ger följande definition: ”Open data is data that can be freely used, reused and redistributed by anyone – subject only, at most, to the requirement to attribute and sharealike”.
Sedan förra året har jag varit engagerad i ett EU-projekt som heter Linked Heritage – Coordination of Standards and Technologies for the enrichment of Europeana. Linked Heritage har som huvuduppdrag att tillföra kulturarvsportalen Europeana nytt material från både offentlig och privat sektor, att höja kvaliteten på den metadata som finns i Europeana och att förbättra sökning, åtkomst och användning av innehållet i Europeana. Arbetet i Linked Heritage grundar sig i stor utsträckning på resultaten från ett tidigare EU-projekt kallat Athena.
Linked Heritage har nyligen gett ut publikationen ” Your terminology as a part of the semantic web recommendations for design and management”, (som kan laddas ner från projektets webbplats). Den vänder sig i första hand till dem som arbetar vid europeiska kulturarvsinstitutioner (framförallt museer) med rekommendationer kring terminologier och flerspråkighet (dvs hur man kan hantera bl a flerspråkigt kulturarvsdata för att göra det möjligt att samma begrepp kan länkas till varandra).
Vikten av att använda sig av vedertagna standarder, metoder och format för det digitaliserade materialet framgår allt tydligare ju mer man fördjupar sig i frågan om förbättrad sökning och åtkomst. Man måste se den övergripande bilden; även om ett visst kulturarvsmaterial är säreget och en egen lösning för standarder eller format vid en första anblick verkar vara att föredra, så är det sällan att föredra i längden. Användning av vedertagna standarder gör det lättare att utveckla kopplingar till datamodeller och att ta del av befintligt arbete med enhetligt standardiserat material som är i ständig utveckling. Allt detta främjar i längden största möjliga tillgång till och användningen av kulturarvsmaterial.
Sättet som kulturarvsinstitutionerna digitaliserar och hanterar sina digitala kulturarvsdata är den viktigaste förutsättningen för att informationen från kulturarvsinstitutioner ska kunna anpassas till att vara en del av Linked Open Data både i Europeana och i den semantiska webben. Med kulturarvslyftet och andra satsningar på digitalisering runt hörnet hastar det att starta en mer omfattande diskussion i frågan.
”Om vi på allvar bestämde oss för att bli avsevärt mycket bättre på att publicera öppen data skulle det innebära fler och bättre tjänster”, sade Anna-Karin Hatt, It- och energiminister, i sitt tal häromdagen på Regional Digital Agenda Skåne och det gäller även tjänster för kulturarvsdata.
/Sanja Halling, Digisam

Heja Norge! Bruk er bra!

Syttende mai firas i Stongfjorden ca 1910. Foto: Paul Stang (Fylkesarkivet i Sogn og Fjordane)

Förra veckan lanserades en fin norsk rapport om webbpublicering av fotografi. Den heter ”Fotojuss – förarkiv, bibliotek og museumoch har producerats i samarbete mellan de centrala norska kulturarvsmyndigheterna – Nasjonalbiblioteket, Riksarkivet och Kulturrådet. Både publik efterfrågan, allt starkare politiska signaler och interna ambitioner har bidragit till ökat intresse för materialen och skärpt uppmärksamhet på lagens tillämpning. Från en svensk utsiktspunkt blir man nästan avundsjuk när man ser hur tre centrala aktörer på det viset förmått samla sig till ett gemensamt ställningstagande baserat på kulturinstitutionernas samhällsuppdrag.

Norska ABM-institutioner beräknas förvalta omkring 40 miljoner fotografier och användningen har, precis som här hemma, hämmats av den stora osäkerheten om vad man egentligen får göra med dem. Bokens fokus ligger dock inte på förbuden, utan författarna koncentrerar sig på vad som är möjligt, tillåtet och önskvärt.

Huvudbudskapet till den norska kulturarvssektorn är att den bör börja arbetet med de enkla och okomplicerade materialen; foton med utslocknad upphovsrätt och bilder som institutionerna har formella rättigheter till. Man bör vidare kunna acceptera en viss kalkylerad risk, och den som behöver mer specificerad rådgivning kan kontakta norska Nasjonalbibliotekets jurister som har i explicit uppdrag att stödja hela sektorn.

Boken inleds med en övergripande programförklaring och ett tiopunktsprogram (sidan 13) som är precis lika tillämpligt i Sverige. I de följande kapitlen förs utförliga resonemang om upphovsrätt (åndsverksloven) och personskydd (personvern). Det är läsvärt för den specialintresserade men kanhända förvirrande för många svenskar, eftersom lagen på viktiga punkter skiljer sig från svenska förhållanden.

Mest inspirerande är, tycker jag, praxisavsnittet som med autentiska exempel diskuterar de svåra frågor många bildarkivarier står inför i sitt dagliga arbete. Det är inget facit, men ger ändå stöd för bedömningar i linje med lagen.


En evig fråga rör t ex skillnaden mellan fotografisk bild och fotografiskt verk, och Nasjonalbibliotekets jurister slår mycket tydligt fast att den måste avgöras på juridiska och inte fotografiska grunder. Själva existensen av en dubbel reglering tolkar de som att ett verk måste vara något alldeles enastående. Det saknar därför helt betydelse om upphovsmannen är professionell, berömd eller lagt ned tid och pengar på att åstadkomma bilden. Viktigt är att minnas är däremot kravet på individualitet – den unika, personliga, tolkande blickens prägel. Kan man anta att fotot blivit likadant med en annan fotograf är det sannolikt inte fråga om ett verk.

Vidare diskuteras bl a vad som gäller för negativ i relation till kanske kraftigt bearbetade positiv/kopior (alltid samma skyddsklassning), och vad som menas med att en bild offentliggjorts. Etiska frågor tas också upp, med tankeväckande exempel på t ex medicinska dokumentationsbilder och gruppfoton av barn i olika sammanhang. Det är viktigt är att även etiska avgöranden baseras på professionella riktlinjer, det kan ju inte vara det personliga tyckandet som avgör om t ex ett ansikte ska pixlas. Den potentiella skadan av en integritetskänslig publicering är dessutom större än vid en upphovsrättskränkning, eftersom den inte kan göras ogjord och kanske inte heller kompenseras med pengar.

Med Fotojuss har den norska kulturarvssektorn tagit viktiga första steg. Per Olav Torgnesskar, som varit huvudredaktör för boken, understryker att den ska ses som början på en längre process. Den besvarar en del – men långt ifrån alla – frågor. Lagtillämpningen är fortfarande ett svårt område, säger Torgnesskar, och det vi nu måste gå vidare med är i första hand licensieringsfrågorna.

Johanna Berg, Digisam

Samtidigt kan det vara värt att tänka tvärtom att …

Samtidigt kan det vara värt att tänka tvärtom att användning är en förutsättning för bevarandet. Det är osannolikt att någonting kommer att bevaras för evigt utan att det finns tydliga åtminstone principiella ändamål för användning av materialet. Metadatan är viktigt även från den här synvinkeln. Om vi inte kan tänka på realistiska användningsskenarier är det väldigt svårt att skapa duglig metadata.

PÅ sambrukshemsida finsn det också intressant och …

PÅ sambrukshemsida finsn det också intressant och nyttig information i ämnet. Kolla här:http://www.sambruk.se/

Dessutom finns det intressant information från ett tysk projekt med rekommendationer i ämnet (http://www.langzeitarchivierung.de/index.htm). Bäst tycker jag om deras korta faktablad för olika material (http://www.langzeitarchivierung.de/publikationen/handbuch/informationsblaetter.htm). En översättning av dessa skulle vara bra att ha för svenska kulturminnesorganisationer. Projektets rekomendationer har nu blivit en standard i Tyskland: DIN 31645 (http://www.nabd.din.de/cmd;jsessionid=506CAE3C0AFADE3E45377CC00C4D8329.3?level=tpl-art-detailansicht&committeeid=54738855&artid=145158117&bcrumblevel=3&languageid=de)

I ICOMs Commitee CIDOC som arbetar med katalogiserings- och informationförvaltnigsfrågor finns en arbetsgrupp som jobbar kring temat bevarande av digitalt material (http://cidoc.mediahost.org/wg_digital_preservation(en)(E1).xml). CIDOC har sitt årsmöte den 10-14 juni i helsongfors med många punkter som berör hela ert arbetsområde. Mer information finns här: www.cidoc2012.fi.

Hoppas att detta hjälper i ert arbete. Om ni har fler frågor kontakta mig gärna.
Med vänliga hälsningar
Susanne Nickel

susanne.nickel@eskilstuna.se

Bevarande som e…

Bevarande som en förutsättning för användning av det digitala kulturarvet idag och i framtiden.

                                         Photo: Edmund Tse, CC BY 2.0

Det fanns en genomgående samstämmighet i frågan om samordnade lösningar för långsiktigt digitalt bevarande i de svar som inkom från institutioner och myndigheter på regeringens uppdrag om ett underlag för en nationell strategi för digitalisering, elektronisk tillgång och digitalt bevarande.

 

Vi har nu i Digisam börjat utreda vad det är som behövs för de samordnade lösningarna. För ett par veckor sedan samlade vi de som arbetar på Riksarkivet med de här frågorna för att närma oss problemet. Vi tittade bl a på hur man arbetar med dessa frågor idag. På Riksarkivet har man gjort det under lång tid då man redan under 1970-talet började få in digitala leveranser av arkivmaterial från statliga myndigheter.

 

Den första frågan att ta itu med är vad digitalt bevarande egentligen är. Oftast pratar vi i ABMK-området om digitalt långtidsbevarande. Men bakom den termen döljer sig flera olika begrepp och vägval som förutom långsiktiga lösningar även kan handla om bevarande på kort och medellång sikt. Det finns flera olika definitioner på långsiktig digitalt bevarande, ofta beroende på sammanhanget. På LDB-centrums (Centrum för långsiktigt digitalt bevarande) webbplats finns följande definition som jag tycker sammanfattar problematiken på ett bra sätt: ”Långsiktigt bevarande: En tidsperiod längre än livstiden för systemet (hårdvara och mjukvara). Att bevara med sikte på ”nästkommande generationer.” I dag beräknas medellivslängden för digitala system vara mellan tre och sju år.”

 

LDB-centrums definition pekar på det centrala i frågan, att det gäller att förvalta informationen strategiskt så att bevarande av digital information sker med samma målbild som för den analoga informationen. I svensk arkivkontext finns det ingen bortre tidsgräns för de allmänna handlingar som den offentliga förvaltningen ska bevara, då offentlighetsprincipen inte är tidsbegränsad.

En stor del av problemet är att teknikutvecklingen gör att mjuk- och hårdvara inte har någon längre hållbarhet än några år.  Det innebär att man ständigt måste migrera den digitala informationen för att säkra att den kan bevaras för framtiden. För att kunna hantera den i framtiden behöver man också tekniska metadata av olika slag och för att förstå den dessutom inte bara kunskap om innehållet, utan också om t ex struktur och kontext. I arkivsektorn arbetar man ofta med konceptuella modeller som OAIS-modellen där ”arkivpaket” med metadata beskriver både hur informationen ska läsas och den tekniska miljön som den skapades i.

Under senare år har flera EU-projekt haft stor betydelse för arbete med digitalt bevarande, bland annat CASPAR, PLANETS, m m. Riksarkivet har också deltagit i arbetet kring digitalt bevarande i olika europeiska sammanhang bl a som koordinator för PROTAGE, ett forskningsprojekt som handlade om tillämpning av agentteknologi i digitalt bevarande.

I de samtal vi haft hittills med företrädare för institutioner inom kulturarvssektorn har flera uttryckt önskemål om att utreda om en centralt förvaltad molnlösning skulle kunna vara ett alternativ. Det är med stor sannolikhet mer kostnads- och resurseffektivt än att alla institutioner ska lägga resurser på kompetens, personal och att bygga upp egna tekniska lösningar. Men för att en gemensam lösning ska vara möjlig är det oerhört viktigt att definiera vilka behov av bevarande som olika institutioner har för olika typer av material. Annars går det inte att välja rätt bevarandelösning. Allt material digitaliseras inte för att bevaras ”för alltid” men bevarandeaspekten är central innan en digitaliseringsprocess sätts igång. Vi har bara börjat med att försöka greppa den komplexa bevarandefrågan och återkommer i ämnet i takt med att vårt arbete fortskrider.

Arbetar du med digitalt bevarande inom kulturarvssektorn? Skicka oss gärna dina synpunkter!

/Sanja Halling, Digisam

 

 

En mer avancerad form av länkning

Visualiseringsdiagram av Anja Jentzsch 

Semantik – det låter bra och många pratar om det, men vad är det egentligen? För några veckor sedan ordnade vi på Digisam vårt första problemformuleringsmöte på temat. Många som jobbar i kulturarvssektorn har efterlyst verifierade auktoritetslistor till stöd för institutionernas arbete, men listorna gör inte mycket nytta utan sammanhang och det är därför vi behöver tänka semantiskt. Vi kände att vi behövde hjälp med att hitta de gemensamma utvecklingsområdena och formulera de mest trängande behoven på det område inom sektorn som vetter mot semantik och LOD (linked open data).
Efter en innehållsrik dag med smarta deltagare från KB (Göran Konstenius, Martin Malmsten, Miriam Säfström & Lisa Winberg), Riksarkivet (Martin Bjersby & Mårten Johansson) och RAÄ (Henrik Summanen) kan vi konstatera att det finns flera saker att ta tag i. Vi behöver:
  • Sprida kännedom om semantik och LOD i minnessektorn, i linje med Tim Berners-Lee’s guldstjärnor.
  • Arbeta för fler öppet tillgängliga auktoritetslistor för entiteter av gemensamt intresse, i synnerhet historiska personer.
  • Fundera över Wikipedias roll och funktion i ett utbyggt semantiskt informationssystem.
  • Sammanställa konkreta exempel på hur semantifiering och LOD fungerar i praktiken.
Hör gärna av dig om du har synpunkter på hur vi bäst kan jobba tillsammans för att maximera den gemensamma nyttan av den utveckling som redan pågår.
Johanna Berg, Digisam

Digitalisera snabbare!

Analogt biblioteksarbete på den gamla goda tiden, New York Public Library
(No known copyright restrictions) 
Före jul hade jag glädjen att delta i Digitalisera snabbare! ett seminarium om effektiva arbetsflöden för digitalisering, i arrangemang av Anders Söderbäck på Stockholms universitetsbibliotek. Det var spännande att möta universitets- och forskningsbibliotekarier, en för mig ny krets i digitaliseringsarbetet, och på något sätt betryggande att deras frågor och problem var så lika dem jag brukar möta inom andra delar av kulturarvssektorn.
Bland talarna fanns Richard Davies, digital approvals manager på British Library, som berättade om de stora digitaliseringsprojekt som biblioteket driver i samarbete med Google. Han tecknade också bakgrunden i den omsvängning som institutionen gjort från vad Davies kallar exklusiv lyxdigitalisering till bredare, mer storskalig massdigitalisering.
Davies menade att den där exklusiva varianten nog kan vara motiverad när det gäller vissa unikt värdefulla, komplexa och ömtåliga material som t ex Beowulf eller Magna Charta. På svensk botten kan vi jämföra med objekt som Djävulsbibeln eller kanske det Augsburgska konstskåpet.
Men i allmänhet, menar Davies, blir det för dyrt att arbeta på det sättet. Framför allt kostar det för mycket att göra själva urvalet, då kvalificerad personal måste lägga mycket tid på att hämta fram, sortera, bedöma och prioritera objekten innan de kan skickas in i själva digitaliserings­processen. Det betyder höga marginalkostnader och onödigt slitage på både utvalt och nedprioriterat material, och en alltför långsam process för en institution som i sina samlingar har ungefär 14 miljoner böcker.
Därför jobbar British Library nu med digitalisering av större sammanhållna materialkategorier, som t ex brittisk dagspress. I den modellen prioriteras hela samlingar för digitalisering och eventuellt extraarbete kan under processens gång läggas på de objekt som av någon anledning behöver särskild omsorg i form av rengöring, konservering eller informationskomplettering. Mindre resurser ger på det viset mer resultat ut till användarna. Kvantitet vinner alltså över (extremt hög) kvalitet, och det tror jag är bra. Vad tycker du?
Johanna Berg, Digisam

En nationell strategi för digitalisering av kulturarvet

                                      

                                          Fotograf: Ekelund, Gunnar; Spårvagnsmuseets samlingar
                                          No known copyright restrictions

I torsdags fattade regeringen beslut om en nationell strategi för arbetet med att digitalisera, digitalt bevara och digitalt tillgängliggöra kulturarvsmaterial och kulturarvsinformation.  strategin

Det är en strategi som täcker in hela bredden av digitaliseringsfrågorna, från urval till bevarande och användning. I fokus för strategin står de möjligheter som digitalisering ger för användning, delaktighet och medskapande, idag och i morgon och de förutsättningar som krävs för att detta ska vara möjligt.
Alla statliga institutioner som samlar, bevarar och tillgängliggör kulturarvsmaterial och kulturarvsinformation ska ta fram en plan för digitalisering och tillgänglighet. Målen är högt ställda och ska nås inom fastställda ekonomiska ramar.
Digisam, det samordningssekretariat för digitalisering, digitalt bevarande och digitalt tillgängliggörande av kulturarvet, som efter ett regeringsbeslut är inrättat på riksarkivet, har under hösten startat sin verksamhet www.riksarkivet.se/digisam  Sekretariatets roll är beskrivet i det uppdrag som riksarkivet fick i februari i år: Regeringsuppdrag
Att bidra till och i vissa avseenden samordna arbetet med att nå målet för strategin är Digisams viktigaste uppdrag.
Vi som arbetar på Digisam är Rolf Källman, Johanna Berg och Sanja Halling. Vi har ett stort och spännande uppdrag framför oss att driva, samverka, samordna, inspirera och inspireras. Det enda vi säkert vet är att ett nära samarbete med alla er inom och utom kulturarvsområdet, som liksom vi brinner för de här frågorna, är en förutsättning för att vi gemensamt ska nå målen för strategin.
På den här bloggen kommer vi att reflektera över hur arbetet utvecklas.
Vi hoppas att få möta er här och på många andra mötesplatser.