#hack4no

I helgen som var skedde årets #hack4no (Hack4Norway)  på Campus Ringerike i Hønefoss. Hacket samlade över 500 deltagare, och 200 av dem som deltog var barn som deltog i ett junior-hackathon. Arrangörer av hacket var Kartverket och Difi, i brett samarbete med flera andra organisationer.

Deltagarna under #hack4no skapade utifrån tre olika teman: geodata, transport och kultur. Totalt var det 32 lag som deltog i vuxen-hackathonhet, och här  kan du se (i alla fall nästan) alla projekten. Vinnare i kulturspåret blev Skjult  (som betyder ”dolda” på svenska). Laget tog fram en lösning som samlar olika väsen och historier, från folktro, i en digital karta. Målgruppen är främst barnfamiljer och turister som vill lära mer om de väsen och historier som är knutna till de platser de besöker. Laget kommer nu att utveckla sin lösning med stöd av innovationsexperter för att pitcha den under start-up eventet Slush . Samma gäller vinnarna av Hack4Heritage  som tog fram lösningen myMuseum , samt vinnare från #hack4fi  och #hack4dk.

skjult

Vinnarna Skjult CC BY

Andra vinnare från #hack4no är Savemyreindeer , en lösning som meddelar om det finns renar på järnvägen, Farligt godt  som samlar recept för svartlistade arter så att fler kan hjälpa till att äta upp dem, och Askeladden  som är en Chatbot i Facebook som skickar dig omedelbara svar på frågor du har om din resa. Priset för ’beste digitale fortelling’, där jag själv satt med i juryn, gick till Påvei  som gör bilturen till mindre av en transportsträcka genom att spela upp intressanta anekdoter om den omgivning du passerar igenom.

Nu ser vi fram emot Slush och fortsatta diskussioner om hur det nordiska samarbete Digisam ingår i, och som resulterat i hackathon som ökat användningen av öppet digitalt kulturarv, kan fortsätta ge ringar på vattnet.

Moa Ranung

Hack4Heritage – Vårt varmaste tack!

Deltagare i Hack4Heritage. Foto: Fredrik Enoksson, CC BY-SA

Deltagare i Hack4Heritage. Foto:Fredrik Enoksson CC BY Se fler bilder från hacket här.

Den 14-16 oktober skedde Hack4Heritage, ett kreativt event och hack med fokus på öppna kulturarvsdata. Hack4Heritage arrangerades av Digisam i samarbete med Stockholms stadsarkiv och ägde rum i Stadsarkivets lokaler på Kungsklippan. Cirka 60 deltagare lade under helgen fram sammanlagt 13 väldigt spännande och kreativa projekt baserade på öppna kulturarvsdata. Uppdatering: Se projektpitcharna här. Hela 17 svenska organisationer bidrog med kulturarvsdata och deltog i hög grad under hacket, och för det är vi enormt tacksamma. Hack4Heritage är också en del av ett större nordiskt samarbete kring öppna kulturarvsdata, med stöd av Nordic Innovation, så även nordiska och baltiska data kopplades till eventet. Ett särskilt tack till de representanter från estniska kulturarvsorganisationer som valde att ta sig hela vägen till Hack4Heritage!

Öppna data från kulturarvssamlingar gör det möjligt att skapa nya sorters innovativa och oväntade applikationer, lösningar och kreationer. Syftet med Hack4Heritage var att öka tillgången till öppna kulturarvsdata och föra samman en bred samling aktörer för kreativ användning av det, liksom att skapa en plattform för fortsatta samarbeten på nationell och internationell nivå. Under de tre dagarna arbetade deltagarna tillsammans utifrån tre teman: kod, kreation och koncept. De olika teamen hade ett imponerande fokus när de bland annat skissade på idéer, kodade och tog fram prototyper med hjälp av slöjdmaterial. Deltagarna hade också möjlighet att dela under visningar av Stadsarkivet och lära mer om bland annat crowdsourcing, Wikimedia, API:er och CC-licenser.

bollar_horis

På söndagkvällen presenterades vinnarna i Hack4Heritage:

Publikens pris i kategorin ”Kreation” gick till The Voice of Technical Heritage – En lösning baserad på ljud som förhöjer upplevelsen för museibesökare.

Publikens pris i kategorin ”Koncept” gick till Museum Go – Ett spel där användaren får lösa uppdrag i ett museum och samla medaljer. Se prototypen här

Publikens pris i kategorin ”Kod” gick till ChurchSearch – En webbaserad app som visar kyrkor genom geolokalisering. Se demo här

Juryn under Hack4Heritage, bestående av Karin Nelsson, Teo Zetterman och Björn Hagström, valde ut vinnarna av det Nordiska Slush-priset som delades ut i regi av Nordic Innovation. Priset gick till MyMuseum – En lösning bestående av en personaliserad guide till museer. Se video här. Vinnarna kommer nu att få utveckla sin idé med stöd av innovationsexperter för att sedan delta och pitcha sin lösning under start-up eventet Slush i Helsingfors. Vi följer detta med spänning.

Nästa steg består i att vi på Digisam undersöker hur vi kan fånga upp alla resultat från Hack4Heritage på bästa sätt, och diskuterar hur en eventuell fortsättning på det nordiska samarbetet generellt och Hack4Heritage specifikt skulle kunna se ut, vare sig det skulle kunna vara i form av ett hack eller ett annat format. Vi välkomnar självklart alla synpunkter!

Vi på Digisam vill framföra vårt varmaste tack till alla som deltog i och bidrog till Hack4Heritage: Deltagarna, dataleverantörerna, processledarna, Stockholms stadsarkiv, samarbetspartners och sponsorer, juryn, vår eventkoordinator och alla timanställda – Tack för allt ert engagemang och för att ni gjorde dessa dagar till en fantastisk och minnesvärd händelse!

Moa Ranung, projektledare för #Hack4Heritage

Öppna data, förbättra metadata & skapa länkad öppen data – verktyg på nätet

Öppna data

Öppna data är data som vem som helst fritt kan använda, återanvända och distribuera. Att skapa länkade öppna data innebär att data är inte bara öppna, utan även publicerade i ett maskinläsbart format och sammanlänkade med andra datakällor. Öppna data kan användas på många innovativa och oväntade sätt. Samtidigt är det viktigt att förstå hur data ska publiceras online så att användare kan söka, hitta använda och återanvända data i olika tjänster och produkter. Vilka utbildningsmaterial och verktyg finns det för att publicera uppgifter som öppna eller länkade öppna data?

DCAT-AP är en katalogiseringsspecifikation som rekommenderas av EU Kommissionen som en gemensam vokabulär de datamängder som har publiceras som öppna data. Portalen öppnadata.se exponerar de svenska öppna data som tillgängliggjorts med DCAT-AP. Utbildningsmaterial om hur man skapar en beskrivning av sina öppna data med DCAT-AP finns på nätet.

Metadata

Metadata är ”data om data” som beskriver de digitala samlingarna i kulturarvsinstitutioner och struktureras för att informationen ska bli så kvalitativ och användbar som möjligt. Vid olika tillfällen ökar man kvaliteten och användbarheten på informationen genom att den struktureras enligt vedertagna standarder och format. Ofta görs det när metadata från ett system ska migreras till ett annat system eller när informationen ska aggregeras eller på annat sätt exponeras på nätet. I dessa fall krävs det en hel del resurskrävande teknisk utveckling vid institutionerna. Hur kan man förenkla, förbättra och effektivisera strukturering av kulturarvsinformationen med hjälp av tekniska verktyg på nätet?

"Metadata is a love note to the future", Flickr, by cea+, Licens: CC-BY 2.0.

”Metadata is a love note to the future”, Flickr, by cea+, Licens: CC-BY 2.0.

Det finns idag flera olika verktyg för att strukturera (mappa) metadata från ett till ett annat format eller standard. När man ska exponera metadata genom olika aggregeringstjänster (som exempelvis K-samsök eller Europeana) får man stöd för detta arbete genom dessa tjänster. Inom Europeana tittar man nu också på möjligheterna till att institutionerna ska direkt kunna publicera sina metadata som länkbara i Europeana och en pilotstudie har gjorts för att se på effekterna av den typen av aggregering.

För att få stöd vid strukturering av metadata enligt olika format och standarder, finns det idag också verktyg med öppen källkod på Github. Dessa verktyg har ofta även semantiska stödfunktioner, som gör det möjligt att skapa länkad öppen data.

Mappningsfunktioner

3M är ett mappningsverktyg med öppen källkod, som finns på Github. Med 3M kan man omvandla interna strukturerade data från databaser och annan tillhörande kontextuell information till andra scheman. Fält eller element från en källdatabas (Source Nodes) mappas mot en eller flera enheter som beskrivs i målschemat så att data från ett helt system kan transformeras.

B2SHARE är en tjänst som har utvecklats inom ramen för EUDAT-projektet och som har som syfte att stödja synlighet och sökbarhet av information som lagras digitalt. I B2SHARE finns mappningsfunktioner och beständiga identifierare, anpassade till internationella standarder. Det finns möjlighet att hantera informationen under själva överföringen och efteråt. Man behöver inte ladda ner programvara utan tjänsten kan nås online.

MINT är en mappningsfunktion som har utvecklats i de europeiska samarbetsprojekten Athena, Linked Heritage och Athena Plus. Den stödjer mappning av metadata från institutionernas egna modell till LIDO-format samt transformering av poster till Europeana Data Modell (EDM).

Europeana Connection Kit (ECK) är ett verktyg som har utvecklats inom EU-projektet Europeana Inside där man identifierar befintliga arbetsflöden, standarder och verktyg för att kartlägga vilka funktioner som kan förenkla aggregering för institutioner.

Semantiska stödfunktioner och länkade öppna data

Den semantiska webbens möjligheter kan effektivisera de processer som gör informationen sökbar och användbar. Det finns idag flera initiativ kring att både lägga ut data som öppna data, och att göra det  i ett maskinläsbart format (exempelvis RDF), för att göra datat länkbart. Fördelarna med länkbar data är många då ett maskinläsbart format skapar många fler möjligheter till användning, sammanlänkning och återanvändning.

Open refine

OpenRefine är ett gratisverktyg som bygger på öppen källkod och som har använts i en rad LODprojekt inom kulturarvssektorn. Det fungerar också bra för att undersöka sub-set av metadata samt underlättar identifiering och loggning av felstavning och andra brister i katalogen. Mer information om hur man arbetar med metadata i OpenRefine finns i vår checklista för metadatastatus.

Karma

Karma är ett verktyg med öppen källkod som finns på Github och som gör det möjligt för användare att snabbt och enkelt integrera data från olika datakällor, inklusive databaser, kalkylblad, avgränsade textfiler, XML, JSON, KML och Web API. Användarna kan integrera information genom att modellera den enligt en ontologi som de själva väljer, med hjälp av automatiserade processer. Verktyget kan automatiskt generera en ontologimodell som användarna sedan kan justera och därpå publicera som RDF och/eller lagra i en databas.

Data Tank är ett verktyg med öppen källkod som finns på Github. Verktyget gör det möjligt att omvandla datamängder till en HTTP API och beskriva dem med DCAT-AP.

Recogito är ett verktyg med öppen källkod som har utvecklats inom Pelagios Commons. Verktyget är för närvarande tillgänglig för beta-testning, och beräknas vara klar i december 2016. Recogito kan användas både för att för att publicera öppna data och för sammanlänkning med andra datakällor.

Gemensamma resurser gör processerna mer effektiva: teknisk utveckling behöver inte göras hos alla institutioner samtidigt som informationsförvaltarna får ökad kompetens i frågor kring standarder och hantering av digital kulturarvsinformation. Idag hanteras olika digitala samlingar oftast i den domänspecifika standard som är inbyggd i systemet som man använder. Användning av gemensamma verktyg kan därför vara en fördel vid hantering av flera olika typer av information. Både material som är specifik för en institution (t ex arkivhandlingar) och som inte är det (t ex föremål som ibland finns på arkiv, kopplade till handlingar) kan hanteras genom användning av den mest lämpliga standarden. Även interoperabilitet mellan dessa standarder kan byggas in genom användning av samma verktyg.

En del verktyg är mer utvecklade än andra och det behövs en del anpassningar för att få det passa till sina material och sina behov, men det kanske är ett tillfälle där flera institutioner med samma behov av verktyg kan samarbeta med varandra?

Sanja Halling

Auktoritetsfiler och beständiga identifierare i praktiken

Viktor Lundgren CC BY

Foto: Viktor Lundgren CC BY

Vad menas med auktoritetsfiler?

När man ska skapa kopplingar mellan digital information från olika institutioner, domäner och metadatamodeller, kan informationen länkas samman genom så kallade auktoritetsfiler. Det innebär att datakällor som kan vara referenspunkter för beskrivning av information från flera institutioner tillgängliggörs online. Dessa kan t.ex. vara personer, organisationer, platser, händelser, ämnen och liknande data som har att göra med samlingarna men som är av mer generell natur och på så sätt oberoende av kulturarvssektorns olika traditioner av informationshantering. Via dessa data kan man sedan referera till arkiv-, biblioteks- eller museimaterialet.

Auktoritetsfiler är också en lättillgänglig sökingång för den användare som saknar insikt i hur arkiv, bibliotek och museer ordnar sina samlingar. Samtidigt innebär filerna att även om sökbarheten förbättras, så blir det i längden inte så enkelt att få fram relevanta resultat endast med hjälp av dem. Ibland finns också auktoritetsfiler som refererar till olika aspekter av samma företeelse. Till exempel kan en person förekomma i flera olika auktoritetslistor, i olika roller.

Sökandet efter Viktor Lundgren – Ett praktiskt exempel

Som ett praktiskt exempel kan vi nämna att vi inom arbetsgruppen för Riksarkivets pilotprojekt i Västernorrland  valt att länka samman fotografier av fotografen Victor Lundgren. (Se mer information i en tidigare bloggpost ). I Murbergets  samlingssystem hittade vi en hel del fotografier av Viktor Lundgren, bland annat med hästar som motiv. I NAD (Nationella Arkivdatabasen)  fanns det en fotografisamling av Janrik Bromé där vi fick en träff på samma fotograf, Viktor Lundgren, men inte som fotograf utan som motiv på en fotografi. Troligtvis var det ett självporträtt han tog som skulle skickas som julkort, med följande text på kortets baksida: ”God Jul och Gott Nytt år! Tillönskar Viktor Lundgr” (resten saknas).

Men vårt sökande efter fotografen Viktor Lundgren i det nationella fotografregistret i Kulturnav  gav inga träffar, trots att det fanns en auktoritetspost av honom som fotograf inbäddad i en metadatapost från Sundsvall museum. I Kulturnav är det möjligt att samarbeta kring auktoritetslistor, och i arbetsgruppen diskuterade vi om man kan lägga till en auktoritetspost i det nationella fotografregistret. Vi tog kontakt med Kulturnav/Nordiska museet och fick hjälp med att lägga till en auktoritetspost om fotografen Viktor Lundgren i registret, så att vi kunde länka till den. Posten om Lundgren som fotograf länkades även till posten i Libris. Nu dök även en intressant fråga om identifierare upp. I allmänhet bör auktoritetsfiler inte dupliceras, men här fanns det två olika auktoritetslistor. Den ena listan omfattar författare och pekar på Lundgren i sin roll som författare, och den andra, nationella fotografregistret, pekar på Lundgren i hans roll som fotograf. Fotografier av Lundgren fanns även med i Svenska Turistföreningens arkiv på Nordiska museet, men fotografierna i databasen var enbart märkta ”V Lundgren” och hans namn hade följaktligen inte hamnat i registret. Nu när Lundgrens namn fanns i registret kunde även dessa poster och medföljande information kopplas till auktoritetsposten.

När vi fick reda på grundläggande information om Viktor Lundgren kunde vi lätt hitta mycket mer information om honom i NAD, inklusive kyrkoböcker (födelseböcker, sockenbok och länsrättsliga arkiv (bouppteckning). Vi kunde även hitta information om Lundgren som författare och information (och auktoritetsfil) i Libris  och VIAF (Virtual International Authority File).

Och sedan?

Det finns ingen tvekan om att Lundgren bör finnas i flera listor, i sina olika roller, men finns det ett behov av två separata beständiga identifierare? Ska en ”samma som ”-sammanlänkning skapas eller borde identifieraren från Libris/VIAF återanvändas? Tekniskt sett finns det flera vägar att gå, som är delvis beroende av den tekniska plattformen, och det är en intressant fråga att arbeta vidare med framöver.

Sanja Halling

Intervju med Peter Krantz, Kungliga biblioteket

Peter

Peter
Peter Krantz. Foto: Jann Lipka CC BY-SA

Kungliga biblioteket (KB) är en institution som jobbar aktivt med att släppa ut sitt material på webben. Jag ställde några frågor till Peter Krantz, CIO (Chief Information Officer) på KB om varför det lönar sig att jobba med öppna data och hur kulturarvsinstitutioner kan få fler att börja använda det material som finns hos dem.

– Vad kan kulturarvsinstitutionerna göra för att skapa (större) användbarhet för sina data – vad kan vara det första steget?

Det första är att frigöra dem i så stor utsträckning som möjligt. Det möjliggör för fler att använda dem i andra tjänster och sammanhang. Sedan är kulturarvet ojämnt fördelat över många institutioner och genom att samarbeta runt auktoriteter och standarder kan den information vi förvaltar kopplas ihop igen. Då blir det lättare för andra som vill återanvända materialet i tjänster som är relevanta för användarna. Detta kräver dock att vi utgår från några grundläggande gemensamma principer för att undvika att vi bygger silos av information. På KB och andra institutioner försöker vi koppla ihop information genom att arbeta med länkade data/den semantiska webben. Genom att knyta olika ting med personer, ämnesord, platser och händelser blir det lättare att hitta saker som har med varandra att göra.

Ett annat viktigt område är att tydliggöra i organisationen att fritt material ska läggas ut för andra att återanvända. Man kanske känner att informationen inte är komplett eller tillräckligt hög kvalitet men det anser jag är upp till användaren att avgöra.

När det kommer till bildmaterial specifikt så hoppas jag att vi ska kunna göra det ännu enklare att återanvända genom att tillhandahålla det över protokoll som t.ex. IIIF, International Image Interoperability Framework. Det är en specifikation som på ett standardiserat sätt gör det möjligt att använda olika slags klienter för att bläddra i paginerat material, zooma i högupplösta bilder mm. Vi har redan en del material via World Digital Library presenterat på det sättet. Det går redan nu att bädda in och visa det i andra tjänster om man inte vill hantera själva bildfilerna själv.

– På vilket sätt tror du att öppna data från kulturarvsinstitutionerna kan skapa större nytta i samhället?

Med fri information blir det möjligt för andra att bearbeta den på sätt som kanske gör den ännu mer lättillgänglig för forskare och andra som kan skapa ny kunskap. Vi har sett några exempel där frivilliga jobbar med att transkribera bilderna som utgör en handskrift och plötsligt går det att googla och få träff i enskilda sidor i Nicodemus Tessin d.y:s dagbok från 1688.

Många kulturarvsinstitutioner förvaltar ju en omfattande samling källmaterial som t.ex. kan användas för att belägga påståenden i Wikipedia eller på andra ställen. Det kan leda till ny kunskap om vår historia, platser mm. En utmaning är att nyttan ibland uppstår på andra ställen än i de egna tjänsterna. Det kan vara svårt att få reda på hur mycket materialet används på t.ex. Wikipedia eller i andras tjänster. Jag skulle gärna vilja kunna hitta ett sätt att kunna rapportera den typen av återkoppling för att se tydligare var material gör mest nytta.

– Har ni sett några exempel på ny användning av de datakällor som har publicerats som öppna på KBs webb, t ex SOU:er, kartor, m m?

De flesta dataseten vi publicerat har det hänt något med. SOU:erna har laborerats med på flera ställen, bl.a. på det SOU-hack vi arrangerade 2015. Linköpings universitet tog det material vi hade digitaliserat, komibinerade med moderna SOU:er, och lade in rubbet i en SOU-söktjänst. På annat håll gjordes textanalys, geografiska analyser mm.

Stiftelsen Svensk Industridesign och Designfakulteten har återanvänt metadata från oss för att bygga en särskild sökmotor för designforskning. Det visar hur någon som kanske har ett specifikt användarbehov kan skapa en lösning för det när de får tillgång till datamängden. Att bygga en sådan specifik sökmotor är något som vi kanske skulle haft svårt att prioritera på KB.

Tack Peter för olika vinklar och goda exempel!

Susanne Danelius

Arkivinformation + CIDOC CRM = sant?

b2ap3_thumbnail_bild.jpg

Digisam medverkar sedan hösten 2015 i en testplattform som har som syfte att undersöka om en harmonisering av arkivinformation och CIDOC CRM är möjlig, hur förutsättningarna ser ut och hur det kan underlättas av ett stödjande system.

Det finns idag ett starkt behov av ökad kvalitet i metadatabeskrivningar av digital kulturarvsinformation, konceptuell harmonisering av information mellan olika domäner samt tillgängliggörande av samlingar som maskinläsbar och länkbar data. Stödjande verktyg vid registrering behövs för att skapa så enkla och automatiserade processer som möjligt. Länkbar öppen data i kombination med vedertagna internationella standarder, och stödfunktioner för detta är ett första steg mot ökad användning av kvalitativa kulturarvsdata och möjligheten till sammanlänkningar av olika datamängder.

b2ap3_thumbnail_bild.jpgFoto: Adam Rönnlund

Testplattformen i Västernorrland görs inom ett pilotprojekt som koordineras av Riksarkivet och delfinansierat av Kulturrådet och Länsstyrelsen i Västernorrland, där bland annat British Museum deltar som partner. Verktygen som utvecklas inom ramen för detta initiativ kommer att testas, utvärderas och anpassas för att strukturera arkivinformation till CIDOC CRM samtidigt som man behåller hög kvalitet och ökar möjligheter till praktiska tillämpningar genom bl.a.interoperabel länkbar metadata. Beröringspunkterna kring hanteringen av data mellan Research Space på British museum, Murbergets samlingsdatabas och Nationell arkivdatabas (NAD) kommer att analyseras.
 
Ambitionen är också att diskutera olika förslag till utformning av beständiga identifierare (persistent identifiers/PID), dvs unika kodsträngar för identifiering av digitala objekt/webbresurser, i bred samverkan med nationell och internationell expertis. Under våren kommer en workshop om beständiga identifierare att anordnas.

Sanja Halling

CIDOC CRM-workshop i Oxford

Dominic

Under två intensiva dagar förra veckan deltog jag i en workshop i Oxford om hur man kan hantera kulturarvsinformation i CIDOC CRM-modellen.

Workshopen arrangerades av British Museums-projektet Research Space och leddes av Dominic Oldman, Head of ResearchSpace, och Maria Theodoridou, R & D engineer vid Foundation for Research and Technology FORTH.

Dominic

Dominic Oldman. Foto: Sanja Halling CC-0

Dagarna bjöd på många intressanta diskussioner och modelleringar av kulturarvsinformation i CIDOC CRM med kollegor från bl a Ashmolean Museum of Art and Archeology, Bodleian Libraries, Peabody Museum of Archaeology and Ethnology at Harvard University, Pori Art Museum, Yale University, etc.

Verktyget som användes under kursen var 3M, ett verktyg med öppen källkod som är särskilt utformat för att stödja semantiska mappningar till rikare ontologier och CIDOC Conceptual Reference Model utan att det är nödvändigt att förstå alla tekniska element. I 3M kan man, utan alltför avancerade tekniska förkunskaper, mappa kulturarvsinformation till CIDOC CRM och i samarbete med andra även skapa länkbara data och semantiskt integrera information med andra datakällor. På så sätt harmoniserar man kulturarvsinformation och gör den relevant och användbar för en bredare publik.

Tavla

Mappning pågår. Foto: Sanja Halling CC-0

Varför mappa informationen överhuvudtaget – räcker det inte att bara lägga ut all rådata som länkbar? Utifrån ett antal konkreta exempel blev det tydligt att ”digital argument requires context”, dvs vi behöver vara överens om vad vi menar med vissa begrepp, och för att enas om betydelsen är kontexten nödvändigt. Vad betyder det t ex när ett löst begrepp som ”type” är definitionen på en metadatapost som beskriver ett museiföremål? För att veta vad som avses behövs en utvecklad modell samt dokumentation som man kan gå till när man är osäker på hur man ska göra. Annars kan ”typen” av information bli allt från beskrivning av databärare till bilden av objektet, ämnesbeskrivning, m m.

Vi fick också testa själva att beskriva informationen i CIDOC CRM på ett antal praktiska exempel från bland annat British Museum samt på vårt eget material.

Allt som allt var det två spännande och konstruktiva dagar med nya initiativ som togs på många områden. Det kommer att bli mycket spännande att se hur resultatet av dessa projekt blir.

Riksarkivet medverkar också i initiativet CultureBroker, delfinansierat av Kulturrådet och Länsstyrelsen i Västernorrland som under hösten 2015, i en testbädd, kommer att undersöka om en harmonisering av arkivinformation och CIDOC CRM-modellen är möjlig och hur förutsättningarna för detta ser ut.

Sanja Halling

Rapport från NordLOD-möte 24-25 september

b2ap3_thumbnail_hacknrm.jpg

b2ap3_thumbnail_hacknrm.jpg

Foto: J. Berg. CC 0.

I slutet på september samlades folk från olika nordiska kulturarvsinstitutioner för ett två-dagars nordLOD-möte på Naturhistoriska Riksmuseet i Stockholm. Nätverket nordLOD – uttytt Nordisk Länkad Öppen Data eller Nordic Linked Open Data  – startade våren 2013 med en konferens i Malmö. Sedan gick stafettpinnen vidare till Norge år 2014 och konferensen ”Å sikte mot stjernene” på Gardemoen i Oslo. Nätverket syftar till ett utbyte av kunskaper, erfarenheter och uppdateringar om pågående projekt etc i de nordiska länderna, samt att titta på möjligheterna att länka samman nordiska dataset.

Dagarna i Stockholm hade ingen fast agenda utan deltagarna bestämde på plats vad mötet skulle handla om. Efter en inledande runda där de som ville fick presentera sina dataset och verktyg så bildades mindre samtalsgrupper utifrån de närvarandes intressen. T ex så bildades två grupper kring Wikidata respektive KulturNav för att bland annat diskutera hur dessa skulle kunna fungera som gemensamma resurser för kulturinstitutionerna.  Andra ämnen som det pratades om var internationella gränsöverskridanden, geodata, och hur man bäst missionerar för LOD på sin institution.

En grupp diskuterade planerna på ett NordHack 2016. Sessionen inleddes med korta dragningar om hur de tre senaste nordiska hackathonen gått till: Jacob Wang, Nationalmuseet, var med på Skype och presenterade Hack4DK, Sidsel Hindal, Kultur- og Naturreise, berättade om Hack4NO och Susanna Ånäs, WMFI, talade om Hack4FI. Sedan vidtog en fri diskussion som sökte besvara frågorna när, var, hur och vem? Ett förslag var att inte bara engagera datakunniga personer till hacket utan även t ex forskare och konstnärligt verksamma. Fysiskt sett skulle eventet kunna hända enbart online, eller mer traditionellt att alla samlas på ett ställe, eller att det kan göras som en form av stafett – land för land – med en uppsamling på slutet. Många förslag var uppe och vändes. Vi hoppas vi kan återkomma snart med mer konkreta planer och den som är intresserad av att bidra/delta är välkommen att höra av sig!

Fler bloggposter om nordLOD-träffen finns att läsa här:  Sarah McSeveny-Åril (Kultur- och Naturreise)  och Jessica Parland von Essen (Open Science and Research Initiative)

Susanne Danelius

Rapport från Digital Humanities-kurs i Oxford

Oxford

Oxford

Oxford. Foto: Howard Stanbury CC BY-NC-SA

Den 20 – 24 juli deltog jag och Sanja Halling i kursen Digital Humanities i Oxford, England. Kursen arrangerades av Oxford Universitet och handlade om digital humaniora – om hur man kan använda digital teknik i arbetet med kulturarvet. Ämnen som togs upp var bl a länkad öppen data, crowdsourcing, hantering av digitala bilder, och TEI (text encoding initiative).

Kursens upplägg var lagom intensivt med föreläsningar på morgonen och workshops resten av dagen. Föreläsarna kom i huvudsak från olika engelska universitet. Bland talarna fanns Chris Powell från Ashmolean Museum som talade om korruption av bildfiler – hur det slår mot olika format, hur man upptäcker felen och vad man kan göra åt det.

hyning.jpg

Victoria Van Hyning, Zooniverse. Foto: S. Danelius. CC-0

Victoria Van Hyning från Zooniverse/University of Oxford berättade om deras arbete med crowdsourcing och hur man gör för att få folk intresserade och engagera sig. Hon rekommenderade att man ska vara tydlig med att förklara hur resultatet kommer till nytta och att det man gör verkligen hjälper forskningen. Ett annat tips var att inte göra uppgifterna för svåra eller tidskrävande – så kallade ’microtasks’ är bra  – eftersom användaren fort kan komma igång och snabbt skapa resultat. Ett exempel på microtasks finns i projektet ”Operation War Diary”, där man uppmanas att hjälpa till att tolka dagböcker från Första Världskriget genom att transkribera datum, platser eller namn, och inte hela dagbokssidan.

Det fanns åtta olika spår man kunde välja när det gällde workshopparna. Vi hade valt ett som innebar mycket praktiskt arbete: Linked data for the humanities. Här tog man upp koncept och teknologier bakom den semantiska webben, till exempel RDF, SPARQL, vokabulärer och ontologier.  Vi gick igenom hela processen från databasdump till färdig länkad data. Lärarna tipsade om lämpliga verktyg, till exempel Morph Semantic Converter, Gruff  – A triple-store browser, och Karma.

Här finns filmerna från föreläsningarna

Nästa år kommer kursen att hållas 4 -8 juli. Se mer information på kursens hemsida.

Susanne Danelius

Checklista för beständiga identifierare – Vad ska jag tänka på?

Medaljer

Medaljer

Medaljer. Marinmuseum Karlskrona. Ett urval av medaljer från ur Marinmuseums samlingar. CC-BY-NC.

Kopplat till Digisams pågående arbete med att ta fram förslag till nationella riktlinjer för hur en samordnad digital informationshantering kan ske hos statliga institutioner som samlar, bevarar och tillgängliggör kulturarvsmaterial och kulturarvsinformation, tar vi just nu även fram olika checklistor. Dessa är tänkta att fungera som ett stöd för kulturarvsinstitutionerna i arbetet med olika digitaliseringsmoment. I detta blogginlägg ligger en checklista som handlar om beständiga identifierare i fokus.

Mängden kulturarvsinformation på webben ökar ständigt, och länkad öppen data öppnar möjligheterna att sammanföra information från olika kulturarvsinstitutioner. Samtidigt innebär webbens dynamiska karaktär att den information man söker efter ibland har flyttat och att den inte går att finna trots att den fortfarande finns på webben. Så hur kan man se till att den digitala kulturarvsinformation man publicerar blir så beständig som möjligt?

I ett tidigare blogginlägg har jag skrivit om beständiga identifierare, som är unika kodsträngar kopplade till digitala poster. Själva utformningen av identifierarna för olika objekt och begrepp påverkar om de kommer att vara unika och beständiga. Därför har vi nu tagit fram ett utkast till en checklista för vad man kan tänka på vad gäller beständiga identifierare. Är det någonting du saknar i checklistan? Vi är mycket tacksamma för dina kommentarer och synpunkter på checklistan, antingen direkt som bloggkommentarer eller per mail till sanja.halling@riksarkivet.se (obs! senast den 11 mars). Vi räknar med att dokumentet därefter redigeras och publiceras på vår webbsida.

Sanja Halling