Jamtli ser möjligheter med K-samsök och Europeana

Jamtli i centrala Östersund. Foto: Wikimedia Commons

Jamtli har under de senaste året varit i fokus på många sätt – under sommaren 2018 invigdes Nationalmuseum Jamtli och under april stod de även som värd för Museernas vårmöte 2019. Men hur jobbar ett av Sveriges största regionalmuseer med digitalisering och vilka utmaningar möter man?

Jamtli Fornby öppnade sina portar 1912 och har sedan dess utvecklats från att varit ett friluftsmuseum till att idag ha en bred verksamhet. Mest kända är de för Överhogdalsbonaderna, en nästan 1000 år gammal väv vars budskap fortfarande analyseras. Men hur tar de sig an framtiden och vilka tankar har de kring digitalisering?

– Hela verksamheten jobbar med digitalisering på olika sätt. Utgångspunkten är samlingskatalogen, som ligger till grund för att finna historierna vi vill berätta. Sedan är det ett stort jobb med att skapa digitala versioner av samlingarna. Gällande fotografierna vill vi göra dem digitala, men det är inte enkelt. Det rör sig om omkring 10 miljoner foton, berättar Minna Lehtomäki, avdelningschef över Samlingar och kulturmiljö.

Hur tar man sig då an en samling på närmare 10 miljoner fotografier?

– I nuläget har vi bara digitaliserat en bråkdel. Och det går inte att tänka att nu sätter vi igång med att digitalisera alla 10 miljoner foton, utan vi delar upp det i mindre delprojekt där användandet och användarnas behov får styra. Just nu prioriterar vi porträtt för att kunna tillgängliggöra material för en bredare målgrupp där släktforskningen står i centrum. Sedan hjälper GDPR oss att prioritera, ca 30–40 procent av fotografierna kan vi inte göra tillgängliga just på grund av GDPR och då vi har begränsat med resurser så innebär det att dessa inte digitaliseras i första hand, säger Bengt Nordqvist, antikvarie.

Ett sätt att jobba med digitaliseringen är genom Kulturarvs-IT, satsningen där man får bidrag för att stötta individer som står vid sidan av arbetsmarknaden. Men den satsningen är inte tillräckligt för att ta sig an en sådan massdigitalisering som fotosamlingen utgör. Den ekonomiska aspekten är precis som för de flesta något de ständigt får förhålla sig till.

– Vi har en stor samling samtidigt som vi har lite personal, därför måste vi ständigt prioritera det vi ska digitalisera. En 3D scanning av friluftsområdets historiska byggnader är något som skulle vara intressant att genomföra och tillgängliggöra på webben, men i nuläget har vi inte tillräckligt med ekonomiska resurser för att prioritera ett sådant jobb, menar Minna.

Under 2019 gick Jamtli med i K-samsök, den digitala plattform där museer och andra minnesinstitutioner tillgängliggör och länkar samman data kring sina samlingar. Genom att vara en del av K-samsök blir även Jamtli en del av Europeana, då Europeana skördar data som tillhandahålls av K-samsök. Minna ser stora fördelar med att vara en del av K-samsök och Europeana:

– Genom K-samsök blir vi än mer tillgängliga och synliga, vilket känns viktigt. Europeana är en enorm kunskapsbank som vi vill vara med och bidra till. Vi kommer kunna nå nya brukargrupper och det öppnar även upp möjligheter för att i framtiden finna nya samverkansaktörer.

Om Jamtli fick en stor påse pengar – vad skulle de då satsa på? Minna och Bengt blir först tysta när jag ställer frågan, men efter en kort tids fundering är de eniga i sina svar:

– Att kunna lyfta andra historier. Om vi hade mer personal kunde vi grotta ner oss än mer i samlingarna och hitta det undangömda – det vi idag inte har tid eller råd att leta efter, säger Minna.

Bengt nickar, och tillägger sedan:

– Dessutom vore det kul om vi kunde tillgängliggöra en större del av vår fotosamling, framförallt porträtten. Att kunna hjälpa andra att ta reda på sina historier, med hjälp av porträtten och fotona på de som levde här förr.

Är du nyfiken på att besöka Jamtli hittar du dem fysiskt i centrala Östersund men även på Kringla via K-samsök. Och är du nyfiken på Europeana och K-samsök så kan du hitta intressant läsning här. Dessutom kommer Digisam under hösten anordna en workshop för de aktörer som är intresserade av att leverera data till Europeana – mer information om workshoppen kommer snart dyka upp här på bloggen.

Text: Mikael Weikvist

Nytt samverkansområde kring digitalisering och bevarande

Vad innebär att digitalisera ett kulturarv? Och vad krävs för att en eftervärld ska kunna ta del och använda sig av det? Moa Ranung, samordnare på Digisams sekretariat, har under våren träffat majoriteten av Digisams medverkande för att diskutera dessa frågor – och hur man ska kunna göra verkstad av diskussionerna.

Bakgrunden till träffarna, som är ett första frö i ett nytt samverkansområde, bygger på dialoger som Digisams sekretariat höll med de högsta ledningarna hos flertalet av Digisams medverkande under 2018. Genom dialogerna blev det tydligt att man ser ett antal områden som särskilt viktiga att samverka kring och där samverkansområde Digitalisera och bevara är ett av de högst prioriterade.

Sedan tidigare finns samverkansområde Juridik genom det juridiska rådet, som leds av Sofia Kullman, jurist vid Digisams sekretariat.

– Det juridiska rådet fungerar som ett stöd till Digisams medverkande i juridiska frågor, för närvarande handlar det mest om upphovsrättsliga frågor men även frågor om offentlig upphandling, integritetsskyddslagstiftning och annat kan dyka upp, berättar Digisams verksamhetsledare Carl-Magnus Fahlcrantz.

Inom samverkansområde Digitalisera och bevara kommer medverkande framför allt arbeta med att ta fram standarder, riktlinjer och vägledning inom området. Efter flera dialogmöten under våren, där de medverkande haft möjlighet att lyfta frågor som man ser som särskilt viktiga att arbeta med, träffades man den 14:e maj på det första gemensamma samverkansmötet.

Moa Ranung, samordnare på Digisams sekretariat.
Foto: Mikael Weikvist (CC BY)

– Samverkan inom området Digitalisera och bevara handlar mycket om utveckling och förvaltning av de medverkande aktörernas digitalisering och digitala bevarande av kulturarvet. De leveranser som ska tas fram ska också kunna vara till nytta för en bredare målgrupp som jobbar med digitalisering av kulturarvet, säger Moa Ranung.

Att det finns mycket man vill göra är uppenbart. Och för att ta sig vidare och få fram såväl styrande som stödjande vägledningar och standarder behövs prioritering.

– Jag är väldigt positiv till att en så pass bred grupp lyckades fånga upp ett antal tydliga fokusområden att jobba vidare med. Nu hoppas jag att vi ska kunna ta arbetet ett steg längre – att det inte ska stanna vid skrivbordsmaterial utan verkligen bli verkstad av det. Personligen brinner jag för det visuella kulturarvet, så min förhoppning är att lyckas få ut det och göra det användbart för såväl forskare som allmänheten, säger Sven Rentzhog, avdelningschef för Digital interaktion på Nordiska museet, som var en av deltagarna på mötet.

Vad valde man då att prioritera och hur tar man sig vidare? Moa Ranung, drivande från sekretariatet säger:

– Några frågor som stack ut var gemensamma definitioner av begrepp som rör digitalisering och frågan om hur form och innehåll bör se ut vad gäller metadata, länkad öppen data och kravspecificering inför digitalisering. Frågan om artificiell intelligens är en bubblare, då artificiell intelligens kan vara ett användbart verktyg i digitaliseringen och det digitala bevarandet. I slutändan handlar det om att i ett första steg ta fram så kallad mjuk infrastruktur för att skapa bästa möjliga förutsättningar för ett digitaliserat och tillgängligt kulturarv som både människor och maskiner kan använda på bred front. I juni träffar vi de medverkande igen för att tydliggöra vilka som kommer att ingå i samverkansgruppen, som är en tillsvidarekonstruktion, och de arbetsgrupper som ska kopplas till den. Och så kommer vi att ta fram en färdplan för arbetet.

Samverkansområden inom Digisam vänder sig till Digisams 22 medverkande. Är du en av dem och vill delta, tveka inte att kontakta Moa Ranung för samverkan inom digitalisering och bevarande eller Sofia Kullman för samverkan kring juridiska frågor.

Riksarkivet involverar AI i sin verksamhet

Om ett område skulle kunna bli årets julklapp så undrar vi på Digisam om inte artificiell intelligens, ofta förkortat som AI, har goda möjligheter att bli det om ett halvår. För den intelligenta maskinen och vad den kan innebära för oss – som medborgare men även verksamma inom kulturarvsområdet – är något som det pratas intensivt om. Men osäkerheten gnager ständigt; ofta undrar vi hur vi ska kunna använda AI och hur vi ska komma igång. Lyckligt nog har Riksarkivet krattat gången en aning för oss.

Under slutet av 2018 släppte Riksarkivet rapporten ”Kunskapssystem i Arkivmiljö”, som handlar om vad AI kan innebära för Riksarkivets verksamhet. Catharina Grönqvist är arkivarie på Riksarkivet och författaren bakom rapporten. Att hon brinner för innovation går inte att ta miste på.

– När jag började förstå vad AI är och vad det innebär – då föll polletten ner för hur vi inom arkiv, men även hela kulturarvsområdet, ska kunna använda all vår information som big data.

Rapporten pekar på flera områden där Riksarkivet genom AI kommer kunna förbättra sin verksamhet.

Catharina Grönqvist från Riksarkivet är författaren bakom rapporten. Foto: Catharina Grönqvist (CC BY)

– Det finns flera olika spår att gå, där vi ser att de flesta är beroende av varandra. För att komma igång behövde vi prioritera och då vi ser en stor efterfrågan på mer avancerade söktjänster både för externa och interna användare så föll det sig ganska naturligt att börja arbeta med att få fram mer detaljerad metadata ur våra bestånd. AI-tekniken är dessutom inom flera användningsområden tillräckligt mogen för detta, vilket är en förutsättning för att få tillräckligt bra slutresultat.

För att nå mer detaljerade metadatanivåer jobbar Riksarkivet med så kallad automatiserad metadataextraktion.

– Kort kan man förklara det som att AI använder sig av flera olika tolkningstekniker för att gräva i handlingarna och där få ur relevant metadata på en mer detaljerad nivå.

Du nämnde att tekniken inte riktigt är mogen inom alla områden, kan du utveckla det?

– Dels är detta ett forskningsområde där det fortfarande finns många vita områden på kartan för alla, oavsett användningsområde. Men kulturarvssektorns utmaning är att forskningen inom AI utgår från nyare data som ibland skiljer sig rätt mycket från den äldre information som vi bevarar. Det innebär att vi hamnar lite i baksätet och tyvärr inte fullt ut kan dra fördel av det som sker inom forskningen. Till exempel inom bildigenkänning där de stora öppna dataset som alla använder för att träna AI på inte innehåller bilder på äldre föremål, vilket gör att AI:n inte kan känna igen dem.

Betyder det att det är kört för oss?

– Inte alls, men jag tror det är bra att ha en förståelse för hur kulturarvssektorns data skiljer sig från den moderna som alla pratar om i det här sammanhanget och sätta sig in i vilka förutsättningar, både som begränsningar och styrkor, som detta ger. Det är viktigt att vi inser att det som är unikt för oss och våra samlingar är ett komplement som behövs till det här forskningsområdet och som inte kommer den till del utan vår medverkan. Vi behöver en symbios mellan de som förstår hur man använder och tränar AI och de som förstår materialet som används för att träna AI:n.

Vad är det senaste som du snappat upp inom forskningen kring AI?

– Det händer väldigt mycket just nu. Ett av de största hindren för att skapa en riktigt smart AI är i många fall att det är väldigt dyrt att samla in stora mängder att träna på, så det forskas mycket på hur man ska komma runt det problemet. Vissa testar tekniker där två AI arbetar mot varandra för att bli smartare, andra testar att ta fram nya verktyg som skapar extra träningsdata för att ”blåsa upp” de dataset de redan har. Man börjar också tänka utanför boxen i större utsträckning och testar, kombinerar och använder etablerade AI-tekniker inom nya områden, exempelvis har det kommit nya spännande resultat där man använder samma typ av AI för att tolka text som man tidigare tolkat bilder med. Sedan förfinar man ständigt upplärningen av maskinerna och här ser jag att man är i en fas där man försöker ta reda på hur mycket maskinerna egentligen förstår av kontext och rimlighet. Man försöker också skapa mer mångsidiga och smarta system som man kan lära vidare med nya uppgifter så att man inte måste börja från noll varje gång man vill lära AI:n en ny färdighet.

Många pratar om AI – men inte fullt lika vanligt tycks det vara att ta steget vidare. Catharina menar att det inte ska ses som något oöverstigligt.

–För oss på Riksarkivet föll det sig naturligt att undersöka om det fanns möjligheter att använda AI inom de utvecklingsaktiviteter som redan var igång. Så vi gjorde en inventering över vilka aktiviteter som kunde vara aktuella för AI och gjorde samtidigt en omvärldsbevakning för att se om det fanns AI-tekniker som kunde vara relevanta. Gör man så och hittar en matchning är nästa steg att titta på om man har tillräckligt med data för att skapa en AI och om tekniken verkar redo att ge de resultat som man är ute efter. Märker man här att tekniken inte är riktigt där ännu, så har man ändå skapat sig en bättre förståelse för förutsättningarna som datamängderna har – och det i sin tur kan ge upphov till nya idéer. Det kan också visa sig att man inser att man måste höja kvaliteten på sin information eller göra den digitalt bearbetningsbar fullt ut och då kan man börja med de åtgärderna medan själva AI-tekniken kommer ikapp.

Metadata ses ju som en nödvändighet för att ha koll på all data – men kommer metadata verkligen behövas i en framtid där man kommit än längre med AI?

– AI innebär helt klart ett paradigmskifte. Kontextuell metadata, det vill säga vår beskrivning av ett objekt, ser jag än så länge som en nödvändighet för att finna och få fram informationen. Men på längre sikt är det troligt att man genom AI kan hantera och söka information i de digitala objekten utan att vara beroende av den mellanhand som kontextuell metadata innebär.

Innebär det att vi inte behöver fortsätta med metadata?

– Jodå, för de flesta användningsområden inom AI är metadata fortfarande väldigt centralt för att vi ska få systemen att fungera. Dessutom behöver vi träna den framtida AI:n och för att kunna göra det är metadata en förutsättning. Så kort, metadata behövs kanske inte i framtiden, men för att nå dit behöver vi just metadata.

Slutligen, hur tror du vi på Digisam ska arbeta för att på bästa sätt hantera AI?

– Det vore guld värt med en löpande omvärldsbevakning på vilka utvecklingsprojekt som är på gång inom sektorn. Det är viktigt att vi inte uppfinner hjulet flera gånger och att vi samverkar smart och på rätt nivå. Det kan handla om att byta erfarenheter, förstå vilka system som fungerar, att byta data med varandra. Just att byta och berika varandras träningsdata tror jag vi kommer ha stor vinning av.

Catharinas rapport fungerar utmärkt för att få en fördjupad bild av vad AI är och kan dessutom ge inspiration för vad man kan uppnå med tekniken.