Satsningar på att digitalisera kulturarvet lyftes under årets Almedalsvecka

Digitaliseringsfrågorna har, inte oväntat, uppmärksammats på flera håll under årets Almedalsvecka. Vi vill passa på att tipsa om de här två programpunkterna som lyfter frågan om digitalisering av kulturarvet.

Museipanelen

 

Centralmuseernas samarbetsråd

Juridiskt stöd på digisam.se

Det finns många juridiska aspekter att förhålla sig till i arbetet med att digitalisera kulturarvet. För att underlätta för dig som arbetar inom området har vi nu samlat vårt digitala juridiska stöd till en samlingssida som ligger under Stöd och verktyg.

Digisams upphovsrättsskola

Upphovsrätt är något vi alla måste kunna och som vi måste förhålla oss till i arbetet, inte minst när vi vill tillgängliggöra kulturarvet digitalt. För att stötta dig som är ny inom området finns Digisams upphovsrättsskola – ett antal filmer som går igenom grunderna inom upphovsrätten.

Digisams vägledning om upphovsrätt

Vägledningen förklarar upphovsrätten och angränsande lagstiftning mer utförligt än Digisams upphovsrättsskola. Till vägledningen finns även ett antal avtalsmallar framtagna.

Rättsfall

Digisams juridiska råd har tittat närmare på ett antal nyare rättsfall som berör oss som arbetar med digitalisering av kulturarvet. Vi har sammanfattat och förklarat rättsfallen med förhoppningen att man därigenom snabbt och enkelt ska kunna ta till sig det som händer inom rättsutvecklingen.

Här hittar du samlingssidan om juridik.


Text och bild: Mikael Weikvist (CC BY)

Dom i mål om offentlig upphandling

Högsta förvaltningsdomstolen har meddelat dom i ett mål den 10 juni 2021, mål 4998-20. Det handlar om Umeå universitet som hade begärt överprövning av en upphandling som Socialstyrelsen gjort. Eftersom det alltså handlar om två statliga subjekt och lagen om offentlig upphandling så bör den vara intressant för många inom Digisam att titta närmare på.

Här hittar du mer information om domen. 

Sex års arbete på sex månader – artificiell intelligens innebär stora möjligheter för arkiven

Fotograf: Olof Karsvall

Hur fungerar egentligen texttolkning av handskrivet material? Har tekniken kommit tillräckligt långt – eller blir resultatet snarare felstavningar som gör sig bäst i humorsammanhang? Digisams kommunikatör stämde digital träff med Olof Karsvall, forskningsledare på Riksarkivet, som under de senaste två åren varit med och drivit ett projekt där Riksarkivet, genom artificiell intelligens, tolkat 22 000 sidor äldre handskrifter.

Genom finansiering av Vinnova kunde Riksarkivet 2020 starta projektet. Materialet man valde att transkribera var polisrapporter från Göteborg under perioden 1862-1902. Under slutet av 1800-talet fördubblades befolkningen i Göteborg, samtidigt passerade hundratusentals svenskar staden under den stora emigrationsvågen. Ett spännande material, vilket många forskare hade påtalat. Att materialet i sig även var väldigt lämpligt för texttolkning – renskrivna sidor där texten löper från vänster till höger, uppifrån och nedåt – var en faktor som bidrog till beslutet.

Bättre information om arkivets material

Av Riksarkivets totala handlingar är ungefär fem procent digitiserade, det vill säga omgjorda från analog till digital form. Fem procent kan låta som en låg siffra, men om man tar i beaktan att Riksarkivet totalt har 180 hyllmil arkivhandlingar, så pratar vi om ungefär 230 miljoner skannade bilder.

Hur stor del av Riksarkivets material som utgör handskrivet material är svårt att avgöra, men troligen rör det sig om ungefär en femtedel av det totala materialet. Att nu kunna transkribera genom artificiell intelligens skapar nya möjligheter.

– Genom transkribering kan vi göra materialet mer tillgängligt för användaren. Dels handlar det om möjligheten att lättare kunna läsa handlingarna, äldre handskrifter är inte helt enkla för den ovane. Dels handlar det om att transkribering skapar helt nya möjligheter för oss som arkiv. Vi kan få fram metadata på en ny nivå, vilket innebär att forskare och den intresserade allmänheten kan söka i arkiven på ett helt nytt sätt.

Lyckat projekt med låg felmarginal

Målbilden med transkriberingen av polisrapporterna var att eftersträva så låg felmarginal som möjligt.

– Efter att materialet hade hanteras av programvaran så nådde vi 97 % korrekthet. En hög träffsäkerhet. Och vi skulle absolut kunna nöja oss med det resultatet, men det gjorde vi inte, utan med hjälp av volontärer har vi sedan valt att rätta de sista felen.

Felen i sig handlar ofta inte om att maskinen tolkat tecknen fel, utan det beror snarare på att vissa delar i materialet inte är tillräckligt tydligt, exempelvis att de handskrivna orden inte syns tillräckligt bra.

Behöver det texttolkade materialet alltid överensstämma till hundra procent med originalhandlingen? Olof menar att det beror på vad som är syftet med transkriberingen:

– Vill man först och främst söka i handlingarna och skapa annan form av metadata så behövs inte så hög korrekthet som var fallet med vårt material. Är syftet däremot att läsa texterna så är det ju självklart trevligt med så få fel som möjligt, men samtidigt så tror jag att man uppskattar att det finns en texttolkning med en del fel, än ingen texttolkning alls.

Vad krävs då för att korrektheten ska bli så pass hög som var fallet med polisrapporterna? Dels handlar det om hur materialet är uppbyggt, om det är prydliga handskrifter där orden intar liknande positioner på sidorna. Sedan spelar den träningsdata som man skapar modellen stor roll. Olof förklarar:

– Efter att materialet hade skannats in transkriberade volontärerna manuellt 470 sidor, vilket sedan är vad som ligger till grund för den modell vi använde. Ska man få ett bra resultat så bör modellen byggas på 400-500 sidor manuella transkriberingar. Resultatet blir okej med färre transkriberade sidor, men för att få ett hyfsat bra resultat så bör man använda sig av minst 100 sidor. Ju fler sidor desto bättre modell, men överstiger det 500 sidor så ger det inte längre så stor utväxling.

Texttolkade genom Transkribus

Riksarkivet valde att göra transkriberingarna genom Transkribus, en programvara men även en plattform för texttolkning. Olof ser flera fördelar med verktyget.

– Dels är den enkel att använda, dels behövs inte allt för stora tekniska kunskaper, vilket innebär att tröskeln är låg. Sedan behöver man inte bygga egna modeller, utan kan använda de som andra skapat.

Vad kan då nedsidan vara? Att en annan aktör hanterar ens data och att servrarna ligger i Österrike innebär att man inte kan transkribera allt material genom Transkribus.

– Vi hanterar ju känsligt material som går under sekretess. Dessutom måste vi förhålla oss till GDPR. Vi har så smått börjat att bygga egna HTR-modeller, vilket innebär att Riksarkivet kan göra tolkningarna på hemmaplan och därmed hantera känsligt material.

Det totala material som man texttolkade var på 22 000 sidor, vilket i sig tog ca sex månader. Skulle en människa manuellt göra arbetet skulle det ta cirka 6 år. En stor tidsbesparing.

Vad skulle du säga att texttolkning kommer innebära för användaren av arkiven i framtiden?

– Framförallt blir det ett nytt informationslager som vi adderar till det nuvarande. Genom en ny form av metadata kan användaren söka mer på innehåll än vad som är möjligt nu. Handskrivet materialet blir läs- och sökbart, vilket skapar helt nya möjligheter för datadriven forskning.

För dig som vill ta del av mer av Riksarkivets arbete så har de tagit fram en film som berättar om projektet. Vill du botanisera bland rapporterna så hittar du dem här.

Vårens sista Digisamfika

Den 11 juni är det dags för vårens sista Digisamfika. Denna gång kommer vi framförallt summera våren som varit och socialisera innan sommaren på allvar tar vid. 

  • När: 11 juni 9.00 – 10.00
  • Var: digitalt via Teams.

Anmäl dig genom att mejla digisam@raa.se senast den 9 juni. Länken till fikat skickas ut den 10 juni.

Varmt välkomna!

Tre nya vägledningar från Digisam

Digisam har släppt tre nya vägledningar. Vägledningarna är framtagna gemensamt av flera representanter från Digisams 22 medverkande institutioner och vänder sig till dig som jobbar med digitaliseringsfrågor på en kulturarvsinstitution.

Termlista

Digisams Termlista definierar digitaliseringsbegrepp och navigerar i den begreppsdjungel som många upplever inom området. Termlistan följer ISO-standarden för terminologiskt arbete och innehåller utöver definitioner även förklarande texter som förklarar termerna närmare.

Här hittar du Digisams Termlista.

 

Vägledning till ett sammanlänkat kulturarv

Vägledningen är en introduktion till hur information kan länkas samman över organisationsgränser samt ett antal strategier för hur man kan jobba med frågan.

Här hittar du Vägledning till ett sammanlänkat kulturarv. 

 

Vägledning till digitalt bevarande

Vägledningen förklarar hur det digitala kulturarvet tas med in i framtiden. Den är uppbyggd kring ett antal teman som är centrala i arbetet med digitalt bevarande och tar bland annat upp regelverk, bevarandefaser, OAIS-modellen och bevarandeformat.

Här hittar du Vägledning till digitalt bevarande.

 

Framtagna genom samverkan

Arbetet har skett över sektorsgränserna och resultatet ska kunna användas brett bland Sveriges kulturarvsinstitutioner.

– Vägledningarna har tagits fram av arbetsgrupper där representanter från både arkiv-, bibliotek- och museisektorn ingår. Under arbetets gång har vi behövt kliva ur våra stuprör och alla sektorers perspektiv har lyfts upp. Det gör att vägledningarna kommer att kunna användas på bred front, oavsett organisationstillhörighet, och bidra till att vi kan kraftsamla oss i digitaliseringsarbetet, säger Moa Ranung, samordnare på Digisams sekretariat och samverkansledare för arbetet.

Historien i spelformat – så kan digitalt kulturarv främja innovation och lustfyllt lärande

Foto: Ubisoft

Ett hållbart digitaliserat Sverige där de bästa förutsättningarna finns för att digitalt drivna innovationer ska utvecklas, spridas och användas. Det är regeringens vision och ett av delmålen för digitaliseringspolitiken. Hur kan digitalt kulturarv, genom innovation och entreprenörskap, skapa samhällsvärden för flera grupper i vårt samhälle?

Spel i kulturen och framtidens lärande

Datorspel är idag en självklar och dominerande del av vår kultur, inte minst hos unga. Enligt Internetstiftelsens rapport Svenskarna och internet spelar mer än hälften av internetanvändarna nöjesspel på nätet och en fjärdedel gör det dagligen. Samtidigt har Youtube bara på 15 år blivit världens främsta kanal för utbildning, underhållning och information. Att lärandet är en ödesfråga, inte bara för den enskilda individen utan också för organisationer och samhället i stort är något som framhålls i en rapport om framtidens lärande, framtagen av Kairos Future och Tekniska museet.

– Vi befinner oss i krisens och det stora omtagets tid. Gamla sanningar ifrågasätts och många upphör att gälla. Många behöver hitta de nya arbetsformer och partnerskap som kan bära in i framtiden. Det öppnar för nya lösningar inte minst som några av nycklarna till framtidens lustfyllda lärande handlar om autenticitet, gemensam problemlösning och samskapande, säger Peter Skogh, VD för Tekniska museet, i rapporten Lustfyllt lärande – vägen till framtiden.

Kulturarvsdata som framgångsfaktor

Assassin’s Creed är en serie med actionäventyrsspel i olika historiska miljöer som har byggts upp med hjälp av kulturarvsdata. Det första spelet i serien släpptes 2007 av Ubisoft och utspelar sig under tiden för det tredje korståget. Fram till idag har en rad olika spel som hämtar inspiration från olika tidsepoker lanserats. Assassin’s Creed: Unity som släpptes 2014 utspelar sig under den franska revolutionen och illustrerar hur det såg ut i Paris under den perioden. Bland annat har kartor från år 1789 och historiska teckningar över Notre-Dame i Paris digitaliserats och använts. Genom digitaliserat material har Paris återskapats i detalj och Notre-Dame har en central roll i spelet. Processen att återge katedralen så detaljerat som möjligt pågick under ett par års tid.

Stärkt samhällsengagemang

Efter branden i Notre-Dame 2019 donerade Ubisoft 500 000 euro till arbetet med att restaurera katedralen. Företaget möjliggjorde även att PC-användare under en veckas tid kunde ladda hem spelet utan kostnad.

– När vi skapade Assassin’s Creed: Unity, utvecklade vi en ännu närmare förbindelse med den här otroliga staden och dess landmärken – en av de mest anmärkningsvärda delarna i spelet var det extraordinära återskapandet av Notre-Dame, skriver Ubisoft efter branden i april 2019.

Ökad tillgänglighet och kreativ katalysator

Assassin’s Creed visar hur historiska data kan användas på ett innovativt sätt som ger ökad tillgänglighet till kulturarvet, samtidigt som det kan främja nyfikenhet, lusten till lärande och väcka ett intresse för historia hos unga såväl som vuxna. I Assassin’s Creed Odyssey och Assassin’s Creed Origins – skapades separata utbildningsdelar av spelet där miljöer används för att berätta om olika historiska perioder. Digitaliserade kartor, teckningar, föremål och återskapade kulturmiljöer är en förutsättning för utformningen av spelen. Användningen av kulturarvsdata i spel skapar möjligheter att utveckla kreativitet och ökat entreprenörskap, något som i förlängningen kan bidra till såväl fler arbetstillfällen som en utveckling av samhället i positiv riktning.

Digitala spel bevaras för framtiden

Sedan 1995 bevarar Kungliga biblioteket (KB) svenska dator- och tv-spel. Men biblioteket saknar många delar av utgivningen, särskilt onlinespel och appar. Därför gör KB nu en satsning på att samla in digitala spel, så att även framtida generationer kan studera dem. Enligt den så kallade e-pliktslagen ska KB få in webbpublicerat material. Men det omfattar inte digitala spel, vilket innebär att KB måste hitta nya vägar för att samla in materialet. Inom den närmaste tiden kommer KB att kontakta fler spelstudior i Sverige för att diskutera möjligheten att bevara ännu mer material. Men biblioteket tar även emot spontana förfrågningar från spelutvecklare. Läs mer här om att donera spel till KB.

Text: Karolina Gerdin


Värdet av digitalt kulturarv

Artikeln bygger på Rapporten Digitaliserat kulturarv – för demokrati och positiv samhällsutveckling: en förstudie samt en fallstudie om innovation och entreprenörskap genom digitaliserat kulturarv, båda framtagna av konsultbolaget Governo som en del Digisams satsning på att synliggöra värdet av det digitala kulturarvet.

Digitalt bevarande av ljud för hälsa och forskning

Foto: Sounds of Changes (CC BY)

Vi omges dagligen av ljud men tänker inte alltid på att ljuden förändras över tid och är en del av vårt kulturarv. Hur lät stadsliv på 1980-talet och hur lät #metoo? Sounds of Changes och Minnen.se är två digitala plattformar som samlar in ljud och berättelser för att visa samhällets förändringar och sprida kunskap om vår historia för framtiden.

Dåtid och nutid i Sounds of Changes

Det tvååriga projektet Sounds of Changes genomfördes mellan sex museer i Europa med målet att bevara ljud från både historiska och samtida miljöer. Flygvapenmuseum och Arbetets museum ledde projektet som finansierades av EU Creative Europe. Projektets mål var att inspirera till användning av historiska ljud i till exempel film-, musik- och teaterproduktion, men också som utbildningsmaterial. Insamlandet av ljud har skett inom projektet och genom utomstående aktörer.

– Ett viktigt mål för Sounds of Changes är inte bara att faktiskt spara ljud, utan också sprida kunskap kring hur ljud samverkar och formar vår miljö och vår historia. Vi vill visa hur ljuden är en del av historiens förändringar, berättar Torsten Nilsson, enhetschef på samlingsenheten på Flygvapenmuseum och projektledare för Sounds of Changes.

Betydelsen av ljud för ökad livskvalitet

Att fånga upp ljud i vår nutid och göra det tillgängligt för allmänheten skapar möjliga värden för många. Med hjälp av Wikimedia Sverige finns ljuden i Sounds of Changes idag i Wikimedia Commons. När projektet slutrapporterades 2019 hade ljuddatabasen besökare från hela världen och målgruppen unga utgjorde majoriteten av besökarna. Ljud från Sound of Changes används också på äldreboenden. I finska Tammerfors finns idag tio ljudmuseer som används i omvårdnaden av äldre med demenssjukdomar för att bidra till ökat välbefinnande.

Minnen – berättelser om vardagslivet

Webbplatsen minnen.se som ägs och förvaltas av Nordiska museet, andra museer och kulturarvsorganisationer i Sverige och Norge, samlar människors berättelser om sitt vardagsliv för att bygga kunskap om vår historia och samtid. Alla kan bidra med egna berättelser i form av text, ljud och bilder under olika insamlingsteman som sparas i en gemensam minnesbank för framtiden.

Foto: Gunnar Lundh, Nordiska museet (CC0)

Viktigt för framtidens forskning

Berättelserna på minnen.se används både i museernas utställningar och i forskning. En av de insamlingar som pågår nu är Mitt liv som genomförs i samarbete mellan UR och Nordiska museet där landets alla skolbarn kan berätta om sitt liv här och nu för framtidens forskare. Förra året startade Nordiska museet en insamling av berättelser om hur coronaviruset påverkar människors vardag, vilket har resulterat i tusentals bidrag och ett större forskningsprojekt initierat av Karolinska Institutet.

– Idag kan vi låta barnen själva berätta om sitt liv och dokumentera sin samtid för framtiden. Mitt liv bedrivs digitalt ute i landets skolor, vilket gör att alla kan delta och vi får in berättelser från barn med olika bakgrund från olika delar av Sverige, säger Sven Rentzhog, avdelningschef digital interaktion på Nordiska museet.


Värdet av digitalt kulturarv

Artikeln bygger på rapporten Digitaliserat kulturarv – för demokrati och positiv samhällsutveckling: en förstudie samt en fallstudie om projektet Sounds of Changes, båda framtagna av konsultbolaget Governo som en del Digisams satsning på att synliggöra värdet av det digitala kulturarvet.

Källa citat Torsten Nilsson, projektledare på Sounds of Changes: https://www.flygvapenmuseum.se/samlingar/Projekt/soundsofcanges/

Källa citat Sven Rentzhog, avdelningschef digital interaktion på Nordiska museet: https://www.nordiskamuseet.se/artiklar/mitt-liv-digital-insamling-skolan

Text: Karolina Gerdin

”För många kommer det bli ett uppvaknande att se hur mycket som kan göras med ett digitaliserat kulturarv”

Foto: Love Börjeson (CC BY)

Love Börjeson är verksamhetsledare för KB-labb, Kungliga bibliotekets labb för datadriven forskning med utgångspunkt i KB:s digitala samlingar, som startade i maj 2019. Vad händer just nu på KB-labb, hur kan språkmodeller gör skillnad i samhället och vilka möjligheter finns i digitaliseringen av kulturarvet?

KB-labb fyller snart två år, hur är läget hos er?

I och med att vi släppte språkmodellen KB-BERT förra året har Kungliga biblioteket blivit en aktör att räkna med inom språkteknologi. KB-labb har också fått en hel del samarbetsförfrågningar. Vi är med i projektet Språkmodeller för svenska myndigheter som drivs av RISE och håller på att etablera ett partnerskap med AI Sweden. Och så bygger vi förstås fler och starkare språkmodeller. Som nationalbibliotek har vi en viktig roll att spela i utvecklingen av artificiell intelligens (AI) som bygger på humanistisk data.

Det låter som en snabb utveckling på kort tid?

Ja, det har gått snabbt tack vare flera lyckliga omständigheter. En av dem var att vi redan hade två stora forskningsprojekt som styrde logiken – att verksamheten ska vara forskningstillvänd. Det tvingade oss att bli bra väldigt snabbt. Förfrågningen om att bygga BERT kom från akademin och KB-labb startade som ett projekt. Nu ska verksamheten föras över i förvaltning och bli en del av nationell infrastruktur för datadriven forskning.

Vilken roll har ni i projektet Språkmodeller för svenska myndigheter?

Vi grundtränar språkmodeller som andra sedan kan experimentera med och bygga vidare på. Det arbetet gör vi ändå, men det här är ett naturligt sammanhang för oss att finnas i. RISE har en stark expertis inom NLP, Natural Language Processing, och datavetenskapen generellt har en hastighet som gör att vi behöver samarbeta och bevaka vad som händer utanför sektorn och internationellt på de stora företagens forskningsavdelningar.

Hur används språkmodellerna och vilken är den största nyttan?

Den stora samhällsnyttan är att användarna kan interagera med samlingarna på helt nya sätt. Användningsområdena är enorma eftersom språkmodellerna kan användas fritt och överallt där det finns textresurser. Polisen, Skatteverket och Arbetsförmedlingen är några av de myndigheter som använder modellerna idag. Ett område där språkmodellerna kan göra konkret nytta är inom GDPR-hantering där de används för att automatisera uttagen av personnamn. Språkmodellerna används också inom medicinsk forskning för att identifiera inopererade implantat och vid utbyggnad av busstrafik i glesbygd.

Hur långt har kulturarvssektorn kommit i arbetet med digitalisering?

Vi hade nyligen Matilda Ernkrans, minister för högre utbildning och forskning, på besök här på KB och passade på att berätta om kopplingen mellan digitaliseringen av det svenska kulturarvet och ekonomisk samhällsnytta. För många kommer det bli ett uppvaknande att se hur mycket som går att göra med ett digitaliserat kulturarv. Det finns en stor ängslighet inför AI och digitalisering inom kulturarvssektorn. Fler skulle behöva släppa taget och våga sig ut.

Kompetens är alltså en viktig fråga för digitaliseringen av kulturarvet?

Ja, det skulle jag säga. Det är en fråga om kompetens, men också om vilja. Att digitalisera är ganska enkelt idag om man inte utgår från det svåraste fallet och generaliserar det till alla materialtyper. Det handlar också om att kompetens inom datavetenskap behöver finnas med från början och på fler positioner i organisationerna. Vi är inne i ett kunskapsskifte och det är viktigt att vi som myndigheter är föregångare i att realisera digitaliseringens möjligheter.

Text: Karolina Gerdin

Digisamfika i maj med tema AI

Den 7 maj intar de intelligenta robotarna Digisams digitala fika. Missa inte tillfället att lyssna till Olof Karsvall som kommer att berätta om Riksarkivets arbete med artificiell intelligens genom deras HTR-projekt (Handwritten Text Recognition).

Digisams digitala fikor är öppen för dig som tycker digitalt kulturarv är viktigt. I normala fall infallet fiket den sista fredagen varje månad. Men på grund av valborg och en fullmatad april med såväl Digikult som Museernas vårmöte så väljer vi att skjuta på fikat en vecka.

  • När: fredag 7 maj 9.00 – 10.00
  • Var: digitalt via Teams
  • Anmäl: skicka epost till digisam@raa.se senast 5 maj (du kommer få länken till fikat den 6 maj).

Vi vill genom fikat uppmuntra till kontakt över organisationsgränserna och just därför kommer vi efter fikat skicka ut en deltagarlista med kontaktinformation. Vill du inte vara med på en sådan lista – ange då detta i anmälan. Listan kommer bestå av ditt namn, vart du jobbar samt din epost-adress. För information om hur vi behandlar personuppgifter, se www.raa.se/gdpr

Välkommen!

Text och bild: Mikael Weikvist (CC BY)