Digital Humaniora i Norden

b2ap3_thumbnail_CdqcR8tXIAAJ3LB.jpg

b2ap3_thumbnail_CdqcR8tXIAAJ3LB.jpg

Lasse Mårtensson, Högskolan i Gävle, talar om digital analys av medeltida handskrifter. Foto: Johanna Berg CC-0

Intresset för digital humaniora växer. HumLab, Umeå och Humanistlaboratoriet, Lund har redan fått sällskap av Centrum för digital humaniora i Göteborg, och ytterligare flera lärosäten siktar i samma riktning. Det är goda nyheter för minnesinstitutionerna eftersom det öppnar för nya samarbeten och helt nya sätt att bedriva forskning på deras samlingar. Som Simon Chaplin från Wellcome Collections i annat sammanhang konstaterat är institutionerna idag ”information-rich, but analysis-poor, and we need to change that”.

Utvecklingen i våra grannländer liknar den i Sverige, och många centrala aktörer har nu samlats i en ny förening för Digital Humaniora i Norden, som för ett par veckor sedan arrangerade sin första konferens. Det blev en generalmönstring av ett område i dynamisk utveckling. Över 200 personer samlades i Oslo och fick på bara ett par dagar ta del av ett helt överväldigande program med allt från Ibsen till papyrus och klubbmusik. Mer än 80 presentationer i fem parallella spår gjorde det omöjligt för deltagarna att bevaka mer än en bråkdel av det brokiga innehållet. Men jag tror ändå att alla fick höra spännande saker.

Jag var t ex mycket imponerad av hur Gísli Pálsson från Reykjavik med SQL kopplat samman data från folkräkningsmaterial – på makro och mikronivå – och därigenom skapat nya insikter om den demografiska kollaps som följde på Stórabóla, en svår smittkoppsepidemi på Island 1707-09. Hans studie hade varit omöjlig utan folkräkningarna i Jarðabók Árna Magnússonar og Páls Vídalín i digitaliserad form, och detsamma gäller många andra projekt. En viktig uppgift för materialförvaltande institutioner är därför att i dialog med universiteten digitalisera resurser med bred forskningspotential.

Norska Nasjonalbibliotekets Bokhylla.no ger norrmännen fri tillgång till nästan all norsk litteratur som givits ut före år 2000, över 200 000 volymer. Dessutom öppnar den oanade möjligheter för forskning. Varje verk kan nu studeras mot bakgrund av alla andra böcker, och vi fick exempel på både temamodellering, dataanalys av litterär stil och fjärrläsning som kontextualiseringsstrategi. Möjligheterna är oändliga.

Digital humaniora är ett fält under framväxt och det samlar forskare från många discipliner och akademiska miljöer. Bland allt jag missade fanns sessioner om bland annat GIS och kartvisualisering, korpuslingvistik, konsthistoria och paleografi. Den som vill veta mer om forskningen – eller använda material, verktyg och plattformar – hittar samtliga abstracts här.

Här är Dag 1 som den såg ut via storify.com och här finns Dag 2

Johanna Berg

Språkteknologi + Kulturarv = SANT

b2ap3_thumbnail_reading.jpg

 b2ap3_thumbnail_reading.jpg
 Learning To Read in Algeria, 1965. Mennonite Church, USA. No known copyright restrictions.

Kärnan i Digisams uppdrag är att stödja kulturarvsmyndigheter och institutioner i arbetet med att mer – snabbare! – digitalisera, tillgängliggöra och bevara sina material. Vår uppfattning är att arbetet med digital produktion och bevarande lämpar sig för storskaliga och standardiserade processer. Ett tillgängliggörande för alla förutsätter också enhetlighet – på grundnivå som öppna data – men dessutom en större lyhördhet för olika användares behov. 

 Många människor efterfrågar nämligen bearbetade data, tematiskt editerade och sammansatta för olika målgruppsprofiler. De flesta museer och motsvarande arbetar aktivt med att skräddarsy sina erbjudanden för olika användargrupper och många lyckas också bra med att nischa presentationer olika för t ex skolbarn, turister eller lokalhistoriskt intresserade.

Folk som vet mer – experter, forskare – behöver dock delvis andra saker, t ex vill de ofta ha tillgång till större mängder obearbetad data, och är i allmänhet ointresserade av andras urval. På den flanken tycks många institutioner ha svårare att hitta fram till och matcha önskemål från t ex universitetsvärlden, trots att just forskarsamhället ofta pekas ut som en viktig målgrupp.

Vi är många som ser att det skulle finnas mycket att vinna på ett närmande mellan forskarsamhället och kulturarvsinstitutionerna. I arkiv och museer finns källmaterial som kan vara till glädje också i ett större perspektiv när det gäller studier av sådant som klimat- och miljöförändringar, arbetsliv eller familjemönster. Vi ser en underutnyttjad guldgruva, men hur ska vi hitta fram till forskarsidan?

Därför blev vi glada då Språkbanken i Göteborg tog kontakt och bjöd in oss att delta i arbetet med CLARIN , en svensk infrastruktur för språkteknologi som kommer att skapa förutsättningar för bredare forskningsansatser inom språkområdet, men också öppna nya dörrar för hum/sam-forskare i allmänhet och fungera som drivhus för en bredare implementering av data mining av historiska texter.

 Motsvarande infrastrukturer finns i många europeiska länder, och Vetenskapsrådet har nu beviljat den svenska satsningen programstöd om 45 miljoner på fem år. Digisam ingår som ett av sju K-center (knowledge centers) i programmet och tanken är att vi ska fungera som brygga mellan forskarsamhället och minnesinstitutionerna, och bidra i arbetet med att göra digitaliserade text/språkresurser mer direkt forskningsbara.

 Vi ser fram emot att tillsammans med CLARIN-konsortiet söka fördjupa kontakterna mellan ABM-institutioner och lärosäten, främja ny forskning på gamla material, och blåsa nytt liv i källmaterial som ännu inte fått komma in i den digitaliserade stugvärmen.

Till att börja med kommer vi att bjuda till ett första seminarium om Kulturarvets texter i mars. Återkommer om detta!

 Johanna Berg

Hållbar framtid och oanade möjligheter – digitalisering av naturhistoriska samlingar

b2ap3_thumbnail_Nrm-1.jpg

Den 9 januari hölls en konferens på Naturhistoriska riksmuseet om digitalisering av naturhistoriska samlingar. Under fjorton föredrag och efterföljande diskussioner blev det tydligt att digitalisering av samlingarna är av stor vikt, och att massdigitalisering är på frammarsch av en anledning. Vi behöver framför allt informationen för vår kunskap om miljön och för att kunna sätta in rätt insatser för en hållbar framtid.

Hedvig Kjellström från KTH beskrev hur Big Data, det vill säga stora och varierande volymer data, kan användas på en rad sätt. Med tillgång till stora volymer data från naturhistoriska samlingar kan information som tidigare legat dold bli synlig och visualiseras. Matthias Obst från Göteborgs Universitet berättade hur både historisk och nutida data kring olika arter använts i en forskningsstudie för att visa hur uppsättningen arter förändrats över tid.

b2ap3_thumbnail_Nrm-1.jpg

 

I Nederländerna pågår redan idag massdigitalisering av herbarieark i regi av Naturalis Biodiversity Center. Detta i ett tempo av 35 000 ark per dag! Paris Herbarium har i sin satsning på massdigitalisering av naturhistoriska samlingar gjort det möjligt för människor från alla världens hörn att hjälpa till med märkningen av objekten, så kallad crowd sourcing. I Finland ska de viktigaste samlingarna vara digitaliserade innan år 2025.

En ansökan om medel för att massdigitalisera de omfattande samlingar av herbarieark och insekter som finns på naturhistoriska museer och institutioner i Sverige lämnas in under våren. Digisam följer och deltar i arbetet, med utgångspunkt i att främja och driva massdigitalisering som det mest kostnadseffektiva sättet att digitalisera kulturarvsinstitutionernas samlingar.

Arrangörer av konferensen var GBIF Sweden i samarbete med Naturhistoriska riksmuseet och Digisam. GBIF är ett internationellt projekt som gör information om jordens arter tillgänglig för alla via en portal. Läs mer om konferensen på GBIF Sweden:s blogg.

Moa Ranung

EUDAT-projektet – en gemensam datainfrastruktur för forskningsdata

b2ap3_thumbnail_eudat.jpg

På europeisk nivå finns det idag ett initiativ att skapa en gemensam och tvärdisciplinär datainfrastruktur för forskningsdata som med hjälp av olika tjänster underlättar hantering av stora datamängder. EUDAT-projektet kommer att utveckla generella tjänster (för närvarande uppdelade i fyra områden: ”Find – Safe – Stage – Share”) som kan implementeras på olika sätt.

 b2ap3_thumbnail_eudat.jpg
Digisam deltar i DCH-RP-projektet som kommer att ta fram en roadmap för digitalt bevarande av det digitala kulturarvet. Inom ramen för projektet kommer även de tjänster från EUDAT som är relevanta för digitalt bevarande av kulturarvsmaterial att testas. En del praktiska experiment kommer att göras inom projektet med data från svenska kulturarvsinstitutioner.
 
Digisam deltog i workshopen kring digitalt bevarande av kulturarvsdata (som anordnades av DCH-RP-projektet) under EUDAT-projektets internationella konferens i Rom den 28-30 oktober. Där presenterade jag vårt arbete med samordnad informationshantering av kulturarvsinformation genom de digitala infrastrukturerna. Mer information om workshopen och alla presentationer finns här: http://www.digitalmeetsculture.net/article/digital-preservation-of-cultural-data/
 
 /Sanja Halling