Språkteknologi + Kulturarv = SANT

b2ap3_thumbnail_reading.jpg

 b2ap3_thumbnail_reading.jpg
 Learning To Read in Algeria, 1965. Mennonite Church, USA. No known copyright restrictions.

Kärnan i Digisams uppdrag är att stödja kulturarvsmyndigheter och institutioner i arbetet med att mer – snabbare! – digitalisera, tillgängliggöra och bevara sina material. Vår uppfattning är att arbetet med digital produktion och bevarande lämpar sig för storskaliga och standardiserade processer. Ett tillgängliggörande för alla förutsätter också enhetlighet – på grundnivå som öppna data – men dessutom en större lyhördhet för olika användares behov. 

 Många människor efterfrågar nämligen bearbetade data, tematiskt editerade och sammansatta för olika målgruppsprofiler. De flesta museer och motsvarande arbetar aktivt med att skräddarsy sina erbjudanden för olika användargrupper och många lyckas också bra med att nischa presentationer olika för t ex skolbarn, turister eller lokalhistoriskt intresserade.

Folk som vet mer – experter, forskare – behöver dock delvis andra saker, t ex vill de ofta ha tillgång till större mängder obearbetad data, och är i allmänhet ointresserade av andras urval. På den flanken tycks många institutioner ha svårare att hitta fram till och matcha önskemål från t ex universitetsvärlden, trots att just forskarsamhället ofta pekas ut som en viktig målgrupp.

Vi är många som ser att det skulle finnas mycket att vinna på ett närmande mellan forskarsamhället och kulturarvsinstitutionerna. I arkiv och museer finns källmaterial som kan vara till glädje också i ett större perspektiv när det gäller studier av sådant som klimat- och miljöförändringar, arbetsliv eller familjemönster. Vi ser en underutnyttjad guldgruva, men hur ska vi hitta fram till forskarsidan?

Därför blev vi glada då Språkbanken i Göteborg tog kontakt och bjöd in oss att delta i arbetet med CLARIN , en svensk infrastruktur för språkteknologi som kommer att skapa förutsättningar för bredare forskningsansatser inom språkområdet, men också öppna nya dörrar för hum/sam-forskare i allmänhet och fungera som drivhus för en bredare implementering av data mining av historiska texter.

 Motsvarande infrastrukturer finns i många europeiska länder, och Vetenskapsrådet har nu beviljat den svenska satsningen programstöd om 45 miljoner på fem år. Digisam ingår som ett av sju K-center (knowledge centers) i programmet och tanken är att vi ska fungera som brygga mellan forskarsamhället och minnesinstitutionerna, och bidra i arbetet med att göra digitaliserade text/språkresurser mer direkt forskningsbara.

 Vi ser fram emot att tillsammans med CLARIN-konsortiet söka fördjupa kontakterna mellan ABM-institutioner och lärosäten, främja ny forskning på gamla material, och blåsa nytt liv i källmaterial som ännu inte fått komma in i den digitaliserade stugvärmen.

Till att börja med kommer vi att bjuda till ett första seminarium om Kulturarvets texter i mars. Återkommer om detta!

 Johanna Berg