Digitala vägar till samlingarna

KB

KB

Kungliga Biblioteket. Foto: Bronks. CC 0.

Vad har ettor och nollor med kulturarv att göra? Det är tydligen många som undrar, för fredagen den 9 oktober 2015 lockade seminariet ”Digitala vägar till samlingarna” närmare 80 personer till Kungliga bibliotekets hörsal. Arrangör var Digisam i samverkan med KB och SWE-CLARIN, och deltagarna i huvudsak kolleger från forskningsbibliotek, arkiv och museer.

Dagen började med Lars Borin från Språkbanken/SWE-CLARIN som introducerade CLARIN som språkteknologisk infrastruktur. Därefter fick vi ta del av några exempel på tillämpningar från olika områden. Jussi Karlgren från Gavagai och KTH talade om hur han processar stora mängder textdata från bl a riksdagsdebatt, medier, bloggar och social media och på det viset kan läsa av vad det är folk snackar om – och hur. Jussi lyfte också frågan om hur minnesinstitutionerna bör förhålla sig till den dramatiskt ökande textualiteten. Mycket som blir text idag har aldrig blivit det förut, men ska chattar och sms samlas in bara för att det idag är möjligt? Leif-Jöran Olsson från Språkbanken/SWE-CLARIN presenterade sitt arbete med Dramawebben, och tecknade hur språkteknologiska verktyg kan visa vägen till oprövade forskningsfrågor och nya sätt att analysera t ex dramatiskt innehåll.

repliker

Bild från Leif-Göran Olssons presentation.

Jens Edlund från KTH talade sedan om taldata, vad talteknologer kan utvinna ur t ex inspelade intervjuer, och hur mycket av språket som egentligen handlar om vad som händer mellan orden. I stort sett samtliga talare pekade på den gällande upphovsrättslagstiftningen som ett utvecklingshinder för minnessektorn och hela området digital humaniora. Vikten av öppna licenser på publicerade material kan inte nog understrykas.

Som avslutning fick vi peptalk av Peter Krantz från KB, som påminde om att nyttan av data ligger i användningen och att många institutioner fortfarande lägger för mycket energi på förpackning/editering och gränssnitt. Sådant tillgängliggörande möjliggör absolut viss användning, men styr också förståelsen och hindrar annan användning än den institutionen planerat för. Ofta lägger man också för stor vikt vid samlingarnas magnitud eller bländas av drömmen om perfekt data – ouppnåeligt rent, felfritt, kristalliskt! Peter pläderade övertygande för att myndigheter och institutioner istället (också) bör bygga sig digitala lastkajer och låta utomstående hämta ut rådata för egen bearbetning och forskning. Minns att små dataset kan vara till stor glädje, och även ofullständig/lågkvalitativ data kan göra stor nytta!

Ta gärna del av dagens presentationer här:

Cecilia Lindhé och Marie Lennersand kunde tyvärr inte vara med i fredags, men vi försöker ordna ett nytt seminarium med dem längre fram. Återkommer om detta!

Johanna Berg