Projekt för att tillgängliggöra historiska inspelningar

Bilden dokumenterar en av de många intervjuer som på 1960-talet gjordes med utvandrade svenskar i Chicago (arkivuppteckning ULMA Sv-Am 1962:1:77)
Vi på Digisam är glada att få vara en del av projektet ”TillTal – Tillgängligt kulturarv för forskning i tal”. Tillsammans med ISOF och KTH ska vi undersöka nya metoder och verktyg för att orientera i och bearbeta större mängder historiska talinspelningar.
Texten nedan har tidigare publicerats på www.sprakochfolkminnen.se
—
I institutets samlingar finns tiotusentals timmar inspelat tal. Projektet TillTal har nu fått anslag på 9,7 miljoner för att utreda hur man med talteknologins hjälp kan göra den stora arkivskatten mer tillgänglig för forskning.
9,7 miljoner i anslag
Kungl. Vitterhetsakademien och Riksbankens Jubileumsfond har beslutat att ge 9,7 miljoner kronor i anslag till projektet ”TillTal – Tillgängligt kulturarv för forskning i tal” som är ett samarbete mellan Institutet för språk och folkminnen, Kungliga Tekniska högskolan och Digisam. Tanken är att utgå från det stora talmaterial som finns i institutets arkiv och undersöka hur taltaknologiska metoder kan göra inspelningarna mer tillgängliga för forskare. Projektet startar 2017 och pågår till och med 2020.
Tiotusentals timmar tal
Den stora arkivskatten med ljudande material innehåller mängder av godbitar för humanistisk och samhällsvetenskaplig forskning men är ändå dåligt utnyttjad.
”Det är svårt att forska i eftersom det inte går att söka i materialet. Är man intresserad av ett ord eller fenomen är det hopplöst att leta igenom. Bara i våra samlingar finns ungefär 13 000 timmar talinspelningar som är digitaliserade och att lyssna igenom alltihop en enda gång, åtta timmar om dagen, fem dagar i veckan skulle ta mer än sex år”, berättar projektledaren Rickard Domeij.
Syftet med projektet TillTal är att hitta metoder och verktyg för att kunna hantera och bearbeta stora mängder historiska talinspelningar.
Utmaning med historiskt material
Nyckeln till att kunna hantera och analysera stora mängder talinspelningar finns i talteknologin. Det är ett område som fått stort genomslag på senare år, taligenkänning finns till exempel i de flesta moderna mobiltelefoner. Även inom forskningen har talteknologin utvecklats som metod.
”De talteknologiska metoder som finns bygger på analyser och statistik om hur talet ser ut idag. I projektet vill vi undersöka hur man skulle kunna använda talteknologi för att forska i historiskt material. Med ett sådant forskningsverktyg skulle man kunna ta fram mycket spännande material ur väldigt stora mängder data”, säger Rickard Domeij.
Utmaningarna med det historiska talmaterialet är att både inspelningskvaliteten och dialekter, ord och uttryck skiljer sig från de moderna inspelningar som ligger till grund för dagens talteknologiska metoder. Viktigt med samarbete
En viktig del i projektet är att språkteknologer och forskare arbetar tillsammans. Från institutet deltar förutom språkteknologer även forskare i dialekter och i folkminnen. ”Det användarcentrerade arbetet är viktigt och därför ska språkteknologerna och forskarna tillsammans undersöka behoven och utveckla metoder som passar”, säger Rickard Domeij.
Linn Kierkegaard, Institutet för språk och folkminnen
Länkar
Mer om Språkteknologi
Riksbankens jubileumsfond: Forskning på samlingar i arkiv, bibliotek och museer får 38 miljoner kronor
Riksbankens jubileumsfond: TillTal – Tillgängligt kulturarv för forskning i tal