Digital infrastruktur är ett begrepp som idag används i vid bemärkelse, för allt från internetuppkoppling till datahantering med en hel rad tjänster kopplade till det, som till exempel grid-tjänster, datalagring, säkerhet, interaktivitet, med mera. Tekniska infrastrukturer som, bl.a. genom uppkopplingskapacitet, kan stödja datagenererande kulturarvsinstitutioner är e-infrastrukturer och i vissa fall även forskningsinfrastrukturer kopplade till olika vetenskapliga domäner. Begreppet ”digital infrastruktur” används ibland också för olika tjänster kopplade till datahantering genom e-infrastrukturer, som t ex för datalagring.

Forskningsinfrastrukturer

Begreppet ”forskningsinfrastruktur” definieras av EU-kommissionen som faciliteter, resurser och tjänster som används av det vetenskapliga samfundet för att genomföra spetsforskning inom sina respektive områden.

Det finns ett stort antal nationella och internationella infrastrukturer som skapar förutsättningar för forskning inom alla ämnesområden.

Forskningsinfrastrukturer på europeisk nivå

En rapport från studien ”Pertinence and Impact of Research Infrastructure Activity in FP7 – EPIRIA”, som togs fram år 2012 på EU-kommissionens uppdrag, analyserar de ca 313 projekt om infrastrukturer som finns inom det sjunde ramprogrammet (FP7). I rapporten utvärderades forskningsinfrastrukturernas relevans, effektivitet och användbarhet och förslag för framtida insatser redovisades. Genom en kategorisering av forskningssinfrastrukturer i tematiska områden klassificeras projekten inom FP7 i fem ämnesområden, däribland samhällsvetenskap & humaniora. Projekttyperna ”e-infrastrukturtjänster” och ”policyutveckling & support” sträcker sig över flera områden och klassificeras som ”horisontella”.

Figur 1 ”Thematic Areas”, från rapporten ”Pertinence and Impact of Research Infrastructure Activity in FP7 – EPIRIA”, s. 9.
Figur 1 ”Thematic Areas”, från rapporten ”Pertinence and Impact of Research Infrastructure Activity in FP7 – EPIRIA”, s. 9.

Rapporten konstaterar en ökad sammanhållning av de europeiska forskningsinfrastrukturerna, bland annat genom sammanlänkning av datainfrastrukturer, harmonisering, standardisering och interoperabilitet av metoder och verktyg samt ökad lättillgänglighet. Det konstaterades även en förbättring och serviceorientering av tjänster, innovativa metoder och verktyg för insamling, bearbetning och analys, inklusive visualisering och simuleringsteknik. Rapporten pekar på att forskningssinfrastrukturernas verksamhet och tjänsternas relevans är hög, bland annat eftersom de uppfyller användarnas behov.

Det europeiska strategiforumet för forskningsinfrastrukturfrågor, ESFRI har tagit fram en vägvisare (roadmap) för europeiska forskningsinfrastrukturer, European Roadmap for Research Infrastructures 2016 för forskningsinfrastrukturer. Vägvisare har därefter också tagits fram på nationell nivå i flera medlemsstater. Bland de relevanta infrastrukturerna inom humaniora finns CLARIN, en numera etablerad forskningsinfrastruktur i Sverige (Swe-CLARIN) som syftar till att göra stora språkliga material tillgängliga för humanistisk och samhällsvetenskaplig forskning och DARIAH, forskningsinfrastruktur för konst och humaniora.

Forskningsinfrastrukturer på nationell nivå

I Sverige har Vetenskapsrådet tagit fram en nationell färdplan, Vetenskapsrådets guide till infrastruktur 2012 och en ny färdplan 2014, Vetenskapsrådets guide till infrastrukturen 2014. I färdplanen definieras forskningsinfrastrukturer som nödvändiga verktyg för att kunna bedriva forskning av högsta kvalitet, som kan vara centraliserade, distribuerade eller virtuella.. De innefattar anläggningar, instrument, kunskapssamlingar och tjänster och syftar till att utnyttjas av forskare eller forskargrupper inom grundforskning eller tillämpad forskning inom alla forskningsområden.

Färdplanen pekar på relevans av e-Vetenskap och e-Infrastrukturer samt de angelägna behoven av tvärvetenskaplig infrastruktur för samhällsvetenskap och humaniora för att skapa bättre förutsättningar för forskning med hjälp av databaser och tillgång till kulturarvsdata. Färdplanen lyfter fram vikten av samordning av befintliga infrastrukturer och stödjande e-infrastrukturer. Digitaliseringen av kulturarvet och hur det bäst ska kunna ske för att komma forskningen till gagn lyftes redan i färdplanen från 2012 som en aktuell och komplex fråga för forskare inom flera områden. Humanistisk forskning lyfts fram som exempel på område där man är i allt högre grad beroende av forskningsinfrastrukturer. Där finns även flera exempel på forskning som går över disciplingränser vilket gör att infrastrukturer blir en strategisk komponent där satsningar mot samordning av existerande infrastrukturer, ämnesövergripande samarbeten och ökad utnyttjande av e-infrastruktur främjar framtida forskning. Parallellt med trenden mot datadriven forskning finns det också en internationell rörelse kring öppen tillgång till forskningsdata och mjukvara. På Vetenskapsrådets hemsida finns också en översikt över forskningsinfrastrukturer efter ämnesområde.

 E-infrastrukturer

Enligt Vetenskapsrådets definition i ovan nämnda dokument, är e-infrastrukturer de infrastrukturer vars målsättning är att tillhandahålla e-vetenskapliga metoder och tekniker, vilket omfattar allt från datorer, databaser och nätverk till mjukvara och användarstöd.  Genom ökad samordning av existerande infrastrukturer, innovation och samarbeten kan man förvänta sig stora möjligheter för framtida forskning, genom bland annat visualiseringar och datadriven forskning, s k Big Data.

E-infrastrukturer på europeisk nivå

EU Kommissionens information om e-infrastrukturer inom ramen för ”Digital Agenda for Europe” gör det tydligt att e-infrastrukturer ska svara mot de behov som europeiska forskare har vad gäller digitala tjänster i form av digitala nätverk, dataanvändning och hantering av digital information.

E-infrastrukturerna har under senare tid genomgått en stor förändring, med övergång från en ren teknisk inriktning med fokus på kommunikationsnätet till att omfatta tjänster med flera lager. Utvecklingen har också gynnats av de nya beräkningsinfrastrukturerna, med ”grid”-resurser (HTC), högpresterande datainfrastrukturer (HPC), molninfrastrukturer, tjänsteinfrastrukturer för visualisering och simulering samt infrastrukturer för vetenskapliga data och globala virtuella forskningsgrupper.

TERENA har tidigare varit ett samarbetsorgan för de europeiska forskningsnäten (där SUNET, svenska universitetsnätverket, är medlem) som samlade in statistiken kring forskningsnät, gjorde utredningar, bedrev tekniska projekt och formulerade policies. TERENA har under 2014 gått ihop med DANTE (Delivery of Advanced Network Technology to Europé) och blivit GÉANT, ett pan-europeiskt datanätverk för forskning och utbildning.

Mobilus in Mobili, Flickr, by Chicago Metra Yard, CC-BY 2.0
Mobilus in Mobili, Flickr, by Chicago Metra Yard, CC-BY 2.0

E-infrastrukturer på nationell nivå

I Vetenskapsrådets guide till infrastruktur från 2014 står det att betydelsen av e-infrastruktur ur såväl internationellt som nationellt perspektiv ökar för forskning. E-infrastrukturer definieras som som verktyg för elek­tronisk kommunikation, lagring, bearbetning och visualisering av data samt datorer för storskaliga beräkningar, visualisering, modellering och lagring, nätverk för dataöverföring och avancerat användarstöd som hör ihop med detta. Vad gäller elektronisk kommunikation så är SUNET idag den nätverksinfrastruktur som används av de flesta statliga kulturarvsinstitutioner som har digitala samlingar. I den nationella färdplanen från Vetenskapsrådet konstateras det att ”när det gäller datanät som tillhandahålls av SUNET finns goda möjligheter att vidga användargruppen till att även inkludera arkiv, bibliotek, museer och kulturmiljöinstitutioner”. I SUNETs strategidokument 2015-2018 står det att ”Sunets nätverk och väl integrerade tjänster är det självklara valet för svensk forskning, högre utbildning och kultur.” Idag är de flesta statliga kulturarvsinstitutioner som ingår i Digisams uppdrag redan uppkopplade till nätet genom SUNET. Detta öppnar stora möjligheter för samverkan kring tjänster för forskare/tillhandahållande av källmaterial för forskning.

Vad gäller storskaliga datorresurser för beräkning och lagring, s k ”compute infrastructures” samt användarstöd relaterat till dessa finns det två stora aktörer i Sverige: SNIC och SWEGrid. SNIC (Swedish National Infrastructure for Computing ) är en nationell infrastruktur för att tillhandahålla högpresterande storskaliga datorresurser för forskare. SNIC står för beräkningsresurserna till svenska forskare genom tillgång till de sex högpresterande dataanläggningar i Sverige. SNIC har också ansvar för den strategiska och vetenskapliga utvecklingen och finansieringen av all infrastruktur rörande effektiv datoranvändning, dvs nätverk, beräkningsservrar, datalagring, visualisering och Grid-teknik. SweGrid (The Swedish GRID Initiative) är en nationell beräkningsresurs, s k ”computational grid”. Vad gäller datanätverk finns det via SNIC även lagringsmöjligheter genom SweStore (Swedish Storage Initiative), idag är dock både SNICs och SweGrids resurser tillgängliga endast för universitet och forskare.

Vetenskapsrådets publikation ”Swedish science cases for e-infrastructure” pekar på att behoven av en stödjande e-infrastruktur är höga och förväntas öka ytterligare både vad gäller grundläggande kapacitet och nya tjänster (bl a lagring). Rapporten lyfter ARIADNE, CESSDA, CLARIN, DARIAH, DC-NET, och Europeana som särskilt viktiga samarbeten där bland annat standarder utvecklas. DC-net-projektet var det första europeiska projektet som initierade samverkan mellan e-infrastrukturer, kulturarvsinstitutioner och forskningssektorn och hade som syfte att främja den digitala infrastrukturen för att underlätta tillgången till forskningsinformation i digital form från kulturarvssektorn. Projektet tog fram förslag till prioriteringar av nya tjänster som kan förmedlas genom de digitala infrastrukturerna för förmedling och lagring av kulturarvsdata. Högst prioriterat blev det långsiktiga digitala bevarandet och på andra plats kom beständiga identifierare. En rapport om dessa prioriteringar, kompletterad med goda exempel (best practices), har publicerats av DC-NET, ”DC-net priorities and Best Practices for Cultural heritage”. Inom ramen för projektet har man även publicerat en studie om tjänster för digitalt bevarande: ”Digital preservation services: state of the art analysis”, baserad på en analys som ger en överblick av verktyg och tjänster som stödjer olika funktioner inom digitalt bevarande.  DC-net projektets resultat var en viktig utgångspunkt för projektet DCH-RP (Digital Cultural Heritage Roadmap for Preservation) som tog vid där DC-net slutade och som tagit fram en roadmap för digitalt bevarande, samt en handbok. Inom ramen för DCH-RP-projektet har man även undersökt möjligheterna till att kunna tillämpa bevarandetjänster som skulle vara tillgängliga via e-infrastrukturer och GRID-nätverk.

Behov av stödjande e-infrastrukturer för forskare och andra forskningsinfrastrukturer ställer nya krav på de tjänsterna som e-infrastrukturerna tillhandahåller. SNIC har gjort en kartläggning av behoven som redovisas i rapporten ”Survey of e-infrastructure needs for eight large infrastructures – Report from SNIC to the Swedish Research Council” där ett urval av science cases presenterades.

Infrastrukturella tjänster för datahantering

Flera olika tjänster och verktygskataloger har skapats inom ramen för olika projekt och initiativ, som komplement till e-infrastrukturer. Ibland är det generella tjänster som inom ramen för EUDAT-projektet och ibland tematiska som till exempel bevarandetjänster inom DCH-RP,  tjänster för textdigitalisering inom SUCCEED-projektet eller som resultat av ett nätverksgemenskapsintresse, som t. ex. COPTR-tjänster.

En nationell överenskommelse (så kallad Memorandum of Understanding) om den infrastrukturella inriktningen har skrivits under mellan Riksarkivet, i egenskap av huvudman för Digisam, och Vetenskapsrådet/SUNET som tillhandahåller digital infrastruktur. Denna överenskommelse innebär grunden för olika former av samverkan, till exempel mellan kultur och forskning så att forskare får bättre tillgång till kulturarvsdata som material för forskning och undervisning, eller nya utbildningsresurser. Inom detta överenskommelsen har man som ett första steg påbörjat ett pilotprojekt om lagring för långsiktig användbarhet.

Under modelleringsarbetet kring digitala infrastrukturer som Digisam genomförde uttrycktes ett starkt behov av stödfunktioner både i form av råd och stöd och i form av tekniska verktyg, för bland annat lagring, bevarande, mappning, semantiska stödfunktioner, beständiga identifierare, m m.

Slutsats

Under Digisams arbetet har det blivit tydligt att det idag inte existerar en sammanhållande infrastruktur för kulturarvsinformation som innehåller alla nödvändiga aktörer, delar och funktioner. Målet blir istället att ha en koordinerande funktion med samarbetsplattform för digitalt kulturarv där man identifierar och implementerar verktyg och tjänster som stödjer hantering av kulturarvsdata. Mycket kan också vinnas genom samutnyttjadet av av de stora forskningsinfrastrukturerna och kulturarvets datainfrastrukturer med digitaliserad kulturarvsinformation. Samlat utgör digital kulturarvsinformation en betydande resurs för forskning. Digitala infrastrukturer med tillhörande tjänster för bland annat infrastruktur för lagring skulle därför kunna förenkla hantering av kulturarvsinformation, som kan leda till ökad forskning och bred publik användning och återanvändning