Vi försöker sortera…

Postsorteringen, New York ca 1910-15. Fotograf: okänd. Library of Congress. No known copyright restrictions.

Vi på Digisam har regeringens uppdrag att i samverkan med minnessektorn arbeta med frågor kring digitalisering, digitalt bevarande och digitalt tillgängliggörande av kulturarvet. Vi möter många som tycker att det är en bra idé, men får också många frågor om vad de där begreppen står för – egentligen.

Vi har sett att orden förstås på olika sätt inom arkiv, bibliotek och museer. Man använder samma ord för helt olika saker, eller olika ord när man menar samma sak. Ibland när man säger ”digitalisering” menar man alla slags IT-stödda processer, ibland får samma begrepp stå för något vi uppfattar som en mindre delprocess (scanning t ex). På det viset tar det tid att förstå varandra. Det kan bli svårt att lösa problem när man inte har en gemensam förståelse för vad de består i, och risken finns att man blir både oense och överens på helt fel grunder.
Därför prioriterar vi på Digisam en gemensam Begreppsmodellering för området ”Digitalt kulturarv”. Experterna i vår styrgrupp – Martin Bjersby (Riksarkivet), Göran Konstenius (KB), Lars Lundqvist (RAÄ) och Sven Rentzhog (Nordiska museet) – har hjälpt oss att ta fram en generell och övergripande konceptuell modell som ska förstås icke-kronologiskt och täcka in alla aspekter av ”digitalt kulturarv” så som det definieras i våra uppdrag.
Obs! Klicka för större bild.

Vi hoppas att den ska hjälpa oss att ensa begreppen och skapa en gemensam förståelse för vad som är äpplen och päron. Modellen kommer vidare att ligga till grund för fortsatt modelleringsarbete, där vi stegvis bryter ned delarna i allt mindre beståndsdelar och så småningom når fram till mer specifika och konkreta frågor om t ex olika bärare och materialtyper. När vi väl fått ordning på begreppen blir det lättare att utforma sektorsövergripande råd och stöd för vardaglig problemlösning inom området, något som efterfrågas på många håll, inte minst inom Kulturarvslyftet.

För att komma vidare i arbetet behöver vi just nu från er som jobbar i sektorn feedback på följande punkter:

1.      Finns det något som hör hit (till digitalt kulturarv) men som INTE täcks in av överrubrikerna/ huvudprocesserna: Styra, Producera, Använda, Bevara?
2.      Finns det något under Producera som INTE täcks in av underrubrikerna/delprocesserna: Bildfångst & Metadata?
3.      Finns det något under Använda som INTE täcks in av underrubrikerna/delprocesserna: Öppen data & Paketering?
4.      Finns det något ytterligare av vikt att tillägga, stryka, flytta, ändra?
Är mycket tacksam för just dina synpunkter på just dessa frågor! Kommentera gärna här nedan eller maila mig direkt men OBS senast den 14 maj. Räkna också med att vi kommer att återkomma med ytterligare frågor längre fram i modelleringsprocessen. Vi ser fram emot att ta del av dina bidrag till en robust gemensam förståelse av vad digitalt kulturarv handlar om. Egentligen.
Johanna Berg, Digisam

25 thoughts on “Vi försöker sortera…

  1. Lars Aronsson

    Jag behöver veta om ett visst verk redan är digitaliserat. Det enda verktyget för det, som finns idag, är att söka på Google. Här kunde Digisam hjälpa till genom att upprätta en katalog, men inga sådana initiativ syns till. I andra hand kunde Digisam kräva att alla som digitaliserar gör sitt material indexerbart för Google. Men det steget syns inte i det här processdiagrammet. Det är en brist.

  2. Lars Aronsson

    Ordet ”mediafångst” är påhittat och används ingenstans. Det har totalt 7 Google-träffar. Bildfångst är en etablerad fackterm sedan över 25 år och har 6000 Google-träffar.

  3. Jättebra initiativ helt enkelt. Litet såsom Henrik hann kommentera har modellen dock en ganska industriell syn på skapandet av det digitala kulturarvet som en produkt som först skapas och sedan blir ‘färdig’ för konsumenter. Samtidigt ser processen ut såsom det finns en ägare som faktiskt kan styra (hela) processen. Det här är inte helt olikt från de flesta process/livcykelsmodeller som finns redan tidigare. Den representerar ett institutionsperspektiv på det digitala kulturarvet som inte nödvändigtvis hänger ihop med det som händer med det digitala (eller analoga) kulturarvet ‘där ute’ på institutioner och särskilt på sikt i samhället. Jag menar inte att det är nödvändigtvis något stort fel med denna synvinkel i sig men det är viktigt att inte anta att allt finns med i bilden och/eller att dessa processer är de mest relevanta från en annan än en institutionell synvinkel.

  4. Hej Lars och tack för svar. Modellen i bloggposten ovan är inte tänkt som processdiagram. Idén med den är att försöka skapa en sektorsgemensam förståelse av vad begreppen står för. Bilden tar inte upp några aktiviteter/leveranser, och inte heller vilka aktörer som eventuellt bör stå för sådana. Men det betyder förstås inte att sådana frågor är oviktiga, bara att allt har sin tid och att vi tar dem vid ett senare tillfälle. Initiativ till den typ av katalogtjänst du efterfrågar har tidigare tagits inom DigX-projektet i Lund, se http://digx.ub.lu.se/indexfh.cfm, men som alltför ofta tycks det ha saknat långsiktig förvaltning/finansiering och verkar nu sedan ett par år insomnat. Digisam kommer att göra sitt yttersta för att samla resurser på verksamheter med långsiktigt stabil förvaltning och hoppas kunna återkomma till frågan om vilka verktyg som är allra viktigast. / Johanna

  5. Hej Isto och tack för feedback. Vår ”övergripande konceptuella och icke-kronologiska modell” är inte ett försök att teckna hela bilden av digital utveckling för kulturarvet. Det har andra gjort bättre, se t ex Henrik Summanens Nätvaron i praktiken (http://www.k-blogg.se/2012/02/17/natvaron-i-praktiken-ett-idedokument/). Vi har i uppdrag att stödja 24 myndigheter i arbetet med ”digitalisering” och hittills inleds alla dokument med bekymrade begreppsdiskussioner som landar i helt olika förhållningssätt. För dessa institutioner och många andra handlar de stora frågorna om hur de kan styra sitt interna digitaliseringsarbete mot effektivt resursutnyttjande, stabilt bevarande och maximal användbarhet. Och för att vi ska kunna prata om detta behöver vi en gemensam diskurs som vi nu försöker bygga tillsammans. Välkommen med flera inspel!/ Johanna

  6. Susanne Nickel

    När vi nu prata om ord här kanske det vore bra att ta sig en titt på e-arkiv, e-diarium som också jobbar med orddefinitioner. Kanske här finns något att plocka ifrån?

  7. Hej Susanne,vi håller med dig. Vi har nära kontakt med projektet e-arkiv och e-diarium och kommer att samverka i det fortsatta modelleringsarbetet./Rolf

  8. Vi pratade på Digisam igår om det du är inne på när det gäller öppen data och andra centrala utgångpunkter för hur vi hanterar offentlig information. Vi tror precis som du Henrik att det finns ett antal grundförutsättningar som följer av den digitala agendan för Sverige http://bit.ly/HBL54W som behöver tydliggöras i en särskild text. /rolf

  9. I stort tycker jag att modellen känns användbar, vilket bör vara det viktigaste kriteriet för en modell. Jag har helt kort försökt fundera igenom Stockholms UB:s digitaliseringsverksamhet utifrån modellen och tycker den gav hjälp att förstå vår verksamhet och se var vi var starka och var vi var svaga (även om jag nöjt konstaterar att vi faktiskt tänkt på alla delar i modellen). Visst är modellen en förenkling, det ju alla modeller. Blir den för komplex blir den också oanvändbar. Den konstanta loop som finns mellan användning och produktion av digitalt material syns ju inte i modellen, men jag tror det är bättre att rita en annan karta för den, än att försöka få in detta i en och samma modell. Möjligen skulle jag vilja notera någonstans att även ”digitalt fött” (för att använda ett begrepp jag egentligen inte tycker om) material kan hanteras enligt samma modell.Sedan funderar jag rent konkret på om rubriken ”paketering” skulle byta namn till ”kontextualisering”? Tror också att jag vill byta ut rubriken ”öppen data” till något annat men har inget bra förslag. Egentligen vill jag kalla detta ”web” eller ”internet”.(Och så tycker jag att ”kulturarv” är ett lika komplicerat begrepp som ”digitalisering”, men det är en parentes.)

  10. Jag tycker att modellen ganska bra stämmer överens med mitt sätt att se på digitalt kulturarv. ”Digitalt kulturarv” kanske skulle kunna tas för kulturarv i född digital form snarare än ”digitaliserat kulturarv” vilket jag tror är det som ni menar. Jag har ett tillägg till processen producera. Jag tycker att ”efterbearbetning” är värd ett eget processteg. Jag är van vid, från andra arbeten med att definiera digitaliseringskedjor och processer, att se bildfångsten endas som den del i produktionsprocessen som rör själva avbildningsförfarandet där masterfilerna eller arkivfilerna (som är råmaterialet produceras). Alla andra förädlingsprocesser så som skapande av derivat för webbvisning, förlagor print on-demnadtryckning, OCR-läsning, OCR-zoning, skapande av e-pub format etc. ligger inom ramen för efterbearbetning. Fokus på dessa två processteg är helt olika. I bildfångst (eller digital avbildning som jag tycker är en bättre term) ligger fokus på att skapa en ”rå”-fil som ett på så riktigt sätt som möjligt avbildar förlagan, som har en hög teknisk kvalitet och som kan användas som utgångspunkt för att skapa alla andra derivat. Under efterbearbetning är fokus på att skapa material som är användbart i olika publiceringskanaler och där kvaliteten utgår från upplevd kvalitet snarare än teknisk.Vad det gäller ordet paketering som det används i det här sammanhanget så finns har jag inga synpunkter men noterar att det krockar med ett annat paketeringsförfarande som ingår i bevarandedelen. Många arkivsystem bygger på OAIS-modellen där SIP, AIP och DIP paket är vanliga begrepp och där paketering används flitigt.

  11. HejJa som du säger så är ju tillgängliggörandet en del av användbarheten. Det jag saknade var just ett förtydligande kring detta eftersom jag anser att rubriken Använda är väldigt generell. Jag skulle önska ett större fokus just på formen för tillgängliggörandet men samtidigt kan jag mycket väl se att detta är en detalj som förhoppningsvis och troligtvis kommer att tas med senare i processen.mvh/Amanda

  12. Hej Anders & tack för att du tagit dig tid att kika på modellen. Extra kul med inspel också från bibliotekssidan! Användbarhet är vårt motto, och vi lovar att rita flera bilder, modeller och processcheman allt eftersom. Vi kommer också att modifiera bilden här ovan då vi sammanvägt relevanta synpunkter. Fler än du har uttryckt viss skepsis mot paketering resp öppen data – kontextualisering resp rådata är vanliga förslag på alternativa rubriker. Hur låter det tycker du? Det digitalt födda materialet smygs in nere i högra hörnet och den klent formulerade idén med det är att det tänks ansluta till användning och bevarande. Vad gäller själva kulturarvsbegreppet har vi lagt det i mitten helt enkelt därför att det är det regeringen använder när den skriver sina uppdrag och sådana kan inte mötas med dekonstruktion. På återhörande!/ Johanna

  13. Hej Erik och tack för synpunkter. Vi tänker oss att vi i steg två kommer att bryta ned varje delprocess i ytterligare delprocesser. Då kommer det också att klarna om de derivat du talar om hör mest hemma under media/bildfångst eller snarare bör skrivas in under användning. Som komplement till ditt förslag om efterbearbetning kan nämnas att andra röster fört fram förberedelser som ett separat inslag. De hävdar då, med viss rätt, att inventering/urval/prioritering är felplacerat under styrning.Hur tänker du kring det?Själv börjar jag känna ett visst behov av det ännu oritade schema som också pekar ut bl a behovet av explicita processer/rutiner och infrastrukturella stöd/verktyg. Min förhoppning är att vi kommer dit – med hjälp av dig och andra kolleger i sektorn!/ Johanna

  14. Hej igen Amanda! Hela modellen ovan är formulerad på en generell och abstrakt nivå, men när vi bryter ned rubrikerna kommer vi att kunna stegvis zooma in den praktiska vardagsverksamheten på institutionerna. Just under Använda tror vi att det är viktigt att hålla isär Öppendata/Rådata och Paketerad/Kontextualiserad information. Tillgänglighet är sannolikt relevant för båda, men blir i det ena fallet en i huvudsak teknisk fråga och i det andra en kanske målgruppsnischad diskussion. Verkar det vettigt tycker du, eller tänker du på tillgängliggörandet i andra perspektiv?/ Johanna

  15. Bra modell! Jag vill mest instämma med några föregående talare: datafångst tycker jag är bättre än bildfångst, som tycks utesluta åtminstone ljudinspelningar. Paketering/öppen data ledde mina tankar på helt fel spår, men när jag såg alternativen kontextualiserat/rådata blev det hela genast klarare — de termerna är nog bättre.

  16. Missade insmygningen i nedre högra hörnet…Jag är inte så förtjust att använda rådata istället för öppen data. Rådata skulle för mig hamna under bild/datafångst – i SUB:s process är det de obearbetade TIFF:arna som är rådata (eller, hmmm, är den fysiska förlagan rådata?). Det ni pratar om under rubriken öppen data är, tänker jag, snarare en förädling. (Även Tim Berners-Lee’s ”Raw Data Now!”-kampanj syftade ju till att göra något med rådatat, nämligen att tillgängliggöra det på internet.) Det ni beskrivit under rubriken handlar för mig väldigt mycket in ”internetifiering” (API:er, permalänkar, LOD o.s.v.). Viktiga saker! Eftersom det är underförstått att publicering idag sker via internet och vettig publicering innefattar t.ex. permalänkar, API:er och datadelning, skulle jag nog kalla den processen publicering. Publicering och Kontextualisering funkar fin som delprocesser under ”användas”.

  17. Hej Stefan & tack för svar! Vi jobbar vidare med detta under våren och återkommer med en reviderad modell så snart vi kan. Ser ju att det behövs något slags ordförklaringar till valda begrepp och hoppas på att saken blir tydligare allt eftersom. / Johanna

  18. Hej igen! Vi får nog fundera ett varv på de där underrubrikerna. Huvudpoängen är att ”publicering som LOD” är något annat – och mer användbart – än paketerad info i dig utst eller tematiska webtidskr typ. Återkommer! / Johanna

  19. För det första tycker ja att framställningen är mycket intressant och en utmärkt utgångspunkt för vidare diskussion. Jag presenterar i det följande en begreppsmodell av lite annan typ som kan användas till att analysera och komplettera den föreslagna Digisam-modellen speciellt då arbetet fortgår och fördjupas.Först några begrepp på hög abstraktionsnivå som är fritt härledda ur ontologier som CIDOC CRM:1. Tid och rum2. Plats3. Stoff4. Externa händelser, aktiviteter och processer (events)5. Interna mentala fenomen6. Aktörer7. Fysiska objekt8. Konceptuella objekt9. Tekniska system10. Juridiska objekt11. Benämningar12. Egenskaper13. Tillstånd14. RelationerSchemat ovan bildar ett skikt i en hierarki som kan förgrenas vidare och ta olika former i olika kontext (t ex olika domäner har typer av aktörer resp. roller). Schemats entiteter och relationer bildar ett nätverk som i tekniska tillämpningar kan uttryckas formellt t ex med hjälp av RDF och OWL, vilka är den semantiska webbens ”modersmål”.Det givna schemat tillåter och förutser multippel realisering vilket betyder att en instans kan vara underställd flera högre stående klasser, t ex en entitet kan samtidigt vara ett fysiskt och juridiskt objekt. För att ta ett annat exempel: en entitet kan uppstå från en process som kan karakteriseras både som intellektuellt skapande och manuell produktion. Vidare, ett artefakt kan beskrivas utgående från sina fysiska egenskaper men även utgående från de betydelser som är förknippade med de givna formerna osv.Med hjälp av ovanstående entiteter kan man beskriva ett objekt från tillkomst till upplösning i enlighet med livscykelmodellen men även genom att inrama de givna entiteterna i konsekutiva faser i enlighet med Records Continuum modellen.Genom att från början stödja sig på internationellt godtagna modeller och standarder blir det i längden enklare att t ex serialisera information till ett transportformat som LIDO för att överföra data från ett system till ett annat. Vidare blir det möjligt att strukturera moln av länkad data på ett meningsfullt och för användaren intuitivt sätt. Slutligen, genom att ta i beaktande dimensioner som de ovan uppräknade blir det möjligt att disambiguera och kontextualisera – alltså både skärpa och berika – befintliga, ofta knapphändiga metadatascheman.Några observationer om den givna Digisam-modellen. Stommen kan beskrivas som processorienterad, där övergripande processer kan spjälkas upp i delprocesser. Då tycker jag att rubriceringen inte är helt konsekvent – rubrikerna faller inom olika klasser i det ovan givna schemat (alltså punkterna 1–14). De kan t ex klassificeras som events, konceptuella objekt, operativa system resp. juridiska objekt.Jag skulle gärna skilja mellan att tillhandahålla (det som producenten gör) och använda (det som konsumenten gör) information. Lådan “Använda” borde alltså spjälkas i tu. I redan befintliga värdekedjor som baserar sig på öppen data fungerar konsumenterna dessutom som sekundära producenter.Man borde kanske också göra åtskillnad mellan skapande och produktion, t ex före bildfångsten har vi en lång produktionskedja och i början av den en skapande verksamhet. Skapandet fattas nu i modellen.Även slutändan av ett objekts livscykel fattas. Det kan gälla gallring, kassation eller förstöring av objekt, en persons död eller upplösningen av en institution. Ett besläktat tema är att det finns två typer av transformationer av objekt: i den ena typen bevarar objektet sin identitet, i den andra typen får objektet en ny identitet.För att sammanfatta: Det går väl att hålla modellen begriplig men samtidigt förankra den teoretiskt och göra den kompatibel med existerande standarder. Det är värt att påminna sig om en slogan som Apple använde någon gång på 80-talet: en bra produkt har både yta och djup.Mika Nymanmika.nyman@synapse-computing.com

  20. BEGREPP – FRÅN KOGNITION VIA FORMALISERING TILL OPERATIVA SYSTEMBegrepp uppstår ur våra upplevelser av vår föränderliga omgivning. I denna växelverkan med omgivningen skapar vi relativt stabila kognitiva enheter som återspeglar återkommande fenomen i vår föreställningsvärld. Begreppen motsvarar alltså det återkommande och varaktiga i upplevelsen. Trots att begreppen är relativt beständiga är de inte oföränderliga. Vi omdefinierar begreppen kontinuerligt så att de står allt bättre i samstämmighet med både vår upplevelse och andra begrepp – någon kan invända, att definitionerna är föränderliga men inte de underliggande begreppen. Denna process är inte bara subjektiv utan sker i social växelverkan och tar sig uttryck i olika diskurser. Digisam-modellen är ett uttryck för strävan att harmonisera sådana diskurser. De begrepp som identifieras i denna harmoniseringsprocess måste uttryckas som ett formellt system. Ett krav på detta system är, att man ur det skall kunna härleda klasser som kan implementeras med hjälp av programmeringsspråk. Här finns en fara för en återvändsgränd: en lyckad harmonisering kan leda till en lyckokänsla som döljer att man inte har skapat ett spår från de kognitiva entiteterna till formalisering och operationalisering som dessutom måste vara överensstämmande med internationella standarder och befintliga, planerade eller framdida tjänster. Det finns också en motsatt fara: att man skapar formella system som nog kan implementeras som klasser och operativa system men som inte har kontakt med en levande diskurs som på ett autentiskt sätt återspeglar den aktuella verkligheten i arkiv, bibliotek, museer och forskning. Den tredje faran är givetvis att man skapar tekniskt fungerande system som inte är förankrade i en täckande och konsistent beskrivning av måldomänen. För att få det hela att gå ihop krävas alltså domänspecifik expertis, strategisk överblick och teknisk insyn – alla tre.Mika

  21. Här kommer ett par synpunkter(har inte hunnit reflektera över innehållet i de tidigare inläggen).Istället för ”Användas” kan ord som ”Förädla” eller ”Tillgängliggöra” passa bättre in. ”Användas” tycker jag blir otydligt i sammanhanget, det förknippar jag med processer som rör målgrupperna/brukarna.Angående ”Digitalt födda material”, den skulle kunna vara riktad till mitten till ”Digitalt kulturarv”. Även det innehållet kan behöva ”Bevaras” eller ”Användas” (förädlas/tillgängliggöras).

  22. Hej Mika & tack för ambitiöst svar! Vi kommer att ha nytta av dina klargöranden i vårt fortsatta arbete med semantisk anpassning. Vår ”övergripande konceptuella och icke-kronologiska modell” är emellertid inte tänkt som en heltäckande bild av digital informationshantering utan – väldigt analogt och gammeldags – ett försök att hitta gemensamma ord för den fortsatta dialogen med folk som inte talar RDF/OWL. Det är förhoppningsvis därför det ser lite banalt ut för dig som kan. På återhörande / Johanna

  23. Hej Helene och tack för synpunkter. Vad gäller användning är poängen med det (eller användbarhet) just att det för tankarna till nyttiggörandet av informationen. Tanken är att skärpa fokus på hur institutionerna/informationsförvaltarna kan skapa förutsättningar för maximal användning inom andra pol/samhällsområden som utbildning, forskning, turism, design – som alternativt/kompletterande till förädling/kontextualisering/paketering. Angående det digitalt födda, se svar till Anders Söderbäck ovan. / Johanna

  24. Hej allihop och varmt tack för att ni tagit er tid att granska vår lilla modell, grunna och komma med smarta synpunkter och kommentarer som kommer att hjälpa oss vidare med modelleringen. Med de inlägg jag fått direkt på mailen är ni ett tjugotal som bidragit. Det tackar vi för och vi kommer att återkomma till er. Vi måste bara väga samman feedbacken först och revidera modellen innan vi kan återkomma med vidare steg i den öppna processen. Det betyder att vi nu stänger den här diskussionen nu och önskar er alla en trevlig helg!/Johanna


Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

*