Arkivinformation + CIDOC CRM = sant (del 2)

Vi har i en tidigare bloggpost  skrivit att Digisam medverkar i ett projekt på Riksarkivet som handlar om att undersöka hur arkivinformation kan harmoniseras med CIDOC CRM  och hur detta kan underlättas av ett stödjande system. Det är intressant att se CIDOC CRM RDF  användas med data från arkiv och museer, eftersom CIDOC CRM RDF är en befintlig etablerad semantisk beskrivning för tvärsektoriell kulturarvsdata som kan uttryckas med bibehållen kvalitet. Projektet har i första hand testat tjänsten 3M (Mapping Memory Manager),  utvecklat av FORTH.

Arkiv och samlingar

Utmaningar som vi har mött i att uttrycka arkivinformation med CIDOC CRM-modellen omfattade bland annat att definiera arkivbildarens roll, beskriva volym och utgå ifrån objektbaserad beskrivning.

I CIDOC-CRM  kan en person eller organisation tilldelas olika roller. Ett informationsobjekt kan exempelvis ha skapats av en ”creator”. Men arkivbildaren behöver inte vara densamma som den som har skapat informationen. Arkivbildaren kan också ta emot information som skapats av andra, men som mottas av personen/organisationen i egenskap av arkivbildare. Därmed blir det inom arkivinformationskontexten en skillnad mellan ”arkivbildning” och ”samling”. En samling, dvs. ett antal objekt som samlats utifrån ett specifikt tema eller urval, kan vara ett arkiv men behöver inte vara det. En samling förutsätter inte en arkivbildare, utan kan ha uppkommit i flera av varandra oberoende samlares verksamheter.

Ytterligare en utmaning utgör begreppet ”volym” som går tillbaka till en tid då arkiv i regel var pappershandlingar, det vill säga volymen som fysiskt objekt (kartong med papper) och som logiskt objekt (informationsinnehållet i handlingarna i kartongen). Detta försvårar användningen av CIDOC-CRM som förutsätter en tydlig åtskillnad mellan fysisk och logisk natur (t.ex. i fråga om dateringar) – medan det i praktiken är mycket av informationen om en volym i arkivredovisningen som kan hänföras till antingen den fysiska eller den logiska beskrivningen av objektet.

Å andra sidan skulle ytterligare information kunna adderas i och med anpassning till möjligheterna att göra en mer objektorienterad beskrivning. Ett brev kan exempelvis ha ett annat värde för forskare och andra användare än bara som ett dokument. Det kan ha att göra med exempelvis specifikt material, särskilt bläck, m.m.

Resultatet av mappningarna mellan arkivdata och CIDOC-CRM pekar på att det idag finns utmaningar med hänsyn till de specifika krav som ställs för beskrivning av arkivinformation. Samtidigt finns det en stor framtida potential i möjligheten att sammanlänka informationsbeskrivningar. Det har även varit tydligt att ett övergripande initiativ för detta borde tas på en mer generell nivå.

Läs mer…

Sammanlänkningar av arkivinformation och museiinformation

Med hänsyn till de utmaningar som vi mötte vid mappningarna av arkivinformation till CIDOC CRM, bestämde vi oss för att testa hur det skulle vara att sammanlänka arkivinformation med museiinformation med hjälp av CIDOC CRM–modellen. Efter några sökningar i materialet valde vi att försöka hitta några fotografier av fotografen Victor Lundgren. I Murbergets  samlingssystem hittade vi en hel del fotografier av Viktor Lundgren, bland annat med hästar som motiv.

b2ap3_thumbnail_Skarmavbild-2016-05-12-kl.-17.37.52.png

Foto: Viktor Lundgren CC BY

Fotografierna var beskrivna på objektnivå och det var ganska okomplicerat att göra en mappning i 3M av den information som fanns med.

 b2ap3_thumbnail_Skarmavbild-2016-05-12-kl.-17.55.38.png

För att hitta en grundläggande gemensam nivå utifrån det metadata som fanns tillgänglig i de båda systemen och med CIDOC CRM som utgångspunkt ritade vi upp en modell som såg ut på följande sätt och som omfattade information från både arkivinformationssystem och samlingssystem:

bild

I NAD (Nationella Arkivdatabasen)  fanns det en fotografisamling av Janrik Bromé där vi fick en träff på samma fotograf, Viktor Lundgren, men inte som fotograf utan som motiv på en fotografi, troligtvis ett självporträtt han har tagit som skulle skickas som julkort, med texten på kortets baksida: ”God Jul och Gott Nytt år! Tillönskar Viktor Lundgr” (resten saknas).

viktor

Bilden nedan visar resultatet av mappningen utifrån arkivinformation, en grafisk framställning av de hierarkiska strukturerna, uttryckta genom relationer i CIDOC CRM.

b2ap3_thumbnail_visualisering2.png

Vi ville även testa sammanlänkningar av fotografens auktoritetspost. Vi tittade i Fotografregistret från Nordiska museet i Kulturnav  men lyckades inte hitta fotografen som vi tittade på (Viktor Lundgren) där- Däremot fanns det en auktoritetspost om honom inbäddat i en metadatapost från Sundsvalls museum . Idag är Kulturnav en plattform för samarbete kring auktoritetslistor, och i vårt arbete uppstod frågan om hur vi gör när vi vill lägga till en enstaka auktoritetspost. Vi kontaktade då Kulturnav/Nordiska museet och fick auktoritetsposten http://kulturnav.org/e8cbd259-d5da-434c-b621-9f654e664561 publicerad i registret, så att vi kunde länka till den.

När vi nu fick reda på grundläggande uppgifter om Viktor Lundgren kunde vi även hitta mycket annan information om honom i NAD, bland annat i kyrkoarkiven (födelseboken, församlingsboken och häradsrätts arkiv (bouppteckning).

Genom TMP2 (ThesaurusManagement Platform),  webbplattform för att samarbeta kring och publicera tesaurier och auktoritetsfiler kunde vi också sammanlänka informationen med termer som ”fotograf”,  ”professionellt fotografi” , ” Svart-vitt fotografi”,  för att nämna några.

Resultat

När det gäller interoperabilitet mellan arkiv- och museiinformation som skulle kunna effektiviseras av CIDOC CRM och/eller länkbara data så har vi kunna konstatera både möjligheter och utmaningar. Resultatet av mappningarna mellan arkivdata och CIDOC-CRM RDF pekar på att det idag finns utmaningar med hänsyn till de specifika krav som ställs för beskrivning av arkivinformation. Så som det ser ut utifrån dagens begränsningar handlar det framförallt om svårigheterna i beskrivningen av själva materialet eftersom informationen inte mappas på samma nivå då arkivinformation använder flernivåbeskrivning.

För att åstadkomma snabb effekt och sammanlänka information mellan skilda metadatamodeller fokuserar man redan idag på att sammanlänka information genom auktoritetsfiler. Det finns också en stor framtida potential i möjligheten att sammanlänka information genom att skapa interoperabilitet mellan datamodeller, vilket var vad vi undersökte med hjälp av CIDOC CRM i de tester som genomförts. Det har även varit tydligt att ett övergripande initiativ för detta borde tas på en mer generell nivå. Om man jämför hur liknande frågor har hanterats i biblioteksdomänen för att överkomma liknande utmaningar så har anpassningar gjorts på en övergripande nivå i samarbete med ICOM/CIDOC. Man har exempelvis tagit fram anpassningar av CIDOC för biblioteksmaterial, inklusive auktoritetsdata; FRBR, FRAD och FRSAD-modeller samt FRBRoo. Det innebär att biblioteks- och museidata idag har en gemensam konceptuell modell för beskrivning av informationen.

Har du egna erfarenheter av sammanlänkning av informationen från arkiv och museer? Har du synpunkter på harmonisering av dessa datamodeller? Vi är tacksamma för dina kommentarer och synpunkter på projektets resultat, antingen direkt som bloggkommentarer eller per mail till sanja.halling@riksarkivet.se (obs! senast den 23 maj).

Lina Marklund och Sanja Halling

4 thoughts on “Arkivinformation + CIDOC CRM = sant (del 2)

  1. Susanne Nickel

    Tidschemat är ganska tight! KAN ni inte utöka tiden för kommentarer. Det är inget lätt ämne och behöver kanske en viss tid för eftertanke.

  2. Lina Marklund

    Vet att det är ganska tight om tid, men vi har inte så mycket att spela på tyvärr. Vi kan förlänga tiden för kommentarer till måndagen 23 maj. /Lina

  3. Standarder och gemensamma modeller, som CIDOC CRM och referenshanteringen mellan olika standarder och uttryck är komplext att navigera.

    Har ni uttryckt er ”lokala behovsbild” för projektet i någon form av UML-diagram där ni sedan exponerar ”er modell” genom länkning och RDF uttryck till de standarder som ni behöver förhålla er till? Ni illustrerade era tankar i denna post med er informationsmodell där ni gjort er koppling.

    Jag klurade även på användningen av wikidata.org för att förstärka saker som ligger i kultarvsskatterna och arkiven med entiter/termer/begrepp som är ”allmän gods” i termer av att det finns uttryck för dem i Wikidomänerna?

    Sedan är jag nyfiken på ”verktygsuppsättningen” för det praktiska arbetet.

  4. Hej Fredric och tack för din kommentar!

    Komplexiteten är anledningen till att de flesta projekt med länkade data och kulturarvsinformation börjar enkelt, med en harmonisering av olika metadatastandarder på en grundläggande gemensam nivå och komplexitet som byggs in över tiden. Samtidigt är CIDOC CRM ett format som kan användas på ett så pass enkelt eller avancerat sätt som man väljer att lägga det på.

    Vad vi försökte undersöka var om det skulle gå att skapa semantisk interoperabilitet mellan domänspecifika datamodeller och CIDOCs CRM RDF och koppla samman så mycket information som möjligt som länkbar data med en gemensam ontologi. Sedan pekade vi på olika auktoritetsfiler och även wikidata.org, för hästen som motiv (https://www.wikidata.org/wiki/Q726)

    Vad verktygen beträffar så använde vi tjänsten 3M (Mapping Memory Manager): http://139.91.183.3/3M/

    Vänliga hälsningar,
    Sanja Halling


Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *

*