Checklista för beständiga identifierare – Vad ska jag tänka på?

Medaljer

Medaljer

Medaljer. Marinmuseum Karlskrona. Ett urval av medaljer från ur Marinmuseums samlingar. CC-BY-NC.

Kopplat till Digisams pågående arbete med att ta fram förslag till nationella riktlinjer för hur en samordnad digital informationshantering kan ske hos statliga institutioner som samlar, bevarar och tillgängliggör kulturarvsmaterial och kulturarvsinformation, tar vi just nu även fram olika checklistor. Dessa är tänkta att fungera som ett stöd för kulturarvsinstitutionerna i arbetet med olika digitaliseringsmoment. I detta blogginlägg ligger en checklista som handlar om beständiga identifierare i fokus.

Mängden kulturarvsinformation på webben ökar ständigt, och länkad öppen data öppnar möjligheterna att sammanföra information från olika kulturarvsinstitutioner. Samtidigt innebär webbens dynamiska karaktär att den information man söker efter ibland har flyttat och att den inte går att finna trots att den fortfarande finns på webben. Så hur kan man se till att den digitala kulturarvsinformation man publicerar blir så beständig som möjligt?

I ett tidigare blogginlägg har jag skrivit om beständiga identifierare, som är unika kodsträngar kopplade till digitala poster. Själva utformningen av identifierarna för olika objekt och begrepp påverkar om de kommer att vara unika och beständiga. Därför har vi nu tagit fram ett utkast till en checklista för vad man kan tänka på vad gäller beständiga identifierare. Är det någonting du saknar i checklistan? Vi är mycket tacksamma för dina kommentarer och synpunkter på checklistan, antingen direkt som bloggkommentarer eller per mail till sanja.halling@riksarkivet.se (obs! senast den 11 mars). Vi räknar med att dokumentet därefter redigeras och publiceras på vår webbsida.

Sanja Halling

Kommentar (2)

 • Marcus Smith| 6 mars, 2015

  Hej! Några korta kommentar på checklistan:

  [list]
  [*] Bra att ni tar upp beroenden på externa uppslagstjänster! Det är viktigt! Värt att påpeka dock att uppslagstjänsten behövs bara för att nå en kopia av objektet, men påverkar inte identifierarens unikhet; inte alla URI:er är upplösbara, t.ex, och ska inte behöva vara.

  [*] Bra också med att uppmana till återanvändning av befintliga identifierare som redan används. Skapa inte nya unika indentifierare i onödan! 🙂

  [*] En fråga som jag skulle lägga till är, ”Innehåller identifieraren något innebörd i sig som kan påverkas av framtida förändringar?” eller någonting i den stilen. Med detta menar jag att man ska undvika t.ex. att anse namn vara unika och oföränderliga, eller att t.ex. organisatoriska fördelningar eller samlingsinformation ingår i en URI (en framtida omorganisation kan ju göra att avdelningen byter namn, eller försvinner), eller att URI:n blir beroende av en viss produkt eller system (vad händer när man byta system eller leverantör?). Tänk typ ’Cool URIs’ http://www.w3.org/TR/cooluris/ 🙂

  [*] Skillnaden mellan URN och URL förklarades obsolet redan för tio år sedan (se t.ex. http://tools.ietf.org/html/rfc3986). Att nämna bägge två under ”Exempel” som om de är två separata saker utan vidare förklaring kan därför skapa förvirring kring begreppen.

  [*] Däremot nämns kanske den viktigaste form av unik identifierare i dagens digitala sammanhang, nämligen URI:er, bara en gång i brädtexten – och där bara för att fråga om deras stuktur ifall man använder dem, inte för att uppmana att man borde använda dem – och tas inte upp överhuvudtaget under ”Exempel” där andra sorters unika identifierare förses med definierande länkar. URI:er skulle tåla att äga lite mer rum i checklistan, tycker jag, men borde väl åtminstone definieras till samma grad som de andra exemplen.

  [*] (Sidospår: Strängt taget borde man nog prata om IRI:er snarare än URI:er för att inte utesluta identifierare med internationaliserade domännamn, men i praktiken är det väl underförstått att pratar man om URI:er, menar man även IRI:er.)
  [/list]

  Ser fram emot att se den slutgiltiga versionen!

  /Marcus

 • Sanja Halling| 9 mars, 2015

  Hej Marcus och stort tack för bra synpunkter och inspel!

  Nedan följer några kommentarer:
  o Det stämmer att uppslagstjänster är viktiga, bland annat p g a robusthet och långsiktigt tillförlitlighet. URI:er är attributer av en resurs medan uppslagstjänstens PID:ar tillåter att metadata om en digital resurs lagras och hämtas, man når inte endast kopior av en digital resurs utan PID:ar möjliggör också annat, som t ex citering av resurser eller att kunna referera till de digitala objekten. Det finns idag inte något krav på att beständiga identifierare som uttrycks som URI:er är upplösbara, men från bevarandesynpunkt skulle det vara att föredra – vilket också talar för användning av uppslagstjänster.
  o Håller med om att nya identifierare inte ska skapas i onödan. 🙂
  o Det är väldigt viktigt att URI:erna utformas på ett så stabilt och beständigt sätt som möjligt, vilket det står mer specifikt om i EU Kommissionens rekommendationer som det refereras till i checklistan och i W3Cs rekommendationer. ”Cool URIs” är ett sätt att tänka i rätt riktning. Dock används PID-system i stor utsträckning idag för digitala resurser inom exempelvis forskningssektorn eftersom URI:er ses generellt sätt som otillräckliga på lång sikt (t ex p g a att domännamn inte alltid är beständiga över tid).
  o Även om URI i http://tools.ietf.org/html/rfc3986 klassificeras som en ”locator”/platshänvisning, ett namn eller både och (för att underlätta teknisk hantering), är det ibland fortfarande nödvändigt att kunna göra skillnad mellan ett unikt namn och en plats. Till exempel kan en namngiven resurs eller dess kopior finnas på flera platser, eller så behöver man att skilja ut begreppen när specifika analoga identifierare implementeras i URI:er. De flesta biblioteken idag använder URN:er för publikationer, som genom en uppslagstjänst kan kopplas ihop med URL:er. Det kommer vi också förtydliga när vi introducerar begreppen.
  o Det stämmer, just nu finns det mesta om URI:er och utformning av URI:er under ”Några fördjupningstips” så vi kommer att lägga till mer information om URI:er i ”Exempel på standarder/system för beständiga identifierare” också.
  o Naturligtvis kan det i tillämpliga fall också vara relevant att prata om IRI:er och även andra typer av identifierare, som t ex LSID:er för Life-Science. Vi kommer att lägga till mer information om dessa identifierare också.

  Vi ser fram emot fortsatt dialog i dessa frågor!

  /Sanja