• Home
  • /Posts Tagged ' LOD '

Archives

CIDOC CRM-workshop i Oxford

Under två intensiva dagar förra veckan deltog jag i en workshop i Oxford om hur man kan hantera kulturarvsinformation i CIDOC CRM-modellen.

Workshopen arrangerades av British Museums-projektet Research Space och leddes av Dominic Oldman, Head of ResearchSpace, och Maria Theodoridou, R & D engineer vid Foundation for Research and Technology FORTH.

Dominic

Dominic Oldman. Foto: Sanja Halling CC-0

Dagarna bjöd på många intressanta diskussioner och modelleringar av kulturarvsinformation i CIDOC CRM med kollegor från bl a Ashmolean Museum of Art and Archeology, Bodleian Libraries, Peabody Museum of Archaeology and Ethnology at Harvard University, Pori Art Museum, Yale University, etc.

Verktyget som användes under kursen var 3M, ett verktyg med öppen källkod som är särskilt utformat för att stödja semantiska mappningar till rikare ontologier och CIDOC Conceptual Reference Model utan att det är nödvändigt att förstå alla tekniska element. I 3M kan man, utan alltför avancerade tekniska förkunskaper, mappa kulturarvsinformation till CIDOC CRM och i samarbete med andra även skapa länkbara data och semantiskt integrera information med andra datakällor. På så sätt harmoniserar man kulturarvsinformation och gör den relevant och användbar för en bredare publik.

Tavla

Mappning pågår. Foto: Sanja Halling CC-0

Varför mappa informationen överhuvudtaget – räcker det inte att bara lägga ut all rådata som länkbar? Utifrån ett antal konkreta exempel blev det tydligt att ”digital argument requires context”, dvs vi behöver vara överens om vad vi menar med vissa begrepp, och för att enas om betydelsen är kontexten nödvändigt. Vad betyder det t ex när ett löst begrepp som ”type” är definitionen på en metadatapost som beskriver ett museiföremål? För att veta vad som avses behövs en utvecklad modell samt dokumentation som man kan gå till när man är osäker på hur man ska göra. Annars kan ”typen” av information bli allt från beskrivning av databärare till bilden av objektet, ämnesbeskrivning, m m.

Vi fick också testa själva att beskriva informationen i CIDOC CRM på ett antal praktiska exempel från bland annat British Museum samt på vårt eget material.

Allt som allt var det två spännande och konstruktiva dagar med nya initiativ som togs på många områden. Det kommer att bli mycket spännande att se hur resultatet av dessa projekt blir.

Riksarkivet medverkar också i initiativet CultureBroker, delfinansierat av Kulturrådet och Länsstyrelsen i Västernorrland som under hösten 2015, i en testbädd, kommer att undersöka om en harmonisering av arkivinformation och CIDOC CRM-modellen är möjlig och hur förutsättningarna för detta ser ut.

Sanja Halling

 

Linked data and the future of aggregation

Today, we live in a world with great expectations on digital access to information. Adapting to those expectations brings on a strong need for increased availability and quality of digital cultural information online. According to the latest report from Enumerate about digitisation, digital access and preservation at the cultural heritage institutions, most of the participating institutions in the survey have a rich mix of cultural heritage materials. On average 23% of the heritage collections has been digitally reproduced.  32% of the digitally reproduced and born-digital heritage collections at the institutions are available online for general use. Obviously, there is a lot more to be done. Which are the main obstacles in making cultural heritage information available and usable online?

Cultural heritage information today is mainly described according to traditional methods that have been created over a long time. The digital era has given us tools to show the institutions’ collections in a way that eliminates physical limitations and therefore the material/information can reach a wider audience than ever before. New technology has also given heritage institutions opportunities to create digital stories and engage users in the digital cultural arena. Still, the new technical possibilities are sometimes seen as limitations rather than opportunities, mainly because they are challenging professionals to think differently and change their traditional ways of describing information. Technology is only an instrument for adding value –  the real challenge is not to use technology for its own sake, as a fashionable add on, but as a way to create something completely new.

Metadata is structured data used for identification and description, and for facilitating access. Metadata refers to the information that describes an object, ”data about data”. There are currently several different types of descriptive metadata standards in use for managing digital cultural heritage information. 

Objects and documents that from the beginning was part of the same collection or held at the same institution could today be fragmented across several types of organisations or parts of an organisation. Description of those objects and documents would then have been based on the traditions (for example, for registration of objects and cataloguing of documents) that were current at the time the different collections were created. This means that today those old traditions are still defining how information is being “translated” in the digital format.

 bild1

Taking a map as an example, it can be described in very different ways depending on which cultural heritage domain it is described in. Sometimes the descriptions are similar, but expressed in different ways, but sometimes it is actually complementary information. A map is described as an object in the museum systems, with a description made in associated metadata standards; while , as an archival object, it would be described with entirely different descriptions and under other procedures and standards than in a museum system.

What does this mean? At the museum you could probably find a lot of information about, for example, a specific drawing or a certain aquarelle painting technique used for producing this specific map. At the archive, you could instead learn a lot about the context of this very map, revealing not so much about the document itself as at the museum, but for example about the people and the organisations that were involved in creating this map, and why it was created, who has owned it and so on. At the library, you could see if it also was a part of a hand-drawn atlas, and if it is possibly related to published reproductions. And the person, who made the map, is he defined as an artist, land surveyor, cartographer, illustrator or a records creator?

This means that it is quite difficult today to find out about all the aspects of one map in only one search- It takes quite a lot of navigation between different online portals and websites to get there. The situation is further complicated by the fact that different descriptions of information are not harmonised between different domains, so the same word, for example the term “provenance”, has different meanings across different domains. This makes it complicated for the user not knowing about all the models of the descriptions. Putting all those descriptions together in a meaningful way is the key issue for making qualitative cultural heritage information available to be used and reused easily between different domains. In order to achieve this, there is a general need at the cultural heritage institutions for common technical support for implementation of established international metadata standards and for making links between different data sets.

Today, cultural heritage institutions invest a lot of time and resources to get over those obstacles by developing processes of aggregation. When talking about digital cultural heritage, the word aggregation often refers to the transfer of collections of metadata from different institutions to different kinds of web portals, or for making metadata available through APIs. The processes of aggregation are connected to aggregators. Linked Heritage defines aggregator as follows: In the context of digital cultural heritage and particularly in the context of Europeana, aggregators are gathering material from individual organisations, standardising formats and metadata into a common model, and channelling them into Europeana according to the Europeana guidelines and procedures. There are different kinds of aggregators; country specific (national or regional, cross-domain or domain specific), project aggregators and independent organisations.

The services the aggregators provide are based on different ”mappings” (translations) between different metadata models, between those used at the institutions and the ones needed for delivering the information to the aggregators and their services and online portals. Today it requires a lot of time and resources to develop and manage the mappings of cultural heritage information, which is under constant development. Every single change at the institution, as for example a transfer to an updated version of the collection management system or a change of the metadata model of the national aggregator brings with it additional costs. 

This also means that at the end of the aggregation processes, information between different institutions or domains is often being harmonised at the very basic common level, by making connections only between those parts of the description that really are comparable between different institutions. This makes it easier for the user to find information from different domains in one search only. However, that still leaves those users that are searching for additional information, or asking more advanced questions, with the trouble of having to navigate through different digital sources.

 bild2

Aggregation digital cultural heritage – current situation bottlenecks Image: Elco van Staveren CC BY-SA 2.0

The future of these issues seems to have become much brighter since the development of the semantic web, and big data technology is opening up new possibilities for making information qualitative, linkable and usable in a lot of different ways. Will the role of the aggregators in the future be to link together all information instead, thus creating added value in terms of quality and complementary information?

Nevertheless, there are still issues to be solved before semantic technologies can be widely implemented at an institutional level. Interlinking with other data sets is done on a quite basic level today, and there is a lot more to be done before we can take real advantage of the semantic web. There is still a need to standardise the descriptions for enabling models for linking the information that is described on completely different levels. A promising model that would allow cultural heritage information from different domains to be linked and expressed in high quality, is CIDOC CRM, an ISO standard. The latest version was published in 2015, including a CRM RDFS schema. There is also already a lot of work done to harmonise CIDOC CRM with metadata standard schemas, resulting in FRBR00 (harmonisation with library material) and CIDOC CRM Sci (scientific observations). This sort of standardisation helps to create automated (or semi-automated) linking processes. 

 bild3

Linked data Image: Elco van Staveren CC BY-SA 2.0

However, when one talks about linked open data, it also means that data needs to be open. Here, Europeana has done an excellent work pushing forward CC0-licences for metadata.  That is the main strength of the EDM model – making it possible for developers and users to freely create applications based on the material from Europeana. Neverthless, when searching for additional, or more advanced information, developers are left with the trouble of navigation through different materials, most of it not linkable and with unclear licences. Institutions that are willing to provide more metadata descriptions to Europeana as CC0 are often unable to do that. Partly it is because of current aggregation processes and partly because the EDM model is established as an ontology on a basic common level, not adapted to manage all the additional information based on non-harmonised different data models coming from different institutions and aggregators. 

Therefore, it would be very interesting to see the possibilities of connecting EDM and CIDOC CRM-RDFS models, thus enabling institutions to provide as much information as linkable open data as they want to. Attempts to see connections between those models were done, for example in this Graphical representation of the harmonised EDM-CRM models. This could be a pragmatic way of evolution to a future in which the institutions themselves are, step by step, changing from collection databases to linked data. This would be a way of improving interoperability of cultural heritage data at the same time as making it linkable. Of course, that would be a long term perspective. In the near future, this could be done at the aggregators’ level in combination with common tools and services for making those processes easier.

What does all this means for the future of aggregation? Today, metadata still needs to be aggregated. It takes time to adapt to linked open data and it requires new kind of expertise at the institutions, and implementation or development of new tools and services.

Working towards an evolving method of creating linked open data would certainly be a way to create usable data across domain boundaries, to link together all information, thus creating added value in terms of quality and complementary information.

Hopefully, this will be a future step for the aggregators.

Sanja Halling

 

 

Rapport från NordLOD-möte 24-25 september

b2ap3_thumbnail_hacknrm.jpg

Foto: J. Berg. CC 0.

I slutet på september samlades folk från olika nordiska kulturarvsinstitutioner för ett två-dagars nordLOD-möte på Naturhistoriska Riksmuseet i Stockholm. Nätverket nordLOD – uttytt Nordisk Länkad Öppen Data eller Nordic Linked Open Data  – startade våren 2013 med en konferens i Malmö. Sedan gick stafettpinnen vidare till Norge år 2014 och konferensen ”Å sikte mot stjernene” på Gardemoen i Oslo. Nätverket syftar till ett utbyte av kunskaper, erfarenheter och uppdateringar om pågående projekt etc i de nordiska länderna, samt att titta på möjligheterna att länka samman nordiska dataset.

Dagarna i Stockholm hade ingen fast agenda utan deltagarna bestämde på plats vad mötet skulle handla om. Efter en inledande runda där de som ville fick presentera sina dataset och verktyg så bildades mindre samtalsgrupper utifrån de närvarandes intressen. T ex så bildades två grupper kring Wikidata respektive KulturNav för att bland annat diskutera hur dessa skulle kunna fungera som gemensamma resurser för kulturinstitutionerna.  Andra ämnen som det pratades om var internationella gränsöverskridanden, geodata, och hur man bäst missionerar för LOD på sin institution.

En grupp diskuterade planerna på ett NordHack 2016. Sessionen inleddes med korta dragningar om hur de tre senaste nordiska hackathonen gått till: Jacob Wang, Nationalmuseet, var med på Skype och presenterade Hack4DK, Sidsel Hindal, Kultur- og Naturreise, berättade om Hack4NO och Susanna Ånäs, WMFI, talade om Hack4FI. Sedan vidtog en fri diskussion som sökte besvara frågorna när, var, hur och vem? Ett förslag var att inte bara engagera datakunniga personer till hacket utan även t ex forskare och konstnärligt verksamma. Fysiskt sett skulle eventet kunna hända enbart online, eller mer traditionellt att alla samlas på ett ställe, eller att det kan göras som en form av stafett – land för land – med en uppsamling på slutet. Många förslag var uppe och vändes. Vi hoppas vi kan återkomma snart med mer konkreta planer och den som är intresserad av att bidra/delta är välkommen att höra av sig!

Fler bloggposter om nordLOD-träffen finns att läsa här:  Sarah McSeveny-Åril (Kultur- och Naturreise)  och Jessica Parland von Essen (Open Science and Research Initiative)

Susanne Danelius

 

Sammanlänkning av data

Kulturarvsinformation har skapats över lång tid och är under ständig förändring. Den digitala utvecklingen har gett oss verktyg för att visa institutionernas samlingar på ett sätt som går utöver fysiska begränsningar och därmed nå en mycket bredare publik än någonsin tidigare. Tekniken har också gett kulturarvsinstitutionerna möjligheter att skapa digitala berättelser och engagera användare på den digitala kulturarvsarenan.

För att kunna öka användbarheten behöver vi fokusera på att strukturera och öka kvaliteten på kulturarvsinformation. Idag finns de tekniska förutsättningarna för detta, men tekniken är bara ett medel och det är viktigt att fokus ligger på vad vi vill uppnå med tekniken och inte på tekniken i sig. Ett grundläggande krav för att öka potentialen i kulturarvsinformationen är användning av standarder.

Det finns flera olika typer av metadatastandarder som idag används för att hantera digital kulturarvsinformation. Metadata som begrepp syftar på den information som beskriver ett objekt, dvs ”data om data” som skapas utifrån de traditioner (för t ex katalogiseringar) som var gällande vid tiden då respektive samling skapades. Det innebär att objekt och dokument som från början kunde vara del av samma samling eller institution idag kan vara splittrade över flera typer av organisationer eller inom olika delar av samma organisation.

På så sätt kan t ex en karta hanteras som ett föremål i ett museisystem med tillhörande metadatastandarder och möjligheter till tillgängliggörande och bevarande, samtidigt som en karta av samma typ hanteras som arkivmaterial med helt andra beskrivningar och enligt andra rutiner och förordningar vid en annan institution.

b2ap3_thumbnail_kartor.jpg

Ett övergripande mål för den nationella digitaliseringsstrategin är att kulturarvsinstitutionerna ska öka digitalisering och tillgängliggörande av den digitala kulturarvsinformationen. Hur vi tillgängliggör och använder information har drastiskt ändrats i och med tillgången till nya digitala metoder, tjänster och verktyg. Idag kan vi föra samman kulturarvsinformation som förvaras på olika institutioner och i olika domäner, men för att med hög kvalitet få ut den fulla potentialen är det fortfarande mycket som behöver göras.

Den digitala informationen skapas och tillgängliggörs idag utifrån de strukturer som har skapats för olika domäner och det finns ett antal olika sökmöjligheter. På en mer generell nivå skapas interoperabilitet i Europeana, men är man intresserad av lite mer specifik information finns det flera sökvägar.

När det gäller arkiv kan man hitta information i Nationella Arkivdatabasen (NAD) och på den europeiska nivån genom Europeiska arkivportalen/Archives Portal Europe. I båda fallen är informationen strukturerad enligt arkivstandarder.

bibliotekssidan är det Libris på nationell och TEL (The European Library) på europeisk nivå som är ingångarna. En samsökningsfunktion har utvecklats för biblioteks- och arkivdata, Sondera.

Museisamlingar görs idag tillgängliga på olika sätt, exempelvis genom museernas hemsidor, museisystemens portaler med information från alla institutioner som använder samma samlingssystem, eller regionala portaler. Hur beskrivningar och metadata ser ut varierar beroende på vilka standarder som används vid institutionerna eller i museisystemen. De museer som levererar metadata till K-samsök gör det i K-samsöks format och informationen blir då sökbar genom applikationen Kringla. Det finns också flera museer i Sverige idag som leverar informationen direkt till Europeana genom olika EU-finansierade projekt. Deras metadata struktureras då enligt LIDO-format.

Att informationen är strukturerad på olika sätt, med metadata som har skapats och hanterats i en rad olika standarder och system, gör att sökningarna inte resulterar i optimala svar. Komplexiteten i detta är en av de bakomliggande orsakerna för det stora intresset för sammanlänkning av information som finns i olika domäner genom den semantiska webbens möjligheter, s k ”länkad öppen data”.

Det finns idag flera initiativ för att lägga ut data som länkbar öppen data i maskinläsbart format (rdf). Även om det finns en del exempel på publicerad länkbar data så finns det få exempel där sammankopplingar har gjorts så att länkad öppen data har skapats.

Auktoritetsfiler som tillgängliggörs online är ett exempel på länkbar öppen data. Stöd för hantering av dessa resurser/källmaterial kan t ex byggas i registreringsprocessen. Det finns initiativ kring detta på europeisk nivå där man bl a har tagit fram en handbok kring hantering av terminologier ”Your terminology as a part of the semantic web: recommendations for design and management”, där rekommendationer kring hantering av terminologier för kulturarvsdata i RDF/SKOS-format finns. För närvarande pågår uppbyggnad av en plattform för hantering av terminologier (auktoritetslistor, tesaurier, m m), ”Terminology Management Platform”, inom ramen för Athena Plus-projektet.

Även om länkad data inte innebär en fullständig optimering av sökmöjligheterna är det ändå ett första steg i sammanlänkningen av idag spridda kulturarvsdata. Maskinläsbarhet ger dessutom fler möjligheter till praktiska tillämpningar, exempelvis i form av virtuella utställningar, applikationer för utbildning, m m.

Sammanfattningsvis finns det ett starkt behov av konceptuell harmonisering av information mellan olika domäner och ett stöd för detta vid registrering och/eller aggregering. Länkbar öppen data i kombination med implementering av vedertagna internationella standarder är ett första steg i den processen.

/Sanja Halling

 

 

Linked Open Nordic Heritage

Over the years that I have worked with digital cultural heritage information, I have had the privilege to meet Nordic colleagues in a variety of contexts. On those occasions, it did not take long before we started to talk about how much we would gain from collaborating on a variety of issues. However, despite numerous attempts, we have not really managed to establish a sustainable collaboration.

The past year the discussions have taken a more concrete form, and the topic was raised on how we could go forward and establish a platform for Nordic collaboration.

Our discussion followed two main tracks. Firstly it would benefit the the Nordic countries as well as the European community if we collaborate and put the focus on issues that are relevant from a Nordic perspective., And secondly, we have a shared history with a heritage that is connected across the borders, which have changed many times throughout history.

 

b2ap3_thumbnail_Ant-Simons.jpg

Ant Simons during a workshop

 

When we at Digisam in the autumn of 2012 got the opportunity to arrange a conference under the Swedish Presidency of the Nordic Council of Ministers, we gathered a group of Nordic colleagues to discuss the theme of the conference and how we could make it a launching pad for concrete Nordic cooperation. The theme, linked open cultural data in the Nordic countries, was an easy decision. The Semantic Web we have today provides us with the technological tools that allow us to link together cultural information in a complex system, to which everyone can contribute, and which enables linking of objects, documents, images, places, people and events in a way that create meaning and context. The Semantic Web can create knowledge through the many stories that can be told.

With all presentations and meetings from this conference in fresh memory, I am glad that we chosed this theme.

 

b2ap3_thumbnail_Tim-Sherrat_02.jpg 

Tim Sherratt giving his presentation ”A map and some pins”: open data and unlimited horizons. 

 

The Minister of Culture, Lena Adelsohn Liljeroth. said in her speech that she believes strongly in the potential of a Nordic collaboration on digital heritage. She brought up a number of important pre-conditions to achieve the objectives of an open and creative use of digital cultural heritage information: ”It is at the moment when information about our cultural heritage is used that we start to benefit from it. Only then can we see what we get back on our investments. However, this requires that the information is easily accessible and free to use so that the users can become co-creators of our common cultural heritage. ”

 

Lena-Adelsohn-Liljeroth_02.jpg

Lena Adelsohn Liljeroth, Minister of Culture

 

There is a lot that we at Digisam take with us from the days in Malmö for our future work. Personally, I will try to keep as much as possible of the energy that the attendees and speakers brought to the conference. I will also carry with me the conviction that it is the power of information that binds us together. The idea of linked open data seems almost to live it´s own life and is something that we carry with us in our daily work. A good illustration was made by Ingibjörg Steinunn Sverrisdottir in her talk: From being an issue that I had to look for people to talk about it with, the interest for linked open data has increased dramatically only in the past year.

b2ap3_thumbnail_Merete-Sanderhoff.jpg

Our moderator, Merete Sanderhoff

 

I wish to give my sincere thanks to the speakers, the participants, our collaboration partner Media Evolution and Merete Sanderhoff who in an excellent way moderated the conference! You have all helped us to set the direction forward. And to go further, we need your thoughts and ideas about concrete Nordic cooperation. So, tweet, email or contact us by other means. We look forward to hear from you so that we can go forward and together create a platform for Nordic collaboration about our digital Nordic Cultural Heritage.

Rolf Källman