Historien om Knossos er mest en historie om hvordan man fortolker arkeologiske funn. Konferansens guidede tur understreket dermed tematikken «Provenance of Knowledge» på en utmerket måte.

Hva man skal med lenkede data

CIDOC 2018: Provenance of Knowledge
Heraklion, Kreta, Hellas, 29.9.-5.10.2018

Bjørnar Bruket, Musikkbibliotekar
Rockheim – Det nasjonale museet for populærmusikk

Hva skal man med lenkede data? Det er ingen vits i å produsere en ny silo med samme data bare i et nytt språk. Ved ett av innleggene under sesjonen Semantic Web, LOD, Graph DBS and Provenance of Knowledge ble denne meningen ytret fra podiet, tilsynelatende uten provoserende kraft, i alle fall med tanke på at en potensiell diskusjon i etterkant av foredraget var fraværende.

Jeg måtte selv bruke litt tid på å reflektere over argumentasjonen og poenget. Inntrykket som festet seg etter senere diskusjoner under konferansen – og for øvrig etter lignende diskusjoner i eget museumsmiljø – er at lenkede data generelt og konseptuelle modeller som CIDOC CRM spesielt er vanskelig å forstå. Det er vanskelig å se den konkrete nytte eller gevinst ved lenkede data og ontologibasert museumsmetadata. Og hvis man heller ikke teoretisk sett kan forestille seg mulighetene som ligger i lenkede data, er det desto vanskeligere å reflektere over hva man skal med lenkede museumsdata. Uten mulighet for å gå i dybden her, vil jeg påstå at det kreves en grunnleggende forståelse av informatikk for å få et håndfast grep på disse konseptene og dets teknologi. På bakgrunn av konferansens relaterte sesjoner er det tydelig at det foregår en del samarbeid mellom dokumentasjonsmiljøer i museene og eksterne informatikere på utviklingsprosjekter omhandlende lenkede data. Hvorfor gjøres det ikke mer av dette i Norge mon tro?

Kontekst er et viktig stikkord for å forstå mulighetene ved lenkede data og samtidig noe av kjernen ved CIDOC CRM. Et museumsobjekt – uavhengig om det er en gjenstand eller et lydopptak – er avhengig av å bli satt i kontekst for å gi mening (for noen som helst). Vi gir objektet kontekst ved å dokumentere det. I aller enkleste form gjøres dette typisk i form av inntaksprotokollen. Proveniens i sitt korteste format. I et videre perspektiv er det nesten utømmelig hvilke sammenhenger et objekt kan «leses» inn i. Det avhenger av forskerens blikk, publikums minne, politikerens agenda etc. Tradisjonelt sett så dokumenteres ikke alle «lesninger» av et objekt i museumsdatabasen. Med gode grunner. Og av praktiske årsaker. Et objekt skal kunne gå inn og ut av ulik kontekst. Det er problematisk å «låse» et objekt til en bestemt kontekst. Det er samtidig ressursmessig krevende å dokumentere alle tolkninger av et objekt i en database. På en annen side er det etisk problematisk å velge bort tolkninger (som for øvrig ble dekket på andre sesjoner under konferansen).

Fra workshop hvor vi bl.a. øvde oss på konseptuell modellering (CRM) av Wikipedia-artikkelen om mordet på JFK (!).
Fra workshop hvor vi bl.a. øvde oss på konseptuell modellering (CRM) av Wikipedia-artikkelen om mordet på JFK (!).

For eksempel er hendelse en type sammenheng som jeg tror er vanskelig å komme utenom når man jobber med kulturarv – fra dokumentasjon til formidling. Det er vanskelig å formidle en historie uten å trekke inn en hendelse eller flere, men ingen registrerer vel en hendelse i museumsdatabase eller? Jo, teoretisk sett kan man definere inntak, produksjonsdatering osv. som hendelser. Men en historisk hendelse (hendelser vi snakker om igjen og igjen) tar gjerne en mer abstrakt form enn et inntak, et objekt eller en person, selv om det som oftest er mulig å feste en hendelse til tid og sted. Eller i det minste knytte en hendelse til et visst tidsforløp innenfor et avgrenset geografisk område. Tenk festival eller, dessverre, krig. I CIDOC CRM er hendelse et konsept som noe forenklet sagt kan likestilles med objekter og aktører. Dette gir derimot ingen mening igjen dersom man ikke knytter objekter, aktører og hendelser sammen via semantisk meningsfulle relasjoner. Og da er vi kommet til det avgjørende elementet for å finne og se sammenhenger i en database, nemlig muligheten for å kontekstualisere. Hvilke objekter kan man knytte til den samme hendelsen? Hvilke personer spilte en rolle i akkurat den hendelsen? Finnes det flere fotografier fra samme hendelse fra ulike fotografer?

Løfter man så blikket og ser flere databaser i lys av det overnevnte er man over i den semantiske weben med lenkede data. Det nye språket – som nevnt i innledningen – er forståelig på tvers av databaser. På tvers av museumssamlinger. Det åpner opp for en helt annen måte å integrere museumsdata mellom museer, men også integrering av museumsdata og eksterne lenkede datasett. Fordi man i et sånt språk har felles, stabile referanser til identiske hendelser, aktører og objekter. Hvis et museum ikke innehar all informasjon og dokumentasjon om et emne (hvilke museer gjelder vel ikke dette) er det desto viktigere å nå ut og kombinere informasjon fra ulike kilder for å samle kunnskap, se sammenhenger, ny kontekst etc. Georgia O’Keeffe Museum[1] er et lite kunstnermuseum som nettopp gjør dette. Elizabeth Neely oppsummerte poenget på dette viset under konferansen: «For systems to collaborate, people need to collaborate». Vi må vite hva vi vil med lenkede data altså.

Det er viktig å understreke at dette er en annen måte å integrere museumsdata på enn den vi kanskje kjenner aller best i norsk sammenheng: Digitalt Museum. Det er muligens ikke så lett å se, men det er nesten ingen lenkede data i Digitalt Museum i dag (som i utgangspunktet er en kopi av de ulike datasettene fra Primus-basene i norske museer), med unntak av enkelte data som er hentet fra KulturNAV. KulturNAV er en positiv utvikling i norsk sammenheng – selv om det er en annen og enklere tilnærming enn CIDOC CRM – fordi det gjøres mulig å integrere autoritetsregistre som lenkede data på tvers av museumsdatabasene og ikke minst utover museenes egne databaser. Et autoritetsregister – eller datasett som det gjerne heter når vi snakker om lenkede data – kan være en biografisk oversikt over fotografer. Anders Beer Wilse[2] er et eksempel på en slik autoritetspost som er publisert på Digitalt Museum og lenket til objekter fra 17 ulike museumssamlinger. Hva slags relasjon Wilse har til de drøye 20 000 objektene derimot er det ikke så lett se, fordi relasjonene ikke er semantiske. Man må gå inn på hvert enkelt objekt for å finne ut hvilken relasjon Wilse har til det konkrete objekt: om Wilse er fotograf av bildet, avfotografert på et bilde, tidligere eier av et objekt etc. Å uttrykke relasjoner på denne måten i et søkegrensesnitt er noe av potensialet ved lenkede data som er ontologibasert. En kan automatisk separere de ulike type relasjonene mellom en person og objekter i en treffliste eller et annet grensesnitt og slik gi brukere et raskere bilde på sammenhenger i datasettet.

Flere prosjekter som omhandlet konvertering, eller tilpasning, til CIDOC CRM ble presentert på konferansen.
Flere prosjekter som omhandlet konvertering, eller tilpasning, til CIDOC CRM ble presentert på konferansen.

Styrken til CIDOC CRM ligger i det grundige (sam)arbeidet som er lagt ned gjennom flere år – til og med før semantisk web var en realitet, noe som ble presentert i en retrospektiv forelesning om CLIO – hvor så å si all relevant museumsdokumentasjon er modellert med konsepter og relasjoner. Den store utfordringen er implementering av modellen. På konferansen omhandlet flere forelesninger prosjekter som med ulike metoder hadde forsøkt konvertering («mapping») av eksisterende databaser til «nye siloer» basert på CIDOC CRM og lenkede data. Dette er krevende prosesser med prøving og feiling, og mye for- og etterarbeid for i det hele tatt å få det til. Derfor må man ha gode argumenter for å sette i gang slike prosjekter, og en plan for hvordan man skal utnytte lenkede data utover sin egen museumsdatabase. Man må gjerne gjøre forsøk med delsamlinger. Et slikt konverteringsprosjekt bør kanskje ikke omfatte en total museumsdatabase uansett. Slik jeg forstår så strides informatikerne om hvor hensiktsmessig det er å operere med en fullskala museumsdatabase basert på lenkede data som forvaltningssystem – en såkalt grafdatabase – bl.a. fordi det krever mye energi og prosessorkraft å stadig gjøre søk og endringer. Jo flere relasjoner, jo mer komplisert. Men, sånn er jo den verden vi prøver å beskrive. Lenkede data kan hjelpe oss her, om enn i utvalgte tematiske datasett.

 

[1] http://cdm16622.contentdm.oclc.org/cdm/landingpage/collection/arch_fa

[2] https://digitaltmuseum.no/021035449336/wilse-anders-beer-1865-1949

Legg igjen en kommentar