Foto: (CC BY)

Standarder och auktoriteter för metadata

Metadata används för att beskriva data och information så att det kan läsas av både maskiner och människor. Gemensamma standarder och vokabulärer krävs för att detta ska fungera. Här hittar du exempel på sådana för kulturarv.

Begreppet metadata handlar helt enkelt om data som beskriver ett visst objekt (en databas, ett föremål, en bild, en text osv). Det finns ingen egentlig begränsning på vad metadata kan omfatta. En tavla kan beskrivas med metadata för konstnärens namn, platsen och tiden då den skapades och vad den föreställer, men även kemiska komponenter i pigment, typ av pensel och duk, vilken sorts restaurering som skett, böcker som skrivits om den, filmer den förekommer i med mera. Det är användarbehoven som styr vilken metadata som är relevant och behoven hos samlingsförvaltare respektive forskare överlappar bara delvis.

Standarder och Auktoriteter

Genom att använda dig av nationella och internationellta standarder och vokabulärer så kan andra användare hitta det du skapat och bygga vidare på det. Genom att använda en allmänt erkänd standard bidrar du till att minska missförstånd och öka användbarheten, oavsett vilket språk du använder.

Auktoriteter är standardbegrepp som har en URI (Uniform Resource Identifier), det vill säga att det finns ett beständigt sätt att referera till resursen över ett nätverk, till exempel World Wide Web. Till skillnad mot en vanlig webbadress så ska en URI inte ändras, den måste vara konsekvent över tid. För att säkerställa detta krävs att de som är värd för en auktoritet har en långsiktig förvaltningsplan. Många olika organisationer kan ha tagit fram URI för till exempel en plats, en person eller en typ av föremål. Därför behöver du tänka efter innan du väljer vilken du vill använda dig av, men det gör egentligen ingenting om du använder dig av olika auktoriteter i ett och samma dataset, eller byter mellan olika dataset – så länge som URI är bestående.

Fördelen med att använda sig av Auktoriteteter med URI är att du på så sätt tillhandahåller en definition av vad du menar. Till exempel: begreppet ”medeltid” kan referera till olika tidsperioder beroende på var i världen du är. Genom att använda en länk till en auktoritet så blir det tydligt för användarna vad som menas i just detta fall. Maskinell avläsning av dataset kan dessutom översätta din data till olika språk eller olika typer av visualisering på tidsaxlar eller kartor. Populära leverantörer av auktoriteter för kulturarv är Getty Research Institute, GeoNames, Wikidata, VIAF och KulturNav (se nedan).

Läs om hur K-Samsök använder auktoriteter

Digisam

Digisam är en plattform där statliga kulturarvsaktörer tillsammans arbetar för ett digitalt kulturarv. Sekretariatet som samordnar arbetet finns hos Riksantikvarieämbetet. Digisam sammanställer information om och länkar till metadata-standarder för museer, bibliotek och arkiv. Det finns också många andra resurser att hitta via deras hemsida och de anordnar även seminarier och informerar om event som kan vara av intresse.

Spectrum

Spectrum är museernas egen standard inom samlingsförvaltning. Den är i första hand en standard för processer och arbetsrutiner, men ger en bra inblick i den typ av dokumentation som är viktig utifrån samlingsperspektiv och den data som eventuellt kan förekomma i systemen. Riksantikvarieämbetet har bidragit till att ta fram en svensk översättning av Spectrum. I detta ingår svensk översättning av informationsenheter och -grupper och definitioner av dessa.

I bilagan till Spectrum listas informationsenheterna i alfabetisk ordning med tillhörande råd för hur dessa informationsenheter kan registreras. Vilka av dessa som faktiskt används varierar från samling till samling, ingen innehåller allt. Det är en bra start för den som funderar på vilken metadata som kan behövas om man forskar på samlingar och vilken hierarki man bör bygga sin databas utifrån.

Spectrum har inte auktoriteter/URI för dessa termer, det får letas upp via någon av de tjänster som nämns nedan.

Getty Research Institute Vocabularies

Att veta vilken typ av metadata man bör samla in och enligt vilken hierarki är bara grunden. De termer och begrepp som används för att representera den information som registreras är avgörande för om datan blir sökbar och kompatibel med andra datamängder. Gemensamma vokabulärer gör metadata maskinläsbar och att den går att analysera i mycket större omfattning. Detta är en särskild utmaning för humaniora och samhällsvetenskap där många av begreppen ofta handlar om kulturella företeelser som varierar över tid och rum.

The Getty Research Institute har sammanställt vokabulärer på engelska som i hög grad används internationellt. Framförallt The Art & Architecture Thesaurus (Getty AAT) har kommit att bli en standard för kulturarvsinstitutioner och forskare. Det finns även en för geografiska platser (TGN) och en för specifika konstverk och kulturarvsobjekt (CONA) samt för ikonografiska motiv (IA) och konstnärer  (ULAN).

GeoNames

GeoNames är en geografisk databas med över 11 miljoner unika platser och 25 miljoner platsnamn. Databasen kan laddas ned för egen användning, eller så kan du söka fram en lokalitet och få unik URI (auktoritet) som kan användas i ditt dataset. Se till exempel Åbo: geonames.org/633679/turku

GeoNames är en så kallad gazetteer, vilket är ett sorts geografiskt uppslagsverk/register. Digitala gazetteers kan förutom platsnamn och -info även innehålla koordinater för att kunna visualisera platser på webbkartor. Det finns speciellt framtagna gazetteers för historiska platser och -namn som kan ha haft annorlunda gränser under olika historiska perioder. Till exempel Pleiades för Antiken och China Historical GIS.

KulturNav

KulturNav är en webbplats och programvara förvaltad av KulturIT för att skapa, förvalta och distribuera gemensam öppen terminologi och auktoriteter, speciellt utvecklad och anpassad för museer och andra kulturarvsinstitutioner. KulturNav samlar URI:er från olika organisationer för relevanta begrepp, personer, platser med mera och de tillhandahåller även egna. Se till exempel Selma Lagerlöf.

LIBRIS

LIBRIS är en nationell söktjänst med information om verk som finns på svenska bibliotek. Kungliga biblioteket ansvarar för drift och utveckling och tillhandahåller auktoriteter för enskilda verk. Till skillnad från en generell auktoritet för romanen ”Röda rummet” av August Strindberg så finns här alltså en möjlighet att referera till en specifik utgåva eller översättning, under förutsättning att den finns på ett svenskt bibliotek.

PeriodO

PeriodO är en öppen standard för perioder och tidsangivelser inom historia, konsthistoria och arkeologi. Den kan användas både för att hitta standardiserade benämningar och för att reda ut hur olika perioder i olika delar av världen överlappar varandra. Det finns en webbklient som kan användas för att genomsöka och redigera dataset, och det går att ladda ned projektets eget dataset som innehåller kanoniska begrepp. Innehållet är under ständig utveckling och länkas till Wikidatas URI-auktoriteter.

VIAF

VIAF (Virtual International Authority File) sammanställer flera olika auktoritetsregister, framförallt auktoriteter från bibliotek. Deras söktjänst kan ge dig flera olika förslag på auktoriteter för framförallt personer, publikationer och organisationer. 

Wikidata

Wikidata är en fri, öppen och multilingvistisk sekundär databas som samlar strukturerad data för Wikipedia, Wikimedia Commons osv. Det är entiteterna i Wikidata som gör att användare kan hitta fram till rätt person, plats och begrepp oberoende av variationer i stavning och olika språk. Wikidata samlar även referenser som ligger till stöd för att definitionerna. Se t.ex. Gustaf IV Adolf, de olika namn och beteckningar han är känd under, samt vilka personer, platser, tidsperioder, företeelser osv som han är relaterad till.