(CC0)

Standarder och vokabulärer för metadata

Metadata används för att beskriva data och information så att det kan läsas av både maskiner och människor. Gemensamma standarder och vokabulärer krävs för att detta ska fungera. Här hittar du exempel på sådana för kulturarv.

Begreppet metadata handlar helt enkelt om data som beskriver ett visst objekt (en databas, ett föremål, en bild, en text osv). Det finns ingen egentlig begränsning på vad metadata kan omfatta. En tavla kan beskrivas med metadata för konstnärens namn, platsen och tiden då den skapades och vad den föreställer, men även kemiska komponenter i pigment, typ av pensel och duk, vilken sorts restaurering som skett, böcker som skrivits om den, filmer den förekommer i med mera. Det är användarbehoven som styr vilken metadata som är relevant och behoven hos samlingsförvaltare respektive forskare överlappar bara delvis. Genom att förstå och använda sig av nationellt och internationellt erkända standarder och vokabulärer så kan du se till att du hittar det du letar efter och du säkerställer även att andra kan bygga vidare på det du skapat.

Principer för FAIR data

FAIR står för ”findable, accessible, interoperable, reusable”. Det är principer som tagits fram för att data ska vara tillgänglig och användbar på bästa sätt. Riklig och korrekt metadata är en av de viktigaste komponenterna i detta sammanhang. Standardiserad och korrekt metadata krävs för att kunna söka fram relevant information, att kunna kombinera data från olika källor och skapa ny kunskap med hjälp av det. Forskningsfinansiärer ställer allt högre krav på öppen tillgång till forskningsdata.

Svensk Nationell Datatjänst (SND) har som huvuduppgift att stödja tillgänglighet, bevarande och återanvändning av forskningsdata och relaterat material. De har sammanställt generell information i relation till forskningsdata.

Var innebär FAIR data? Text och länkar till fler resurser

Vad är metadata? Text och video

Vad är en metadatastandard? Text och video

DIGISAM

Digisam är en plattform där statliga kulturarvsaktörer tillsammans arbetar för ett digitalt kulturarv. Sekretariatet som samordnar arbetet finns hos Riksantikvarieämbetet. Digisam sammanställer information om och länkar till metadata-standarder för museer, bibliotek och arkiv. Det finns också många andra resurser att hitta via deras hemsida och de anordnar även seminarier och informerar om event som kan vara av intresse.Metadata och standarder för kulturarvDigitaliseringsprocessen

SPECTRUM

Spectrum är museernas egen standard inom samlingsförvaltning. Den är i första hand en standard för processer och arbetsrutiner, men ger en bra inblick i den typ av dokumentation som är viktig utifrån samlingsperspektiv och den data som eventuellt kan förekomma i systemen. Riksantikvarieämbetet har bidragit till att ta fram en svensk översättning av Spectrum. I detta ingår svensk översättning av informationsenheter och -grupper och definitioner av dessa.

I bilagan till Spectrum listas informationsenheterna i alfabetisk ordning med tillhörande råd för hur dessa informationsenheter kan registreras. Vilka av dessa som faktiskt används varierar från samling till samling, ingen innehåller allt. Det är en bra start för den som funderar på vilken metadata som kan behövas om man arbetar med samlingar eller med forskning på dem.

Spectrum: Dokument och länkar

Getty Vocabularies

Att veta vilken typ av metadata man bör samla in och enligt vilken hierarki är bara grunden. De termer och begrepp som används för att representera den information som registreras är avgörande för om datan blir sökbar och kompatibel med andra datamängder. Vokabulärer gör metadata maskinläsbar och att den går att analysera i mycket större omfattning. Detta är en särskild utmaning för humaniora och samhällsvetenskap där många av begreppen ofta handlar om kulturella företeelser som variera över tid och rum.

The Getty Research Institute har sammanställt vokabulärer på engelska som i hög grad används internationellt. Framförallt The Art & Architecture Thesaurus har kommit att bli en standard för kulturarvsinstitutioner och forskare.

Getty Vocabularies

CLARIN

CLARIN (Common Language Resources and Technology Infrastructure) syftar till att skapa en e-forskningsinfrastruktur som gör språkresurser (annoterade ljud- och videoinspelningar, textsamlingar, ontologier m.m.) och verktyg baserade på språkresurser och språkteknologi (t.ex. taligenkännare och system för text mining) tillgängliga och användbara för forskare inom alla discipliner, framför allt inom humaniora och samhällsvetenskap.Swe-CLARINCLARIN for researchers

 

  • Publicerad:
  • Uppdaterad:
  • Kategorier: Ej kategoriserad