Foto: (CC BY)

Standarder och auktoriteter för metadata

Metadata används för att beskriva data och information så att de kan läsas av både maskiner och människor. Gemensamma standarder och vokabulärer krävs för att detta ska fungera.

Metadata är data om data, eller data som beskriver ett visst objekt. Här finns exempel på sådana för kulturarv. Det beskrivs även mer ingående i artiklarna ”Vad menas med användbarhet” och ”Olika typer av metadata” här på raa.se.

Det finns ingen egentlig begränsning av vad metadata kan omfatta. En tavla kan beskrivas med metadata för konstnärens namn, platsen och tiden då den skapades och vad den föreställer, men även kemiska komponenter i pigment, typ av pensel och duk, vilken sorts restaurering som skett, böcker som skrivits om den, filmer den förekommer i med mera.

Det är användarbehoven som styr vilka metadata som är relevanta och behoven hos samlingsförvaltare respektive forskare överlappar bara delvis.

Vokabulärer och auktoriteter – förklaring

En vokabulär är  termer och deras definitioner som rör ett visst område, till exempel ämnesområden, föremålstyper, konststilar, fornlämningar och så vidare. Genom att använda nationellt och internationellt etablerade vokabulärer blir det enklare både att hitta och att förstå det du skapat.

Men var uppmärksam på att samma term kan ha olika betydelser i olika vokabulärer. Termen ”Bro” kan vara  en konstruktion eller ett sockennamn. Olika termer kan ha samma betydelse i till exempel vokabulärer på olika språk: ”Bro” respektive ”Bridge”. För att komma runt detta krävs något mer: en kontrollerad vokabulär med unika identifierare för termerna (auktoriteter).

Auktoriteter är termer som har en globalt unik identifierare i form av en URI (Uniform Resource Identifier). Det finns alltså ett beständigt och maskinläsbart  sätt att referera till resursen, det vill säga en webbsida, en bild, ett dokument eller något annat material som finns tillgängligt på internet.

En auktoritets URI kan även vara en webblänk, som gör att det går att hitta den på internet (URL = Uniform Resource Locator). En URL ska vara beständig, den ska helst inte bytas ut alls och om det händer måste den gamla identifieraren peka ut den nya som ersatt den.

Långsiktiga planer

Därför krävs långsiktiga förvaltningsplaner och eftertanke innan du väljer auktoriteter. Men det gör ingenting om olika auktoriteter används vid olika tillfällen eftersom maskinerna förstår vad som avses med hjälp av dess URI.Auktoriteter ger alltså en definition av vad som avses.  Som exempel kan termen (vokabulären) ”medeltid” syfta på olika tidsperioder i olika delar av världen, medan auktoriteten ger en definition av termen, till exempel att det rör kinesisk medeltid.

Genom att använda en länk till en auktoritet blir det tydligt för användarna vad som avses. Maskinell avläsning kan dessutom översätta dina data och metadata till olika språk.

Tjänster som Wikidata skapar även relationer mellan auktoriteter så att en maskin enbart genom att få en identifierare (URI) för August Strindberg kan hitta och sammanställa långt mer information; var han bodde, studerade, vilka böcker han skrev samt  födelseår med mera (se figur).

 

Länkad data och auktoriteter Bild: Peter Krantz (CC BY)

Vokabulärer och auktoriteter för kulturarv

Det finns många olika vokabulärer och auktoriteter, som dessutom ofta överlappar varandra. Ingen vokabulär kommer att innehålla allt du behöver, och det går som sagt utmärkt att blanda auktoriteter från olika vokabulärer.

Riksantikvarieämbetet kommer under åren 2024–2025 att arbeta aktivt med frågor om vokabulärer och auktoriteter för kulturarvet. Arbetet kommer att bedrivas inom ramen för det nystartade nätverket för digitalt kulturarv och är en del av att omsätta den nationella strategin för digitalt kulturarv till verklighet på museiområdet.

Det framtida arbetet med vokabulärer och auktoriteter ska dock inte vara ett hinder för att börja tillämpa sådana redan i dag.

Här nedan presenterar vi några relevanta resurser för kulturarvsforskning och som dessutom är relativt enkla att använda för den enskilde. Dessa kan med fördel användas för att skapa tabeller och databaser, eller när beskrivande metadata för till exempel forskningsdata ska anges.

Getty Research Institute

The Getty Research Institute har sammanställt vokabulärer på engelska som i hög grad används internationellt. Framförallt The Art & Architecture Thesaurus (Getty AAT) har kommit att bli en standard för kulturarvsinstitutioner och forskare. Det finns även en för geografiska platser (TGN) och en för specifika konstverk och kulturarvsobjekt (CONA) samt för ikonografiska motiv (IA) och konstnärer  (ULAN). Det finns en gemensam sökportal för AAT, TGN och ULAN.

Söktjänst: Getty Vocabularies

Rekommenderas för: (för svenska termer, se KB nedan):

  • Instrument/Metod
  • Material
  • Ämnesområde
  • Personer inom konst, arkitektur, litteratur
  • Historiska platser/regioner
  • Stilperioder
  • Objekttyper

GeoNames

GeoNames är en geografisk databas med över 11 miljoner unika platser och 25 miljoner platsnamn. Databasen kan laddas ned för egen användning, eller så kan du söka fram en lokalitet och få unik URI (auktoritet) som kan användas i ditt dataset. Se till exempel Åbo: geonames.org/633679/turku

GeoNames är en så kallad gazetteer, vilket är ett sorts geografiskt uppslagsverk/register. Digitala gazetteers kan förutom platsnamn och -info även innehålla koordinater för att kunna visualisera platser på webbkartor. Det finns speciellt framtagna gazetteers för historiska platser och namn som kan ha haft annorlunda gränser under olika historiska perioder. Till exempel Pleiades för Antiken och China Historical GIS.

Söktjänst: GeoNames

Rekommenderas för:

  • Geografiska platser (länder, regioner, städer osv)

Kungliga biblioteket – Ämnesord på svenska

Kungliga biblioteket publicerar kontrollerade vokabulärer för svenska ämnesord som används av biblioteken, med beständiga identifierare för dem. Om du vill beskriva vad din data handlar om med svenska metadata så är detta en bra tjänst.

Söktjänst: id.kb.se

Rekommenderas för:

  • Ämnesord på svenska (främst humaniora och samhällsvetenskap)
  • Termer på svenska relaterade till biblioteks- och arkivobjekt

Nomisma

Nomisma tillhandhåller en vokabulär specialiserad på termer som är relevanta inom numismatik. Från objekttyper och material, till myntningsplatser och personer. Många av dem är koordinatsatta.

Söktjänst: Nomisma

Rekommenderas för:

  • Numismatiska termer, platser, personer

PeriodO

PeriodO är en öppen standard för perioder och tidsangivelser inom historia, konsthistoria och arkeologi. Den kan användas både för att hitta standardiserade benämningar och för att reda ut hur olika perioder i olika delar av världen överlappar varandra. Det finns en webbklient som kan användas för att genomsöka och redigera dataset, och det går att ladda ned projektets eget dataset som innehåller kanoniska begrepp. Innehållet är under ständig utveckling och länkas till Wikidatas URI-auktoriteter.

Söktjänst: Guide till PeriodO

Rekommenderas för:

  • Arkeologiska och kulturhistoriska tidsperioder

VIAF

Virtual International Authority File (VIAF) skapar auktoriteter för termer som förekommer i bibliotekssystem, till exempel för personer och organisationer. På så sätt blir de maskinläsbara och interoperabla oavsett språk och alfabet. Termerna i VIAF mappas mot motsvarande i olika nationella bibliotek.

Söktjänst: VIAF

Rekommenderas för:

  • Personer (författare, konstnärer, historiska personer)
  • Organisationer

Wikidata

Wikidata publicerar kontrollerade vokabulärer som används av organisationens olika tjänster: Wikipedia, Wikimedia Commons, Wikispecies och så vidare. Det är få termer, begrepp, platser, personer med mera som inte har wikidata-ID (se ttill exempel Gustaf IV Adolf).

Auktoriteterna innehåller strukturerade metadata i maskinläsbara format, inklusive relationer till andra termer. De är sökbara på olika språk och för alternativa stavningar. Termer och begrepp som är etablerade och väldefinierade är på det hela taget oproblematiska att använda sig av. Wikidata innehåller dessutom bara grundläggande metadata, inte själva artikeltexterna.

Wikidata pekar alltid på minst en källa för termen. Det medför att tjänsten fungerar som en stor sambandscentral för vokabulärer och auktoriteter.

Söktjänst: Wikidata introduction

Rekommenderas för:

  • Alla termer som du inte hittar på annat sätt
  • För att hitta vokabulärer för en viss term (listade under Identifiers)

Auktoriteter för specifika kulturarvsobjekt

Ovan nämnda vokabulärer är framförallt användbara för att hitta identifierare för generella termer samt för personer. Det allra bästa är såklart att också ange unik identifierare för de objekt som ingår i dina studier – vare sig det är ett speciellt föremål, en viss kulturhistorisk lämning eller byggnad, eller en specifik arkivhandling.

Allt eftersom samlingar digitaliseras skapas unika identifierare för dem och det blir allt vanligare att dessa även publiceras som URL. Här följer några söktjänster som du kan använda dig av för att leta fram dessa objektsspecifika auktoriteter.

K-Samsök: Föremål, lämningar, byggnader

K-samsök är Riksantikvarieämbetets aggregator som indexerar innehållet i de samlings- och arkivdatabaser som är anslutna till tjänsten. Globalt unika identifierare skapas i form av beständiga länkar till källan

Även kulturhistoriska lämningar och byggnader från Riksantikvarieämbetets egna register indexeras på detta sätt.

Du kan hitta beständiga identifierare för specifika objekt i samlingar och arkiv som är anslutna till K-samsök via söktjänsten Kringla. Under ”Teknisk data” kan du hitta dess beständiga Objekt-URI. Till exempel för denna klänning ur Nordiska museets samlingar: Klänning – Nordiska museet / DigitaltMuseum.

Observera att inte alla museer och arkiv levererar information till K-samsök.

Söktjänst: Kringla

Rekommenderas för:

  • Fornlämningar och övriga kulturhistoriska lämningar (RAÄ Kulturmiljöregister)
  • Arkeologiska uppdrag (RAÄ Kulturmiljöregister)
  • Kulturhistoriska byggnader och kyrkor (RAÄ Bebyggelseregister)
  • Föremål i samlingar
  • Arkivhandlingar (se dock även NAD)

Runor

Sökportalen Runor kan användas för att hitta auktoriteter för runinskrifter från hela världen. Informationen hämtas från flera olika källor, som till exempel Samnordisk runtextdatabas och Digitala Sveriges runinskrifter. K-Samsök indexerar objekten och skapar auktoriteter för dem. Sökplattformen är utvecklad att kunna visa upp informationen även på engelska.

Söktjänst: Runor

Rekommenderas för:

  • Runinskrifter (runstenar, föremål)

NAD: Arkivhandlingar

Nationell arkivdatabas (NAD) förvaltas av Riksarkivet men innehåller dessutom information från många andra arkivbestånd. NAD har framförallt identifierare för specifika samlingar, till exempel de manuskript från August Strindberg som finns på Göteborgs universitetsbibliotek respektive Uppsala universitetsbibliotek.

Söktjänst: Sök arkiv

Rekommenderas för:

  • Arkivsamlingar

LIBRIS: Publikationer

LIBRIS är en nationell söktjänst med information om verk som finns på svenska bibliotek. Kungliga biblioteket ansvarar för drift och utveckling och tillhandahåller auktoriteter för enskilda verk. Till skillnad från en generell auktoritet för romanen ”Röda rummet” av August Strindberg så finns här alltså en möjlighet att referera till en specifik utgåva eller översättning, under förutsättning att den finns på ett svenskt bibliotek.

Söktjänst: LIBRIS katalogisering

Rekommenderas för:

  • Specifika utgåvor av publikationer

Standarder för termer och begrepp övrigt

ISO standarder

SIS – Svenska Institutet för Standarder är en del av ISO och CEN som är nätverk av experter som arbetar med att skapa internationella standarder i en bred mening, från arbetsprocesser till teknik, inklusive för kulturarvsarbete i olika sammanhang.

SS-EN 15898:2019 Bevarande av kulturarv – Generella termer och definitioner innehåller rekommenderade termer för kulturvården på svenska och deras definitioner. De är även matchade med motsvarande termer på engelska. Läs mer om RAÄ och SIS här.

Via ISO:s termdatabaser kan du också söka upp begreppen och deras definitioner.

Spectrum

Spectrum är museernas egen standard inom samlingsförvaltning. Den är i första hand en standard för processer och arbetsrutiner, men ger en bra inblick i den typ av dokumentation som är viktig utifrån samlingsperspektiv och den data som eventuellt kan förekomma i systemen. Riksantikvarieämbetet har bidragit till att ta fram en svensk översättning av Spectrum. I detta ingår svensk översättning av informationsenheter och -grupper och definitioner av dessa.

I bilagan till Spectrum listas informationsenheterna i alfabetisk ordning med tillhörande råd för hur dessa informationsenheter kan registreras. Vilka av dessa som faktiskt används varierar från samling till samling, ingen innehåller allt. Det är en bra start för den som funderar på vilken metadata som kan behövas om man forskar på samlingar och vilken hierarki man bör bygga sin databas utifrån.

Spectrum har inte auktoriteter/URI för dessa termer, det får letas upp via någon av de tjänster som nämns ovan.