Foto: (CC BY)

Standarder och auktoriteter för metadata

Metadata används för att beskriva data och information så att de kan läsas av både maskiner och människor. Gemensamma standarder och vokabulärer krävs för att detta ska fungera. Här hittar du exempel på sådana för kulturarv.

Begreppet metadata handlar helt enkelt om data som beskriver ett visst objekt (ett dataset, ett föremål, en bild, en text, en film osv). Det finns ingen egentlig begränsning på vad metadata kan omfatta. En tavla kan beskrivas med metadata för konstnärens namn, platsen och tiden då den skapades och vad den föreställer, men även kemiska komponenter i pigment, typ av pensel och duk, vilken sorts restaurering som skett, böcker som skrivits om den, filmer den förekommer i med mera. Det är användarbehoven som styr vilka metadata som är relevanta och behoven hos samlingsförvaltare respektive forskare överlappar bara delvis.

Vokabulärer och auktoriteter – förklaring

En vokabulär är en sammanställning av termer och deras definitioner som är relevanta för ett visst område: t.ex. ämnesområden, föremålstyper, konststilar, fornlämningar osv. Genom att använda dig av nationellt och internationellt etablerade vokabulärer så blir det enklare både att hitta och förstå det du skapat. Samtidigt kan samma term ha olika betydelser i olika vokabulärer (är “Bro” en konstruktion eller ett sockennamn?), och olika termer kan ha samma betydelse, till exempel vokabulärer på olika språk: Bro resp Bridge. För att komma runt detta krävs något mer: en kontrollerad vokabulär med unika identifierare för termerna.

Auktoriteter är termer som har en globalt unik identifierare i form av en URI (Uniform Resource Identifier). Det vill säga att det finns ett beständigt sätt att referera till resursen som är maskinläsbart. En auktoritets URI kan även vara en i form av en webb-länk, som gör att det går att hitta den på internet (URL = Uniform Resource Locator). En URL ska vara beständig, den ska helst inte bytas ut alls och om det händer måste den gamla identifieraren peka ut den nya som ersatt den. För att säkerställa detta krävs långsiktiga förvaltningsplaner. Därför behöver du tänka efter innan du väljer auktoriteter, men det gör ingenting om du använder dig av olika auktoriteter vid olika tillfällen, eftersom maskinerna förstår vad som åsyftas med hjälp av dess URI.

Fördelen med att använda sig av auktoriteter och inte bara termer är att du tillhandahåller en definition av vad du menar. Till exempel “medeltid” kan referera till olika tidsperioder beroende på var i världen du är. Genom att använda en länk till en auktoritet så blir det tydligt för användarna vad som menas i just detta fall. Maskinell avläsning kan dessutom översätta dina data och metadata till olika språk. Tjänster som Wikidata skapar även relationer mellan auktoriteter, så att en maskin enbart genom att få en identifierare för August Strindberg, kan hitta och sammanställa långt mer information: t.ex. var han bodde, studerade, vilka böcker han skrev,  födelseår osv (se figur).

 

Länkad data och auktoriteter Bild: Peter Krantz (CC BY)

Vokabulärer för kulturarv

Det finns många olika vokabulärer och auktoriteter, som ofta överlappar varandra dessutom. Ingen vokabulär kommer innehålla allt du behöver, och det går som sagt utmärkt att blanda auktoriteter från olika vokabulärer. Här presenterar vi några av de som är relevanta för kulturarvsforskning och som dessutom är relativt enkla att använda för den enskilde. De kan med fördel användas när du skapar tabeller och databaser, eller när du ska ange beskrivande metadata för t.ex. forskningsdata.

Getty Research Institute

The Getty Research Institute har sammanställt vokabulärer på engelska som i hög grad används internationellt. Framförallt The Art & Architecture Thesaurus (Getty AAT) har kommit att bli en standard för kulturarvsinstitutioner och forskare. Det finns även en för geografiska platser (TGN) och en för specifika konstverk och kulturarvsobjekt (CONA) samt för ikonografiska motiv (IA) och konstnärer  (ULAN). Det finns en gemensam sökportal för AAT, TGN och ULAN.

Söktjänst: Getty Vocabularies

Rekommenderas för: (för svenska termer, se KB nedan):

  • Instrument/Metod
  • Material
  • Ämnesområde
  • Personer inom konst, arkitektur, litteratur
  • Historiska platser/regioner
  • Stilperioder
  • Objekttyper

GeoNames

GeoNames är en geografisk databas med över 11 miljoner unika platser och 25 miljoner platsnamn. Databasen kan laddas ned för egen användning, eller så kan du söka fram en lokalitet och få unik URI (auktoritet) som kan användas i ditt dataset. Se till exempel Åbo: geonames.org/633679/turku

GeoNames är en så kallad gazetteer, vilket är ett sorts geografiskt uppslagsverk/register. Digitala gazetteers kan förutom platsnamn och -info även innehålla koordinater för att kunna visualisera platser på webbkartor. Det finns speciellt framtagna gazetteers för historiska platser och -namn som kan ha haft annorlunda gränser under olika historiska perioder. Till exempel Pleiades för Antiken och China Historical GIS.

Söktjänst: GeoNames

Rekommenderas för:

  • Geografiska platser (länder, regioner, städer osv)

Kungliga biblioteket – Ämnesord på svenska

Kungliga biblioteket publicerar kontrollerade vokabulärer för svenska ämnesord som används av biblioteken, med beständiga identifierare för dem. Om du vill beskrivavad din data handlar om med svenska metadata så är detta en bra tjänst. Söktjänst: id.kb.se

Rekommenderas för:

  • Ämnesord på svenska (främst humaniora och samhällsvetenskap)
  • Termer på svenska relaterade till biblioteks- och arkivobjekt

Nomisma

Nomisma.org tillhandahåller en vokabulär specialiserad på termer som är relevanta inom numismatik. Från objekttyper och material, till myntningsplatser och personer. Många av dem är koordinatsatta. Söktjänst: Nomisma

Rekommenderas för:

  • Numismatiska termer, platser, personer

PeriodO

PeriodO är en öppen standard för perioder och tidsangivelser inom historia, konsthistoria och arkeologi. Den kan användas både för att hitta standardiserade benämningar och för att reda ut hur olika perioder i olika delar av världen överlappar varandra. Det finns en webbklient som kan användas för att genomsöka och redigera dataset, och det går att ladda ned projektets eget dataset som innehåller kanoniska begrepp. Innehållet är under ständig utveckling och länkas till Wikidatas URI-auktoriteter.

Söktjänst: Guide till PeriodO

Rekommenderas för:

  • Arkeologiska och kulturhistoriska tidsperioder

VIAF

Virtual International Authority File (VIAF) skapar auktoriteter för termer som förekommer i bibliotekssystem, till exempel för personer och organisationer. På så sätt blir de maskinläsbara och interoperabla oavsett språk och alfabet. Termerna i VIAF mappas mot motsvarande i olika nationella bibliotek.

Söktjänst: VIAF

Rekommenderas för:

  • Personer (författare, konstnärer, historiska personer)
  • Organisationer

Wikidata

Wikidata publicerar kontrollerade vokabulärer som används av organisationens olika tjänster: Wikipedia, Wikimedia Commons, Wikispecies osv. Det är få termer, begrepp, platser, personer osv som inte har wikidata-ID (se t.ex. Gustaf IV Adolf). Auktoriteterna innehåller strukturerade metadata i maskinläsbara format, inklusive relationer till andra termer. De är sökbara på olika språk och för alternativa stavningar. Termer och begrepp som är etablerade och väldefinierade är på det hela taget oproblematiska att använda sig av. Wikidata innehåller dessutom bara grundläggande metadata, inte själva artikeltexterna.

Wikidata pekar alltid på minst en källa för termen. Det medför att tjänsten fungerar som en stor sambandscentral för vokabulärer och auktoriteter.

Söktjänst: Wikidata introduction

Rekommenderas för:

  • Alla termer som du inte hittar på annat sätt
  • För att hitta vokabulärer för en viss term (listade under Identifiers)

Auktoriteter för specifika kulturarvsobjekt

Ovan nämnda vokabulärer är framförallt användbara för att hitta identifierare för generella termer samt för personer. Det allra bästa är såklart att också ange unik identifierare för de objekt som ingår i dina studier – vare sig det är ett speciellt föremål, en viss kulturhistorisk lämning eller byggnad, eller en specifik arkivhandling. Allt eftersom samlingar digitaliseras så skapas unika identifierare för dem och det blir allt vanligare att dessa även publiceras som URL. Här följer några söktjänster som du kan använda dig av för att leta fram dessa objektsspecifika auktoriteter.

K-Samsök: Föremål, lämningar, byggnader

K-samsök är Riksantikvarieämbetets aggregator som indexerar innehållet i de samlings- och arkivdatabaser som är anslutna till tjänsten. Globalt unika identifierare skapas i form av beständiga länkar till källan

Även kulturhistoriska lämningar och byggnader från Riksantikvarieämbetets egna register indexeras på detta sätt.

Du kan hitta beständiga identifierare för specifika objekt i samlingar och arkiv som är anslutna till K-samsök via söktjänsten Kringla. Under “Teknisk data” kan du hitta dess beständiga Objekt-URI. T.ex. för denna klänning ur Nordiska museets samlingar: http://kulturarvsdata.se/nomu/object/NM0193605A-B.

Observera att inte alla museer och arkiv levererar information till K-samsök.

Söktjänst: Kringla

Rekommenderas för:

  • Fornlämningar och övriga kulturhistoriska lämningar (RAÄ Kulturmiljöregister)
  • Arkeologiska uppdrag (RAÄ Kulturmiljöregister)
  • Kulturhistoriska byggnader och kyrkor (RAÄ Bebyggelseregister)
  • Föremål i samlingar
  • Arkivhandlingar (se dock även NAD)

Runor

Sökportalen Runor kan användas för att hitta auktoriteter för runinskrifter från hela världen. Informationen hämtas från flera olika källor, som t.ex. Samnordisk runtextdatabas och Digitala Sveriges runinskrifter. K-Samsök indexerar objekten och skapar auktoriteter för dem. Sökplattformen är utvecklad att kunna visa upp informationen även på engelska.

Söktjänst: Runor

Rekommenderas för:

  • Runinskrifter (runstenar, föremål)

NAD: Arkivhandlingar

Nationell arkivdatabas (NAD) förvaltas av Riksarkivet men innehåller dessutom information från många andra arkivbestånd. NAD har framförallt identifierare för specifika samlingar, till exempel de manuskript från August Strindberg som finns på Göteborgs universitetsbibliotek respektive Uppsala universitetsbibliotek.

Söktjänst: Sök arkiv

Rekommenderas för:

  • Arkivsamlingar

LIBRIS: Publikationer

LIBRIS är en nationell söktjänst med information om verk som finns på svenska bibliotek. Kungliga biblioteket ansvarar för drift och utveckling och tillhandahåller auktoriteter för enskilda verk. Till skillnad från en generell auktoritet för romanen “Röda rummet” av August Strindberg så finns här alltså en möjlighet att referera till en specifik utgåva eller översättning, under förutsättning att den finns på ett svenskt bibliotek.

Söktjänst: LIBRIS katalogisering

Rekommenderas för:

  • Specifika utgåvor av publikationer

Standarder för termer och begrepp övrigt

ISO standarder

SIS – Svenska Institutet för Standarder är en del av ISO och CEN som är nätverk av experter som arbetar med att skapa internationella standarder i en bred mening, från arbetsprocesser till teknik, inklusive för kulturarvsarbete i olika sammanhang

SS-EN 15898:2019 Bevarande av kulturarv – Generella termer och definitioner innehåller rekommenderade termer för kulturvården på svenska och deras definitioner. De är även matchade med motsvarande termer på engelska. Läs mer om RAÄ och SIS här.

Via ISO:s termdatabaser kan du också söka upp begreppen och deras definitioner.

Spectrum

Spectrum är museernas egen standard inom samlingsförvaltning. Den är i första hand en standard för processer och arbetsrutiner, men ger en bra inblick i den typ av dokumentation som är viktig utifrån samlingsperspektiv och den data som eventuellt kan förekomma i systemen. Riksantikvarieämbetet har bidragit till att ta fram en svensk översättning av Spectrum. I detta ingår svensk översättning av informationsenheter och -grupper och definitioner av dessa.

I bilagan till Spectrum listas informationsenheterna i alfabetisk ordning med tillhörande råd för hur dessa informationsenheter kan registreras. Vilka av dessa som faktiskt används varierar från samling till samling, ingen innehåller allt. Det är en bra start för den som funderar på vilken metadata som kan behövas om man forskar på samlingar och vilken hierarki man bör bygga sin databas utifrån.

Spectrum har inte auktoriteter/URI för dessa termer, det får letas upp via någon av de tjänster som nämns ovan.