7. Datastandarder

För att säkra största möjliga användbarhet och möjligheten att hitta relevant data som sparas i samlingsförvaltningssystemet bör systemet vara uppbyggt enligt de mest använda metadatastandarderna. Dessa standarder beskriver bland annat hur data ska registreras i systemen: Följs standarderna så är det garanterat att informationen är konsekvent registrerad även för stora och ibland heterogena samlingar.

Räknemaskin Standard Machine CoFoto: (CC BY)

Lägg märke till att även om systemet är uppbyggt i enlighet med dessa standarder så är det avgörande för användbarheten HUR data registreras. Det vill säga om ett fält inte används på ett konsekvent sätt (till exempel att fältet “Geografisk härkomst” bara används för föremålets geografiska härkomst och inte för att registrera information om en avbildad plats eller liknande), så kommer museet inte ha standardiserat data fastän man använder sig av ett standardiserat system. Om data däremot registreras konsekvent enligt standarder blir den inte bara mer användbar inom museet utan det blir även lättare att utbyta data mellan institutioner och system.

Det finns olika typer av datastandarder som är relevanta i det här sammanhanget. Standarderna kan gälla struktur, format eller innehåll

Standarder för struktur och dataelement

Metadatastandarder beskriver vilka fält eller element som behövs för att identifiera och dokumentera ett objekt. I samlingsförvaltningsstandarden Spectrum kallas dessa element för informationsenheter men i mer allmänna sammanhang används även begreppet dataelement. I kulturhistoriska sammanhang omfattar de till exempel följande: identifikations- eller objektnummer, titel/objektbeteckning, tillkomst av objektet, datering, geografisk härkomst, dimensioner, material och förvärv. Den mest omfattande standarden för beskrivning av dataelement och struktur i samband med kulturarvsinformation är CIDOC CRM, en ontologi som har tagits fram av  Icoms dokumentationskommitté, CIDOC. CIDOC CRM är även ISO standard sedan 2006 (ISO21127:2006) och har aktualiserats 2014 (ISO21127:2014). CIDOC CRM är en bra grund för systemutvecklare som ägnar sig åt (vidare-)utveckling av samlingsförvaltningssystem eftersom den beskriver vilka dataelement som behövs och vilka relationer som ska finnas mellan de olika elementen. Den är väletablerad och garanterar att informationen i samlingsförvaltningssystemen blir jämförbara och kompatibla med andra system. En tillämpning av CIDOC CRM är dataformatet Lightweight Information Describing Objects (LIDO). Vid val av samlingsförvaltningssystem är det värdefullt att kräva att systemet är anpassat mot CIDOC CRM och kan till exempel exportera data i formatet LIDO. Det kan både förenkla samarbete med aggregatorer och även förenkla att byta system i framtiden. Andra standarder och standardiserade dataformat som används för att beskriva kulturarvsinformation är bl.a. Categories for the Description of Works of Art (CDWA), Cataloging of Cultural Objects (CCO) och Europeana Data Model (EDM). Det finns flera standarder för annan typ av information som är vanligt förekommande bland kulturarvsinformation såsom Dublin Core (generell metadatastandard) och Darwin Core (observations data/naturhistoriska samlingar). Observera att de flesta standarder är för omfattande för att användas som en allmän riktlinje om vilken information museet måste registrera om samlingarna. Några standarder tillhandahåller dock även en lista över obligatoriska dataelement (till exempel CDWA core categories, som ger en bra riktlinje för vilken information museet borde fokusera på vid katalogisering). Med utgångspunkt från dataelementen som finns listade i standarden bör museet själv bestämma vilka av dessa som är viktigast för dokumentation av den specifika samlingen. Beroende på vilken sorts samling museet förvaltar är olika informationsenheter mer eller mindre viktiga för specifika museer. Förvaltar museet till exempel en samling med många föremål i drift, blir det viktigare att fokusera på fält för status, åtgärder som underhåll, bevakningsdatum för besiktningar, än för andra museer. I och med att samlingsförvaltningssystem inte bara sparar information om objekten, utan även om aktiviteter i samband med samlingsförvaltning, så är samlingsförvaltningsstandarden Spectrum en viktig riktlinje vad gäller definiering av dataelement som behövs i ett samlingsförvaltningssystem. Dessa dataelement finns  beskrivna på sidan Spectrumprocesserna och samlingsförvaltningssystem.  De viktigaste dataelement som bör finnas i ett samlingsförvaltningssystem är listade i kravspecifikationstabellen, där de är grupperade efter Spectrum processerna.

Standarder för registrering 

Dataformatstandarder är riktlinjer om HUR informationen ska registreras i fälten. Dessa riktlinjer berör främst syntax, stil och grammatik som företrädesvis ska användas. Det finns idag inga vedertagna svenska standarder om hur information bör registreras men det är viktigt att museet upprättar tydliga och noggranna riktlinjer kring detta. Enkla principer att börja med är till exempel att beskrivningar ska registreras i hela meningar med korrekt grammatik, utan förkortningar eller akronymer. Vid registrering av enstaka ord (som till exempel material) eller vid upprättande av egna ordlistor (till exempel över fordonstyper eller verktyg i museets samlingar), bör det definieras i förväg att de ska registreras i obestämd form och i singularform. Internationella dataformatstandarder är bland annat Cataloging of Cultural Objects (CCO) och Describing Archives: A Content Standard (DACS).

Standarder för innehåll (vokabulärer)

Vokabulärer är listor med vedertagna begrepp som ska användas för registrering av viss information, oftast i form av ett auktoritetsregister, tesaurus eller enklare ordlista. Väletablerade och internationellt använda exempel på vokabulärer är Gettys Vocabularies, som kan användas som länkade data och finns att ladda ner i olika format. Mest använda är Art and Architecture Thesaurus (AAT) och Thesaurus of Geographic Names (TGN). Om systemet inte tillåter en direkt uppkoppling mot Gettys vokabulärer online är det en bra idé att registrera Gettys URI för begreppet i museets egen ordlista (till exempel http://vocab.getty.edu/page/aat/300041379 för “litografi”). Om samlingarna innehåller verk av många internationella konstnärer, kan det även vara gynnsamt att använda sig av Gettys Union List of Artist Names. Internationella standarder som handlar om tema eller avbildat subjekt är till exempel Iconclass och Library of Congress Subject Headings.Vokabulärer på svenska som används av många svenska museer är register och ordlistor som finns på KulturNav, en gemensam webbaserad terminologi- och auktoritetsplattform särskilt utvecklad för nordiska museer och andra kulturarvsinstitutioner. Plattformen förvaltas av det norska företaget KulturIT i samverkan med kulturarvsorganisationer i Norge och Sverige. Vokabulärer på Kulturnav kan vara mer specifik för nordiskt kulturarv, den innehåller till exempel listor över fartygstyper och liknande. De olika listorna på Kulturnav förvaltas av olika museer och kulturarvsinstitutioner. Även här gäller att om vokabulärer i Kulturnav inte kan användas som länkade data direkt i systemet, är det en bra början att registrera URI:na i museets egen ordlista. (till exempel http://kulturnav.org/eea0da69-db7b-4289-a55e-437dee98ea5b för “trossbåt”). En annan möjlighet att säkra internationell återanvändbarhet av museets data genom egna auktoritetslistor och vokabulärer är att registrera Wikidatas URI:er (till exempel http://www.wikidata.org/entity/Q133036 för litografi) som referens till termen eller auktoritetsposten (till exempel om en person). Wikidata länkar ofta vidare till andra auktoritetslistor och är därför en bra nod om man vill jobba mot att på sikt göra sitt innehåll tillgänglig som länkade öppna data.