Checklista: Beständiga identifierare

Denna checklista beskriver olika digitala identifierare och vad din kulturarvsinstitution bör tänka på vad gäller beständiga identifierare, alltså unika kodsträngar som identifierar en resurs på ett sätt som är beständigt över tid.

Beständiga identifierare, Persistent Identifiers (PID), är unika kodsträngar, det vill säga flera koder som kan kombineras på olika sätt, kopplade till olika digitala objekt eller poster. De är en förutsättning för att man ska kunna skapa länkar mellan olika objekt och poster i ett nätverk.

Beständiga identifierare kan hänvisa till all information om ett objekt – digitala bilder, museisamlingen som det är en del av, dokument som hänvisar till det, med mera. Den används för att entydigt identifiera objekt, personer och organisationer.

På så sätt undviks också sammanblandning av olika resurser som annars skulle kunna förväxlas, exempelvis om det är en bro eller orten Bro som avses. Beständiga identifierare kan användas på både objekt och mer abstrakta begrepp som ”upphovsperson” eller ”korrespondens”.

Varje kulturarvsinstitution bör ha en övergripande policy för användning av identifierare. Det är viktigt att identifierarna är utformade på ett sådant sätt att de är globalt unika och beständiga. Även om identifierarna endast används internt bör de vara utformade på ett sådant sätt att de kan integreras i formella standarder och format vid extern användning.

Olika slags identifierare

Det finns olika typer av identifierare. Ett av de mer kända formaten är Uniform Resource Identifier (URI). En URI är en identifierare av en abstrakt eller fysisk resurs, till exempel en webbsida, på Internet eller i ett datornätverk. Det kan klassificeras som en platshänvisning, Uniform Resource Locator (URL), ett namn för resursen, Uniform Resource Name (URN), eller både och.

Diagrammet visar att en URI kan vara en URL, en URN eller både och.
En URI kan vara en URL (Uniform Resource Locator), en URN (Uniform Resource Name) eller både och. Foto: (CC BY-SA)

En beständig identifierare kan vara en kombination av institutionens interna identifierare och information om vilken typ av resurs som identifieras och hur resursen kan nås. Det finns även ett antal tjänster som gör det möjligt att länka mellan de identifierare som används internt i institutionernas samlingssystem och de identifierare som skapas när informationen till exempel görs tillgänglig online.

Man kan skapa beständiga identifierare av exempelvis interna identifierare vid institutionen med en uppslagstjänst, resolution service. Den identifierar en digital fil, men refererar också till flera filer och digitala objekt eller lagrar metadata om en resurs.

De flesta bibliotek använder i dag URN:er för publikationer, som genom en uppslagstjänst kan kopplas ihop med URL:er. En URL ger information om hur man når resursen och var den finns.

På så sätt är det möjligt att göra skillnad mellan ett unikt namn och en plats, i de fall en namngiven resurs eller dess kopior finns på flera platser. Ibland kan det även vara relevant med specifika typer av identifierare, som till exempel LSID:er som är identifierare för Life-Science.

Läs mer om de olika begreppen:

System för beständiga identifierare

Det finns både interna och externa system som kan hantera beständiga identifierare. Om man använder ett internt system ska man se till att utforma systemet så att det följer rekommenderade standarder för exempelvis utformning av URI:er.

Om URI:erna skapas internt är det bra om de utformas så stabilt och beständigt som möjligt. Detta står det mer specifikt om i EU-kommissionens rekommendationer och i W3C:s rekommendationer om till exempel ”cool URI”, se länk nedan.

Vid val av ett externt system är det viktigt att systemet är tekniskt tillförlitligt och flexibelt i sättet att presentera metadata, samt interoperabelt. I relevanta fall kan även en uppslagstjänst som dirigerar webbläsaren till en aktuell kopia av objektet användas.

PID eller URI

PID-system används i allt större utsträckning för digitala resurser eftersom URI:er generellt ses som otillräckliga på lång sikt på grund av att domännamn och webbsidors struktur ändras över tid. URI:er är dock beständiga så länge en institution behåller registreringen av domännamnet.

PID:ar skapade med ett PID-system är i sin tur beständiga så länge den databas som håller PID-registreringarna finns kvar. Med andra ord slutar inte PID:ar skapade med ett PID-system att vara beständiga för att institutionen till exempel ändrar namnet på hemsidan.

Samtidigt kräver ett PID-system tekniskt underhåll, vilket gör att PID:ar skapade i ett sådant system i praktiken kan vara mindre beständiga än domännamn eftersom skapandet av dem är beroende av kompetens och specialbyggd mjukvara.

Med hjälp av en så kallad innehållsförhandling, content negotiation, kan olika typer av svar ges av servern beroende på vilken agent, exempelvis olika programvaror, webbläsare eller appar, det är som efterfrågar URI:n. Exempelvis kan en webbläsare få ett HTML-dokument eller en PDF-fil, en RDF-läsare får en RDF-fil och om det dyker upp nya format på vilka informationen kan representeras kan dessa läggas till senare.

Läs mer om identifierare

Beständiga identifierare vid din institution

  • Finns det en datapolicy vid din institution?
  • Finns det en policy för identifierare vid din institution?
  • Är institutionens identifierare unika internt?
  • Är institutionens identifierare unika globalt?
  • Är institutionens identifierare beständiga internt?
  • Är institutionens identifierare beständiga globalt?
  • Om identifierarna endast används internt, är de utformade på ett sådant sätt att de kan integreras för extern användning på ett unikt och beständigt sätt, i enlighet med rådande rekommendationer?
  • Är identifierarna som används redan implementerade i institutionens befintliga system, till exempel i databaser som används vid registrerings- och/eller katalogiseringsprocesser?
  • Återanvänds de unika identifierare som redan finns utan att en ny identifierare skapas?
  • Fungerar återsökbarheten? Genom att det till exempel vid uppdatering av länkar skapas en länk som pekar mot originalinformationen?
  • Finns det behov av en extern uppslagstjänst för identifierare?
    (Till exempel Kungliga bibliotekets uppslagstjänst.)
  • Om de beständiga identifierarna uttrycks med URI:er, följer dessa följande standard rekommenderad av Europeiska kommissionen: ”http://{domän}/{typ}/{koncept}/{referens}/”?

System för institutionens beständiga identifierare

  • Används systemet endast internt eller också externt?
  • Är systemet integrerat med andra system vid institutionen, till exempel samlingssystem?
  • Finns det en plan för förvaltning och långsiktigt bevarande av systemet?
  • Finns det en introduktion till systemet för alla som använder identifierare vid registrering av material?
  • Är systemet tekniskt tillförlitligt, till exempel vad gäller:
    – säkerhet?
    – säkerhetskopiering med redundant teknik (där informationen finns på flera geografiska platser och/eller tekniska plattformar)?
    – automatisk uppdatering av registret över identifierarna?
  • Om det är ett externt system som används för att tilldela identifierare till resurser, är systemet i sådana fall förvaltat av en kompetent och trovärdig organisation?
  • Är systemet flexibelt och kan det exponera data utan att informationen förloras, det vill säga sker exponeringen kvalitativt, med hög detaljnivå och med rikt beskrivna objekt?
  • Är systemet interoperabelt, det vill säga tillämpas exempelvis vedertagna internationella standarder och/eller öppna standarder?

När du vill veta mer

Några tumregler från W3C-communityt

Exempel på standarder och system för beständiga identifierare

Om checklistan

Checklistan bygger på Digisams urspungliga checklista för beständiga identifierare som utarbetades i samråd med experter från Sverige och utlandet (2015).

Digisams checklista finns i DiVA (diva-portal.org)