Oscaria - Örnen 28 maj 1968 Foto: ( PDM)

Let’s talk data

Data är hjärtat av alla open GLAM-relaterade aktiviteter – och därför är kvalitet central. Vad datakvalitet är och hur den mäts, det ska vi upptäcka i det här mötet av “Open GLAM nu!”: Dr. Karin Glasemann (Nationalmuseum), Bengt Nordqvist (Jamtli) och Marcus Smith (Riksantikvarieämbetet), delade sina perspektiv på datakvalitet och hur man arbetar med detta på sina institutioner. Om ni skulle vilja börja med en inledning till vad OpenGLAM är, titta här.

Varför börjar den här webinarieserien med detta ämne? Som Karin Glasemann sa under sin presentation: Institutionerna borde “tänka data, och inte applikation”. Då open GLAM har till syfte att tillgängliggöra båda de digitala och analoga samlingarna och bidra till en mer öppen institution, är data och dess kvalitet grunden för alla resulterande aktiviteter och verktyg enligt våra gäster.

 

Marcus Smith från Riksantikvarieämbetet började med en inledning om vad data, metadata och paradata egentlig är. Då han jobbar med K-samsök, den nationella aggregator till Europeana i Sverige och en tjänst för öppna kulturarvsdata, kunde han dela insikter i vad datakvalitet är och vilka parametrar är relevanta för att analyser den.

“När vi pratar om datakvalité, beror det också ofta på sammanhanget. Det finns egentlig inga neutrala mått som kan tillämpas över alla datamängder. För att beskriva vad vi menar med datakvalité, det måste alltid mätas i relation till syftet eller ändamål som data används till.” Marcus Smith

Trots det, finns det några kännetecken som visar på nivån av datakvalitén, som till exempel noggrannhet, korrekthet, kopplingar till annat data, konsekvens, struktur, konsekvens, maskinläsbarhet eller användbarhet. Marcus beskriver ett exempel på hur datakvalitet mäts med Europeana Publishing Framework, ett ramverk som presenterar olika datakvalitetsparametrar i kontexten av att publicera data i Europeana. Den demonstrerar att ju bättre kvaliteten av publicerade data i Europeana är, desto mer kan användare och andra organisationer göra med era data. Han visar också ett verktyg som utvecklats på Riksantikvarieämbetet och hjälper institutionerna i K-samsök att öka sin datakvalitetsnivå genom att arbeta med sina rättighetsmärkningar.

Pojke med stor pumpa på skottkärra, 1910-tal. Foto: (CC BY)

Från vad datakvaliteten är och hur den bedöms vänder vi oss till ett perspektiv på institutionell nivån. Dr. Karin Glasemann delade sina insikter kring utvecklingen på Nationalmuseum i Stockholm. Som digitaliseringssamordnare koordinerade hon processen att dokumentera och digitalisera museets samlingar under flyttningen. Hon beskriver svårigheterna och utmaningarna med att digitalisera stora objektmängder under en kort period. En central aspekt för att öka kvaliteten av metadata och data på Nationalmuseum var att utveckla interna rutiner och processer för att samla all information om samlingen vid en åtkomstpunkt. En annan värdefull lärdom var att dina data aldrig kommer att vara perfekta – varje institution måste börja digitalisera någon gång med de resurser som finns och definiera sin egen “good enough” datakvalitetsnivå för att få ut dem i världen.

“Man får utveckla rutiner kring alla de här digitala hjälpmedlen som man har för att det ska bli så bra som möjligt. […] Vår vision var att vi skulle ha en sammanhängande information för alla föremål, det skulle vara åtkomligt och sökbar för alla i personalen och att vi hade effektiva, fungerande rutiner utan dubbelregistrering och med en startpunkt för all information.” Karin Glasemann

Vad Nationalmuseum upplevde efter att de släppte sina data fritt med öppna licenser både via sin egen webbplats och på Wikimedia Commons och Europeana, var att deras samlingar nu används i alla möjliga sammanhang, från artiklar och appar till sociala medier och memes. Genom att tillgängliggöra sina data kan de digitaliserade samlingar spridas och hitta användare utanför institutionen:

“Det som vi lärde oss under den här processen var vad det egentlig betydde att vara tillgänglig i en digital värld: Jag tror att viktigaste är just att de digitaliserade samlingar som museer förvaltar är hjärtat i alla satsningar. […] Men samtidigt […] är det inte museet i slut som är huvudanvändare av de här resurserna utan det är världen där ute. Det går inte att uppnå högst effekt om man inte våga släppa sitt material fritt också.” Karin Glasemann

Dennis Nordsten får hjälp av Kjell Jakobsson att hålla i brädan medan han reser sig, 1982. Foto: (CC BY-SA)

I den sista presentationen av detta möte talade Bengt Nordqvist om Jamtlis verksamhet när det gäller att digitalisera sina samlingar och kataloger och hur dessa byggts upp under tid. Han presenterar hur de arbetar med de register och kataloger som de har. Jamtli har ett eget digitalt bildarkiv på sin webbplats: Det möjliggör för användarna att berika museets kunskap (och därmed metadata) om sina egna samlingar, eftersom användare kan lämna kommentarer med information som till exempel om personer eller platser som är synliga på digitaliserade fotografier. Han delade också insikter om utmaningarna med att arbeta med institutionens digitala samlingar och digitalisera de fysiska samlingarna.

Att ta med sig

  • Det finns många olika parametrar för att mäta datakvalitet – du behöver fokusera på de som hjälper din institution att nå de mål du vill uppnå med dina data.
  • Att skapa interna processer och rutiner kan hjälpa till att inkludera hela institutionen i att förstå varför det är viktigt att uppnå dina mål med att göra digital insamlingsdata och metadata öppet tillgängliga.
  • Dina data kommer aldrig att vara perfekta. Hitta din ”good enough”-nivå för att publicera dem, så att andra, men även din egen instiution, kan använda dem.
  • Så snart dina data publiceras kan du få ett mervärde genom att din publik stödjer dig för att öka din datakvalitet, till exempel genom att berika dina metadata.

Gå till nästa session: Arbeta tillsammans!

Mer information