E-kurs: Städa smart – en introduktion till Open Refine
Kursen riktar sig till dig som arbetar med datahantering i forsknings-, kulturarvs‑ eller statistikprojekt och vill förbättra kvaliteten i dina datasets.
Om e-kursen och kursmål
Den här kursen ger dig grunderna i hur du använder OpenRefine för att göra datarensning och datatransformation mer effektivt. Du får lära dig hur du identifierar och hanterar inkonsekvenser, dubbletter och oönskade format i dataset och hur du kan strukturera data på ett sätt som gör den mer användbar för analys eller vidare bearbetning.
OpenRefine är ett open‑source‑verktyg som kan användas för stora mängder data och erbjuder bland annat funktioner för filtrering, klustring och omformatering av data.
Kursen innehåller:
- En introduktion till OpenRefine som program och arbetsyta
- Hur du importerar data och påbörjar datarensning
- Grundläggande tekniker för att hitta och korrigera felaktigheter
- Hur du normaliserar format och hanterar dubbletter
- Tips på hur du kan exportera och återanvända din städade data
Efter kursen kan du:
- Förstå vad OpenRefine är och i vilka situationer verktyget är användbart
- Starta ett projekt i OpenRefine och importera data
- Identifiera vanliga dataproblem som felstavningar, inkonsekventa format och tomma värden
- Använda filtrering, facetter och klustring för att strukturera data
Målgrupp
Kursen riktar sig till dig som är ny till OpenRefine och arbetar med data i någon form, exempelvis inom forskning, kulturarv eller offentlig sektor, och vill förbättra kvaliteten på dataset samt effektivisera arbetet med datarensning och strukturering.
Praktisk information
Nivå: Introduktion
Upplägg: Webbaserad e-kurs som genomförs individuellt i egen takt. Kursen är öppen för alla och kräver inget inlogg.
Förkunskaper: Inga förkunskaper krävs
Tidsåtgång: Cirka 90 minuter, inklusive övningar