Datavask og ryddige regneark

Målgruppe
Alle ansatte og studenter ved UiT som jobber i prosjekter som involverer forskningsdata, og som har et særlig ansvar for fortløpende håndtering av datafilene.

Varighet
60 minutter, inkludert tid for spørsmål og kommentarer.

Kurskalender og påmelding
Se arrangementsliste på Forskningsdataportalen UiT.

Kursmateriale
PowerPoint-presentasjon oppdatert februar 2023.

Om kurset

Datavask eller databehandling er en essensiell og tidkrevende del av statistisk analyse. Databehandlingens formål er å klargjøre datasett og variabler for deskriptiv analyse, visualisering og/eller statistisk modellbygging. Man må sørge for at regnearkene er ryddige med gyldige verdier og håndterbare variabler. Denne forelesningen går gjennom beste praksis for organisering av regneark og grunnleggende tips for datavask. Formålet er å oppnå «tidy data» som vil gjøre nedstrøms analyse mer effektiv, gjøre dataene maskinlesbare, og bidra til å gjøre forskningen reproduserbar.

Webinaret vil gå gjennom typiske feil og gi konkrete eksempler på god praksis. Det vil bli anledning til å evaluere eksempeldata og tid til kommentarer, spørsmål og diskusjon.

Webinaret bygger på modulen “Hvordan strukturere og dokumentere forskningsdata”.