Nasjonale prøver — datajournalistikk i praksis

Journalister gjør betydelig innsats for å presentere sentrale skoledata, men myndighetene spiller ikke med.

I 2004 ble ord­nin­gen med nasjonale prøver i lesing, skriv­ing, matem­atikk og engel­sk inn­ført i grunnskolen. Ord­nin­gen var omstridt og møtte en del mot­stand i beg­yn­nelsen, og skaper fort­satt debatt. Men mot­stand finnes også i sys­temet selv. I dette inn­legget vil jeg se nærmere på data­jour­nal­is­tiske pros­jek­ter som er gjort med resul­tatene fra nasjonale prøver.

To per­son­er med over gjen­nom­snitts innsikt i hvor­dan det er å jobbe med dataene fra nasjonale prøver er Even West­vang hos Bengler/Origo og Anders Erik­sen hos TV 2. Begge to har pub­lis­ert spen­nende pro­duk­ter, og ikke minst delt innsikt i hvor utfor­drin­gene lig­ger i slike pros­jek­ter. Rap­porter fra da West­vang og Erik­sen besøk­te UiB i 2009 finnes her, mens enda mer spe­si­fikk info om hvor­dan West­vangs nye pros­jekt skoleporten.bengler.no ble til finnes på Ori­go-bloggen.

Even West­vangs visu­alis­er­ing av nasjonale prøver.



TV 2 pub­lis­erte i 2008 resul­tatene fra nasjonale prøver på tv2.no. Her kan du fil­trere deg gjen­nom fylk­er og kom­muner, og få resul­tater per skole. Det finnes også top­plis­ter over skol­er i de ulike prøve­formene. Just dette med top­plis­ter og ranger­ing av skol­er var blant stridsspørsmå­lene da ord­nin­gen ble satt i gang. Før pub­lis­erin­gen job­bet Erik­sen med data utlev­ert i uku­rante for­mater (.pdf) for for­målet, men på tross av ekstraar­bei­det job­bet TV 2s team seg fram til et pre­sentabelt datasett passende for webpub­lis­er­ing. Da det så ble oppdaget feil i dataset­tet gav Utdannnings­di­rek­toratet etter og gav TV 2 opp­daterte data i Excel-format. 

I år plukket Even West­vang opp trå­den og laget skoleporten.bengler.no, der de samme resul­tatene vis­es på et kart. Kartet er i seg selv et fint stykke arbeid, men pøl­sa i rosi­nen er hvor­dan West­vang doku­menter­er både frem­gangsmåten sin, så vel som at han del­er koden bak pros­jek­tet.

Jeg vil gjerne trekke fram et par poeng fra West­vangs arbeidslogg: 

  • Datak­ilde: Dag­bladet. Utgangspunk­tet for pros­jek­tet er et Excel-ark med data delt av Dag­bladet. Ikke Utdannnings­di­rek­toratet. Selv om Utdannnings­di­rek­toratet vis­er data på sine web­sider, del­er de ikke data for gjenbruk. 
  • Skol­ereg­is­ter: web scrap­ing. På tross av at det finnes reg­is­ter over norske skol­er på web, lar disse seg ikke enkelt “skrapes” da adress­er blir vist som grafikk (en bilde­fil, ikke tekst). Det går an å tolke slike bilder om til tekst igjen, men dette er tungvint og burde være unød­vendig. Meto­den West­vang endte opp med var å skrape googlesøk innen skoleporten.utdanningsdirektoratet.no, og så geokode adressene der­fra. Er dette med vil­je gjort vanske­lig for­di det selges en bok med disse dataene? 

Kudos til West­vang! Ikke bare for å ende opp med denne fram­gangsmåten, men helst for å dele resul­tatene med andre som skulle trenge dataene. På github-kon­toen til pros­jek­tet lig­ger nå 2925 skol­er (csv-for­mat) med navn, kom­mune, fylke, adresse, antall elever og koor­di­nater. Kun ca 100 skol­er man­gler geokoding. 

Vi har jo disse dataene, hvorfor jamre?

Dataene fra nasjonale prøver 2008 finnes. De deles av Dag­bladet. Andre medi­er har dem også. Data for 2009 og 2010 er etter­spurt, men meg bek­jent ikke pub­lis­ert i noe for­nuftig for­mat uten­for skoleporten.utdanningsdirektoratet.no, og der er de særde­les lite tilgjen­gelig for videre­bruk. Eller?

Resul­tatene fra prøvene i engel­sk og reg­n­ing vil bli pub­lis­ert hen­holdsvis 16. novem­ber og 14. desember.

Dette er et sitat fra udir.no 2. novem­ber i år. Det er alt­så kun dager til nye data pub­lis­eres, la oss håpe Utdan­nings­di­rek­toratet har lært. Fornyings‑, admin­is­trasjons- og kirkede­parte­mentets utkast til ret­ningslin­jer er uansett anbe­falt lektyre. 

Hva med skoleregistret?

Per i dag sit­ter ped.lex.no san­syn­ligvis på det beste reg­istret over norske skol­er, barne­hager og øvrige utdan­ningsin­sti­tusjon­er. For videre­bruk av denne typen data kan dette se ut til å være et hin­der, ikke en hjelp. Det kreves et tungvint og kro­n­glete arbeid for å mask­inelt hente ut data her­fra. Med det er West­vangs skra­pede datasett over skol­er (på github) muli­gens det beste set­tet som er tilgjen­gelig per i dag? 

Behov for basisdata/grunndata

I jak­ten på datasett og kreativ bruk av disse dukker det stadig opp behov for “basis­da­ta” eller “grun­n­da­ta”. Med det men­er jeg datasett som beskriv­er entitetene i ver­den, og ikke nød­vendigvis pros­essene disse med­virk­er i. Lis­ten over resul­tater fra nasjonale prøver er data fra en pros­ess, data om norske skol­er og hvor de befinner seg er i en slik sam­men­heng nyt­tig å bryte ned resul­tatene over. Det vil være rel­a­tivt sta­bilt fra år til år, mens resul­tatene fra nasjonale prøver for­mod­entlig vil variere mer. 

Å sam­le opp slike datasett som beskriv­er entiteter, basisdata/grunndata, vil med andre ord kunne være med på å gjøre andre data mer verdi­fulle og nyt­tige. Erik Bol­stad har en sam­ling slike datasett på sin web­side (erikbolstad.no). Bol­stad har smak­en for geografiske data, og del­er data om ver­den (ver­dens­del­er, land, region­er i land), Norge (fylk­er, kom­muner, post­num­mer [med geoko­or­di­nater], fiske­banker, fjell over 1000 meter, jern­banes­tasjon­er, kirk­er, osv) og skan­di­naviske kommunesenter. 

At kunnskap om slike datasett blir sam­let og gjort kjent er med andre ord vik­tig, og må inklud­eres i kunnskaps­bas­er som data.norge.no, no.ckan.net og andre.

Summa summarum

Dataene fra nasjonale prøver har vist seg i flere pros­jek­ter å by på hode­bry for folk som vil gjen­bruke dem. Likev­el har dataset­tet både blitt sett av mange, og nå også fått flere spen­nende grafiske vis­ningsløs­ninger. Debat­ten om vi skal ha innsyn og ranger­ing av hvor bra eller dårlig norske skol­er lev­er­er har stil­net. Er vi enige nå?

Videre fram­står Utdan­nings­di­rek­toratet som en mot­spiller, ikke en med­spiller. Slik vil vi ikke ha det. Hvis forhold­ene skal ligge til rette for effek­tiv gjen­bruk av offentlig sek­tors data, må vi spille på lag. Jeg er ganske sikker på at både norske borg­ere, norsk presse og Utdan­nings­di­rek­toratet (og andre offentlige instanser) vil tjene på å anse hveran­dre som med­spillere. Hva kan vi gjøre for å bygge opp en pos­i­tiv del­ingskul­tur rundt “data vi allerede har betalt for”? Har du inn­spill er debat­ten gående både på data.norge.no, her i Fak­ta først og spo­radisk på Ori­go.

Det vi i alle fall har lært er at på tross av (den ikke lenger så nye) offent­lighet­sloven, og et økt fokus på gjen­nom­sik­tighet og del­ingskul­tur; så er det ennå ikke en smal sak å gjen­bruke dette dataset­tet. Likeledes kan pros­jek­ter som Erik­sens og West­vangs se ut til å bane vei, og bidra til at pros­essen kan gå let­tere pros­jekt for prosjekt. 

Twittermelding fra skoleporten - avslag på innsyn

PS: Siste opp­da­ter­ing i West­vangs pros­jekt er et avs­lag om innsyn i tal­lene for 2009 og 2010. Begrun­nelsen er den etter hvert ikke ukjente §9 i offent­lighet­sloven, som åpn­er for at data kan nek­tes utlev­ert hvis dataeier men­er tilret­te­leg­gingsjobben er for arbeidskrevende.

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

1 KOMMENTAR

  1. […] This post was men­tioned on Twit­ter by Olav A. Øvre­bø, Har­ald Groven, eiriks, Adriel Hamp­ton, Offentlige data and oth­ers. Offentlige data said: Nasjonale prøver — data­jour­nal­is­tikk i prak­sis: Jour­nal­is­ter gjør bety­delig innsats for å pre­sen­tere sen­trale sk… http://bit.ly/dc1gBQ […]

til toppen