Nasjonale prøver — datajournalistikk i praksis

Journalister gjør betydelig innsats for å presentere sentrale skoledata, men myndighetene spiller ikke med.

I 2004 ble ord­nin­gen med nasjo­na­le prøver i lesing, skri­ving, mate­ma­tikk og engel­sk inn­ført i grunn­sko­len. Ord­nin­gen var omstridt og møt­te en del mot­stand i begyn­nel­sen, og ska­per fort­satt debatt. Men mot­stand fin­nes også i sys­te­met selv. I det­te inn­leg­get vil jeg se nær­me­re på data­jour­na­lis­tis­ke pro­sjek­ter som er gjort med resul­ta­te­ne fra nasjo­na­le prøver.

To per­soner med over gjen­nom­snitts inn­sikt i hvor­dan det er å job­be med data­ene fra nasjo­na­le prøver er Even Wes­tvang hos Bengler/Origo og Anders Erik­sen hos TV 2. Beg­ge to har pub­li­sert spen­nen­de pro­duk­ter, og ikke minst delt inn­sikt i hvor utford­rin­ge­ne lig­ger i sli­ke pro­sjek­ter. Rap­por­ter fra da Wes­tvang og Erik­sen besøk­te UiB i 2009 fin­nes her, mens enda mer spe­si­fikk info om hvor­dan Wes­tvangs nye pro­sjekt skoleporten.bengler.no ble til fin­nes på Ori­go-blog­gen.

Even Wes­tvangs visu­ali­se­ring av nasjo­na­le prøver.



TV 2 pub­li­ser­te i 2008 resul­ta­te­ne fra nasjo­na­le prøver på tv2.no. Her kan du fil­tre­re deg gjen­nom fyl­ker og kom­mu­ner, og få resul­ta­ter per sko­le. Det fin­nes også topp­lis­ter over sko­ler i de uli­ke prøve­for­me­ne. Just det­te med topp­lis­ter og ran­ge­ring av sko­ler var blant strids­spørs­må­le­ne da ord­nin­gen ble satt i gang. Før pub­li­se­rin­gen job­bet Erik­sen med data utle­vert i uku­ran­te for­ma­ter (.pdf) for for­må­let, men på tross av eks­tra­ar­bei­det job­bet TV 2s team seg fram til et pre­sen­ta­belt data­sett pas­sen­de for webpub­li­se­ring. Da det så ble opp­da­get feil i data­set­tet gav Utdann­nings­di­rek­to­ra­tet etter og gav TV 2 opp­da­ter­te data i Excel-for­mat.

I år pluk­ket Even Wes­tvang opp trå­den og laget skoleporten.bengler.no, der de sam­me resul­ta­te­ne vises på et kart. Kar­tet er i seg selv et fint styk­ke arbeid, men pøl­sa i rosi­nen er hvor­dan Wes­tvang doku­men­te­rer både frem­gangs­må­ten sin, så vel som at han deler koden bak pro­sjek­tet.

Jeg vil gjer­ne trek­ke fram et par poeng fra Wes­tvangs arbeids­logg:

  • Data­kil­de: Dag­bla­det. Utgangs­punk­tet for pro­sjek­tet er et Excel-ark med data delt av Dag­bla­det. Ikke Utdann­nings­di­rek­to­ra­tet. Selv om Utdann­nings­di­rek­to­ra­tet viser data på sine web­si­der, deler de ikke data for gjen­bruk.
  • Skole­re­gis­ter: web scra­ping. På tross av at det fin­nes regis­ter over nors­ke sko­ler på web, lar dis­se seg ikke enkelt «skrapes» da adres­ser blir vist som gra­fikk (en bilde­fil, ikke tekst). Det går an å tol­ke sli­ke bil­der om til tekst igjen, men det­te er tung­vint og bur­de være unød­ven­dig. Meto­den Wes­tvang end­te opp med var å skra­pe google­søk innen skoleporten.utdanningsdirektoratet.no, og så geoko­de adres­se­ne der­fra. Er det­te med vil­je gjort vans­ke­lig for­di det sel­ges en bok med dis­se data­ene?

Kudos til Wes­tvang! Ikke bare for å ende opp med den­ne fram­gangs­må­ten, men helst for å dele resul­ta­te­ne med andre som skul­le tren­ge data­ene. På git­hub-kon­to­en til pro­sjek­tet lig­ger nå 2925 sko­ler (csv-for­mat) med navn, kom­mu­ne, fyl­ke, adres­se, antall ele­ver og koor­di­na­ter. Kun ca 100 sko­ler mang­ler geoko­ding.

Vi har jo disse dataene, hvorfor jamre?

Data­ene fra nasjo­na­le prøver 2008 fin­nes. De deles av Dag­bla­det. Andre medi­er har dem også. Data for 2009 og 2010 er etter­spurt, men meg bekjent ikke pub­li­sert i noe for­nuf­tig for­mat uten­for skoleporten.utdanningsdirektoratet.no, og der er de sær­de­les lite til­gjen­ge­lig for videre­bruk. Eller?

Resul­ta­te­ne fra prø­ve­ne i engel­sk og reg­ning vil bli pub­li­sert hen­holds­vis 16. novem­ber og 14. desem­ber.

Det­te er et sitat fra udir.no 2. novem­ber i år. Det er alt­så kun dager til nye data pub­li­se­res, la oss håpe Utdan­nings­di­rek­to­ra­tet har lært. For­ny­ings-, admi­ni­stra­sjons- og kirke­de­par­te­men­tets utkast til ret­nings­lin­jer er uan­sett anbe­falt lek­tyre.

Hva med skoleregistret?

Per i dag sit­ter ped.lex.no san­syn­lig­vis på det beste regist­ret over nors­ke sko­ler, barne­hager og øvri­ge utdan­nings­in­sti­tu­sjo­ner. For videre­bruk av den­ne typen data kan det­te se ut til å være et hin­der, ikke en hjelp. Det kre­ves et tung­vint og krong­le­te arbeid for å maski­nelt hen­te ut data her­fra. Med det er Wes­tvangs skra­pe­de data­sett over sko­ler (på git­hub) muli­gens det beste set­tet som er til­gjen­ge­lig per i dag? 

Behov for basisdata/grunndata

I jak­ten på data­sett og krea­tiv bruk av dis­se duk­ker det sta­dig opp behov for «basis­data» eller «grunn­data». Med det mener jeg data­sett som beskri­ver enti­te­te­ne i ver­den, og ikke nød­ven­dig­vis pro­ses­se­ne dis­se med­vir­ker i. Lis­ten over resul­ta­ter fra nasjo­na­le prøver er data fra en pro­sess, data om nors­ke sko­ler og hvor de befin­ner seg er i en slik sam­men­heng nyt­tig å bry­te ned resul­ta­te­ne over. Det vil være rela­tivt sta­bilt fra år til år, mens resul­ta­te­ne fra nasjo­na­le prøver for­mo­dent­lig vil varie­re mer. 

Å sam­le opp sli­ke data­sett som beskri­ver enti­te­ter, basisdata/grunndata, vil med andre ord kun­ne være med på å gjø­re andre data mer ver­di­ful­le og nyt­ti­ge. Erik Bol­stad har en sam­ling sli­ke data­sett på sin web­si­de (erikbolstad.no). Bol­stad har sma­ken for geo­gra­fis­ke data, og deler data om ver­den (ver­dens­de­ler, land, regio­ner i land), Nor­ge (fyl­ker, kom­mu­ner, post­num­mer [med geoko­or­di­na­ter], fiske­ban­ker, fjell over 1000 meter, jern­bane­sta­sjo­ner, kirker, osv) og skan­di­na­vis­ke kom­mune­sen­ter.

At kunn­skap om sli­ke data­sett blir sam­let og gjort kjent er med andre ord vik­tig, og må inklu­de­res i kunn­skaps­ba­ser som data.norge.no, no.ckan.net og andre.

Summa summarum

Data­ene fra nasjo­na­le prøver har vist seg i fle­re pro­sjek­ter å by på hode­bry for folk som vil gjen­bru­ke dem. Like­vel har data­set­tet både blitt sett av man­ge, og nå også fått fle­re spen­nen­de gra­fis­ke vis­nings­løs­nin­ger. Debat­ten om vi skal ha inn­syn og ran­ge­ring av hvor bra eller dår­lig nors­ke sko­ler leve­rer har stil­net. Er vi eni­ge nå?

Videre fram­står Utdan­nings­di­rek­to­ra­tet som en mot­spil­ler, ikke en med­spil­ler. Slik vil vi ikke ha det. Hvis for­hol­de­ne skal lig­ge til ret­te for effek­tiv gjen­bruk av offent­lig sek­tors data, må vi spil­le på lag. Jeg er gans­ke sik­ker på at både nors­ke bor­ge­re, norsk pres­se og Utdan­nings­di­rek­to­ra­tet (og andre offent­li­ge instan­ser) vil tje­ne på å anse hver­and­re som med­spil­le­re. Hva kan vi gjø­re for å byg­ge opp en posi­tiv delings­kul­tur rundt «data vi alle­re­de har betalt for»? Har du inn­spill er debat­ten gåen­de både på data.norge.no, her i Fak­ta først og spo­ra­disk på Ori­go.

Det vi i alle fall har lært er at på tross av (den ikke len­ger så nye) offent­lig­hets­lo­ven, og et økt fokus på gjen­nom­sik­tig­het og delings­kul­tur; så er det ennå ikke en smal sak å gjen­bru­ke det­te data­set­tet. Like­le­des kan pro­sjek­ter som Erik­sens og Wes­tvangs se ut til å bane vei, og bidra til at pro­ses­sen kan gå let­te­re pro­sjekt for pro­sjekt.

Twittermelding fra skoleporten - avslag på innsyn

PS: Sis­te opp­da­te­ring i Wes­tvangs pro­sjekt er et avslag om inn­syn i tal­le­ne for 2009 og 2010. Begrun­nel­sen er den etter hvert ikke ukjen­te §9 i offent­lig­hets­lo­ven, som åpner for at data kan nek­tes utle­vert hvis data­ei­er mener til­rette­leg­gings­job­ben er for arbeids­kre­ven­de.

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

1 KOMMENTAR

KOMMENTÉR
  1. […] This post was men­tio­ned on Twit­ter by Olav A. Øvre­bø, Harald Gro­ven, eiriks, Adri­el Hamp­ton, Offent­li­ge data and others. Offent­li­ge data said: Nasjo­na­le prøver — data­jour­na­lis­tikk i prak­sis: Jour­na­lis­ter gjør bety­de­lig inn­sats for å pre­sen­te­re sen­tra­le sk… http://bit.ly/dc1gBQ […]

Skriv en kommentar

Bidra til god debatt - skriv under fullt navn. Se våre kommentarregler.

Abonner på kommentarer
til toppen