Helt siden vi begynte arbeidet med å kartlegge offentlige data, var det klart at det er et stort behov for helt grunnleggende informasjon om hva slags datakilder som finnes rundt om i ulike offentlige virksomheter og etater. Det inspirerte til ideen om en enkel test av hvordan offentlige virksomheter informerer om datakilder på sine egne nettsteder.
En avgrensing var nødvendig. Vi tok utgangspunkt i Norge.nos liste over våre styresmakter og valgte å ta for oss alle nettsteder til virksomheter innen den utøvende statsmakt: Departementene, direktorater og tilsyn, ombud, fylkesmenn, råd og utvalg. Totalt utgjør disse 125 virksomheter, som altså er fordelt på ulike nivåer og fagområder i statsforvaltningen og av svært ulik størrelse og innretning.
Dette var de sentrale spørsmålene vi sjekket:
- Opplyser virksomheten om egne datakilder på egen forside/hjemmeside — ja eller nei?
- Opplyser virksomheten om egne datakilder på eget nettsted (delvis eller fullstendig) — ja eller nei?
For å finne svaret på det første spørsmålet, lette vi etter bestemte nøkkelord på virksomhetens forside. Hvis ordene statistikk, data, registre, tall forekom i en eller annen kombinasjon på et fast sted på forsiden, betydde det som regel at virksomheten hadde en eller annen form for informasjon om datakilder direkte tilgjengelig fra forsiden. Vi gikk også inn på siden det ble lenket til og sjekket at det faktisk var relevant informasjon om datakilder der.
En tredjedel av virksomhetene — 40 virksomheter — informerte om datakilder fra forsiden, to tredjedeler — 85 virksomheter — gjorde det ikke.
Hvis man mener at det er viktig å opplyse om datakilder, burde informasjonen være tilgjengelig fra forsiden. Men hvis virksomheter informerer på en annen side på eget nettsted, bør dette også registreres (eksempelvis finner mange brukere fram til informasjon via søkemotorer, og besøker kanskje ikke forsiden). For å undersøke om datakilder ble omtalt på nettstedet i det hele tatt, brukte vi som regel nettstedskartet som de fleste tilbyr. Her ga kartleggingen som resultat at seks av ti (76 virksomheter) på en eller annen måte informerer om datakilder, mens vi hos fire av ti (49 virksomheter) ikke kunne finne noe informasjon.
Det er grunn til å bemerke at vi har vært “snille” i vurderingene. Selv om vi visste eller ante at en virksomhet har atskillig mer data enn den opplyser om, har den likevel fått “ja” hvis den hadde noe informasjon om datakilder i det hele tatt. For eksempel har mange en enkel oppstilling av statistikk fra sitt fagfelt eller ansvarsområde. Det er jo nettopp noe av poenget og problemet at så lenge virksomhetene ikke tilbyr fullstendig informasjon om sine datakilder, hindres effektiv viderebruk av data. Vi har i denne delen av kartleggingen ikke vurdert spesielt om virksomhetene tilbyr nedlasting eller på annen måte gjør datasett lett tilgjengelig.
Når resultatene fordeles på type virksomhet, viser det seg at departementene er dårligst til å informere om datakilder (vi har her holdt departementenes informasjon om statsbudsjettet utenfor). Kun tre av 19 departementer informerer om egne datakilder på forsiden av sine nettsteder (Statsministerens kontor og Regjeringsadvokaten er her for enkelhets skyld regnet til departementene, selv om de i Norge.no-oversikten står under “Regjeringen”). Direktorat og tilsyn gjør det her best; hos nær halvparten av disse totalt 51 virksomhetene kan man finne informasjon om datakilder på forsiden.
Når vi leter etter informasjon om datakilder på hele nettstedet, kommer fylkesmannsembetene best ut. Samtlige har noe informasjon om datakilder. Det ser ut som dette skyldes en gjennomført linje om å informere om nettstedet Miljøstatus i Norge, som har miljøinformasjon og ‑data om hvert enkelt fylke. Alle lenker til dette nettstedet. For øvrig er det også fylkesmennene imellom stor variasjon i iveren etter å informere om datakilder. Fylkesmannen og fylkeskommunen i Østfold har for eksempel samarbeidet om nettstedet Østfold analyse, der en finner statistikk og data fra ulike kilder om fylket.
På dette spørsmålet kommer også direktorat og tilsyn bra ut, 84 prosent opplyser om datakilder på et eller annet vis.
Virksomhetene er som nevnt høyst ulike med hensyn til oppgaver, størrelse og nivå i statsforvaltningen. Det er å forvente at de faglig orienterte virksomhetene blant direktoratene samler inn og disponerer mye data, og at departementene i liten grad gjør dette. Det kan forklare noen av forskjellene, men samtidig er det ingen grunn til at ikke departementene skal informere om datakilder innen sektoren de styrer. Hvordan dette enkelt kan gjøres, viser Kommunal- og regionaldepartementet (KRD). På en egen side, som er lenket fra departementets forside, listes opp databaser og registre som KRD har ansvaret for.
Det kanskje beste eksemplet vi kom over i kartleggingsarbeidet er Statens forurensningstilsyns katalog for miljødata. Her er de enkelte datakildene registrert på egne sider. Hvert datasett er beskrevet grundig og det går fram hvordan dataene produseres og hvem som er eier. Sentralt i vår sammenheng er at mange av datasettene — men ikke alle — er tilgjengelig for nedlasting i ulike formater. Dette gjør jobben atskillig enklere for den som vil bruke dataene videre. Hvis SFT skal brukes som eksempel på god praksis, bør det imidlertid også påpekes at det ikke tilbys noe API (et programmeringsgrensesnitt som muliggjør kommunikasjon mellom programvare). Se vår tidligere artikkel om god praksis ved tilgjengeliggjøring av data.
Andre virksomheter som utmerker seg er Utdanningsdirektoratet og Helsetilsynet. Utdanningsdirektoratet viser direkte fra sin forside til ulike datakilder for skolen. Helsetilsynet har satt sammen en egen side med oversikt og beskrivelse av norske og internasjonale datakilder.
Resultatene av denne delen av kartleggingen var omtrent i tråd med antakelser vi hadde på forhånd:
- Det er ingen enhetlig praksis for å informere om datakilder
- Mange virksomheter informerer ikke i det hele tatt
- På mange nettsteder er informasjonen godt gjemt
- Det er få virkelig gode eksempler på forbilledlig informasjon om datakilder
Nettstedene innen den utøvende makt ble undersøkt med henblikk på svært grunnleggende informasjon. Resultatene viser at det er stort forbedringsbehov for de aller fleste. For eksempel burde KRDs informasjonsside om datakilder være et minstekrav på departementsnivå, men selv dette er det altså bare ett departement som kan tilby.
(Dette blogginnlegget er hentet fra vår kommende rapport fra kartleggingsprosjektet om offentlige data. Rapporten legges fram i sin helhet 12. januar, og problemstillingene diskuteres på et seminar samme dag. Våre egne bakgrunnsdata blir også gjort tilgjengelig så fort vi har anledning).
Dette er et bra prosjekt! I Helsetilsynet har vi tenkt at dersom folk skal ha grunn til å ha tillit til våre beskrivelser av rikets tilstand, må vi både vise frem hvilke kunnskapskilder vi bruker og stoler på, og vise våre egne data (både enkeltdokumenter som tilsynsrapporter, vedtak i saker der vi undersøker påstått svikt, høringsuttalelser osv., og produksjonstall). Først da har den som er engasjert i helse- og sosialsektorene et fair grunnlag for å kunne kritisere det vi kommer med, og vi unngår å påberope oss autoritet og troverdighet uten at enhver kan diskutere om vi er den verdig.
Regjeringen i UK driver for tiden et prosjekt der (i prinsippet) all stedfestet, tallmessig informasjon legges ut på nettet slik at den kan hentes fra kart. Det gir grunnlag for å se forskjeller mellom i strøk i en storby, mellom kommuner osv. på de områdene der det offentlige forlanger at borgere og bedrifter skal gi fra seg informasjon. Og verdt å merke seg: Det offentlige skal i minst mulig grad filtrere og tilrettelegge data for brukerbehov på måter som begrenser bruken av grunndata. Folk selv skal avgjøre bruken av dataene.Og hva som er interessant bruk vil forandre seg kontinuerlig, og den utviklingen kan brukerne styre direkte — at leverandøretatene styrer den gjennom brukerundersøkelser med påfølgende utplukk av “hva som er relevant for folk” er ikke bra nok.
Jeg er sikker på at det må komme langt mer av slik publisering også her i landet. Vår offentlige sektor er ikke særlig gode i dag, som dere har vist.
Helge Høifødt, nettredaksjonen, http://www.helsetilsynet.no.
Psst: Lenken til vårt nettsted i artikkelen er død…