Info om datakilder: mager kost i staten

Bare en av tre statlige virksomheter vi undersøkte opplyste om egne datakilder på hjemmesiden.

Helt siden vi beg­y­nte arbei­det med å kart­legge offentlige data, var det klart at det er et stort behov for helt grunn­leggende infor­masjon om hva slags datak­ilder som finnes rundt om i ulike offentlige virk­somheter og etater. Det inspir­erte til ideen om en enkel test av hvor­dan offentlige virk­somheter informer­er om datak­ilder på sine egne nettsteder.

En avgrens­ing var nød­vendig. Vi tok utgangspunkt i Norge.nos liste over våre styres­mak­ter og val­gte å ta for oss alle nettst­ed­er til virk­somheter innen den utøvende stats­makt: Departe­mentene, direk­torater og tilsyn, ombud, fylkes­menn, råd og utvalg. Totalt utgjør disse 125 virk­somheter, som alt­så er fordelt på ulike nivåer og fagom­råder i stats­for­valt­nin­gen og av svært ulik stør­relse og innretning.

Dette var de sen­trale spørsmå­lene vi sjekket:

  • Oppl­yser virk­somheten om egne datak­ilder på egen forside/hjemmeside — ja eller nei?
  • Oppl­yser virk­somheten om egne datak­ilder på eget nettst­ed (delvis eller full­s­tendig) — ja eller nei?

For å finne svaret på det første spørsmålet, lette vi etter bestemte nøkkelord på virk­somhetens for­side. Hvis ordene sta­tis­tikk, data, reg­istre, tall forekom i en eller annen kom­bi­nasjon på et fast sted på for­si­den, bety­dde det som regel at virk­somheten hadde en eller annen form for infor­masjon om datak­ilder direk­te tilgjen­gelig fra for­si­den. Vi gikk også inn på siden det ble lenket til og sjekket at det fak­tisk var rel­e­vant infor­masjon om datak­ilder der.

En tred­jedel av virk­somhetene — 40 virk­somheter — informerte om datak­ilder fra for­si­den, to tred­jedel­er — 85 virk­somheter — gjorde det ikke.

Kilde: Vox Publica

Kilde: Vox Publica

Hvis man men­er at det er vik­tig å oppl­yse om datak­ilder, burde infor­masjo­nen være tilgjen­gelig fra for­si­den. Men hvis virk­somheter informer­er på en annen side på eget nettst­ed, bør dette også reg­istr­eres (eksem­pelvis finner mange brukere fram til infor­masjon via søke­mo­tor­er, og besøk­er kan­skje ikke for­si­den). For å under­søke om datak­ilder ble omtalt på nettst­edet i det hele tatt, bruk­te vi som regel nettst­ed­skartet som de fleste tilbyr. Her ga kart­leg­gin­gen som resul­tat at seks av ti (76 virk­somheter) på en eller annen måte informer­er om datak­ilder, mens vi hos fire av ti (49 virk­somheter) ikke kunne finne noe informasjon.

Kilde: Vox Publica

Kilde: Vox Publica

Det er grunn til å bemerke at vi har vært “snille” i vur­derin­gene. Selv om vi vis­ste eller ante at en virk­somhet har atskil­lig mer data enn den oppl­yser om, har den likev­el fått “ja” hvis den hadde noe infor­masjon om datak­ilder i det hele tatt. For eksem­pel har mange en enkel opp­still­ing av sta­tis­tikk fra sitt fagfelt eller ans­var­som­råde. Det er jo net­topp noe av poenget og prob­lemet at så lenge virk­somhetene ikke tilbyr full­s­tendig infor­masjon om sine datak­ilder, hin­dres effek­tiv videre­bruk av data. Vi har i denne delen av kart­leg­gin­gen ikke vur­dert spe­sielt om virk­somhetene tilbyr ned­last­ing eller på annen måte gjør datasett lett tilgjengelig.

Når resul­tatene forde­les på type virk­somhet, vis­er det seg at departe­mentene er dårligst til å informere om datak­ilder (vi har her holdt departe­mentenes infor­masjon om stats­bud­sjet­tet uten­for). Kun tre av 19 departe­menter informer­er om egne datak­ilder på for­si­den av sine nettst­ed­er (Statsmin­is­terens kon­tor og Reg­jer­ingsad­vokat­en er her for enkel­hets skyld reg­net til departe­mentene, selv om de i Norge.no-oversikten står under “Reg­jerin­gen”). Direk­torat og tilsyn gjør det her best; hos nær halv­parten av disse totalt 51 virk­somhetene kan man finne infor­masjon om datak­ilder på forsiden.

Kilde: Vox Publica

Kilde: Vox Publica

Når vi leter etter infor­masjon om datak­ilder på hele nettst­edet, kom­mer fylkesman­nsem­betene best ut. Samtlige har noe infor­masjon om datak­ilder. Det ser ut som dette skyldes en gjen­nom­ført lin­je om å informere om nettst­edet Miljøs­ta­tus i Norge, som har miljøin­for­masjon og ‑data om hvert enkelt fylke. Alle lenker til dette nettst­edet. For øvrig er det også fylkes­mennene imel­lom stor vari­asjon i iveren etter å informere om datak­ilder. Fylkesman­nen og fylkeskom­munen i Øst­fold har for eksem­pel samar­bei­det om nettst­edet Øst­fold analyse, der en finner sta­tis­tikk og data fra ulike kilder om fylket.

På dette spørsmålet kom­mer også direk­torat og tilsyn bra ut, 84 pros­ent oppl­yser om datak­ilder på et eller annet vis.

Kilde: Vox Publica

Kilde: Vox Publica

Virk­somhetene er som nevnt høyst ulike med hen­syn til opp­gaver, stør­relse og nivå i stats­for­valt­nin­gen. Det er å for­vente at de faglig ori­en­terte virk­somhetene blant direk­toratene sam­ler inn og disponer­er mye data, og at departe­mentene i liten grad gjør dette. Det kan fork­lare noen av forskjel­lene, men sam­tidig er det ingen grunn til at ikke departe­mentene skal informere om datak­ilder innen sek­toren de styr­er. Hvor­dan dette enkelt kan gjøres, vis­er Kom­mu­nal- og region­alde­parte­mentet (KRD). På en egen side, som er lenket fra departe­mentets for­side, listes opp data­bas­er og reg­istre som KRD har ans­varet for.

Det kan­skje beste eksem­plet vi kom over i kart­leg­gingsar­bei­det er Statens foruren­sningstil­syns kat­a­log for miljø­da­ta. Her er de enkelte datak­ildene reg­istr­ert på egne sider. Hvert datasett er beskrevet grundig og det går fram hvor­dan dataene pro­duseres og hvem som er eier. Sen­tralt i vår sam­men­heng er at mange av dataset­tene — men ikke alle — er tilgjen­gelig for ned­last­ing i ulike for­mater. Dette gjør jobben atskil­lig enklere for den som vil bruke dataene videre. Hvis SFT skal brukes som eksem­pel på god prak­sis, bør det imi­dler­tid også påpekes at det ikke tilbys noe API (et pro­gram­mer­ings­grens­es­nitt som mulig­gjør kom­mu­nikasjon mel­lom pro­gram­vare). Se vår tidligere artikkel om god prak­sis ved tilgjen­gelig­gjøring av data.

Andre virk­somheter som utmerk­er seg er Utdan­nings­di­rek­toratet og Helsetil­synet. Utdan­nings­di­rek­toratet vis­er direk­te fra sin for­side til ulike datak­ilder for skolen. Helsetil­synet har satt sam­men en egen side med over­sikt og beskriv­else av norske og inter­nasjonale datak­ilder.

Resul­tatene av denne delen av kart­leg­gin­gen var omtrent i tråd med antakelser vi hadde på forhånd:

  • Det er ingen enhetlig prak­sis for å informere om datakilder
  • Mange virk­somheter informer­er ikke i det hele tatt
  • På mange nettst­ed­er er infor­masjo­nen godt gjemt
  • Det er få virke­lig gode eksem­pler på for­billedlig infor­masjon om datakilder

Nettst­e­dene innen den utøvende makt ble under­søkt med hen­blikk på svært grunn­leggende infor­masjon. Resul­tatene vis­er at det er stort forbedrings­be­hov for de aller fleste. For eksem­pel burde KRDs infor­masjon­s­side om datak­ilder være et min­stekrav på departe­mentsnivå, men selv dette er det alt­så bare ett departe­ment som kan tilby.

(Dette blog­ginn­legget er hen­tet fra vår kom­mende rap­port fra kart­leg­ging­spros­jek­tet om offentlige data. Rap­porten legges fram i sin hel­het 12. jan­u­ar, og prob­lem­still­in­gene diskuteres på et sem­i­nar samme dag. Våre egne bak­grunns­da­ta blir også gjort tilgjen­gelig så fort vi har anledning).

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

4 KOMMENTARER

  1. Dette er et bra pros­jekt! I Helsetil­synet har vi tenkt at der­som folk skal ha grunn til å ha tillit til våre beskriv­elser av rikets til­stand, må vi både vise frem hvilke kunnskap­skilder vi bruk­er og stol­er på, og vise våre egne data (både enkelt­doku­menter som tilsyn­srap­porter, ved­tak i sak­er der vi under­søk­er påstått svikt, høring­sut­talelser osv., og pro­duk­sjon­stall). Først da har den som er engas­jert i helse- og sosialsek­torene et fair grunnlag for å kunne kri­tis­ere det vi kom­mer med, og vi unngår å påberope oss autoritet og tro­verdighet uten at enhver kan diskutere om vi er den verdig. 

    Reg­jerin­gen i UK dri­ver for tiden et pros­jekt der (i prin­sip­pet) all sted­festet, tallmes­sig infor­masjon legges ut på net­tet slik at den kan hentes fra kart. Det gir grunnlag for å se forskjeller mel­lom i strøk i en stor­by, mel­lom kom­muner osv. på de områ­dene der det offentlige for­langer at borg­ere og bedrifter skal gi fra seg infor­masjon. Og verdt å merke seg: Det offentlige skal i minst mulig grad fil­trere og tilret­te­legge data for bruker­be­hov på måter som begrenser bruken av grun­n­da­ta. Folk selv skal avgjøre bruken av dataene.Og hva som er inter­es­sant bruk vil foran­dre seg kon­tin­uerlig, og den utviklin­gen kan bruk­erne styre direk­te — at leverandøre­tatene styr­er den gjen­nom brukerun­der­søkelser med påføl­gende utplukk av “hva som er rel­e­vant for folk” er ikke bra nok. 

    Jeg er sikker på at det må komme langt mer av slik pub­lis­er­ing også her i lan­det. Vår offentlige sek­tor er ikke særlig gode i dag, som dere har vist. 

    Helge Høifødt, net­tredak­sjo­nen, http://www.helsetilsynet.no.

    Psst: Lenken til vårt nettst­ed i artikke­len er død…

  2. Hei, Helge. Takk for tilbakemeldin­gen, lenke­feilen er fik­set. Kom­mentaren din er utvil­somt i tråd med hvor­dan vi ser på disse spørsmå­lene, og med erfarin­gene vi har gjort oss så langt. Inter­es­sant innblikk i hvor­dan dere job­ber. Vil du si at Helsetil­synet pub­lis­er­er alle data dere kan i dag, på måter som leg­ger til rette for viderebruk?

  3. Nei, vi er ikke i mål med pub­lis­er­ings­form. Én diskusjon er beskyt­telse av de per­son­ene sak­ene angår — enkelt­sak­er er jo av det mest inter­es­sante vi pro­duser­er. Vi job­ber nå med nytt nettst­ed, og vil stadig utvide data­meng­den. Tilbakemeldin­gene på vår Tilsyns­meld­ing, som har eget kapit­tel med pro­duk­sjon­stall, peker også i ret­ning av at vi bør legge ut flere tabeller, med mer full­s­tendi­ge datasett.

  4. For de fleste offentlige virk­somheter er offentlig­gjøring = rap­porter i pdf eller word-for­mat. Dvs. papir på skjerm. At andre kan ta seg av å lage tilgjen­gelige og bruk­er­vennlige nettst­ed­er av infor­masjo­nen som de selv ikke har kom­petanse og kap­i­tal til å lage om den legges ut som struk­tur­erte datafil­er, er dessverre en fjern tanke for de fleste organisasjoner.

til toppen