Info om datakilder: mager kost i staten

Bare en av tre statlige virksomheter vi undersøkte opplyste om egne datakilder på hjemmesiden.

Helt siden vi begyn­te arbei­det med å kart­leg­ge offent­li­ge data, var det klart at det er et stort behov for helt grunn­leg­gen­de infor­ma­sjon om hva slags data­kil­der som fin­nes rundt om i uli­ke offent­li­ge virk­som­he­ter og eta­ter. Det inspi­rer­te til ide­en om en enkel test av hvor­dan offent­li­ge virk­som­he­ter infor­me­rer om data­kil­der på sine egne nett­ste­der.

En avgren­sing var nød­ven­dig. Vi tok utgangs­punkt i Norge.nos lis­te over våre sty­res­mak­ter og valg­te å ta for oss alle nett­ste­der til virk­som­he­ter innen den utøven­de stats­makt: Depar­te­men­te­ne, direk­to­ra­ter og til­syn, ombud, fyl­kes­menn, råd og utvalg. Totalt utgjør dis­se 125 virk­som­he­ter, som alt­så er for­delt på uli­ke nivå­er og fag­om­rå­der i stats­for­valt­nin­gen og av svært ulik stør­rel­se og inn­ret­ning.

Det­te var de sen­tra­le spørs­må­le­ne vi sjek­ket:

  • Opp­ly­ser virk­som­he­ten om egne data­kil­der på egen forside/hjemmeside — ja eller nei?
  • Opp­ly­ser virk­som­he­ten om egne data­kil­der på eget nett­sted (del­vis eller full­sten­dig) — ja eller nei?

For å fin­ne sva­ret på det førs­te spørs­må­let, let­te vi etter bestem­te nøk­kel­ord på virk­som­he­tens for­si­de. Hvis orde­ne sta­ti­stikk, data, regist­re, tall fore­kom i en eller annen kom­bi­na­sjon på et fast sted på for­si­den, betyd­de det som regel at virk­som­he­ten had­de en eller annen form for infor­ma­sjon om data­kil­der direk­te til­gjen­ge­lig fra for­si­den. Vi gikk også inn på siden det ble len­ket til og sjek­ket at det fak­tisk var rele­vant infor­ma­sjon om data­kil­der der.

En tredje­del av virk­som­he­te­ne — 40 virk­som­he­ter — infor­mer­te om data­kil­der fra for­si­den, to tredje­de­ler — 85 virk­som­he­ter — gjor­de det ikke.

Kilde: Vox Publica

Kil­de: Vox Pub­li­ca

Hvis man mener at det er vik­tig å opp­ly­se om data­kil­der, bur­de infor­ma­sjo­nen være til­gjen­ge­lig fra for­si­den. Men hvis virk­som­he­ter infor­me­rer på en annen side på eget nett­sted, bør det­te også regist­re­res (eksem­pel­vis fin­ner man­ge bru­ke­re fram til infor­ma­sjon via søke­mo­to­rer, og besø­ker kan­skje ikke for­si­den). For å under­sø­ke om data­kil­der ble omtalt på nett­ste­det i det hele tatt, bruk­te vi som regel nett­steds­kar­tet som de fles­te til­byr. Her ga kart­leg­gin­gen som resul­tat at seks av ti (76 virk­som­he­ter) på en eller annen måte infor­me­rer om data­kil­der, mens vi hos fire av ti (49 virk­som­he­ter) ikke kun­ne fin­ne noe infor­ma­sjon.

Kilde: Vox Publica

Kil­de: Vox Pub­li­ca

Det er grunn til å bemer­ke at vi har vært «snil­le» i vur­de­rin­ge­ne. Selv om vi viss­te eller ante at en virk­som­het har atskil­lig mer data enn den opp­ly­ser om, har den like­vel fått «ja» hvis den had­de noe infor­ma­sjon om data­kil­der i det hele tatt. For eksem­pel har man­ge en enkel opp­stil­ling av sta­ti­stikk fra sitt fag­felt eller ansvars­om­rå­de. Det er jo nett­opp noe av poen­get og pro­ble­met at så len­ge virk­som­he­te­ne ikke til­byr full­sten­dig infor­ma­sjon om sine data­kil­der, hind­res effek­tiv videre­bruk av data. Vi har i den­ne delen av kart­leg­gin­gen ikke vur­dert spe­si­elt om virk­som­he­te­ne til­byr ned­las­ting eller på annen måte gjør data­sett lett til­gjen­ge­lig.

Når resul­ta­te­ne for­de­les på type virk­som­het, viser det seg at depar­te­men­te­ne er dår­ligst til å infor­me­re om data­kil­der (vi har her holdt depar­te­men­te­nes infor­ma­sjon om stats­bud­sjet­tet uten­for). Kun tre av 19 depar­te­men­ter infor­me­rer om egne data­kil­der på for­si­den av sine nett­ste­der (Stats­mi­nis­te­rens kon­tor og Regje­rings­ad­vo­ka­ten er her for enkel­hets skyld reg­net til depar­te­men­te­ne, selv om de i Norge.no-oversikten står under «Regje­rin­gen»). Direk­to­rat og til­syn gjør det her best; hos nær halv­par­ten av dis­se totalt 51 virk­som­he­te­ne kan man fin­ne infor­ma­sjon om data­kil­der på for­si­den.

Kilde: Vox Publica

Kil­de: Vox Pub­li­ca

Når vi leter etter infor­ma­sjon om data­kil­der på hele nett­ste­det, kom­mer fyl­kes­manns­em­be­te­ne best ut. Samt­li­ge har noe infor­ma­sjon om data­kil­der. Det ser ut som det­te skyl­des en gjen­nom­ført lin­je om å infor­me­re om nett­ste­det Miljø­sta­tus i Nor­ge, som har miljøin­for­ma­sjon og ‑data om hvert enkelt fyl­ke. Alle len­ker til det­te nett­ste­det. For øvrig er det også fyl­kes­men­ne­ne imel­lom stor varia­sjon i ive­ren etter å infor­me­re om data­kil­der. Fyl­kes­man­nen og fyl­kes­kom­mu­nen i Øst­fold har for eksem­pel sam­ar­bei­det om nett­ste­det Øst­fold ana­ly­se, der en fin­ner sta­ti­stikk og data fra uli­ke kil­der om fyl­ket.

På det­te spørs­må­let kom­mer også direk­to­rat og til­syn bra ut, 84 pro­sent opp­ly­ser om data­kil­der på et eller annet vis.

Kilde: Vox Publica

Kil­de: Vox Pub­li­ca

Virk­som­he­te­ne er som nevnt høyst uli­ke med hen­syn til opp­ga­ver, stør­rel­se og nivå i stats­for­valt­nin­gen. Det er å for­ven­te at de fag­lig ori­en­ter­te virk­som­he­te­ne blant direk­to­ra­te­ne sam­ler inn og dis­po­ne­rer mye data, og at depar­te­men­te­ne i liten grad gjør det­te. Det kan for­kla­re noen av for­skjel­le­ne, men sam­ti­dig er det ingen grunn til at ikke depar­te­men­te­ne skal infor­me­re om data­kil­der innen sek­to­ren de sty­rer. Hvor­dan det­te enkelt kan gjø­res, viser Kom­mu­nal- og regio­nal­de­par­te­men­tet (KRD). På en egen side, som er len­ket fra depar­te­men­tets for­si­de, lis­tes opp data­ba­ser og regist­re som KRD har ansva­ret for.

Det kan­skje bes­te eksemp­let vi kom over i kart­leg­gings­ar­bei­det er Sta­tens for­urens­nings­til­syns kata­log for miljø­data. Her er de enkel­te data­kil­de­ne regist­rert på egne sider. Hvert data­sett er beskre­vet grun­dig og det går fram hvor­dan data­ene pro­du­se­res og hvem som er eier. Sen­tralt i vår sam­men­heng er at man­ge av data­set­te­ne — men ikke alle — er til­gjen­ge­lig for ned­las­ting i uli­ke for­ma­ter. Det­te gjør job­ben atskil­lig enk­le­re for den som vil bru­ke data­ene vide­re. Hvis SFT skal bru­kes som eksem­pel på god prak­sis, bør det imid­ler­tid også påpe­kes at det ikke til­bys noe API (et pro­gram­me­rings­grense­snitt som mulig­gjør kom­mu­ni­ka­sjon mel­lom pro­gram­vare). Se vår tid­li­ge­re artik­kel om god prak­sis ved til­gjenge­lig­gjø­ring av data.

And­re virk­som­he­ter som utmer­ker seg er Utdan­nings­di­rek­to­ra­tet og Helse­til­sy­net. Utdan­nings­di­rek­to­ra­tet viser direk­te fra sin for­si­de til uli­ke data­kil­der for sko­len. Helse­til­sy­net har satt sam­men en egen side med over­sikt og beskri­vel­se av nors­ke og inter­na­sjo­na­le data­kil­der.

Resul­ta­te­ne av den­ne delen av kart­leg­gin­gen var omtrent i tråd med anta­kel­ser vi had­de på for­hånd:

  • Det er ingen enhet­lig prak­sis for å infor­me­re om data­kil­der
  • Man­ge virk­som­he­ter infor­me­rer ikke i det hele tatt
  • På man­ge nett­ste­der er infor­ma­sjo­nen godt gjemt
  • Det er få vir­ke­lig gode eksemp­ler på for­bil­led­lig infor­ma­sjon om data­kil­der

Nett­ste­de­ne innen den utøven­de makt ble under­søkt med hen­blikk på svært grunn­leg­gen­de infor­ma­sjon. Resul­ta­te­ne viser at det er stort for­bed­rings­be­hov for de aller fles­te. For eksem­pel bur­de KRDs infor­ma­sjons­side om data­kil­der være et minste­krav på depar­te­ments­nivå, men selv det­te er det alt­så bare ett depar­te­ment som kan til­by.

(Det­te blogg­inn­leg­get er hen­tet fra vår kom­men­de rap­port fra kart­leg­gings­pro­sjek­tet om offent­li­ge data. Rap­por­ten leg­ges fram i sin hel­het 12. janu­ar, og pro­blem­stil­lin­ge­ne dis­ku­te­res på et semi­nar sam­me dag. Våre egne bak­grunns­data blir også gjort til­gjen­ge­lig så fort vi har anled­ning).

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

4 KOMMENTARER

  1. Det­te er et bra pro­sjekt! I Helse­til­sy­net har vi tenkt at der­som folk skal ha grunn til å ha til­lit til våre beskri­vel­ser av rikets til­stand, må vi både vise frem hvil­ke kunn­skaps­kil­der vi bru­ker og sto­ler på, og vise våre egne data (både enkelt­do­ku­men­ter som til­syns­rap­por­ter, ved­tak i saker der vi under­sø­ker påstått svikt, hørings­ut­ta­lel­ser osv., og pro­duk­sjons­tall). Først da har den som er enga­sjert i helse- og sosial­sek­to­re­ne et fair grunn­lag for å kun­ne kri­ti­se­re det vi kom­mer med, og vi unn­går å påbe­ro­pe oss auto­ri­tet og tro­ver­dig­het uten at enhver kan dis­ku­te­re om vi er den ver­dig.

    Regje­rin­gen i UK dri­ver for tiden et pro­sjekt der (i prin­sip­pet) all sted­fes­tet, tall­mes­sig infor­ma­sjon leg­ges ut på net­tet slik at den kan hen­tes fra kart. Det gir grunn­lag for å se for­skjel­ler mel­lom i strøk i en stor­by, mel­lom kom­mu­ner osv. på de områ­de­ne der det offent­li­ge for­lan­ger at bor­ge­re og bedrif­ter skal gi fra seg infor­ma­sjon. Og verdt å mer­ke seg: Det offent­li­ge skal i minst mulig grad fil­tre­re og til­rette­leg­ge data for bru­ker­be­hov på måter som begren­ser bru­ken av grunn­data. Folk selv skal avgjø­re bru­ken av dataene.Og hva som er inter­es­sant bruk vil for­and­re seg kon­ti­nu­er­lig, og den utvik­lin­gen kan bru­ker­ne sty­re direk­te — at leve­ran­døreta­te­ne sty­rer den gjen­nom bru­ker­un­der­sø­kel­ser med påføl­gen­de utplukk av «hva som er rele­vant for folk» er ikke bra nok.

    Jeg er sik­ker på at det må kom­me langt mer av slik pub­li­se­ring også her i lan­det. Vår offent­li­ge sek­tor er ikke sær­lig gode i dag, som dere har vist.

    Hel­ge Høi­født, nett­re­dak­sjo­nen, http://www.helsetilsynet.no.

    Psst: Len­ken til vårt nett­sted i artik­ke­len er død…

  2. Hei, Hel­ge. Takk for til­bake­mel­din­gen, lenke­fei­len er fik­set. Kom­men­ta­ren din er utvil­somt i tråd med hvor­dan vi ser på dis­se spørs­må­le­ne, og med erfa­rin­ge­ne vi har gjort oss så langt. Inter­es­sant inn­blikk i hvor­dan dere job­ber. Vil du si at Helse­til­sy­net pub­li­se­rer alle data dere kan i dag, på måter som leg­ger til ret­te for videre­bruk?

  3. Nei, vi er ikke i mål med pub­li­se­rings­form. Én dis­ku­sjon er beskyt­tel­se av de per­sone­ne sake­ne angår — enkelt­sa­ker er jo av det mest inter­es­san­te vi pro­du­se­rer. Vi job­ber nå med nytt nett­sted, og vil sta­dig utvi­de data­meng­den. Til­bake­mel­din­ge­ne på vår Til­syns­mel­ding, som har eget kapit­tel med pro­duk­sjons­tall, peker også i ret­ning av at vi bør leg­ge ut fle­re tabel­ler, med mer full­sten­di­ge data­sett.

  4. For de fles­te offent­li­ge virk­som­he­ter er offent­lig­gjø­ring = rap­por­ter i pdf eller word-for­mat. Dvs. papir på skjerm. At and­re kan ta seg av å lage til­gjen­ge­li­ge og bru­ker­venn­li­ge nett­ste­der av infor­ma­sjo­nen som de selv ikke har kom­pe­tan­se og kapi­tal til å lage om den leg­ges ut som struk­tu­rer­te data­fi­ler, er dess­ver­re en fjern tan­ke for de fles­te orga­ni­sa­sjo­ner.

til toppen