Gode prinsipper for offentlige data

Kvalitetsmerking av datasett blant forslagene fra Teknologirådets ekspertgruppe.

Tek­no­logi­rå­det pre­sen­ter­te i dag sin rap­port om fri­gi­vel­se og videre­bruk av offent­li­ge data (pdf). For­ny­ings­mi­nis­ter Rig­mor Aas­rud benyt­tet anled­nin­gen til å kunn­gjø­re nav­net på regje­rin­gens kom­men­de data­kilde­por­tal — data.norge.no –, og ba sam­ti­dig om inn­spill til hva por­ta­len bør inne­hol­de og hvor­dan den bør utfor­mes.

Sli­ke inn­spill inne­holdt også rap­por­ten fra eks­pert­grup­pen. Den anbe­fa­ler at data.norge.no skal inne­hol­de blant annet den­ne infor­ma­sjo­nen:

  • Beskri­vel­se av data­ene
  • Hvil­ket for­mat data­ene fin­nes på
  • Beskri­vel­se av even­tu­elt pro­gram­me­rings­grense­snitt (API) som kan bru­kes for å få til­gang til data­ene
  • Tids­an­gi­vel­se for et data­sett, evt. om det drei­er seg om sann­tids­data
  • Hvil­ken kva­li­tet data­ene har

For­sla­get om kva­li­tets­mer­king imøte­går en van­lig inn­ven­ding mot å pub­li­se­re data­kil­der — at man mener kva­li­te­ten på data­ene ikke er god nok. I rap­por­ten skis­se­res en ska­la for kva­li­tet som spen­ner fra høy­es­te kva­li­tet («Kva­li­tets­sik­ret og opp­da­tert — kan bru­kes for eksem­pel i auto­ma­ti­ser­te beslut­nings­pro­ses­ser») til laves­te («Data­ene er ikke opp­da­tert og kan være behef­tet med bety­de­li­ge feil».) Hele ska­la­en på rap­por­tens side 16.

Den kom­men­de data­kilde­por­ta­len må som et mini­mum inne­hol­de offent­li­ge virk­som­he­ters rådata, skri­ver eks­pert­grup­pen (rådata er for­stått som data på det for­ma­tet det bru­kes hos det aktu­el­le orga­net). Vide­re skri­ver de:

Det et også øns­ke­lig at data­ene gjø­res til­gjen­ge­li­ge på for­ma­ter som for­enk­ler gjen­bruk. For data hvor det­te er rele­vant bør det fin­nes et godt doku­men­tert API. Det må til­bys et API for alle typer sann­tids­data.

Rap­por­ten slår fast det vik­ti­ge prin­sip­pet om arbeids­de­ling mel­lom offent­li­ge virk­som­he­ter og offent­lig­he­ten: «Som hoved­re­gel bør alle data­sett som ikke utgjør en trus­sel mot rikets sik­ker­het eller indi­vi­ders per­son­vern offent­lig­gjø­res, etter­som det på for­hånd kan være vans­ke­lig å vur­de­re gjen­bruks­ver­di­en av et data­sett. Data ingen trod­de det var inter­es­se for kan få nytt liv i kom­bi­na­sjon med and­re typer data.»

Eks­pert­grup­pen kom­mer med et svært inter­es­sant inn­spill om forsk­nings­data. Også inter­na­sjo­nalt blir spørs­må­let om fri­gi­vel­se av under­lags­da­ta­ene for forsk­ning dis­ku­tert, ikke minst i for­bin­del­se med kon­flik­te­ne rundt klima­fors­ke­res data. Her skri­ver eks­pert­grup­pen:

Til tross for at sta­dig fle­re pub­li­ka­sjo­ner fra forsk­nings­pro­sjek­ter gjø­res all­ment til­gjen­ge­li­ge, er under­lags­da­ta­ene for forsk­nin­gen i liten grad til­gjen­ge­li­ge. Det kan være rime­lig å stil­le spørs­mål ved den­ne prak­si­sen. Data fra offent­lig finan­sier­te forsk­nings­pro­sjek­ter – i den grad de ikke inne­hol­der per­son­sen­si­tiv infor­ma­sjon – bør også gjø­res til­gjen­ge­lig for all­menn­he­ten.

Dis­se har del­tatt i eks­pert­grup­pen bak rap­por­ten:
Espen Ander­sen – Insti­tutt for stra­te­gi og logis­tikk, Han­dels­høy­sko­len BI
Håkon Wium Lie – Ope­ra Soft­ware
Jan­nicke Birke­vold – Skatte­eta­ten, Inno­va­sjons- og utvik­lings­av­de­lin­gen
Sil­vi­ja Seres – Tek­no­logi­rå­det og Micro­soft Fast
Tom Slun­gaard – Norsk Eien­doms­in­for­ma­sjon

Tek­no­logi­rå­dets for­mål er å gi uav­hen­gi­ge råd til Stor­tin­get og øvri­ge myn­dig­he­ter i vik­ti­ge tek­no­logi­spørs­mål og dess­uten bidra til den offent­li­ge debat­ten rundt tek­no­lo­gi.

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

2 KOMMENTARER

  1. Data­kva­li­tet er helt klart vik­tig, men poten­si­elt resurs­kre­ven­de å doku­men­te­re og fik­se opp, i den grad der blir for mye fokus på kva­li­tet før set­te­ne deles. Det kan raskt bli et hin­der for fri­gi­vel­se av data. Å mer­ke set­tet med en-eller-annen kva­li­tet­gra­de­ring er uan­sett en god idé, kan­skje det kan sen­ke pres­set om «per­fek­te» data­sett hvis det blir aksept for å lan­se­re sett med lav kva­li­tet?

    «If you are not embar­rassed by the first ver­sion of your pro­duct, you’ve laun­ched too late.»

    Det­te er etter sigen­de Reid Hoff­man, grün­de­ren bak linke­dIn, sine ord. Det er den hold­nin­gen jeg håper kan sprin­ge fram her. Kva­li­te­ten kan all­tids heves på sikt, men etter at pro­se­dy­re­ne og vanen at data deles er etab­lert.

    En annen måte å gi kva­li­tet på data kon­tekst er å leg­ge til ret­te for at pro­sjek­ter som benyt­ter data­ene kan len­ke til­ba­ke til data­set­tet, og slik kan vi ran­ge­re set­te­ne etter popu­la­ri­tet. Det­te gir et hint om set­tet er godt nok til gjen­bruk, uan­sett hvor­dan det vil­le slå ut i en for­mell ran­gert kva­li­tets-ver­di.

    Yr har jo bare et (vell..) data­sett, men hos­ter også uli­ke apps som er laget på deres data: http://tillegg.yr.no/
    Jeg sier ikke at data.norge.no, eller and­re data­ma­ga­sin, tren­ger å hos­te filer, men opp­ford­re til å len­ke pro­sjek­ter som bru­ker data­set­te­ne opp mot set­te­ne. Noe så enkelt som en kom­men­tar­boks (husk tra­ck­backs) vil­le hjel­pe mye. Det er selv­sagt ingen­ting i vei­en for å gå leng­re med mer for­vel­le til­bake­mel­din­ger.

    Å leg­ge til ret­te for å dele erfa­rin­ger med set­te­ne vil være svært smart i den grad det er øns­ke om å få med seg fle­re enn kun utvik­ler­fir­ma­er med sto­re tek­nis­ke avde­lin­ger.

    Å vite hva et data­sett har blitt brukt til før kan være et fint hint om poten­sia­let for nye løs­nin­ger.

  2. […] This post was men­tio­ned on Twit­ter by Ben­te Kals­nes and Nett­ho­der (NONA), Mor­ten Dahl. Mor­ten Dahl said: RT @Netthoder: Anbe­fa­ler @oovrebo sin artik­kel om gode prin­sip­per for offent­li­ge data http://cot.ag/doqCiy via @PalHivand […]

til toppen