Gode prinsipper for offentlige data

Kvalitetsmerking av datasett blant forslagene fra Teknologirådets ekspertgruppe.

Teknolo­girådet pre­sen­terte i dag sin rap­port om fri­givelse og videre­bruk av offentlige data (pdf). Forny­ingsmin­is­ter Rig­mor Aas­rud benyt­tet anled­nin­gen til å kun­ngjøre navnet på reg­jerin­gens kom­mende datak­ilde­por­tal — data.norge.no –, og ba sam­tidig om inn­spill til hva por­tal­en bør inneholde og hvor­dan den bør utformes.

Slike inn­spill inneholdt også rap­porten fra ekspert­grup­pen. Den anbe­faler at data.norge.no skal inneholde blant annet denne informasjonen:

  • Beskriv­else av dataene
  • Hvilket for­mat dataene finnes på
  • Beskriv­else av eventuelt pro­gram­mer­ings­grens­es­nitt (API) som kan brukes for å få til­gang til dataene
  • Tid­san­givelse for et datasett, evt. om det dreier seg om sanntidsdata
  • Hvilken kvalitet dataene har

Forslaget om kvalitetsmerk­ing imøtegår en van­lig innvend­ing mot å pub­lis­ere datak­ilder — at man men­er kvaliteten på dataene ikke er god nok. I rap­porten skisseres en skala for kvalitet som spen­ner fra høyeste kvalitet (“Kvalitetssikret og opp­datert — kan brukes for eksem­pel i automa­tis­erte beslut­ning­spros­ess­er”) til laveste (“Dataene er ikke opp­datert og kan være beheftet med bety­delige feil”.) Hele skalaen på rap­portens side 16.

Den kom­mende datak­ilde­por­tal­en må som et min­i­mum inneholde offentlige virk­somheters råda­ta, skriv­er ekspert­grup­pen (råda­ta er forstått som data på det for­matet det brukes hos det aktuelle organet). Videre skriv­er de:

Det et også ønske­lig at dataene gjøres tilgjen­gelige på for­mater som foren­kler gjen­bruk. For data hvor dette er rel­e­vant bør det finnes et godt doku­mentert API. Det må tilbys et API for alle typer sanntidsdata.

Rap­porten slår fast det vik­tige prin­sip­pet om arbei­ds­del­ing mel­lom offentlige virk­somheter og offent­ligheten: “Som hov­e­dregel bør alle datasett som ikke utgjør en trussel mot rikets sikker­het eller indi­viders per­son­vern offentlig­gjøres, etter­som det på forhånd kan være vanske­lig å vur­dere gjen­bruksver­di­en av et datasett. Data ingen trodde det var inter­esse for kan få nytt liv i kom­bi­nasjon med andre typer data.”

Ekspert­grup­pen kom­mer med et svært inter­es­sant inn­spill om forskn­ings­da­ta. Også inter­nasjon­alt blir spørsmålet om fri­givelse av under­lags­dataene for forskn­ing diskutert, ikke minst i forbindelse med kon­flik­tene rundt kli­maforskeres data. Her skriv­er ekspertgruppen:

Til tross for at stadig flere pub­likasjon­er fra forskn­ing­spros­jek­ter gjøres all­ment tilgjen­gelige, er under­lags­dataene for forsknin­gen i liten grad tilgjen­gelige. Det kan være rimelig å stille spørsmål ved denne prak­sisen. Data fra offentlig finan­sierte forskn­ing­spros­jek­ter – i den grad de ikke innehold­er per­son­sen­si­tiv infor­masjon – bør også gjøres tilgjen­gelig for allmennheten.

Disse har deltatt i ekspert­grup­pen bak rapporten:
Espen Ander­sen – Insti­tutt for strate­gi og logis­tikk, Han­delshøyskolen BI
Håkon Wium Lie – Opera Software
Jan­nicke Birkevold – Skat­tee­tat­en, Inno­vasjons- og utviklingsavdelingen
Sil­vi­ja Seres – Teknolo­girådet og Microsoft Fast
Tom Slun­gaard – Norsk Eiendomsinformasjon

Teknolo­girådets for­mål er å gi uavhengige råd til Stortinget og øvrige myn­digheter i vik­tige tek­nol­o­gis­pørsmål og dessuten bidra til den offentlige debat­ten rundt teknologi.

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

2 KOMMENTARER

  1. Datak­valitet er helt klart vik­tig, men poten­sielt resurskrevende å doku­mentere og fikse opp, i den grad der blir for mye fokus på kvalitet før set­tene deles. Det kan raskt bli et hin­der for fri­givelse av data. Å merke set­tet med en-eller-annen kvalitet­grader­ing er uansett en god idé, kan­skje det kan senke pres­set om “per­fek­te” datasett hvis det blir aksept for å lansere sett med lav kvalitet? 

    “If you are not embar­rassed by the first ver­sion of your prod­uct, you’ve launched too late.” 

    Dette er etter sigende Reid Hoff­man, grün­deren bak linkedIn, sine ord. Det er den hold­nin­gen jeg håper kan springe fram her. Kvaliteten kan alltids heves på sikt, men etter at prosedyrene og vanen at data deles er etablert.

    En annen måte å gi kvalitet på data kon­tekst er å legge til rette for at pros­jek­ter som benyt­ter dataene kan lenke tilbake til dataset­tet, og slik kan vi ran­gere set­tene etter pop­u­lar­itet. Dette gir et hint om set­tet er godt nok til gjen­bruk, uansett hvor­dan det ville slå ut i en formell rangert kvalitets-verdi.

    Yr har jo bare et (vell..) datasett, men hoster også ulike apps som er laget på deres data: http://tillegg.yr.no/
    Jeg sier ikke at data.norge.no, eller andre data­m­a­gasin, trenger å hoste fil­er, men opp­for­dre til å lenke pros­jek­ter som bruk­er dataset­tene opp mot set­tene. Noe så enkelt som en kom­men­tar­boks (husk track­backs) ville hjelpe mye. Det er selvsagt ingent­ing i veien for å gå lengre med mer forvelle tilbakemeldinger. 

    Å legge til rette for å dele erfaringer med set­tene vil være svært smart i den grad det er ønske om å få med seg flere enn kun utvikler­fir­maer med store tekniske avdelinger. 

    Å vite hva et datasett har blitt brukt til før kan være et fint hint om poten­sialet for nye løsninger.

  2. […] This post was men­tioned on Twit­ter by Bente Kalsnes and Net­th­oder (NONA), Morten Dahl. Morten Dahl said: RT @Netthoder: Anbe­faler @oovrebo sin artikkel om gode prin­sip­per for offentlige data http://cot.ag/doqCiy via @PalHivand […]

til toppen