Kartleggingen av offentlig sektors datakilder i Norge har pågått i perioden august til desember 2009. Vi (det er Gudrun T. Grene, Line T. Reiersen og undertegnede) har forsøkt å besvare to hovedspørsmål:
- Hvilke datakilder forvalter offentlige virksomheter?
- Hva hindrer at mer av disse dataene gjøres tilgjengelig for viderebruk?
På denne bloggen har vi rapportert underveis om foreløpige resultater og viderebrakt nyheter om temaet fra inn- og utland. Nå foreligger rapporten, som du kan laste ned i sin helhet i pdf-format her. (OBS stor fil, 14 MB. Publisert under CC-lisens “Navngivelse 3.0 Norge” — se nederst).
Rapporten rundes av med noen forslag til tiltak som vi tror kan bidra til økt oppmerksomhet om og frigivelse av datakilder i norsk offentlig sektor.
Utgangspunktet må være et enkelt definert mål: Flere offentlige datakilder må frigis for viderebruk. Og dette må selvsagt gjøres på en måte som ikke truer personvernet.
Initiativet ligger først og fremst i offentlig sektor, og spesielt hos Fornyings- og administrasjonsdepartementet (FAD). Kartleggingen har vist at kompetansen og interessen for åpne data er ujevnt fordelt på fag- og forvaltningsnivåer, og det er mange virksomheter som ligger langt framme og kan bidra med avgjørende erfaringer som vil komme godt med når et slikt mål skal virkeliggjøres.
Tiltakene vi foreslår knytter seg til kunnskap og kompetanse, regler og rammeverk, insentiver og virkemidler.
- Opprett et norsk data.gov: Dette bør defineres som et hasteprosjekt. Erfaringene fra spesielt USA viser at en portal der datakilder fra alle deler av offentlig sektor presenteres under ett, er et effektivt tiltak for å fokusere og øke oppmerksomheten om verdien av offentlig sektors data. En raskt arbeidende prosjektgruppe burde kunne få opp et slikt nettsted i løpet av kort tid (i hvert fall innen første halvår 2010). Den amerikanske og den kommende britiske portalen kan tas som utgangspunkt og de foreløpige erfaringene derfra studeres for å se om det er behov for spesifikt norske justeringer. Selvsagt bør man også bygge på erfaringene til de norske virksomhetene som har gjort et arbeid på feltet allerede, som SFT, SSB og Avinor.
- Oppmuntre til regionale og lokale datakildesamlinger: Kommuner og fylkeskommuner bør i samarbeid med KS, FAD og andre lage enkle maler for lokale og regionale samlinger av datakilder. Spesielt større byer, men også mindre kommuner har data som vil være av stor verdi for innbyggere, næringsliv og medier å få tilgang til (her kan man også trekke på erfaringene til regionale dataportaler som San Franciscos og Londons).
- Definer prinsipper og lisenser: Det er stor variasjon i hvordan data gjøres tilgjengelig for viderebruk (ulike formater osv.) og hvilke betingelser som knyttes til dataene (fra fri viderebruk til kun ikke-kommersiell m.fl). FAD bør definere et sett klare prinsipper for offentlig sektors data. Her kan man la seg inspirere av den britiske regjeringens liste. Prinsippene bør inneholde en definisjon av hva slags lisenser datasettene skal utstyres med. I dag brukes altfor mye energi på å finne ut om og hvordan data kan viderebrukes. Et enhetlig regelverk vil være et av de viktigste enkelttiltakene.
- Gi personvernet spesialbehandling: Både i virksomheter i offentlig sektor og i befolkningen er det bekymring for at personvernet kan svekkes dersom mer offentlige data frigis. I prinsippene for frigivelse av offentlige data bør spørsmålet om sikkerhet for persondata gis inngående behandling, slik at virksomhetene har klare kriterier å forholde seg til når de skal vurdere frigivelse av datakilder.
- Gjør data-frigivelse til kvalitetskriterium: Den årlige kvalitetsvurderingen av offentlig sektors nettsteder tiltrekker seg mye oppmerksomhet. Det er gjevt å komme høyt opp her og virksomhetene setter av ressurser for å forbedre seg. I 2010-vurderingen bør nye kriterier tas inn for å måle hvor godt virksomhetene informerer om datakilder på nettstedene sine, og hvor dyktige de er til å frigi datakilder på korrekt måte. Mange av prinsippene vi foreslår blir definert (under forrige punkt) bør her brukes mer eller mindre direkte som målepunkter. Dette bør gi resultater allerede i løpet av det kommende året.
- Definer pilotprosjekter: Plukk ut bestemte typer datakilder som i dag ikke er tilgjengelige og som har særlig stort potensial. Definer pilotprosjekter for å utvikle verktøy og definere standarder for frigivelse av disse datakildene, og ha som del av prosjektet at data faktisk frigis. Inviter næringsliv, utviklere og medier til å konkurrere om pilotprosjektene. Eksempel: Voteringsdata fra Stortinget, fylkestinget og kommunestyrene er i rapporten pekt på som en type data med stort potensial for viderebruk i sammenhenger som kan styrke interessen for demokrati og valg.
- Skriv en håndbok: Samle alle regler, prinsipper, lisenser og eksempler på beste praksis for frigivelse av data i en nettbasert håndbok som oppdateres fortløpende (en wiki egner seg meget godt til dette). Her kan man la seg direkte inspirere av det nederlandske prosjektet omtalt i denne rapporten. Som del av det prosjektet ble det også produsert en plakat som illustrerer stegene fram mot frigivelse av data. Som en begynnelse på et slikt prosjekt har vi publisert en artikkel om god praksis for frigivelse av data.
- Driv nettverksbygging: Ansatte som arbeider med datakilder i ulike etater og nivåer i offentlig sektor bør møtes til workshops — fysisk og nettbasert — for å utveksle erfaringer. Denne nettverks- og kompetansebyggingen bør være åpen for alle interesserte også fra næringsliv, journalistikk og utviklermiljøer. Også her kan man trekke direkte på de nederlandske erfaringene referert til i denne rapporten.
- Utlys ekstramidler til data-frigivelse: I offentlige virksomheter er mange opptatt av direkte eller indirekte kostnader som påløper hvis de skal arbeide mer med å klarere og frigi datakilder. Dette kostnadsspørsmålet bør tas alvorlig: Ett tiltak kan være å utlyse en konkurranse der friske midler øremerkes dette arbeidet. En del av ekstrakostnadene vil være knyttet til arbeid som må gjøres én gang.
- Opprett en “utrykningsenhet”: Kostnadsspørsmålet kan også takles ved at det opprettes en prosjektgruppe eller “task force” som arbeider på tvers av etater og virksomheter. Gruppen bør utvikle løsninger som hjelper virksomhetene med å komme hurtigere i mål med å legge data til rette for viderebruk.
Alle disse forslagene retter seg mot de relevante politiske myndighetene og fagorganene, altså særlig FAD og DIFI. Flere av tiltakene kan imidlertid med fordel settes ut i livet i samarbeid med organisasjoner, utviklere, medier, alminnelige brukere. I tillegg er det selvsagt mye de potensielle “viderebrukerne” kan gjøre. Medier og journalister har antakelig bare så vidt begynt å prøve ut mulighetene offentlighetslovens nye paragraf 9 (og andre lovhjemler) gir for å få utlevert data (denne muligheten er som kjent også åpen for alle, ikke bare journalister, selv om de sikkert er storbrukerne). Der hvor datakilden er kjent, men ikke gjort tilgjengelig for nedlasting, kan medier og andre i mange tilfeller “skrape” dataene ut av offentlige nettsider — en praksis som allerede med hell er prøvd av enkelte. Slik “skraping” kan nok brukes som pressmiddel mot enkelte motvillige virksomheter.
Hvis de mener saken er viktig nok, kan medienes organisasjoner også ta initiativet til en kampanje for å frigi offentlige data. I Storbritannia har The Guardian gått i bresjen for en slik “Free our data”-kampanje. Skulle man starte noe slikt nå, ville det være naturlig at mediene samarbeider med næringslivsaktører, organisasjoner og andre interesserte.
Konkrete tiltak kan bidra mye til økt bevissthet om offentlig sektors data og mulighetene frigivelse åpner. Men et virkelig gjennombrudd krever antakelig at det formuleres og kommuniseres en klar politisk målsetting om å frigi data for å øke verdiskaping og innovasjonstakt og åpne opp demokratiske prosesser. Det burde her være tilstrekkelig å vise til hvilken vekt den britiske og den amerikanske regjeringen har lagt på dette temaet det siste året. I dag er det i stor grad opp til hver enkelt virksomhet å definere sitt eget forhold til åpne data. En slik fragmentert situasjon er ingen tjent med.
Bakgrunnsmateriale
Vi har publisert tallmateriale fra kartleggingen: Fakta først bakgrunnsmateriale (Google Doc regneark).
OPPDATERING: Vi har erstattet vår veldig provisoriske “data.gov” med datakildeportalen no.ckan.net, den samme løsningen som brukes i data.gov.uk. Vi håper du vil bidra til denne borgerdrevne datakildeportalen!
Opphavsrett
Fakta først. Viderebruk av datakilder i offentlig sektor: potensial og hindringer av Olav Anders Øvrebø (red.) er lisensiert under en Creative Commons Navngivelse 3.0 Norge Lisens.
Basert på et verk på adresse voxpublica.no.
[…] Vox Publica, på et NONA-møte om arbeidet med å kartlegge status for offentlig data i Norge, og resultatet av det kartleggingsprosjektet viste at det var mange utfordringer å gripe fatt i […]