I denne nye bloggen skal det rapporteres fra en skattejakt av det uvanlige slaget. Oppdraget fra Institutt for informasjons- og medievitenskap på UiB er å kartlegge hva slags ulike datakilder offentlig sektor disponerer, og hva som er til hinder for at mer av disse dataene kan bli gjort tilgjengelig.
Det er et voksende miljø av journalister og andre som har spennende ideer til gjen- eller viderebruk av dataene kommuner, fylker og statsapparatet er pålagt å samle inn, registrere og forvalte. Da jeg presenterte dette prosjektet for en gruppe journalister og IT-folk tidligere i høst, var en av kommentarene: Utviklingen av gravejournalistikk er avhengig av at datakildene åpnes.
Det finnes alt gode eksempler på nyskapende journalistikk der tilgang til ulike typer strukturerte data er en forutsetning. NRKs Maktbasen er etter hvert godt kjent. Amerikanske EveryBlock en inspirasjon for mange. Denne nye “journalistikken i kode” – datastøttet journalistikk — har Vox Publica beskrevet i flere artikler. Flere gode eksempler skal belyses her på “Fakta først” framover.
Jakten på offentlig sektors data må begynne med en kartlegging av hvilke datakilder som faktisk finnes. I dag er det ingen enhetlig praksis i offentlig sektor når det gjelder å informere om hva slags data en virksomhet samler inn eller om den skal gjøre dataene tilgjengelig — for ikke å snakke om i hva slags format.
Vårt prosjekt kan bare være en begynnelse — en fullstendig kartlegging er en kjempejobb, og dessuten et uendelig prosjekt, siden nye datakilder vil komme til. Obama-regjeringens data.gov og det danske digitaliser.dk viser hvordan det kan gjøres.
En debatt på NRK Beta i sommer avslørte et stort engasjement for saken. Er du blant dem som har kunnskap om datakilder i offentlig sektor, er du hjertelig velkommen til å dele informasjonen. I første omgang har vi opprettet et regneark der basisinformasjon kan legges inn av alle som vil.
Pressens organisasjoner har lenge arbeidet for mer åpenhet i offentlig sektor, særlig gjennom dokumentoffentlighet. De fleste, om ikke alle, departementer, etater, kommuner har i dag en offentlig postjournal. Alle kan begjære innsyn i dokumentene. Mange virksomheter har også gjort postjournalen tilgjengelig via egne nettsider.
Kampen om åpne postjournaler er vunnet, i hvert fall bestrider ingen i dag prinsippet om offentlighet i forvaltningen. Det arbeides også med at departementenes elektroniske postjournal skal bli tilgjengelig for alle (ikke bare journalister, som i dag).
Det logiske neste skrittet er å få innsyn i mengdene av data det offentlige samler inn og forvalter. Det betyr ikke absolutt alle data, for en god del data er med rette skjermet av personvernhensyn. Men det er ingen tvil om at langt flere datakilder enn dem som er tilgjengelig i dag, kan frigis for nedlasting og viderebruk.
I den nye offentlighetsloven er det tatt inn en paragraf om rett til å kreve innsyn i sammenstilling av opplysninger fra databaser. Dette styrker muligheten til å få innsyn i dataene (selv om det også er et muligens uheldig forbehold om at sammenstillingen må kunne gjøres med “enkle framgangsmåtar”).
Offentlig informasjon skal være offentlig, som Håkon Wium Lie sier:
Når man som skattebetaler betaler for produksjon av informasjon, er det rimelig å kreve tilgang til informasjonen i etterkant. Vi betaler eksempelvis stortingsrepresentantene for å lage lover, og da er det rimelig å kreve at lovene skal gjøres gratis tilgjengelig. Et annet viktig argument er verdiskaping. Ved å publisere grunndata fritt på nett kan nye virksomheter bygge nye produkter oppå. Mange virksomheter vil eksempelvis kunne ta i bruk kartdata på sine nettsider. Dette fører til bedre tjenester for innbyggerne og med tiden økte skatteinntekter.
Tips og innspill blir vi svært glade for! Bruk kommentarfeltet, eller kontakt oss direkte på e‑post: olav.ovrebo@infomedia.uib.no
Både New Zealand og Storbritannia har nettjenester som publiserer aktivitet fra regjering/ting på http://theyworkforyou.co.nz og http://www.theyworkforyou.com/
Dette er kanskje ikke den typen data som vil skape de mest tabloide overskriftene, men som innlysende kan brukes i research-sammenheng og gravesaker. Det er fint å kunne sjekke om de folkevalgte henger i. Det er klart det er svakheter i alle systemer, også disse hvor noen typer handlinger ikke registreres og den folkevalgte framstår som mindre flittig enn realiteten tilsier, men: det var på tide at dette dukket opp også i Norge. Og det har det gjort.
Buskerudbenken http://buskerudbenken.dt.no er i beta, men leverer i samme baner som nevnte Britiske og New Zealandske tjenester.
Det er edda media som holder på med denne utviklingen, og det er dermed ikke utenkelig at dette sprer seg innen Eddas aviser, i den grad det viser seg å settes pris på. En liten notis om prosjektet (datert 25.aug 09) finnes på http://sandkasse.eddamedia.no/2009/08/25/buskerudbenken-databasetjeneste-i-beta/
Buskerudbenken er en type tjeneste som er 100% avhengig av tilgang på offentlig data i maskinlesbart format. Det er utrolig vanskelig å si hvilke andre tjenester som kan lages, hvis vi bare hadde visst hvilke data som finnes!