Det skapte god stemning i mange utviklermiljøer da Statistisk sentralbyrå tidligere i år gjorde kjent at de vil inkludere et åpent programmeringsgrensesnitt (API) i sine nye nettsider. Det vil gjøre det lettere for interesserte på utsiden å gjenbruke statistikkbyråets data i nye sammenhenger. Et API lar utviklere hente ut data på en enkel måte: Dataene hentes via sin logiske struktur, og kan deretter gjenbrukes uten at man må gjenskape den originale datastrukturen (databasen) i sitt eget system.
Et av målene med de nye SSB-nettsidene er nettopp å øke muligheten for gjenbruk og videreformidling av data, forteller leder for prosjektet Nye ssb.no Per Olav Løvbak. SSB satser blant annet på å gjøre figurer og tabeller lettere tilgjengelig for republisering på andre nettsteder, på samme måte som for eksempel YouTube-videoer i dag kan vises i sin helhet på eksterne sider (embedding).
Prosjektet vil gi SSB helt nye nettsider — ingen liten oppgave. Spesielt interesserte kan nå studere anbudsdokumentene, som inneholder mye informasjon om strategi og ambisjoner. Den nye løsningen skal gjøre det lettere for brukerne å finne tallene de er ute etter, og de interne rutinene for produksjon av statistikk skal bli effektivisert og sikrere, opplyser Løvbak.
SSB ønsker også å se seg som en del av den internasjonale trenden mot frigivelse av mer offentlige data. USA og Storbritannia blir ofte nevnt; Løvbak nevner også Nederland.
— Trenden er helt i tråd med det vi selv ønsker. Det er helt klart målsettingen for oss at statistikken skal gjøres tilgjengelig og så lett anvendbar som mulig, sier han.
Tallmaterialet SSB rår over ser overveldende ut for et utrent øye, men byrået forvalter atskillig mer enn det som er tilgjengelig for folk flest i Statistikkbanken og SSBs ulike publikasjoner (se oversikt). Teoretisk kunne man fått mye mer finkornet inndeling av dataene, noe som ville gitt oppfinnsomme utviklere muligheten til å lage nye tjenester og sammenstillinger med SSB-tallene som basis. Men strenge regler for behandling av personopplysninger forhindrer dette.
— Vi frigir allerede i dag all relevant statistikk på ssb.no, men ønsker å øke tilgjengeligheten ytterligere. Utover dette må vi ta høyde for lovens krav om konfidensialitet, og det gjør at vi ikke kan frigi enkeltopplysninger, sier Løvbak.
Blant annet er man opptatt av faren for at tilsynelatende uskyldige opplysninger i én tabell kan kobles sammen med et annet datasett, og så har man plutselig et omfattende datamateriale om enkeltpersoner ute i offentligheten. Andre årsaker til å være tilbakeholden er at tallene kan være usikre, kanskje resultat av et pilotprosjekt. Det tar tid å bygge opp god statistikk.
— Et eget utvalg tar stilling til om noe er konfidensielt eller ikke. Målet er å frigi mest mulig, og det skal være gode grunner til å holde data tilbake, sier Løvbak.
Unntak gjøres for forskningsprosjekter, der data avidentifiseres og gjøres tilgjengelig for forskere, regulert av kontrakter.
Trenden mot mer åpne data vil trolig også åpne en debatt om SSBs datakilder, muligens med et sterkere press fra aktører både i privat og offentlig sektor om å gjøre mer av dataskattene gjenbrukbare. Det åpner for interessante diskusjoner om hvordan aktørene på alle sider her skal navigere mellom hensynene til personvern, folkeopplysning og verdiskaping. Den rituelle skattelistedebatten kan få selskap.
Håper nye SSB gir tilgang til mer data enn det gamle SSB gjorde. Gamle-SSB har hittil kun republisert de tabellene som tidligere ble trykket på papir i publikasjoner som Statistisk Årbok m.fl. De mest verdifulle av SSBs data er de som har for høyt detaljnivå til at det har vært meningsfullt å papirpublisere, men som heller ikke er persondata beskyttet mot publisering av personopplysningsloven eller statistikkloven.