Åpnet opp det tyske statsbudsjettet

Brukte to helger og JavaScript-verktøy til å lage gjennombruddsprosjekt for åpne data i Tyskland.

Et lite, men aktivt miljø arbei­der for åpen til­gang til offentlig sek­tors datak­ilder i Tysk­land. Offen­er Haushalt — “åpent stats­bud­sjett” — er det første pros­jek­tet som har fått større opp­merk­somhet i medi­ene, og betrak­tes som et lite gjen­nom­brudd for ideen om åpne data i Tyskland.

Start­si­den visu­alis­er­er stør­relses­forhold­et mel­lom de ulike føderale departe­mentenes bud­sjet­ter. Man kan klikke seg videre og se de enkelte bud­sjettposter. Dataene kan eksporteres i ulike for­mater, noe som gjør at andre igjen kan arbei­de videre med mate­ri­alet. Hver side har kom­men­tar­mu­lighet, og bruk­erne kan legge inn lenker til andre rel­e­vante nettsider. Inter­es­sant nok pre­sen­terte NRK i går det norske stats­bud­sjet­tet på en måte som lign­er visuelt, men er laget annerledes rent teknisk.

Vox Pub­li­ca møtte Friedrich Lin­den­berg og Daniel Diet­rich, to av de tre som står bak pros­jek­tet, til en sam­tale i Berlin.

Visu­alis­er­ing av det tyske føderale budsjettet.


Ble dere over­ras­ket av at reak­sjonene på Offen­er Haushalt har vært så positive?
For arbei­det for åpne data i Tysk­land er det enormt vik­tig å lage app­likasjon­er som vis­er med konkrete eksem­pler hva man kan få til med offentlig sek­tors data. Vi håper at flere og flere vil spørre seg om hvor­for infor­masjon fra myn­dighetene ikke er så tilgjen­gelig som den burde være, og om de selv kan gjøre noe med dette.

Hvor mye tid har dere brukt på prosjektet?
Vi var tre stykker som sat­te i gang, to pro­gram­merere og en kon­sep­tutvikler. Vi arbei­det tre til fire dager med kon­sept og research, tre dager med å bear­bei­de dataene og rundt fire dager med pre­sen­tasjo­nen. Et slikt pros­jekt kan man alt­så gjen­nom­føre på et par hel­ger. Alt hadde naturligvis vært vesentlig enklere hvis finans­de­parte­mentet hadde stilt dataene til dis­po­sisjon i et maskin­les­bart for­mat. Fri­givelse av dataene ble avs­lått med hen­vis­ning til faren for at de kunne mis­forstås, men medar­bei­derne i departe­mentet ser også ut til å like vår pro­to­type — nå har de beg­y­nt å sende oss data likevel.

Dere måtte alt­så “skrape” dataene — hvor­dan gjorde dere dette?
Vi lastet ned html-sider og pdf-doku­menter fra finans­de­parte­mentets nettst­ed. Så parset (analy­serte) vi dem og la dem inn i en data­base. Fra denne data­basen eksporterte vi dataene i JSON- og RDF-for­mat, noe som gjorde den videre bear­bei­din­gen enklere.

Dere har brukt JavaScript-verk­tøy i pre­sen­tasjo­nen, ikke Flash. Hvilke vur­deringer lig­ger bak dette valget?
Vi har mye erfar­ing med webte­knolo­gi­er som JavaScript, men ikke så mye med Flash. Sam­tidig er visu­alis­erin­gene man kan lage med JavaScript-verk­tøy som Pro­to­vis, Raphaël og The­Jit like tiltal­ende som Flash-ani­masjon­er. Sen­est fra og med den neste gen­erasjo­nen net­tle­sere med mask­in­vareak­sel­erasjon for html-grafikk vil Flash antake­lig spille en beskje­den rolle innen informasjonsvisualisering.

Kan man egentlig gjøre noe slikt som Offen­er Haushalt rel­a­tivt hur­tig, når man først har kjennskap til verk­tøyene? Jeg tenker f.eks. på redak­sjon­er, hvor man ofte må arbei­de svært raskt.
De nevnte JavaScript-bib­liotekene og Googles visu­alis­er­ings-API er verdi­fulle verk­tøy for jour­nal­is­ter. Dessverre befinner mange av verk­tøyene seg fort­satt i en utviklings­fase, så det er ikke alt som fun­ger­er slik man gjerne hadde øns­ket. De er likev­el rel­a­tivt enkle å bruke og litt JavaScript eller Pro­cess­ing kan man lett lære seg. Slik kan man raskt bygge inter­ak­tive app­likasjon­er som inviter­er leseren til å utforske et tema.

Har dere allerede tenkt på hvor­dan dere vil videreutvikle Offen­er Haushalt? Hva kan forbedres?
Offen­er Haushalt er en pro­to­typ og et verk­tøy. Det er vik­tig at hver enkelt bud­sjettpost har sin egen URL, slik at borg­ere og jour­nal­is­ter kan hen­vise til enkelt­punk­ter i artik­ler og debat­ter. Offen­er Haushalt forteller i seg selv ingen his­to­rie; for å lage slike må man gjøre videre under­søkelser og lage en fortelling ut av det.

App­likasjo­nen kan videreutvikles på mange måter. Vi har allerede data om statens inntek­ter i til­legg til utgiftene, men pre­sen­ter­er ikke disse ennå. Det hadde også vært nyt­tig å pre­sen­tere stat­sreg­n­skapet ved siden av bud­sjet­tet. Videre ville det vært inter­es­sant å kjenne til og analy­sere statens fak­tiske utbe­talinger, slik man gjør i Eng­land med COINS-data­basen.

Det ville også vært spen­nende å sam­men­ligne det tyske bud­sjet­tet med andere nasjon­ers. Slik kunne man sam­men­ligne utgifter til sosial og helse, utdan­ning og forsvar — justert for innbyg­ger­tall eller BNP. Særlig innen­for Europa kunne man på denne måten sikkert utløse noen spen­nende diskusjoner.

Dere har allerede plan­er om å bruke dette verk­tøyet til å pre­sen­tere også del­stats- og kommunebudsjetter?
Vi blir nå kon­tak­tet av en del kom­muner som gjerne skulle ha pre­sen­tert sitt eget bud­sjett i et slikt sys­tem. Det er vi veldig glade for og vil gjerne bidra, men akku­rat nå har vi ikke tid til å følge opp alle hen­ven­delser. Vi vur­der­er å til­by en slik tjen­este i framtiden.

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

2 KOMMENTARER

  1. […] This post was men­tioned on Twit­ter by Har­ald Groven and Vox Pub­li­ca, Offentlige data. Offentlige data said: Åpnet opp det tyske stats­bud­sjet­tet: Bruk­te to hel­ger og JavaScript-verk­tøy til å lage gjen­nom­brud­dspros­jekt for å… http://bit.ly/cHiQV8 […]

  2. Å få stats­bus­jet­tet ut i et for­mat som kan vis­es som treemap vil være lett fra Finans­de­parte­mentets økonomisys­tem, men vil være svært plu­drete fra tek­st­doku­mentene som ble slup­pet 5. okto­ber, noe som har vært diskutert før. PDF-utgaven av stats­bud­sjet­tet er til og med utstyrt med passord! 

    Det er mange gode javascript-verk­tøy for å lage treemap-visu­alis­eringer, men ingen som lager så avanserte som de beste Flash-utviklede som for eksem­pel Nat­ur­al Sci­ence Muse­um of Barcelona.

    Blant gode javaskript­bib­liotek jeg har testet er The Jit

til toppen