Når offentlige data blir livsviktige

Den sparsomme tilgangen til informasjon om omfanget av radioaktive utslipp i Japan har tvunget entusiaster til selv å samle data for å få svar. Norske Geir K. Engdahl bidrar med visualisering.

Krisen ved kjernekraftver­ket Dai-ichi på vestkys­ten av Japan bekym­r­er mange. Mens ikke-japanske medi­er meldte at det var stor fare for umid­del­bar nedsmelt­ing i reak­toren, var japanske avis­er og tv-stasjon­er langt mer mod­er­ate i sin dekn­ing. For mange som ful­gte mediedeknin­gen fra forskjel­lige land, var det vanske­lig å vite hvem man skulle stole på.

Løs­nin­gen ble et inter­nasjon­alt, selvor­gan­is­erende samar­beid mel­lom friv­il­lige fra flere land, deri­blant Tysk­land og Norge. Etter hvert har også japanske myn­digheter frigitt mer data. Resul­tatet er blitt nær “live” til­gang til måle­da­ta visu­alis­ert i et inter­ak­tivt Japan-kart. Men la oss ta his­to­rien kronologisk.

Den tyske bruk­er­venn­lighet­seksperten Mar­i­an Stein­bach var en av dem som bekym­ret seg over at det var vanske­lig å finne eksak­te tall som kunne si noe om alvorlighets­graden av strålin­gen. Han fant etter hvert ut at det japanske departe­mentet for utdan­ning, kul­tur, sport, viten­skap og teknolo­gi (MEXT) jevn­lig pub­lis­er­er målinger av radioak­tivitet fra målestasjon­er rundt om i Japan. Prob­lemet var bare at disse rap­portene kun var tilgjen­gelige på japan­sk og i et lukket doku­ment­for­mat, PDF. Dermed var det vanske­lig å bare klippe ut og lime inn ver­di­ene i et reg­n­eark for å se utviklin­gen over tid.

Stein­bach oppret­tet et reg­n­eark i Google Docs som han ga alle fri til­gang til å redi­gere. Via Twit­ter rekrut­terte han språkkyn­di­ge friv­il­lige som hjalp til med å over­sette rap­portene fra MEXT. Der fant han også hjelp til å kon­vert­ere PDF-filene. For å hente ut dataene fra PDF-doku­mentene ble det brukt to metoder: Skrift­g­jenkjen­ning (OCR) og pro­gram­mer for å kon­vert­ere PDF-tekst til van­lige tekstdokument.

Stein­bach leg­ger ut opp­daterte tall hvert tiende min­utt på hjemmes­i­den sin. De japanske myn­dighetene har etter hvert gjort målin­gene tilgjen­gelige på flere språk, inklud­ert engel­sk, kine­sisk og koreansk.

En av dem som har brukt Mar­i­an sine data til å visu­alis­ere de radioak­tive målin­gene, er den norske matem­atik­eren og pro­gram­mer­eren Geir K. Eng­dahl. På sin hjemme­side har Eng­dahl laget et kart som vis­er de siste målin­gene for hver enkelt målestasjon. 

Data­grunnlaget og resul­tatet etter friv­il­lig, glob­al innsats (ill. H. Ferstad)

“Mar­i­an Stein­bach laget scrap­ing-sys­temet og pub­lis­er­er en csv-fil med dataene. Deretter laget jeg et sys­tem som leser denne filen med jevne mel­lom­rom og gener­erer kartet. Til slutt har enda en friv­il­lig tatt siden jeg lagde og over­satt den til japan­sk. I til­legg har flere hjulpet til med å finne GPS-koor­di­natene til målestasjonene, kom­met med inn­spill til fargeskalaen og tek­sten på siden osv,” forteller Eng­dahl i et epost-intervju.

“Det hele startet med at jeg var nys­g­jer­rig på hvor stor stråle­faren var i Japan. Jeg fant mye snakk i media, men få fak­tiske tall, helt til jeg fant Mar­i­ans csv-fil. Denne filen hadde dataene jeg var inter­essert i, men jeg fikk ikke noe overb­likk over den geografiske spred­nin­gen ved å se på et reg­n­eark. Der­for laget jeg kartet, og det viste seg fort at mange andre var inter­essert også.”

Hvilke utfor­dringer møtte du/dere på veien (f.eks. skrap­ing av data, språkvansker)?
“Første utfor­dring var å finne GPS-koor­di­natene til stasjonene. Jeg beg­y­nte med å ta de stasjonene som viste høyest verdier og lete etter sted­snavnene på Google Maps. Noen fant jeg, men mange var usikre. Dessuten er det over 200 stasjon­er, så jeg fant ut at det var bedre å spørre om friv­il­lige til å finne koor­di­natene, noe som ga godt resul­tat: Etter bare 24 timer hadde folk fylt inn de fleste stasjon­sko­or­di­natene. Google spread­sheets are en god måte å organ­is­ere slikt arbeid på. Over­set­telsen ble også gjort på denne måten: Jeg la ut et Google spread­sheet med alle de forskjel­lige set­nin­gene jeg måtte over­sette, deretter ble cel­lene over­satt en etter en. En annen utfor­dring var høy belast­ning på serveren pga mye trafikk. Her hadde jeg en peri­ode med febril­sk opti­mer­ing av data­bas­esys­temet. Det ble helt krise da web­hotel­let sper­ret kon­toen min pga. for høy load. Jeg måtte ringe dem og fork­lare situ­asjo­nen for å få til­gang til serveren igjen… Neste gang skal jeg lage slike webap­p­likasjon­er på Google App Engine, så de kan tak­le mye mer trafikk. Det hadde f.eks ikke vært noe prob­lem for meg å pro­gram­mere et kart med en tid­slin­je som gjør at bruk­eren kan se hvor­dan strålin­gen utvikler seg i tid, men noe slikt ville full­s­tendig tatt knekken på min nåværende web-server.”

Kan du si noe generelt om framti­den for offentlige data og visualiseringer?
“Fremti­den for offentlige data ser lys ut i mine øyne. Det er kom­met veldig mye data på nett, tildels også i for­mater som er lett å arbei­de med. Det har utrolig mye å si hvor­dan slike data pre­sen­teres (f.eks valg av fargeskala i til­fel­let med strålin­gen i Japan). Et annet kart la seg opprin­nelig på en fargeskala der de mark­erte alt over 80 nano-Gray per time som ill­rødt. De endret det da vi gjorde dem opp­merk­som på at bak­grunnsnivået allerede før jord­skjel­vet var over dette nivået i enkelte fylk­er (pre­fec­tures). Om man ønsker å skape panikk eller bagatel­lis­ere prob­lemet, kan man alltids velge en skala som pass­er ens agen­da. Det lig­ger mye makt i visu­alis­er­ing og pre­sen­tasjon av data, og der­for vil det nok tvinge seg fram en form for “ryk­te” for de som dri­ver med dette. Typisk “denne grup­pen kan vi stole på” eller “han her rep­re­sen­ter­er en spe­siell næringsin­ter­esse” osv. Men jeg er opti­mistisk for fremtiden.”

Situ­asjo­nen i Japan har fort­satt ikke sta­bilis­ert seg helt, men innsat­sen til friv­il­lige net­ten­tu­si­aster gjør at befolknin­gen i Japan og ellers i ver­den er løpende ori­en­tert om utviklin­gen ved kjernekraftverket.

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

INGEN KOMMENTARER

Kommentarfeltet til denne artikkelen er nå stengt. Ta kontakt med redaksjonen dersom du har synspunkter på artikkelen.

til toppen