Når offentlige data blir livsviktige

Den sparsomme tilgangen til informasjon om omfanget av radioaktive utslipp i Japan har tvunget entusiaster til selv å samle data for å få svar. Norske Geir K. Engdahl bidrar med visualisering.

Kri­sen ved kjerne­kraft­ver­ket Dai-ichi på vest­kys­ten av Japan bekym­rer man­ge. Mens ikke-japans­ke medi­er meld­te at det var stor fare for umid­del­bar ned­smel­ting i reak­to­ren, var japans­ke aviser og tv-sta­sjo­ner langt mer mode­ra­te i sin dek­ning. For man­ge som fulg­te medie­dek­nin­gen fra for­skjel­li­ge land, var det vans­ke­lig å vite hvem man skul­le sto­le på.

Løs­nin­gen ble et inter­na­sjo­nalt, selv­or­ga­ni­se­ren­de sam­ar­beid mel­lom fri­vil­li­ge fra fle­re land, der­iblant Tysk­land og Nor­ge. Etter hvert har også japans­ke myn­dig­he­ter fri­gitt mer data. Resul­ta­tet er blitt nær «live» til­gang til måle­data visu­ali­sert i et inter­ak­tivt Japan-kart. Men la oss ta his­to­ri­en kro­no­lo­gisk.

Den tys­ke bru­ker­venn­lig­hets­eks­per­ten Mari­an Stein­bach var en av dem som bekym­ret seg over at det var vans­ke­lig å fin­ne eksak­te tall som kun­ne si noe om alvor­lig­hets­gra­den av strå­lin­gen. Han fant etter hvert ut at det japans­ke depar­te­men­tet for utdan­ning, kul­tur, sport, viten­skap og tek­no­lo­gi (MEXT) jevn­lig pub­li­se­rer målin­ger av radio­ak­ti­vi­tet fra måle­sta­sjo­ner rundt om i Japan. Pro­ble­met var bare at dis­se rap­por­te­ne kun var til­gjen­ge­li­ge på japansk og i et luk­ket doku­ment­for­mat, PDF. Der­med var det vans­ke­lig å bare klip­pe ut og lime inn ver­di­ene i et regne­ark for å se utvik­lin­gen over tid.

Stein­bach opp­ret­tet et regne­ark i Goog­le Docs som han ga alle fri til­gang til å redi­ge­re. Via Twit­ter rekrut­ter­te han språk­kyn­di­ge fri­vil­li­ge som hjalp til med å over­set­te rap­por­te­ne fra MEXT. Der fant han også hjelp til å kon­ver­te­re PDF-file­ne. For å hen­te ut data­ene fra PDF-doku­men­te­ne ble det brukt to meto­der: Skrift­gjen­kjen­ning (OCR) og pro­gram­mer for å kon­ver­te­re PDF-tekst til van­li­ge tekst­do­ku­ment.

Stein­bach leg­ger ut opp­da­ter­te tall hvert tien­de minutt på hjem­me­si­den sin. De japans­ke myn­dig­he­te­ne har etter hvert gjort målin­ge­ne til­gjen­ge­li­ge på fle­re språk, inklu­dert engelsk, kine­sisk og kore­ansk.

En av dem som har brukt Mari­an sine data til å visu­ali­se­re de radio­ak­ti­ve målin­ge­ne, er den nors­ke mate­ma­ti­ke­ren og pro­gram­me­re­ren Geir K. Eng­dahl. På sin hjem­me­side har Eng­dahl laget et kart som viser de sis­te målin­ge­ne for hver enkelt måle­sta­sjon.

Data­grunn­la­get og resul­ta­tet etter fri­vil­lig, glo­bal inn­sats (ill. H. Ferstad)

«Mari­an Stein­bach laget scra­ping-sys­te­met og pub­li­se­rer en csv-fil med data­ene. Der­et­ter laget jeg et sys­tem som leser den­ne filen med jev­ne mel­lom­rom og gene­re­rer kar­tet. Til slutt har enda en fri­vil­lig tatt siden jeg lag­de og over­satt den til japansk. I til­legg har fle­re hjul­pet til med å fin­ne GPS-koor­di­na­te­ne til måle­sta­sjo­ne­ne, kom­met med inn­spill til farge­ska­la­en og teks­ten på siden osv,» for­tel­ler Eng­dahl i et epost-inter­vju.

«Det hele star­tet med at jeg var nys­gjer­rig på hvor stor stråle­fa­ren var i Japan. Jeg fant mye snakk i media, men få fak­tis­ke tall, helt til jeg fant Mari­ans csv-fil. Den­ne filen had­de data­ene jeg var inter­es­sert i, men jeg fikk ikke noe over­blikk over den geo­gra­fis­ke spred­nin­gen ved å se på et regne­ark. Der­for laget jeg kar­tet, og det vis­te seg fort at man­ge and­re var inter­es­sert også.»

Hvil­ke utford­rin­ger møt­te du/dere på vei­en (f.eks. skra­ping av data, språk­vans­ker)?
«Førs­te utford­ring var å fin­ne GPS-koor­di­na­te­ne til sta­sjo­ne­ne. Jeg begyn­te med å ta de sta­sjo­ne­ne som vis­te høy­est ver­di­er og lete etter steds­nav­ne­ne på Goog­le Maps. Noen fant jeg, men man­ge var usik­re. Dess­uten er det over 200 sta­sjo­ner, så jeg fant ut at det var bed­re å spør­re om fri­vil­li­ge til å fin­ne koor­di­na­te­ne, noe som ga godt resul­tat: Etter bare 24 timer had­de folk fylt inn de fles­te sta­sjons­ko­or­di­na­te­ne. Goog­le spre­ads­he­ets are en god måte å orga­ni­se­re slikt arbeid på. Over­set­tel­sen ble også gjort på den­ne måten: Jeg la ut et Goog­le spre­ads­he­et med alle de for­skjel­li­ge set­nin­ge­ne jeg måt­te over­set­te, der­et­ter ble cel­le­ne over­satt en etter en. En annen utford­ring var høy belast­ning på ser­ve­ren pga mye tra­fikk. Her had­de jeg en peri­ode med febrilsk opti­me­ring av data­base­sys­te­met. Det ble helt kri­se da web­ho­tel­let sper­ret kon­to­en min pga. for høy load. Jeg måt­te rin­ge dem og for­kla­re situa­sjo­nen for å få til­gang til ser­ve­ren igjen… Nes­te gang skal jeg lage sli­ke webap­pli­ka­sjo­ner på Goog­le App Engi­ne, så de kan tak­le mye mer tra­fikk. Det had­de f.eks ikke vært noe pro­blem for meg å pro­gram­me­re et kart med en tids­lin­je som gjør at bru­ke­ren kan se hvor­dan strå­lin­gen utvik­ler seg i tid, men noe slikt vil­le full­sten­dig tatt knek­ken på min nåvæ­ren­de web-ser­ver.»

Kan du si noe gene­relt om fram­ti­den for offent­li­ge data og visu­ali­se­rin­ger?
«Frem­ti­den for offent­li­ge data ser lys ut i mine øyne. Det er kom­met vel­dig mye data på nett, til­dels også i for­ma­ter som er lett å arbei­de med. Det har utro­lig mye å si hvor­dan sli­ke data pre­sen­te­res (f.eks valg av farge­ska­la i til­fel­let med strå­lin­gen i Japan). Et annet kart la seg opp­rin­ne­lig på en farge­ska­la der de mar­ker­te alt over 80 nano-Gray per time som ill­rødt. De end­ret det da vi gjor­de dem opp­merk­som på at bak­grunns­ni­vå­et alle­re­de før jord­skjel­vet var over det­te nivå­et i enkel­te fyl­ker (prefec­tu­res). Om man øns­ker å ska­pe panikk eller baga­tel­li­se­re pro­ble­met, kan man all­tids vel­ge en ska­la som pas­ser ens agen­da. Det lig­ger mye makt i visu­ali­se­ring og pre­sen­ta­sjon av data, og der­for vil det nok tvin­ge seg fram en form for «ryk­te» for de som dri­ver med det­te. Typisk «den­ne grup­pen kan vi sto­le på» eller «han her repre­sen­te­rer en spe­si­ell nærings­in­ter­es­se» osv. Men jeg er opti­mis­tisk for frem­ti­den.»

Situa­sjo­nen i Japan har fort­satt ikke sta­bi­li­sert seg helt, men inn­sat­sen til fri­vil­li­ge net­t­en­tu­si­as­ter gjør at befolk­nin­gen i Japan og ellers i ver­den er løpen­de ori­en­tert om utvik­lin­gen ved kjerne­kraft­ver­ket.

TEMA

O

ffentli
ge data

116 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

INGEN KOMMENTARER

Kommentarfeltet til denne artikkelen er nå stengt. Ta kontakt med redaksjonen dersom du har synspunkter på artikkelen.

til toppen