Krisen ved kjernekraftverket Dai-ichi på vestkysten av Japan bekymrer mange. Mens ikke-japanske medier meldte at det var stor fare for umiddelbar nedsmelting i reaktoren, var japanske aviser og tv-stasjoner langt mer moderate i sin dekning. For mange som fulgte mediedekningen fra forskjellige land, var det vanskelig å vite hvem man skulle stole på.
Løsningen ble et internasjonalt, selvorganiserende samarbeid mellom frivillige fra flere land, deriblant Tyskland og Norge. Etter hvert har også japanske myndigheter frigitt mer data. Resultatet er blitt nær “live” tilgang til måledata visualisert i et interaktivt Japan-kart. Men la oss ta historien kronologisk.
Den tyske brukervennlighetseksperten Marian Steinbach var en av dem som bekymret seg over at det var vanskelig å finne eksakte tall som kunne si noe om alvorlighetsgraden av strålingen. Han fant etter hvert ut at det japanske departementet for utdanning, kultur, sport, vitenskap og teknologi (MEXT) jevnlig publiserer målinger av radioaktivitet fra målestasjoner rundt om i Japan. Problemet var bare at disse rapportene kun var tilgjengelige på japansk og i et lukket dokumentformat, PDF. Dermed var det vanskelig å bare klippe ut og lime inn verdiene i et regneark for å se utviklingen over tid.
Steinbach opprettet et regneark i Google Docs som han ga alle fri tilgang til å redigere. Via Twitter rekrutterte han språkkyndige frivillige som hjalp til med å oversette rapportene fra MEXT. Der fant han også hjelp til å konvertere PDF-filene. For å hente ut dataene fra PDF-dokumentene ble det brukt to metoder: Skriftgjenkjenning (OCR) og programmer for å konvertere PDF-tekst til vanlige tekstdokument.
Steinbach legger ut oppdaterte tall hvert tiende minutt på hjemmesiden sin. De japanske myndighetene har etter hvert gjort målingene tilgjengelige på flere språk, inkludert engelsk, kinesisk og koreansk.
En av dem som har brukt Marian sine data til å visualisere de radioaktive målingene, er den norske matematikeren og programmereren Geir K. Engdahl. På sin hjemmeside har Engdahl laget et kart som viser de siste målingene for hver enkelt målestasjon.
“Marian Steinbach laget scraping-systemet og publiserer en csv-fil med dataene. Deretter laget jeg et system som leser denne filen med jevne mellomrom og genererer kartet. Til slutt har enda en frivillig tatt siden jeg lagde og oversatt den til japansk. I tillegg har flere hjulpet til med å finne GPS-koordinatene til målestasjonene, kommet med innspill til fargeskalaen og teksten på siden osv,” forteller Engdahl i et epost-intervju.
“Det hele startet med at jeg var nysgjerrig på hvor stor strålefaren var i Japan. Jeg fant mye snakk i media, men få faktiske tall, helt til jeg fant Marians csv-fil. Denne filen hadde dataene jeg var interessert i, men jeg fikk ikke noe overblikk over den geografiske spredningen ved å se på et regneark. Derfor laget jeg kartet, og det viste seg fort at mange andre var interessert også.”
Hvilke utfordringer møtte du/dere på veien (f.eks. skraping av data, språkvansker)?
“Første utfordring var å finne GPS-koordinatene til stasjonene. Jeg begynte med å ta de stasjonene som viste høyest verdier og lete etter stedsnavnene på Google Maps. Noen fant jeg, men mange var usikre. Dessuten er det over 200 stasjoner, så jeg fant ut at det var bedre å spørre om frivillige til å finne koordinatene, noe som ga godt resultat: Etter bare 24 timer hadde folk fylt inn de fleste stasjonskoordinatene. Google spreadsheets are en god måte å organisere slikt arbeid på. Oversettelsen ble også gjort på denne måten: Jeg la ut et Google spreadsheet med alle de forskjellige setningene jeg måtte oversette, deretter ble cellene oversatt en etter en. En annen utfordring var høy belastning på serveren pga mye trafikk. Her hadde jeg en periode med febrilsk optimering av databasesystemet. Det ble helt krise da webhotellet sperret kontoen min pga. for høy load. Jeg måtte ringe dem og forklare situasjonen for å få tilgang til serveren igjen… Neste gang skal jeg lage slike webapplikasjoner på Google App Engine, så de kan takle mye mer trafikk. Det hadde f.eks ikke vært noe problem for meg å programmere et kart med en tidslinje som gjør at brukeren kan se hvordan strålingen utvikler seg i tid, men noe slikt ville fullstendig tatt knekken på min nåværende web-server.”
Kan du si noe generelt om framtiden for offentlige data og visualiseringer?
“Fremtiden for offentlige data ser lys ut i mine øyne. Det er kommet veldig mye data på nett, tildels også i formater som er lett å arbeide med. Det har utrolig mye å si hvordan slike data presenteres (f.eks valg av fargeskala i tilfellet med strålingen i Japan). Et annet kart la seg opprinnelig på en fargeskala der de markerte alt over 80 nano-Gray per time som illrødt. De endret det da vi gjorde dem oppmerksom på at bakgrunnsnivået allerede før jordskjelvet var over dette nivået i enkelte fylker (prefectures). Om man ønsker å skape panikk eller bagatellisere problemet, kan man alltids velge en skala som passer ens agenda. Det ligger mye makt i visualisering og presentasjon av data, og derfor vil det nok tvinge seg fram en form for “rykte” for de som driver med dette. Typisk “denne gruppen kan vi stole på” eller “han her representerer en spesiell næringsinteresse” osv. Men jeg er optimistisk for fremtiden.”
Situasjonen i Japan har fortsatt ikke stabilisert seg helt, men innsatsen til frivillige nettentusiaster gjør at befolkningen i Japan og ellers i verden er løpende orientert om utviklingen ved kjernekraftverket.