Journalist med medier og internett som spesialfelt. Redaktør i Vox Publica.
Kommentert oversikt over viktige datakilder for energi og miljø – med API.
Hvor langt er Europa kommet i å erstatte fossil energi med fornybar? Hvilke land har effektivisert energibruken mest? EUs miljøbyrå EEA gir svar på disse og mange andre spørsmål i en nyttig samling av indikatorer og datakilder om energi, klima og andre miljøtemaer. Et eksempel: Energieffektivisering og energiforbruk i husholdningene.
Byrået supplerer datakildene med oppdaterte vurderinger av framgangen på nøkkelområder. Data fra Norge er inkludert i mange av indikatorene.
Som en bonus til utviklerne der ute har EEA gjort et API — programmeringsgrensesnitt — tilgjengelig, for effektiv tilgang til dataene. Data kan gjenbrukes i henhold til en åpen lisens, Creative Commons navngivelse. Kommersiell bruk er altså eksplisitt tillatt.
Blogginnlegget er publisert i samarbeid med nettmagasinet Energi og Klima.
Essensiell lesning både for begynnere og viderekomne.
Nå kan du lese det som kanskje er verdens første bok om datajournalistikk. Boken er ute i beta (som muligens kan høres pussig ut for en ord-journalist, men som høres helt riktig ut for en data-journalist) og er en imponerende samling kunnskap om datajournalistikkfaget. Boken er skrevet av durkdrevne datajournalister fra redaksjoner verden over, og passer godt både for de som allerede kan mye om dette og for de som anser dette som nytt territorium.
Først som sist, her er adressen: datajournalismhandbook.org. Bak prosjektet står European Journalism Centre og Open Knowledge Foundation.
Boken består av syv deler. Den første omhandler selve boken, etterfulgt av en samling korte, men mer teoretiske beskrivelser av hva datajournalistikk er (eller kan være). Kapittel tre omhandler hvordan dette ser ut i praksis i ulike redaksjoner. Her er store aktører som BBC, Zeit, the Guardian og Chicago Tribune sentrale, men våre venner i Danmark i Kaas & Mulvad får også plass. Neste del (case studies) beskriver konkrete eksempler, og likner en del i stil på det vi kjenner fra SKUPs metoderapporter. Disse er tydeligvis tenkt til å vare over tid, så detaljer om kode og teknologi omtales kun overfladisk. Her skulle jeg gjerne ha sett mer nerdete detaljer, men jeg innser at dette både kan skremme den ikke-tekniske leser så vel som forkorte levetiden på denne boken dramatisk.
Les hele innlegget »
Rijksmuseum i Amsterdam får økt publikumsinteresse og ny-programmerte apper igjen når de åpner sine data.
Å gjøre data tilgjengelig er relevant for de fleste fagområder i offentlig sektor, ikke bare innen økonomi eller fiskeri. Nylig har jeg skrevet flere artikler om hvordan institusjoner som forvalter kulturarven arbeider aktivt med å åpne sine data og digitaliserte verk for utviklere og for allmennheten. Dette gjelder arkiver, biblioteker og museer.
En av sakene går gjennom status på feltet og knytter utviklingen til foreslåtte endringer i reglene for offentlig sektors data. En annen sak tar spesielt for seg erfaringene det berømte Rijksmuseum i Amsterdam har høstet etter at de ved årsskiftet la om til en åpenhetslinje. Rådgiver Lizzy Jongma fortalte meg i et epost-intervju hvordan museet tenker om åpne data og tilgjengeliggjøring av digitaliserte verk. Nedenfor er intervjuet i sin helhet.
Et eksempel museet bruker er Jan Vermeers “Melkepiken” (The Yellow Milkmaid) fra ca. 1660. Mesterverket fantes i tusenvis av kopier på nettet, de fleste dårlig utførte reproduksjoner som ikke yter originalen rettferdighet. Ved å legge ut sin egen kopi i høy oppløsning håper museet å motarbeide en slik uheldig utvikling, som har ført til at besøkende i museets butikk ikke tror postkortene viser det riktige bildet!Det kommer stadig nye og gode verktøy for datajournalister – uten at du må være programmerer. En oversikt.
Stadig mer digital informasjon i samfunnet skaper behov for stadig nye og bedre verktøy for å analysere, visualisere og presentere informasjon. For pressen, som må kunne orientere seg mot all verdens ulike data og datakilder, er dette et kappløp av nybrottsarbeid — en nyorientering som stadig tar nye svinger. I dette innlegget tar jeg for meg en samling av verktøy for datajournalister som ikke selv programmerer.
Datadrivenjournalism.net skriver jevnlig om dette. Nylig skreiv de om datawrapper, laget av abzv.
Datawrapper er et lite program som hjelper deg å lage grafer. Så langt er det relativt enkle grafer som stolpediagram, kakediagram og linjediagram som er tilgjengelige. Dette er ting som også lett kan lages i for eksempel Excel, men datawrapper gjør dette til en klipp-og-lim prosess, der resultatet er laget i html5 som er nyttig for nettutgaver, leseplater og mobile enheter. Typisk har slike grafer litt ekstra funksjonalitet, som et statisk bilde fra Excel ikke har. Essensen av datawrapper er å knytte dine data sammen med javascriptbibliotek som highcharts, flotr2 og d3, uten at du trenger å vite mer enn at du har data og vil ha graf. Som et open source-prosjekt er det mulig å utvide datawrapper med flere visualiseringsbibliotek og visualiseringstyper etter hvert. Koden er skrevet i PHP og er lett å følge for de som vil.
Programmerende journalist Dan Nguyen har skrevet en introduksjon til programmering i nyhetsredaksjoner med tittelen Code, Don’t Tell: Programming as an Essential Journalism Skill. I et avsnitt om “practical roadmap for non-programmers” anbefaler han å opprette konto hos Twitter, Dropbox og Google. Sistnevntes tjeneste Google docs har jeg sett er særlig populært også i norske redaksjoner, da muligheten for å dele data, samarbeide og å publisere data fra Google spreadsheet (for eksempel som json) kan korte ned antall skritt i en felles arbeidsflyt. NB: sensitive data bør ikke legges ut på internett. Da kan heller en lokal installasjon av Panda kanskje være en idé?
Panda er et prosjekt med støtte fra Knight Foundation som søker å lage “A Newsroom Data Appliance” — en felles lagringsplass for data i en nyhetsredaksjon. Panda er i hurtig utvikling, så selv om ikke alt man kunne ønske seg finnes ennå, så er det gode muligheter for mye kommer etter hvert. Utviklerne, Christopher Groskopf og Brian Boyer (begge tilknyttet Chicago Tribune) diskuterer til stadighet utviklingen på github og Twitter. Panda ble nylig presentert på en NICAR-konferanse, og mottagelsen beskrives som svært god. Panda er ment å kjøres lokalt for hver redaksjon, eller i “skyen”. Det er lagring og søk som så langt er hovedfokuset til dette prosjektet, hvilke skritt som tas videre og hvordan dette blir brukt blir spennende å se. For en demo, se demo.pandaproject.net. Med APIer og utvidelser i stadig utvikling må det for eksempel være lov å drømme om tett integrasjon med Google refine.
Jeg har tidligere blogget om refine, men på tross av at jeg ikke bruker programmet jevnlig selv, blir jeg stadig overrasket hver gang jeg tar det fram. Google refine er ikke bare et glimrende verktøy for å vaske og restrukturere data, det er også er imponerende kraftig verktøy for å gjøre analyser og å grave i data. Google refine er ikke det mest intuitive verktøyet i verden, og i blant er det nyttig å kunne (eller kunne google) litt regexp eller å kunne tilegne seg kunnskap om ting som GREL (Google Refine Expression Language). Heldigvis likner dette mye på Python, så om du skulle lære deg noe om dette, så lærer du samtidig små biter om programmering. Hvis jeg var ansatt som datajournalist i en nyhetsorganisasjon, med press om å levere analyser og datasett jevnlig, så ville jeg ha satt pengene mine på Google refine (dvs, du trenger ikke sette noen penger noe sted, Google refine er gratis).
Et annet spennende område der det skjer nye ting er GIS, geografiske informasjonssystemer. QGIS er et rimelig sted å starte for de av oss som ikke har en bakgrunn fra relevante fagområder, da QGIS er gratis og finnes til alle plattformer. En fin introduksjon finner du på multimedia.journalism.berkeley.edu.
Et annet spennende prosjekt er TileMill, et verktøy for å lage egne kart. Med både en hostet løsning (noen andre driver serveren for deg, mapbox), og muligheten til å lage tiles (de små rektangulære bildene som utgjør et kart i for eksempel Google maps, du har helt sikkert sett dem når du laster kart på en treg linje eller på mobile plattformer) som du kan publisere selv, så har du her et imponerende verktøy for å fortelle historier på kartet. For inspirasjon til hva du kan lage er Chicago Tribunes blogg et fint sted å lete, både for tekniske ting (som her) og vakre (og kanskje noe kontroversielle her i Norge?) ting (som geografisk fordeling av barn under 5 år kodet etter etnisitet) se denne for mer info om hvordan dette kan gjøres.
Nye verktøy evalueres jevnlig på reviews.reporterslab.org der Sarah Cohen (som snakket på Nordiske mediedager i fjor) er direktør. Et verktøy som er utviklet hos reporterslab er timeflow, for gravende journalister som vil holde orden på kronologien i en story. Et tidslinjeverktøy. Du finner en tutorial på github.
På konferansen nevnt over NICAR12 ble et hopetall verktøy, prosjekter og arbeidsmåter presentert, mye av dette ligger også på nett slik at du kan se gjennom presentasjoner og få tips om verktøy og prosjekter.
En fin lenkesamling finner du også her hos Computerworld (via datadrivenjournalism). Et eksempel er MITs exhibit, som har mange visualiseringsformer godt tilpasset formidling som journalistikk. Exhibit krever at du eller en rundt deg kan litt html/javascript.
Det er ingen tvil om at jeg kaster ut en hel masse informasjon her, og lite, om i det hele tatt noe, står på pensum på journalisthøyskolene. Det betyr ikke at journalisthøyskolene er utdatert, vert imot, men at det er mye å lære som ligger utenfor opptråkkede stier. For deg som vil jobbe med datajournalistikk, i alle fall. Det finnes i det hele tatt lite fagstoff på dette området, men slik vil det ikke være lenge.
Fra mennesker med førstehånds innsikt på dette område kommer en crowdsourcet bok, the Data Journalism Handbook. Dette prosjektet er godt i gang, mye er ferdig og du kan se innholdsfortegnelse og boken på ide-stadiet på Google docs. Se videoen for en introduksjon til prosjektet.
Facts are Sacred – the Power of Data ebook fra The Guardian er alt ute. Den kan kjøpes på diverse digitale plattformer, og gir innsikt i hvordan Guardian forholder seg til dette feltet. Boken inneholder mye info og eksempler fra Guardian, men er ikke en “slik gjør du det”-bok. Det er en “dette har vi gjort og lært”-bok.
I fysiske bokhyller finnes det også ting som er verdt å se på. Jeg mener at Philip Meyers “Precision Journalism” er minst like relevant i dag som da den først kom på 70-tallet. Mye av Meyers tankegods på metodesiden kan skrives om til kode – verktøy – og metode er essensen av algoritmer. På visualiseringsfronten er og blir Edward Tufte kongen, og bokens hans “The visual display of quantitative information” inneholder et avsnitt som forklarer at boken startet etter å ha undervist journalistikkstudenter i statistisk metode. Dette er en bok enhver journalist burde ha i prydutgave, den er like vakker som den er nyttig, klar og full av instruksjon.
For å holde deg oppdatert på denne fronten vil jeg anbefale RSS-feeden fra Edward Boraskys scoop.it og datadrivenjournalism.net.
Det mest spennende med dette området synes jeg er at det er så mye prøving og feiling på gang. Vi vet ikke helt hvordan dette skal gjøres, og fra redaksjon til redaksjon og prosjekt til prosjekt prøves ulike metoder og verktøy, med varierende resultat. Etter hvert kan vi håpe at det danner seg mønstre i alt kaoset, slik at metoder og verktøy får en naturlig plass i en fornuftig og effektiv arbeidsflyt. At jeg ikke har snakket om Excel som kongen av datajournalistikk er ikke fordi dette ikke er sant (en pågående studie på området kan tyde på at Excel er norske redaksjoners absolutt viktigste verktøy for databehandling), men fordi Excel allerede finnes i de fleste redaksjoner, det holdes kurs i dette og kompetansen på området finnes over alt. Excel er et flott verktøy, som kanskje bare bør brukes mer?
Hvilke verktøy bruker du til behandling, graving og presentasjon av data? Bruk kommentarfeltet, så lager vi en liste sammen!
Frister det med en måneds opphold hos Guardian? Eller rause pengepremier?
Brenner du inne med en knallgod journalistisk ide som innebærer bruk av datakilder? Da har du en uvanlig sjanse: Information.dk tar nå initiativet til konkurransen Nordisk Nyhedshacker, der førstepremien er en måneds opphold hos datajournalistikkpionerene i The Guardian i London. Oppholdet sponses med 20.000 kroner av Google.
Arrangørene definerer datajournalistikk vidt. Her er eksempler på formater som godtas:
Materialet må være nytt, det vil si laget etter april 2011. Frist for innsending: 20. april.
En annen og større konkurranse arrangeres av European Journalism Centre. International Data Journalism Awards utlyses for første gang, med innsendingsfrist 10. april. Det konkurreres i tre kategorier: Data-driven investigative journalism, Data visualisation & storytelling og Data-driven applications (mobile or web).
Førstepremien i hver kategori er på 7500 euro og deles ut i Paris 31. mai. Juryen ledes av redaktøren for ProPublica. Les mer på Open Knowledge Foundations blogg.
Helsingin Sanomat har også akkurat utlyst en egen konkurranse. Det originale konseptet her går ut på å produsere det de kaller “artikkel-apps”:
By article apps we mean applications that can be embedded into any web site in 560×400 pixel Iframe. An article app should visualize some interesting data, with the possibility of user interaction or of displaying data inputted by the users.
Også denne konkurransen er åpen for internasjonal deltakelse, og det er premier på 3000 euro.
Klima, økonomi, utvikling — Verdensbanken har dataene og deler dem ut.
“Vårt mål er åpne data, åpen kunnskap og åpne løsninger”, proklamerte Verdensbankens president Robert B. Zoellick i 2010. Organisasjonens nye giv innebærer å dele alle datakilder den samler inn. Det er ikke lite: fattigdom, utdanning, ulikhet, helse — kort sagt alle nøkkelindikatorene for utvikling.
Klimadata er også et stort satsingsområde. I en egen kunnskapsportal om klimaendringer samler Verdensbanken mange av de viktigste datakildene på feltet. Dataene kan visualiseres i kart og grafikk, og de er også tilgjengelig for nedlasting og viderebruk i tråd med prinsippene for åpne data. Verdensbanken ønsker å gjøre portalen til et komplett samling av data, verktøy og kunnskap om klima. Blant kommende tilbud er visualisering i høy oppløsning av klimaendringer og -konsekvenser, basert på en rekke ulike klimamodeller.
For utviklere og datajournalister tilbyr Verdensbanken API-er. De arrangerer også konkurranser med rause premier. Akkurat nå pågår Apps for Climate, der innleveringsfristen er 16. mars. Førstepremien er på 15.000 dollar.
I fjor var utvikling temaet for en apps-konkurranse. Blant vinnerne av Apps for development var visualiseringsverktøy, spillbaserte interaktive løsninger og en mobilapplikasjon med helseopplysninger beregnet på gravide.
Blogginnlegget er publisert i samarbeid med nettmagasinet Energi og Klima.
Hvor var G.I. Joe i perioden 1950-2005?
Medier i inn- og utland rapporterer i dag om den amerikanske forsvarsledelsens beslutning om å trekke ut to brigader fra den gjenværende styrken på 80.000 soldater stasjonert i Europa (mange medier skriver at to brigader er 7000 soldater, mens Washington Post sier det blir 10-15.000). USA ønsker å styrke nærværet i Asia/Stillehavet, samtidig som militærutgiftene må kuttes.
Basert på et datamateriale fra Heritage Foundation har Karl Sluis laget en fin interaktiv visualisering av det globale nærværet av amerikanske soldater i perioden 1950-2005. Visualiseringen fungerer best på visualizing.org, så klikk deg dit. Jeg likte bruken av piltaster for å bevege seg fra år til år, det gjør det lett å studere utviklingen i ro og mak. Merk omfanget av soldater i Europa under hele den kalde krigen.
Fordi dataene ikke er oppdatert etter 2005, får man ikke med den nylige uttrekningen av tropper fra Irak.
Datasettet kan lastes ned fra Heritage Foundations sider.
Mer demokrati: Lovende dugnadsprosjekt skal vise hva stortingsrepresentantene stemmer.
En av de mest opplagte og viktigste anvendelsene av offentlige data nærmer seg endelig. Får vi håpe. Lørdag arrangerer NUUG og Holder de ord en dugnad i Oslo med ambisiøs målsetting. Stortinget er i ferd med å åpne tilgangen til voteringsdata. NUUG/Holder de ord ønsker å “utvikle en prototype som tilgjengeliggjør dataene i åpent format og på en nettside.” Konkrete mål for dugnaden:
Jeg håper også medier og journalister biter seg merke i dette initiativet — og bidrar til det. Datajournalister bør gå på dugnaden, men like viktig: Redaksjoner må begynne å tenke på hvordan de selv kan bruke dataene til å styrke den politiske journalistikken.
Også i lokaldemokratiet har publisering og intelligent presentasjon av voteringsdata stort potensial, men i mange kommuner finnes rett og slett ikke dataene. Smart bruk av dataene fra Stortinget kan i neste runde forhåpentlig føre til at også kommunene og lokalmediene innser betydningen.
Forskningsprosjekt avdekker den reelle fordelingen av CO2-utslipp verden over.
Forskningsprosjektet “The Supply Chain of CO2 emissions” kobler data om utslipp fra fossile energikilder fordelt på land og regioner med data om verdenshandel og økonomi. Slik kan utslippskilder spores gjennom hele den globale forsyningskjeden. Det gjør det bl.a. mulig å se hvor i verden CO2 ble sluppet ut for å produsere de varer og tjenester som forbrukes i et bestemt land. En kan også gå et skritt til bakover i kjeden og se hvor det fossile brenselet som trengtes for å produsere de samme varene og tjenestene, stammer fra.
Bak prosjektet står forskere fra Carnegie Institution for Science og norske Cicero.
The Supply Chain of CO2 emissions:
Blogginnlegget ble først publisert i nettmagasinet Energi og Klima.
EU vil gjøre det lettere – og i de fleste tilfeller gratis – å gjenbruke offentlig sektors data.
Ved å åpne opp for økt gjenbruk av offentlige data kan EUs økonomi styrkes med 40 milliarder euro i året, mener EU-kommissær Neelie Kroes. Mandag la hun fram EU-kommisjonens nye strategi for åpne data, et område der reformer kan utløse ny og sårt tiltrengt økonomisk vekst i Europa.
En sentral del av den nye strategien er en revidering av direktivet om viderebruk av offentlig sektors informasjon (PSI). Direktivet er implementert i Norge, og endringene som nå foreslås vil også gjelde her.
En endring med potensielt store konsekvenser er at offentlige myndigheter bare skal kunne ta betaling tilsvarende marginalkostnaden for å levere ut data. I praksis vil dette si at tilgang til offentlige data i de fleste tilfeller blir gratis. Det er vanskelig å si nå om denne nye regelen vil føre til at Statens kartverk må frigi sine data — den evige konfliktsaken i norsk sammenheng. Direktivforslaget har et unntak for “eksepsjonelle tilfeller”, særlig der hvor myndighetsorganer genererer en “substansiell del” av sine driftsinntekter ved utnytting av opphavsrett.
Les hele innlegget »
Dataverksted, hackathon… Hva kan lages med offentlige data?
Sett av førstkommende fredag 2. desember hvis du bor i Bergen eller Oslo og er interessert i potensialet i offentlige data — om du nå er utvikler, journalister, designer, byråkrat eller noe annet. I begge byer arrangeres et juledataverksted eller hackathon eller hackday (kjært barn har osv…).
DIFI, Fornyingsdepartementet, MediArena og en bråte andre er med på å arrangere.
Også i fjor ble det arrangert slike verksteder. Jeg deltok på begge, og varianten i Bergen var mest vellykket av én veldig klar årsak: Deltakerne ble gitt definerte oppdrag om å lage noe ut av to utvalgte datasett. En slik innsnevring av materiale må til for å konsentrere kreativiteten i grupper når tiden man har til rådighet er så knapp. Resultatene ble da også imponerende.
I år får deltakerne i begge byer tilgang på enhetsregisteret fra Brønnøysund.
Arrangementene inngår i den internasjonale dagen for åpne data — sjekk Open Data Day.
OPPDATERING: Her er forslagene til applikasjoner og løsninger som ble produsert i løpet av dagen.
Åpne data gjør bistand mer åpen og effektiv, men Norge følger ikke opp internasjonalt samarbeid om standarder.
Norge kommer bare på 27. plass på en ny rangering av åpenhet om bistandsinformasjon laget av organisasjonen Publish What You Fund. Resultatet karakteriseres som “særlig skuffende”, fordi Norge er blant giverne av bistand som tradisjonelt er blitt oppfattet som ledende innen effektivitet og åpenhet.
Publish What You Fund-indeksen for 2011 toppes av Verdensbanken foran The Global Fund. Sverige kommer på sjetteplass og Danmark er nr. 8.
En viktig årsak til at Norge representert ved Norad scorer så lavt i forhold til nabolandene er den manglende oppfølgingen av det internasjonale initiativet om åpning av data om bistand (IATI). Felles standarder og regler for publisering av data i hele bistandens leveringskjede — fra den opprinnelige bevilgningen til ferdig prosjekt — utarbeides av IATI-sekretariatet. Målet er full sporbarhet av bistandsmidlene.
Norge sluttet seg til IATI fra starten i 2008, men følger ikke lenger opp arbeidet. IATI-sekretariatet i Storbritannia har tross purringer ikke fått noe svar på om eller når norske myndigheter vil implementere standardene.
IATI er sentralt i anbefalingene til norske myndigheter fra Publish What You Fund. “Norge bør lage en tidsplan for implementeringen og begynne å publisere informasjon gjennom IATI-registeret”, skriver organisasjonen. Registeret inneholder informasjon om alle datakilder som tilgjengeliggjøres i henhold til IATI-standarden.
Norge kritiseres også for manglende systematisk publisering av informasjon om landene som mottar bistand — det vil si landstrategier, budsjetter, evalueringer og resultater.
Les hele innlegget »
Last ned listene over alle kandidater som stiller til kommune- og fylkestingsvalget.
Valgkampen til lokalvalget 12. september er i gang. Noen av dagens saker i lokal- og riksmedier: 7 av 10 lokalpolitikere vil ha færre og større kommuner, ifølge en måling utført for Kommunal Rapport. Eiendomsskatt er tema også i valgkampen i Fet kommune. Folkeavstemningen om sammenslåing av Agder-fylkene dekkes av flere, her NRK.
På regjeringens valgportal er det publisert noen nøkkeldata om valget til kommunestyrer og fylkesting. Positivt er det at datakilder er lagt ut til nedlasting i regnearkformat:
Statistisk sentralbyrå har også data om kandidatene, og har sammenstilt ulike variabler (se temaside om valg). Mange er opptatt av ungdoms engasjement i politikken etter massakren på Utøya. Ser man på fordelingen av listekandidater til kommunestyrevalget i den yngste aldersgruppen 18-29 år, viser det seg faktisk at det er flest kandidater blant 19-åringene. Mannlige 19-åringer er den største enkeltgruppen. Last ned datasett (xls).
Mange flere datasett om valg og kandidater kan hentes ut fra SSBs statistikkbank.