Sherlocks første lov om åpne data

Forskere har noe å lære av mesterdetektiven.

Data­enes påli­te­lig­het og gyl­dig­het skal kun­ne etter­prø­ves. Det er noe av det førs­te stu­den­ter lærer på uni­ver­si­te­te­nes meto­de­kurs. Men hvor ofte skjer det egent­lig at forsk­nings­re­sul­ta­ter etter­prø­ves med den nød­ven­di­ge nid­kjær­he­ten? Tid­li­ge­re i år kom det et eksem­pel som bør bli et lære­styk­ke for enhver fors­ker: Dok­tor­grads­stu­den­ten Tho­mas Hern­dons gransk­ning av øko­nom-stjer­ne­ne Car­men Rein­hart og Ken­neth Rogoff.

Rein­hart og Rogoff la i 2010 fram en stu­die av for­hol­det mel­lom stats­gjeld og øko­no­misk vekst, «Growth in a Time of Debt». De fant en sam­men­heng: Når et lands gjeld over­skri­der 90 pro­sent av BNP, stop­per øko­no­mi­en å vokse. Resul­ta­tet fikk mye mer opp­merk­som­het enn van­lig er for forsk­nings­ar­bei­der. Poli­ti­ker­ne som for­søk­te å få grep på stats­gjelds­kri­sen i Euro­pa had­de ende­lig et auto­ri­ta­tivt tall å klam­re seg til. 90 pro­sent — en vann­tett fag­lig begrun­nel­se for spare­po­li­tik­ken, fra to av ver­dens frems­te øko­no­mer!

Som­mer­en og høs­ten 2012 stre­ver Tho­mas Hern­don med Rein­hart og Rogoffs ana­ly­se. Han har las­tet ned data­ene, et regne­ark for­fat­ter­ne for­tjenst­fullt nok har gjort til­gjen­ge­lig. Hern­don vil skri­ve om artik­ke­len i en semi­nar­opp­ga­ve, men kla­rer ikke å repro­du­se­re 90 pro­sent-ters­ke­len. I febru­ar i år skri­ver han en e‑post til Rein­hart og Rogoff og ber om å få se utreg­nin­ge­ne deres også. Han får mate­ria­let, og opp­da­ger kjapt fle­re enk­le feil. Han reg­ner og reg­ner. 90 pro­sent-ters­ke­len for­svin­ner. Res­ten er, som det heter, his­to­rie.

Sherlock-skulptur i Meiringen, Sveits (foto: David Jones, CC:by)

Sher­lock-skulp­tur i Mei­rin­gen, Sveits (foto: David Jones, CC:by)

Hva det­te har med Sher­lock Hol­mes å gjø­re? Fle­re ste­der i Conan Doy­les his­to­ri­er adva­rer mes­ter­de­tek­ti­ven mot å trek­ke slut­nin­ger før alle data er vur­dert. I «A Study in Scar­let», for eksem­pel. Dr. Wat­son, jeg-for­tel­le­ren, er mis­for­nøyd med fram­drif­ten i etter­forsk­nin­gen. Hol­mes pra­ter i vei om fio­li­ner:

«You don’t seem to give much thought to the mat­ter in hand,» I said at last, inter­rup­ting Hol­mes’ musi­cal disqui­sition.
«No data yet,» he answe­red. «It is a capi­tal mis­ta­ke to the­orize before you have all the evi­den­ce. It bia­ses the judgment.»

Sann­he­ten om Rein­hart og Rogoffs regne­feil kom for en dag først da alle data­ene var på plass i Hern­dons data­ma­skin. I mel­lom­ti­den had­de det fore­gått mye «teo­re­ti­se­ring uten alt bevis­ma­te­ria­le». Det er all grunn til å tro at det er man­ge and­re forsk­nings­re­sul­ta­ter som bur­de lidt sam­me skjeb­ne som 90 pro­sent-tesen. Rein­hart og Rogoff had­de jo til og med gjort data til­gjen­ge­lig, om enn ikke kom­plett. Hva så med data som man ikke en gang får tak i for­di de lig­ger på fors­ke­rens PC eller i en skuff?

Fors­ker­mil­jø­er stre­ver ennå med data-åpning. Løs­nin­gen er snub­len­de nær — pub­li­se­ring av data må gjø­res til en betin­gel­se for finan­sie­ring av et forsk­nings­pro­sjekt. I til­legg trengs det for­nuf­ti­ge reg­ler for hånd­te­ring og en god infra­struk­tur for opp­be­va­ring av data­ene. Tenk også på sam­fun­net uten­for fors­ker­ver­de­nen: Til­gang til data bak forsk­nin­gen bør ikke være for­be­holdt fors­ke­re (med de nød­ven­di­ge for­be­hold for å sik­re per­son­ver­net der­som data­ene inne­hol­der per­son­opp­lys­nin­ger).

En opp­munt­ring til slutt: Den som offent­lig­gjør data, får også stør­re gjen­nom­slag i fors­ker­sam­fun­net, det vil si fle­re site­rin­ger. Det viser en stu­die (på fag­fel­tet gen­etikk) som sam­men­lig­ner forsk­nings­ar­tik­ler der data er gjort til­gjen­ge­lig med til­sva­ren­de artik­ler uten åpent data­ma­te­ria­le.

TEMA

Å

pne dat
a

25 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

INGEN KOMMENTARER

Kommentarfeltet til denne artikkelen er nå stengt. Ta kontakt med redaksjonen dersom du har synspunkter på artikkelen.

til toppen