Gerilja-lagring: Bibliotek i USA slår ring om forskingsdata

I USA står forskingsbiblioteka i frontlina for ei rørsle som prøver å berge vitskaplege data frå ei politisk leiing som er fiendtleg innstilt til vitskap.

– Vi kjen­te heilt frå star­ten at det­te var ei opp­gå­ve for oss i fors­kings­bi­blio­te­ka, sei­er Mar­ga­ret Janz. Ho er biblio­te­kar ved Van Pelt Libra­ry, hovud­bi­blio­te­ket ved Uni­ver­si­te­tet i Penn­syl­va­nia i USA. No sit ho på eit kon­tor i lag med kol­le­ga­ene Lau­rie Allen og Kim­ber­ly Eke, og for­tel via Skype om kor­leis dei ham­na i sen­trum av ei rørs­le som job­bar med å «geriljalag­re» offent­le­ge fors­kings­data.

Rørs­la består av biblio­te­ka­rar, fors­ka­rar, it-folk og and­re inter­es­ser­te, og sidan novem­ber i fjor har dei fre­ne­tisk las­ta ned og sik­ker­heits­lag­ra data­sett og annan infor­ma­sjon frå nett­si­de­ne til føde­ra­le fors­kings- og for­val­tings­or­gan. Høgast prio­ri­tet har kli­ma- og miljø­data.

– Eigd av folket

– Det drei­er seg om sto­re data­meng­der som er pro­du­ser­te av insti­tu­sjo­nar som ligg under sty­res­mak­te­ne, men som er eigd av fol­ket. Dei finst ber­re digi­talt, og det er opp til sty­res­mak­te­ne å sik­re at dei er til­gjen­ge­le­ge for deg og meg. I rea­li­te­ten er infor­ma­sjo­nen pris­gitt det gjel­dan­de poli­tis­ke kli­ma­et, sei­er Janz.

Då Donald Trump vann pre­si­dent­va­let i USA sist novem­ber, var det man­ge som brått vart uro­le­ge for dei sto­re meng­de­ne fors­kings­data og annan infor­ma­sjon knytt til kli­ma og mil­jø, som låg spreidd på man­ge offent­le­ge nett­sta­der. Det var ikkje slik at ein fryk­ta at infor­ma­sjo­nen brått vil­le bli slet­ta. Slikt finst det lover mot. Men ein av dei få tin­ga Trump snak­ka sys­te­ma­tisk om gjen­nom hei­le val­kam­pen, var at han vil­le venge­stek­ke det ame­ri­kans­ke miljø­di­rek­to­ra­tet EPA, og løy­ve mind­re pen­gar til klima­fors­king (den­ne lov­na­den har han inn­fridd).

Fra stor pro­test­marsj mot Trumps forsk­nings­po­li­tikk i Wash­ing­ton DC 22. april 2017.

Data­Re­fu­ge. Data­Re­fu­ge set­te straks i gang med såkal­la data­ber­ging, der inter­es­ser­te møt­test for å pei­ke ut vik­ti­ge data­sett og las­te dei ned på sik­re sta­der. Ei rek­kje orga­ni­sa­sjo­nar og insti­tu­sjo­nar slut­ta seg til, nokre nystar­ta for føre­må­let, og man­ge data­ber­gin­gar gjekk av sta­be­len både i USA og i Cana­da i dei førs­te hek­tis­ke måna­da­ne.

Det vart raskt klart at det å ta vare på infor­ma­sjon som ber­re finst på nett, ikkje er enkelt. For det førs­te finst det inga over­sikt over kva data som finst der ute. Dess­utan er infor­ma­sjo­nen ofte ikkje spe­si­elt godt orga­ni­sert. Det er der biblio­te­ka­ra­ne kjem inn.

– Sær­leg dei sto­re fors­kings­bi­blio­te­ka, som oss, har len­ge vore opp­tek­ne av des­se pro­blem­stil­lin­ga­ne. Etter kvart dan­na vi nett­ver­ket Libra­ries+, der vi prø­ver å fin­ne løy­sin­gar for å hand­te­re pro­ble­met i stor ska­la, og ikkje ber­re det som gjeld miljø­data, men alle fag­om­rå­de, for­tel Lau­rie Allen, hovud­bi­blio­te­kar med ansvar for digi­tal fors­kings­støt­te, også ved Uni­ver­si­te­tet i Penn­syl­va­nia.

Var ikkje på radaren

Man­ge av reg­la­ne som gjeld det å ta vare på og til­gjen­ge­leg­gje­re offent­leg infor­ma­sjon, er laga for tryk­te medi­um og fun­ge­rer ikkje så godt i den digi­ta­le tids­al­de­ren. Den nye poli­tis­ke situa­sjo­nen avslør­te man­ge men­ta­le blind­sonar.

– Vi trud­de vi alle­reie gjor­de mykje rett. Det blir til dømes arbeidd mykje med open til­gang til fors­king, alt­så å få infor­ma­sjo­nen ut på nett i det hei­le. Og ved fors­kings­bi­blio­te­ka har vi gjort mykje for å leg­gje til ret­te for våre eig­ne fors­ka­rar. Men det­te enor­me land­ska­pet av offent­leg infor­ma­sjon som alle­reie ligg på nett, og som vel­dig man­ge men­nes­ke nyt­tar dag­leg – det var ikkje på rada­ren, sjølv om pro­ble­met sjølv­sagt har vore der hei­le tida. Pre­si­dent­va­let vart ein auge­op­nar som gjor­de folk merk­sa­me på pro­ble­met, sei­er Allen.

– Og kor sto­re data­meng­der snak­kar vi om?

– Ingen veit. Vi veit at det er snakk om man­ge peta­byte. Kva hei­ter den tin­gen som kjem etter peta­byte – exa­byte? Eg vil tru det er nokre sli­ke. Eitt av dei vik­ti­ge spørs­må­la er kor­leis vi avgjer kva som skal takast vare på. Prø­ver vi å spa­re på alt som nokon gong er blitt pub­li­sert, så løy­ser vi jo ikkje noko pro­blem, tvert imot, sei­er Allen.

Må sikre truverdet

Eit anna pro­blem er kor­leis ein kan vite at den infor­ma­sjo­nen ein tek vare på, er iden­tisk med ori­gi­na­len. I mot­set­nad til trykt infor­ma­sjon, kan digi­tal infor­ma­sjon end­rast med eit taste­trykk. Straks Trump over­tok som pre­si­dent, vart til dømes nett­si­de­ne til EPA end­ra i påven­te av at den nye poli­tis­ke lei­in­ga skul­le avgje­re kva infor­ma­sjon dei vil­le pre­sen­te­re. Eit auge­blikks­bi­le­te av nett­si­de­ne slik dei fram­sto før end­rin­ga, vart gjort til­gjen­ge­leg på dei nye nett­si­de­ne, men i etter­tid har det vist seg at ikkje all infor­ma­sjo­nen på dei gam­le nett­si­de­ne er inklu­dert i det­te auge­blikks­bi­le­tet, men er for­svun­ne. Slikt er vans­ke­leg å avslø­re om ein ikkje har ein påli­te­leg ori­gi­nal å saman­lik­ne med.

Pre­si­dent Donald Trump annon­se­rer at han vil trek­ke USA ut av Paris-avta­len. Rose­ha­gen ved Det hvi­te hus 1. juni 2017. (Foto: Det hvi­te hus/Joyce N. Bog­ho­si­an)

– Kam­pen for open til­gang til fors­kings­data har hei­le tida hatt som mål at alle skal kun­ne bru­ke data­set­ta til det dei vil. Men i så fall må ein jo også vere sik­ker på at dei er påli­te­le­ge. Det var fors­ka­ra­ne som påpeik­te det­te pro­ble­met og sa at data må kun­ne site­rast. Noko anna er at data kan vere vel­dig mykje for­skjel­lig. Man­ge ser for seg vit­skap­le­ge data som lis­ter med tal i eit sta­bilt for­mat som lett kan delast, men eigent­leg snak­kar vi om all type infor­ma­sjon på skjerm. Det kan like gjer­ne vere ei nett­side som for­tel skule­læ­ra­rar om øko­lo­gi, pei­kar Lau­rie Allen på.

Omgre­pet «geril­ja-arki­ve­ring» opp­sto og vart raskt teke i bruk i sam­band med dei førs­te orga­ni­ser­te data­ber­gin­ga­ne etter valet. Men Kim­ber­ly Eke, avde­lings­di­rek­tør for lærings- og fors­kings­støt­te og den tred­je rundt bor­det, for­tel at dei ser på seg sjøl­ve først og fremst som biblio­te­ka­rar, ikkje som poli­tis­ke akti­vis­tar.

– Det­te er rett og slett ting vi len­ge har visst at vi må fin­ne ut av, og no er vi i ein spe­si­ell poli­tisk situa­sjon der man­ge er inter­es­ser­te i å involve­re seg.

Aktivisme i arkivet

Når omsten­da ligg til ret­te for det, kan det å ta vare på infor­ma­sjon bli ei poli­tisk opp­rørs­hand­ling.

For nokre år sidan var det man­ge som vart djupt rør­de over å høy­re om kor­leis biblio­te­ka­rar og loka­le inn­byg­gja­rar i Tim­buk­tu i Mali greid­de å smug­le ut sto­re meng­der uer­stat­te­le­ge mel­lom­al­der­ma­nu­skript og der­med hind­re dei frå å bli øyde­lag­te av isla­mis­tar. Tak­ka vere inn­sat­sen dei­ra, kan doku­men­ta no bli digi­ta­li­ser­te og bevar­te for etter­tida.

Å lage arkiv og sam­le doku­men­ta­sjon har tru­leg all­tid vore ein del av sosi­al og poli­tisk akti­vis­me. Det omfat­tan­de arki­vet etter den jødis­ke filo­so­fen Edmund Hus­serl, som i dag finst i Leu­ven i Bel­gia, vil­le nep­pe ha eksis­tert om ikkje fran­sis­kan­ar­mun­ken Her­man Van Bre­da had­de luk­kast i å smug­le det ut av Nazi-Tysk­land i 1939. På same tid kun­ne ei stor meng­de tysk­språk­le­ge sosia­lis­tis­ke tids­skrift, som vart øyde­lag­de i Tysk­land under and­re verds­kri­gen, etter­på fin­nast att på «Det røde biblio­tek» på Rju­kan. Dei vart møy­som­me­leg sam­la av Hen­rik J. Hjartøy, arbei­dar­parti­mann og biblio­tek­sjef frå 1917 til 1936, og finst i dag ber­re éin annan stad i ver­da, i nasjo­nal­bi­blio­te­ket i Paris.

Utfordra majoritetskulturen

And­re halv­del av 1900-talet såg ei rek­kje ini­tia­tiv der til dømes kvinner­ørs­ler, arbei­dar­rørs­ler og orga­ni­sa­sjo­nar for homo­fi­le og les­bis­ke etab­ler­te eig­ne arkiv som kun­ne for­tel­je om and­re sider ved his­to­ria enn dei som vart for­tal­de i den domi­ne­ran­de kul­tu­ren. Sli­ke arkiv kun­ne ha flei­re føre­mål: For­stå his­to­ria betre, ta eigar­skap til min­ne og iden­ti­tet, eller avdek­ke makt­mis­bruk og urett­vi­se. Uav­hen­gig­heit frå insti­tu­sjons­ar­ki­va var naud­synt i des­se til­fel­la. Mar­gi­na­li­ser­te grup­per kun­ne sjel­dan lite på at insti­tu­sjo­na­ne til majo­ri­tets­sam­fun­net vil ta til­freds­stil­lan­de vare på dei­ra his­to­rie.

I sei­na­re år har man­ge insti­tu­sjons­ar­kiv fått meir inklu­de­ran­de ret­nings­li­ner, og det har igjen resul­tert i, til dømes, uli­ke doku­men­ta­sjons­pro­sjekt som har sprun­ge ut av «Black lives matter»-rørsla. Der går arki­va­rar, orga­ni­sa­sjo­nar og van­le­ge bor­ga­rar saman om å doku­men­te­re politi­vald mot svar­te i USA. 

Eit anna døme er «Skeivt arkiv», Noregs størs­te sam­ling doku­ment frå per­son­ar og orga­ni­sa­sjo­nar rela­tert til «skeiv» his­to­rie, som no held hus ved Uni­ver­si­tets­bi­blio­te­ket i Ber­gen.

Geril­ja-arki­ve­rin­ga i dagens USA skil seg frå mykje annan akti­vist-arki­ve­ring ved at akti­vis­ta­ne ikkje er ute etter å for­tel­je nye his­to­ri­ar, men å beva­re den etab­ler­te. I lys av «post­fakta­sam­fun­net» kan det å insis­te­re på at vit­skap­leg infor­ma­sjon er offent­leg eige­dom, like fullt opp­fat­tast som poli­tisk akti­vis­me.

– Liten grunn til uro i Noreg

Her til lands er offent­leg digi­tal infor­ma­sjon meir tru­ga av mang­lan­de sys­te­ma­tikk, enn av poli­tisk moti­vert his­to­rie­for­fals­king, mei­ner Her­bjørn And­re­sen, første­ama­nu­en­sis ved Insti­tutt for arkiv-, biblio­tek- og infor­ma­sjons­fag ved Høg­sko­len i Oslo og Akers­hus..

– Den typen uro vi ser i USA, over at til dømes Environ­men­tal Pro­tec­tion Agency brått fjer­nar ein mas­se infor­ma­sjon frå nett­si­de­ne sine, den er det føre­bels lite grunn­lag for i Noreg, sei­er And­re­sen.

Han for­tel at når det gjeld doku­men­ta­sjon av slikt som saks­be­hand­ling og kor­re­spon­dan­se, er det stort sett stø­di­ge sys­tem på plass i for­val­tin­ga, og infor­ma­sjo­nen er til­gjen­ge­leg i den grad ein kan få dis­pen­sa­sjon frå reg­la­ne om per­son­vern. Det vil ikkje seie at arki­ve­rin­ga er feil­fri, men det eksis­te­rer pla­nar og ruti­ner for å ta vare på infor­ma­sjo­nen.

Systematikken manglar

– Nett­si­der er ei anna sak. Nasjo­nal­bi­blio­te­ket «haus­tar» infor­ma­sjon frå nors­ke nett­do­me­ne, men vans­ken er å vite kva som vil vise seg å vere vik­tig i etter­tid, sei­er And­re­sen.

Han nem­ner nett­adres­sa pandemi.no som døme. Den vart opp­ret­ta av Helse­di­rek­to­ra­tet i 2009 for å gje infor­ma­sjon om svine­in­flu­ensa­epi­de­mi­en og masse­vak­si­ne­rin­ga som sty­res­mak­te­ne set­te i gang.

– I dag sen­der adres­sa deg til nett­sta­den til Folke­helse­in­sti­tut­tet. Men inn­hal­det på den opp­hav­le­ge nett­sida vart teke vare på for etter­tida, på ini­tia­tiv frå Riks­ar­ki­va­ren som såg på det som eit inter­es­sant his­to­risk doku­ment. Ein sys­te­ma­tisk gjen­nom­gang av kva som blir pub­li­sert av offent­le­ge verk­sem­der, der­imot, det mang­lar, sei­er han.

Prioriterer det nasjonalt viktige

Gre­tel Mari Braa­ten West­man er team­lei­ar for nett­ar­ki­vet ved Nasjo­nal­bi­blio­te­ket, som «haus­tar» infor­ma­sjon frå nors­ke nett­sta­der. Ho sei­er at nett­si­der som til­høy­rer det offent­le­ge hei­le tida har vore høgt prio­ri­tert.

– Vi har nokre selek­sjons­kri­te­ri­um for kva vi haus­ter, til dømes hen­din­gar av nasjo­nal vik­tig­heit, slik som val, eller ter­rorå­ta­ket i 2011. Også kul­tur- og sam­funns­liv skal doku­men­te­rast, så vi haus­tar til dømes alt av nett­avi­ser.

I janu­ar 2016 kom lova om plikt­av­le­ve­ring til Nasjo­nal­bi­blio­te­ket i ny utgå­ve. Den gjev Nasjo­nal­bi­blio­te­ket rett til å sam­le inn infor­ma­sjon som er all­mennt til­gjen­ge­leg på nors­ke dome­ne, utan å be om føre­hands­god­kjen­ning.

– Kor­leis kan de vite at de får med dykk det vesent­le­ge?

– Vi er hel­di­ge i Noreg som har Brønn­øy­sund­re­gis­te­ret, som er offent­leg til­gjen­ge­leg. Ein kan sor­te­re verk­sem­der på sek­tor og fan­ge opp, til dømes, alt innan­for stat­leg sek­tor. Vi får også tips. Ved ei kom­mune­sa­man­slå­ing nyleg, fekk vi tips om at nett­si­de­ne til dei to kom­mu­na­ne som skul­le slå­ast i hop, vil­le bli erstat­ta av ei ny fel­les nett­side frå ein viss dato. Der­med fekk vi tid til å ta vare på dei gam­le. Sli­ke end­rin­gar er det sjølv­sagt vel­dig inter­es­sant for oss å vite om.

TEMA

F

orsknin
gsdata

7 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

INGEN KOMMENTARER

KOMMENTÉR

Skriv en kommentar

Bidra til god debatt - skriv under fullt navn. Se våre kommentarregler.

Abonner på kommentarer
til toppen