Gerilja-lagring: Bibliotek i USA slår ring om forskingsdata

I USA står forskingsbiblioteka i frontlina for ei rørsle som prøver å berge vitskaplege data frå ei politisk leiing som er fiendtleg innstilt til vitskap.

– Vi kjente heilt frå starten at dette var ei oppgåve for oss i forsk­ings­bib­liote­ka, seier Mar­garet Janz. Ho er bib­liotekar ved Van Pelt Library, hov­ud­bib­lioteket ved Uni­ver­sitetet i Penn­syl­va­nia i USA. No sit ho på eit kon­tor i lag med kol­le­gaene Lau­rie Allen og Kim­ber­ly Eke, og for­tel via Skype om kor­leis dei ham­na i sen­trum av ei rørsle som job­bar med å «ger­il­jala­gre» offentlege forskingsdata.

Rørsla består av bib­liotekarar, forskarar, it-folk og andre inter­esserte, og sidan novem­ber i fjor har dei frenetisk las­ta ned og sikker­heit­sla­gra datasett og annan infor­masjon frå nettsi­dene til føderale forsk­ings- og for­valt­ing­sor­gan. Høgast pri­or­itet har kli­ma- og miljødata.

– Eigd av folket

– Det dreier seg om store data­mengder som er pro­duserte av insti­tusjonar som ligg under styres­mak­tene, men som er eigd av folket. Dei finst berre dig­i­talt, og det er opp til styres­mak­tene å sikre at dei er tilgjen­gelege for deg og meg. I realiteten er infor­masjo­nen pris­gitt det gjel­dande poli­tiske kli­maet, seier Janz.

Då Don­ald Trump vann pres­i­dent­valet i USA sist novem­ber, var det mange som brått vart urolege for dei store meng­dene forsk­ings­da­ta og annan infor­masjon knytt til kli­ma og miljø, som låg sprei­dd på mange offentlege nettstad­er. Det var ikkje slik at ein fryk­ta at infor­masjo­nen brått ville bli slet­ta. Slikt finst det lover mot. Men ein av dei få tin­ga Trump snakka sys­tem­a­tisk om gjen­nom heile valkam­p­en, var at han ville vengestekke det amerikanske miljødi­rek­toratet EPA, og løyve min­dre pen­gar til kli­maforsk­ing (denne lov­naden har han inn­fridd).

Fra stor protest­marsj mot Trumps forskn­ingspoli­tikk i Wash­ing­ton DC 22. april 2017.

DataRefuge. DataRefuge sette straks i gang med såkalla data­berg­ing, der inter­esserte møttest for å peike ut vik­tige datasett og laste dei ned på sikre stad­er. Ei rekkje organ­isas­jonar og insti­tusjonar slut­ta seg til, nokre nys­tar­ta for føremålet, og mange data­bergin­gar gjekk av sta­be­len både i USA og i Cana­da i dei første hek­tiske månadane.

Det vart raskt klart at det å ta vare på infor­masjon som berre finst på nett, ikkje er enkelt. For det første finst det inga over­sikt over kva data som finst der ute. Dessu­tan er infor­masjo­nen ofte ikkje spe­sielt godt organ­is­ert. Det er der bib­liotekarane kjem inn.

– Sær­leg dei store forsk­ings­bib­liote­ka, som oss, har lenge vore opptekne av desse prob­lem­still­ingane. Etter kvart dan­na vi nettver­ket Libraries+, der vi prøver å finne løysin­gar for å handtere prob­lemet i stor skala, og ikkje berre det som gjeld miljø­da­ta, men alle fagom­råde, for­tel Lau­rie Allen, hov­ud­bib­liotekar med ans­var for dig­i­tal forsk­ingsstøtte, også ved Uni­ver­sitetet i Pennsylvania.

Var ikkje på radaren

Mange av reglane som gjeld det å ta vare på og tilgjen­ge­leg­gjere offent­leg infor­masjon, er laga for tryk­te medi­um og fun­ger­er ikkje så godt i den dig­i­tale tid­salderen. Den nye poli­tiske situ­asjo­nen avs­lørte mange men­tale blindsonar.

– Vi trud­de vi allereie gjorde myk­je rett. Det blir til dømes arbei­dd myk­je med open til­gang til forsk­ing, alt­så å få infor­masjo­nen ut på nett i det heile. Og ved forsk­ings­bib­liote­ka har vi gjort myk­je for å leg­gje til rette for våre eigne forskarar. Men dette enorme land­skapet av offent­leg infor­masjon som allereie ligg på nett, og som veldig mange men­neske nyt­tar dag­leg – det var ikkje på radaren, sjølv om prob­lemet sjølvsagt har vore der heile tida. Pres­i­dent­valet vart ein augeop­nar som gjorde folk merk­same på prob­lemet, seier Allen.

– Og kor store data­mengder snakkar vi om?

– Ingen veit. Vi veit at det er snakk om mange petabyte. Kva heit­er den tin­gen som kjem etter petabyte – exabyte? Eg vil tru det er nokre slike. Eitt av dei vik­tige spørsmåla er kor­leis vi avg­jer kva som skal takast vare på. Prøver vi å spare på alt som nokon gong er blitt pub­lis­ert, så løyser vi jo ikkje noko prob­lem, tvert imot, seier Allen.

Må sikre truverdet

Eit anna prob­lem er kor­leis ein kan vite at den infor­masjo­nen ein tek vare på, er iden­tisk med orig­i­nalen. I mot­set­nad til trykt infor­masjon, kan dig­i­tal infor­masjon endrast med eit tastetrykk. Straks Trump over­tok som pres­i­dent, vart til dømes nettsi­dene til EPA endra i påvente av at den nye poli­tiske lei­in­ga skulle avg­jere kva infor­masjon dei ville pre­sen­tere. Eit auge­b­likks­bilete av nettsi­dene slik dei fram­sto før endringa, vart gjort tilgjen­ge­leg på dei nye nettsi­dene, men i etter­tid har det vist seg at ikkje all infor­masjo­nen på dei gam­le nettsi­dene er inklud­ert i dette auge­b­likks­biletet, men er forsvunne. Slikt er vanske­leg å avs­løre om ein ikkje har ein pålite­leg orig­i­nal å saman­likne med.

Pres­i­dent Don­ald Trump annon­ser­er at han vil trekke USA ut av Paris-avtal­en. Rose­ha­gen ved Det hvite hus 1. juni 2017. (Foto: Det hvite hus/Joyce N. Boghosian)

– Kam­p­en for open til­gang til forsk­ings­da­ta har heile tida hatt som mål at alle skal kunne bruke dataset­ta til det dei vil. Men i så fall må ein jo også vere sikker på at dei er pålitelege. Det var forskarane som påpeik­te dette prob­lemet og sa at data må kunne sit­erast. Noko anna er at data kan vere veldig myk­je forskjel­lig. Mange ser for seg vit­skaplege data som lis­ter med tal i eit sta­bilt for­mat som lett kan delast, men eigent­leg snakkar vi om all type infor­masjon på skjerm. Det kan like gjerne vere ei nett­side som for­tel skulelærarar om økolo­gi, peikar Lau­rie Allen på.

Omgrepet «ger­il­ja-arkiver­ing» opp­sto og vart raskt teke i bruk i sam­band med dei første organ­is­erte data­bergin­gane etter valet. Men Kim­ber­ly Eke, avdel­ings­di­rek­tør for lærings- og forsk­ingsstøtte og den tred­je rundt bor­det, for­tel at dei ser på seg sjølve først og fremst som bib­liotekarar, ikkje som poli­tiske aktivistar.

– Dette er rett og slett ting vi lenge har visst at vi må finne ut av, og no er vi i ein spe­siell poli­tisk situ­asjon der mange er inter­esserte i å invol­vere seg.

Aktivisme i arkivet

Når oms­ten­da ligg til rette for det, kan det å ta vare på infor­masjon bli ei poli­tisk opprørshandling.

For nokre år sidan var det mange som vart djupt rørde over å høyre om kor­leis bib­liotekarar og lokale innbyg­g­jarar i Tim­buk­tu i Mali grei­d­de å smu­gle ut store mengder uer­stat­telege mel­loma­l­der­manuskript og dermed hin­dre dei frå å bli øyde­lagte av islamis­tar. Tak­ka vere innsat­sen deira, kan doku­men­ta no bli dig­i­talis­erte og bevarte for ettertida.

Å lage arkiv og sam­le doku­men­tasjon har tru­leg alltid vore ein del av sosial og poli­tisk aktivisme. Det omfat­tande arkivet etter den jødiske filosofen Edmund Husserl, som i dag finst i Leu­ven i Bel­gia, ville neppe ha eksis­tert om ikkje fran­siska­n­ar­munken Her­man Van Bre­da hadde lukkast i å smu­gle det ut av Nazi-Tysk­land i 1939. På same tid kunne ei stor mengde tyskspråk­lege sosial­is­tiske tidsskrift, som vart øyde­lagde i Tysk­land under andre verd­skri­gen, etter­på finnast att på «Det røde bib­liotek» på Rjukan. Dei vart møysom­me­leg sam­la av Hen­rik J. Hjartøy, arbei­darpar­ti­mann og bib­liotek­sjef frå 1917 til 1936, og finst i dag berre éin annan stad i ver­da, i nasjon­al­bib­lioteket i Paris.

Utfordra majoritetskulturen

Andre halvdel av 1900-talet såg ei rekkje ini­tia­tiv der til dømes kvin­nerørsler, arbei­dar­rørsler og organ­isas­jonar for homofile og les­biske etablerte eigne arkiv som kunne fortel­je om andre sider ved his­to­ria enn dei som vart for­t­alde i den dominerande kul­turen. Slike arkiv kunne ha fleire føremål: Forstå his­to­ria betre, ta eigarskap til minne og iden­titet, eller avdekke mak­t­mis­bruk og urettvise. Uavhengigheit frå insti­tusjon­sarki­va var naudsynt i desse til­fel­la. Mar­gin­alis­erte grup­per kunne sjel­dan lite på at insti­tusjo­nane til majoritetssam­fun­net vil ta til­fredsstil­lande vare på deira historie. 

I seinare år har mange insti­tusjon­sarkiv fått meir inkluderande ret­ningslin­er, og det har igjen resul­tert i, til dømes, ulike doku­men­tasjon­spros­jekt som har sprunge ut av «Black lives matter»-rørsla. Der går arki­varar, organ­isas­jonar og van­lege bor­garar saman om å doku­mentere poli­ti­vald mot svarte i USA. 

Eit anna døme er «Skeivt arkiv», Noregs største sam­ling doku­ment frå per­son­ar og organ­isas­jonar relatert til «skeiv» his­to­rie, som no held hus ved Uni­ver­sitets­bib­lioteket i Bergen.

Ger­il­ja-arkiveringa i dagens USA skil seg frå myk­je annan aktivist-arkiver­ing ved at aktivis­tane ikkje er ute etter å fortel­je nye his­to­ri­ar, men å bevare den etablerte. I lys av «post­fak­tasam­fun­net» kan det å insis­tere på at vit­skap­leg infor­masjon er offent­leg eige­dom, like fullt opp­fat­tast som poli­tisk aktivisme.

– Liten grunn til uro i Noreg

Her til lands er offent­leg dig­i­tal infor­masjon meir tru­ga av mang­lande sys­tem­atikk, enn av poli­tisk motivert his­to­riefor­fal­sk­ing, mein­er Her­b­jørn Andresen, førstea­manu­en­sis ved Insti­tutt for arkiv‑, bib­liotek- og infor­masjonsfag ved Høgskolen i Oslo og Akershus..

– Den typen uro vi ser i USA, over at til dømes Envi­ron­men­tal Pro­tec­tion Agency brått fjernar ein masse infor­masjon frå nettsi­dene sine, den er det førebels lite grunnlag for i Noreg, seier Andresen.

Han for­tel at når det gjeld doku­men­tasjon av slikt som saks­be­han­dling og kor­re­spon­danse, er det stort sett stødi­ge sys­tem på plass i for­valtin­ga, og infor­masjo­nen er tilgjen­ge­leg i den grad ein kan få dis­pen­sasjon frå reglane om per­son­vern. Det vil ikkje seie at arkiveringa er feil­fri, men det eksis­ter­er pla­nar og ruti­n­er for å ta vare på informasjonen.

Systematikken manglar

– Nettsider er ei anna sak. Nasjon­al­bib­lioteket «haus­tar» infor­masjon frå norske nettdomene, men vansken er å vite kva som vil vise seg å vere vik­tig i etter­tid, seier Andresen.

Han nem­n­er net­tadres­sa pandemi.no som døme. Den vart oppret­ta av Helsedi­rek­toratet i 2009 for å gje infor­masjon om svine­in­flu­en­saepi­demien og mas­se­vaksiner­inga som styres­mak­tene sette i gang.

– I dag sender adres­sa deg til nettstaden til Folke­hel­se­in­sti­tut­tet. Men innhaldet på den opphavlege nettsi­da vart teke vare på for etter­ti­da, på ini­tia­tiv frå Rik­sarki­varen som såg på det som eit inter­es­sant his­torisk doku­ment. Ein sys­tem­a­tisk gjen­nom­gang av kva som blir pub­lis­ert av offentlege verk­semder, der­i­mot, det manglar, seier han.

Prioriterer det nasjonalt viktige

Gre­tel Mari Braat­en West­man er team­leiar for net­tarkivet ved Nasjon­al­bib­lioteket, som «haus­tar» infor­masjon frå norske nettstad­er. Ho seier at nettsider som tilhøyr­er det offentlege heile tida har vore høgt prioritert.

– Vi har nokre selek­sjon­skri­teri­um for kva vi hauster, til dømes hendin­gar av nasjon­al vik­tigheit, slik som val, eller ter­rorå­taket i 2011. Også kul­tur- og sam­funnsliv skal doku­menterast, så vi haus­tar til dømes alt av nettaviser.

I jan­u­ar 2016 kom lova om plik­tavlev­er­ing til Nasjon­al­bib­lioteket i ny utgåve. Den gjev Nasjon­al­bib­lioteket rett til å sam­le inn infor­masjon som er all­men­nt tilgjen­ge­leg på norske domene, utan å be om førehandsgodkjenning.

– Kor­leis kan de vite at de får med dykk det vesentlege?

– Vi er heldige i Noreg som har Brøn­nøy­sun­dreg­is­teret, som er offent­leg tilgjen­ge­leg. Ein kan sortere verk­semder på sek­tor og fange opp, til dømes, alt innan­for stat­leg sek­tor. Vi får også tips. Ved ei kom­mune­samanslåing nyleg, fekk vi tips om at nettsi­dene til dei to kom­mu­nane som skulle slåast i hop, ville bli erstat­ta av ei ny felles nett­side frå ein viss dato. Dermed fekk vi tid til å ta vare på dei gam­le. Slike endringar er det sjølvsagt veldig inter­es­sant for oss å vite om.

TEMA

F

orsknin
gsdata

7 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

INGEN KOMMENTARER

Kommentarfeltet til denne artikkelen er nå stengt. Ta kontakt med redaksjonen dersom du har synspunkter på artikkelen.

til toppen