– Vi kjente heilt frå starten at dette var ei oppgåve for oss i forskingsbiblioteka, seier Margaret Janz. Ho er bibliotekar ved Van Pelt Library, hovudbiblioteket ved Universitetet i Pennsylvania i USA. No sit ho på eit kontor i lag med kollegaene Laurie Allen og Kimberly Eke, og fortel via Skype om korleis dei hamna i sentrum av ei rørsle som jobbar med å «geriljalagre» offentlege forskingsdata.
Rørsla består av bibliotekarar, forskarar, it-folk og andre interesserte, og sidan november i fjor har dei frenetisk lasta ned og sikkerheitslagra datasett og annan informasjon frå nettsidene til føderale forskings- og forvaltingsorgan. Høgast prioritet har klima- og miljødata.
– Eigd av folket
– Det dreier seg om store datamengder som er produserte av institusjonar som ligg under styresmaktene, men som er eigd av folket. Dei finst berre digitalt, og det er opp til styresmaktene å sikre at dei er tilgjengelege for deg og meg. I realiteten er informasjonen prisgitt det gjeldande politiske klimaet, seier Janz.
Då Donald Trump vann presidentvalet i USA sist november, var det mange som brått vart urolege for dei store mengdene forskingsdata og annan informasjon knytt til klima og miljø, som låg spreidd på mange offentlege nettstader. Det var ikkje slik at ein frykta at informasjonen brått ville bli sletta. Slikt finst det lover mot. Men ein av dei få tinga Trump snakka systematisk om gjennom heile valkampen, var at han ville vengestekke det amerikanske miljødirektoratet EPA, og løyve mindre pengar til klimaforsking (denne lovnaden har han innfridd).
DataRefuge. DataRefuge sette straks i gang med såkalla databerging, der interesserte møttest for å peike ut viktige datasett og laste dei ned på sikre stader. Ei rekkje organisasjonar og institusjonar slutta seg til, nokre nystarta for føremålet, og mange databergingar gjekk av stabelen både i USA og i Canada i dei første hektiske månadane.
Det vart raskt klart at det å ta vare på informasjon som berre finst på nett, ikkje er enkelt. For det første finst det inga oversikt over kva data som finst der ute. Dessutan er informasjonen ofte ikkje spesielt godt organisert. Det er der bibliotekarane kjem inn.
– Særleg dei store forskingsbiblioteka, som oss, har lenge vore opptekne av desse problemstillingane. Etter kvart danna vi nettverket Libraries+, der vi prøver å finne løysingar for å handtere problemet i stor skala, og ikkje berre det som gjeld miljødata, men alle fagområde, fortel Laurie Allen, hovudbibliotekar med ansvar for digital forskingsstøtte, også ved Universitetet i Pennsylvania.
Var ikkje på radaren
Mange av reglane som gjeld det å ta vare på og tilgjengeleggjere offentleg informasjon, er laga for trykte medium og fungerer ikkje så godt i den digitale tidsalderen. Den nye politiske situasjonen avslørte mange mentale blindsonar.
– Vi trudde vi allereie gjorde mykje rett. Det blir til dømes arbeidd mykje med open tilgang til forsking, altså å få informasjonen ut på nett i det heile. Og ved forskingsbiblioteka har vi gjort mykje for å leggje til rette for våre eigne forskarar. Men dette enorme landskapet av offentleg informasjon som allereie ligg på nett, og som veldig mange menneske nyttar dagleg – det var ikkje på radaren, sjølv om problemet sjølvsagt har vore der heile tida. Presidentvalet vart ein augeopnar som gjorde folk merksame på problemet, seier Allen.
– Og kor store datamengder snakkar vi om?
– Ingen veit. Vi veit at det er snakk om mange petabyte. Kva heiter den tingen som kjem etter petabyte – exabyte? Eg vil tru det er nokre slike. Eitt av dei viktige spørsmåla er korleis vi avgjer kva som skal takast vare på. Prøver vi å spare på alt som nokon gong er blitt publisert, så løyser vi jo ikkje noko problem, tvert imot, seier Allen.
Må sikre truverdet
Eit anna problem er korleis ein kan vite at den informasjonen ein tek vare på, er identisk med originalen. I motsetnad til trykt informasjon, kan digital informasjon endrast med eit tastetrykk. Straks Trump overtok som president, vart til dømes nettsidene til EPA endra i påvente av at den nye politiske leiinga skulle avgjere kva informasjon dei ville presentere. Eit augeblikksbilete av nettsidene slik dei framsto før endringa, vart gjort tilgjengeleg på dei nye nettsidene, men i ettertid har det vist seg at ikkje all informasjonen på dei gamle nettsidene er inkludert i dette augeblikksbiletet, men er forsvunne. Slikt er vanskeleg å avsløre om ein ikkje har ein påliteleg original å samanlikne med.
– Kampen for open tilgang til forskingsdata har heile tida hatt som mål at alle skal kunne bruke datasetta til det dei vil. Men i så fall må ein jo også vere sikker på at dei er pålitelege. Det var forskarane som påpeikte dette problemet og sa at data må kunne siterast. Noko anna er at data kan vere veldig mykje forskjellig. Mange ser for seg vitskaplege data som lister med tal i eit stabilt format som lett kan delast, men eigentleg snakkar vi om all type informasjon på skjerm. Det kan like gjerne vere ei nettside som fortel skulelærarar om økologi, peikar Laurie Allen på.
Omgrepet «gerilja-arkivering» oppsto og vart raskt teke i bruk i samband med dei første organiserte databergingane etter valet. Men Kimberly Eke, avdelingsdirektør for lærings- og forskingsstøtte og den tredje rundt bordet, fortel at dei ser på seg sjølve først og fremst som bibliotekarar, ikkje som politiske aktivistar.
– Dette er rett og slett ting vi lenge har visst at vi må finne ut av, og no er vi i ein spesiell politisk situasjon der mange er interesserte i å involvere seg.
Aktivisme i arkivet
Når omstenda ligg til rette for det, kan det å ta vare på informasjon bli ei politisk opprørshandling.
For nokre år sidan var det mange som vart djupt rørde over å høyre om korleis bibliotekarar og lokale innbyggjarar i Timbuktu i Mali greidde å smugle ut store mengder uerstattelege mellomaldermanuskript og dermed hindre dei frå å bli øydelagte av islamistar. Takka vere innsatsen deira, kan dokumenta no bli digitaliserte og bevarte for ettertida.
Å lage arkiv og samle dokumentasjon har truleg alltid vore ein del av sosial og politisk aktivisme. Det omfattande arkivet etter den jødiske filosofen Edmund Husserl, som i dag finst i Leuven i Belgia, ville neppe ha eksistert om ikkje fransiskanarmunken Herman Van Breda hadde lukkast i å smugle det ut av Nazi-Tyskland i 1939. På same tid kunne ei stor mengde tyskspråklege sosialistiske tidsskrift, som vart øydelagde i Tyskland under andre verdskrigen, etterpå finnast att på «Det røde bibliotek» på Rjukan. Dei vart møysommeleg samla av Henrik J. Hjartøy, arbeidarpartimann og biblioteksjef frå 1917 til 1936, og finst i dag berre éin annan stad i verda, i nasjonalbiblioteket i Paris.
Utfordra majoritetskulturen
Andre halvdel av 1900-talet såg ei rekkje initiativ der til dømes kvinnerørsler, arbeidarrørsler og organisasjonar for homofile og lesbiske etablerte eigne arkiv som kunne fortelje om andre sider ved historia enn dei som vart fortalde i den dominerande kulturen. Slike arkiv kunne ha fleire føremål: Forstå historia betre, ta eigarskap til minne og identitet, eller avdekke maktmisbruk og urettvise. Uavhengigheit frå institusjonsarkiva var naudsynt i desse tilfella. Marginaliserte grupper kunne sjeldan lite på at institusjonane til majoritetssamfunnet vil ta tilfredsstillande vare på deira historie.
I seinare år har mange institusjonsarkiv fått meir inkluderande retningsliner, og det har igjen resultert i, til dømes, ulike dokumentasjonsprosjekt som har sprunge ut av «Black lives matter»-rørsla. Der går arkivarar, organisasjonar og vanlege borgarar saman om å dokumentere politivald mot svarte i USA.
Eit anna døme er «Skeivt arkiv», Noregs største samling dokument frå personar og organisasjonar relatert til «skeiv» historie, som no held hus ved Universitetsbiblioteket i Bergen.
Gerilja-arkiveringa i dagens USA skil seg frå mykje annan aktivist-arkivering ved at aktivistane ikkje er ute etter å fortelje nye historiar, men å bevare den etablerte. I lys av «postfaktasamfunnet» kan det å insistere på at vitskapleg informasjon er offentleg eigedom, like fullt oppfattast som politisk aktivisme.
– Liten grunn til uro i Noreg
Her til lands er offentleg digital informasjon meir truga av manglande systematikk, enn av politisk motivert historieforfalsking, meiner Herbjørn Andresen, førsteamanuensis ved Institutt for arkiv‑, bibliotek- og informasjonsfag ved Høgskolen i Oslo og Akershus..
– Den typen uro vi ser i USA, over at til dømes Environmental Protection Agency brått fjernar ein masse informasjon frå nettsidene sine, den er det førebels lite grunnlag for i Noreg, seier Andresen.
Han fortel at når det gjeld dokumentasjon av slikt som saksbehandling og korrespondanse, er det stort sett stødige system på plass i forvaltinga, og informasjonen er tilgjengeleg i den grad ein kan få dispensasjon frå reglane om personvern. Det vil ikkje seie at arkiveringa er feilfri, men det eksisterer planar og rutiner for å ta vare på informasjonen.
Systematikken manglar
– Nettsider er ei anna sak. Nasjonalbiblioteket «haustar» informasjon frå norske nettdomene, men vansken er å vite kva som vil vise seg å vere viktig i ettertid, seier Andresen.
Han nemner nettadressa pandemi.no som døme. Den vart oppretta av Helsedirektoratet i 2009 for å gje informasjon om svineinfluensaepidemien og massevaksineringa som styresmaktene sette i gang.
– I dag sender adressa deg til nettstaden til Folkehelseinstituttet. Men innhaldet på den opphavlege nettsida vart teke vare på for ettertida, på initiativ frå Riksarkivaren som såg på det som eit interessant historisk dokument. Ein systematisk gjennomgang av kva som blir publisert av offentlege verksemder, derimot, det manglar, seier han.
Prioriterer det nasjonalt viktige
Gretel Mari Braaten Westman er teamleiar for nettarkivet ved Nasjonalbiblioteket, som «haustar» informasjon frå norske nettstader. Ho seier at nettsider som tilhøyrer det offentlege heile tida har vore høgt prioritert.
– Vi har nokre seleksjonskriterium for kva vi hauster, til dømes hendingar av nasjonal viktigheit, slik som val, eller terroråtaket i 2011. Også kultur- og samfunnsliv skal dokumenterast, så vi haustar til dømes alt av nettaviser.
I januar 2016 kom lova om pliktavlevering til Nasjonalbiblioteket i ny utgåve. Den gjev Nasjonalbiblioteket rett til å samle inn informasjon som er allmennt tilgjengeleg på norske domene, utan å be om førehandsgodkjenning.
– Korleis kan de vite at de får med dykk det vesentlege?
– Vi er heldige i Noreg som har Brønnøysundregisteret, som er offentleg tilgjengeleg. Ein kan sortere verksemder på sektor og fange opp, til dømes, alt innanfor statleg sektor. Vi får også tips. Ved ei kommunesamanslåing nyleg, fekk vi tips om at nettsidene til dei to kommunane som skulle slåast i hop, ville bli erstatta av ei ny felles nettside frå ein viss dato. Dermed fekk vi tid til å ta vare på dei gamle. Slike endringar er det sjølvsagt veldig interessant for oss å vite om.