Read the English version of this article.
Frisk morgenluft møter deg når du stiger av nattoget og ut på perrongen på jernbanestasjonen. Det er første gang du er der, og du er litt desorientert. I hvilken retning ligger utgangen? Instinktet ditt er å ta samme vei som flesteparten av folkene som forlater toget sammen med deg. Suksess! Men virker denne strategien for å finne sannheten alltid like godt? Vi ser ut til å være veldig glad i den, ikke bare på jernbanestasjoner, men også når vi velger regjering.
Demokrati kommer fra det greske ordet Demokratia som betyr “styre ved folket”. Implisitt forbinder vi demokrati med ærlighet og rettferdighet. Vi tolker “styre ved folket” som å styre i tråd med det mest alminnelige individuelle valg. Denne ideen om at det som i alminnelighet regnes som sant, mest sannsynlig er sant, er ikke uten vitenskapelig basis, men bare hvis bestemte vilkår overholdes.
Bør du søke etter sannheten bak nyhetene ved å sjekke hvilke artikler med vurderinger av aktuelle hendelser som deles hyppigst av dine Facebook-venner? Vi kan komme nærmere et svar på dette i et lite, men innflytelsesrikt verk kjent som Condorcets juryteorem.
Condorcets juryteorem: Vilkår og betingelser
Marquis de Condorcet var en fransk filosof og matematiker som levde på det sene 1700-tallet; han var aktiv innen tidlig statsvitenskap. Condorcet levde på samme tid som, og var venn med, Leonhard Euler og Benjamin Franklin, han var abolisjonist (motstander av slaveriet) og en tidlig forsvarer av menneskerettigheter og like rettigheter for kvinner og fargede.
Condorcet var en av de første til å ta i bruk matematikk i samfunnsvitenskapene. Han er mest kjent for sitt arbeid knyttet til flertallsbeslutninger eller ‑votering.
Flertallsvotering, eller flertallsstyre (majority rule), er en kollektiv beslutningsmetode som velger ut det alternativet som får et flertall av stemmene. Prinsippet er intuitivt enkelt, men det kan operasjonaliseres med ulike matematiske funksjoner hvis det er mer enn to alternativer å velge blant eller et likt antall personer kan stemme. Condorcets Essay on the Application of Analysis to the Probability of Majority Decisions ga to resultater som vi fortsatt diskuterer og bruker i dag – Condorcets metode for flertallsbeslutninger og Condorcets juryteorem.
I sitt juryteorem identifiserer Condorcet hvor godt egnet flertallsbeslutningen er til å finne frem til det riktige — sanne — svaret på et ja-nei-spørsmål. La oss si at det dreier seg om et ukjent faktum om verden, som for eksempel om været vil bli fint i morgen, eller om det finnes intelligent liv i universet utenfor vårt solsystem. Sannheten om disse faktaene finnes, men er av ulike årsaker ikke tilgjengelig for oss, eller for øyeblikket ikke tilgjengelig.
Condorcet beviste at hvis vi spør et tilstrekkelig stort antall mennesker et binært spørsmål — hvis vi ber dem si at ja, været blir fint i morgen, eller nei, det blir ikke fint – da er det svaret som gis av flertallet som har høyest sannsynlighet for å være riktig. Videre er det slik at jo flere vi spør, jo større er sannsynligheten for at flertallet vil “finne” sannheten.
Imidlertid er det bare når visse betingelser er oppfylt at teoremet gjelder. Og disse betingelsene er temmelig strenge.
Den første, implisitte betingelsen er at vi forsøker å komme frem til sannheten om ett spørsmål, ikke flere spørsmål samtidig som kanskje er relatert til hverandre.
Den andre, temmelig opplagte betingelsen er at spørsmålet vårt må være slik (kalt verdidom i litteraturen, se Rabinowicz 2016) at det forutsetter at det finnes et sant svar. Ikke alle spørsmål godtar verdidommer som svar; noen spørsmål gjelder preferanser. Hvis du og jeg vurderer om vi har lyst til å spise salat eller pasta til middag, er det et spørsmål om preferanse. Jeg foretrekker kanskje salat, du foretrekker pasta, og ingen av oss tar feil. Men hvis vi diskuterer hvilken av disse rettene som er best for helsen, ville vi felle en verdidom. Hvis jeg mener at salat er sunnere, og du mener pasta, da må en av oss ta feil. Det er ikke logisk inkonsistent hvis jeg vet at salat er bedre for helsen, men likevel foretrekker å spise pasta. Siden det ikke eksisterer en sannhet når en vurderer preferanser, kan ingen sannhet finnes.
Den tredje betingelsen som må være oppfylt for at Condorcets teorem skal gjelde, er at kildene til verdidommene må være eksperter. Heldigvis er definisjonen av ekspert temmelig løs i matematikk og økonomi. En ekspert defineres som en person som kan gjette bedre enn et myntkast. Eller formelt: En ekspert er en person som har en høyere sannsynlighet enn 50 prosent for å gi et riktig svar på et ja-nei-spørsmål. Hvis jeg prøver å bestemme meg for om jeg skal gå til venstre eller høyre, og kaster en mynt 100 ganger, er det ikke garantert at det er riktig å gå til venstre selv om 80 av myntkastene gir dette svaret. I dette tilfellet, hvis påliteligheten til kildene er mindre enn 50 prosent, er det bedre å velge en tilfeldig kilde og spørre om vedkommendes avgjørelse, enn å stole på flertallsbeslutningen.
Den fjerde og strengeste betingelsen for å bruke Condorcets juryteorem, gjelder den statistiske uavhengigheten mellom kildene. To kilder er statistisk uavhengig av hverandre hvis det binære svaret (ja eller nei) fra en av kildene ikke påvirker sannsynligheten for om den andre kilden ville svare ja (eller nei) på det samme spørsmålet. Intuitivt krever uavhengighet at kildene ikke drøfter saken med hverandre, ikke blir påvirket av en innflytelsesrik opinionsleder, ikke har samme eller lignende erfaring eller opplæring, og ikke deler samme informasjon (se Ladha 1995).
Betingelsen om kildenes uavhengighet er veldig strikt, men den ble oppfylt av folkemengden som forlot toget sammen med deg. Menneskene i mengden kjente hverandre ikke og koordinerte ikke beslutningen med hverandre. De har også lært uavhengig av hverandre hvor utgangen er, siden de har tatt toget ofte, eller har sett et skilt til utgangen som du ikke fikk med deg. Folkemengden på toget oppfører seg dermed som uavhengige informasjonskilder. De er også eksperter, i hvert fall de fleste av dem, siden de vet hvor utgangen er.
Sosiale medier og kildematerialets uavhengighet
Når det gjelder dine Facebook-venners deling av lenker til artikler, er betingelsen om uavhengighet ikke oppfylt – og dette henger sammen med hvordan Facebook fungerer.
Det er åpenbart at dine venner er folk som påvirker hverandres meninger i kraft av å delta sammen i et sosialt nettverk. Dette er også ofte folk som deler lignende erfaringer og bakgrunn. Disse korrelasjonene (samvariasjonen) eksisterer nødvendigvis mellom vurderingene deres, og påvirker hvordan meninger og synspunkter formes mellom venner. Dette er noe vi som samfunn sakte er i ferd med å bli klar over.
Konseptet som langsomt trenger inn i vårt digitale liv er filterboblen.
En filterboble er en tilstand som blir skapt for en nettbruker når en personalisert søkealgoritme gjetter hva slags informasjon brukeren ønsker å se. Som resultat av dette blir ikke brukeren eksponert for informasjon som ikke støtter hans eller hennes synspunkt.
Filterbobler kan føre til at en bruker til og med har gått glipp av relevant informasjon som ellers er velkjent i samfunnet.
Hvis du ikke burde høre på vennene dine for å finne sannheten, burde du kanskje heller sjekke hva folk på nettet som du ikke kjenner sier. Hvorvidt den digitale folkemengden av fremmede vil føre deg mot sannheten, avhenger av hvordan de finner nytt innhold som de senere kan dele, like eller avsky.
For å være sikker på at majoriteten av vurderinger hjelper deg med å finne sannheten, må du være sikker på at kildene de fremmede har brukt ikke snakker med hverandre og at de får informasjon fra ulike uavhengige kilder. La oss her anta at nyhetene som rapporteres på nett virkelig er originale artikler heller enn bare meninger og sammenfatninger av en håndfull nyhetsmeldinger.
Verktøyene som velger ut nettinnhold for deg
Internettet har gjort det mulig for folk å kommunisere med hverandre i et større omfang enn noen gang før. Det har også gitt mange mulighet til å ytre seg og bli sett og hørt. Dette havet av uendelige mengder innhold kan vi umulig ha full oversikt over, så hvordan finner vi det innholdet som vi mest sannsynlig er interessert i? Denne jobben gjøres av anbefalingssystemer.
Et anbefalingssystem er programvare som forutsier hvor sannsynlig det er at en bestemt tekst (eller annet innhold) er teksten du er på jakt etter. Avhengig av konteksten systemet brukes i, betyr dette hvor dekkende svaret er på spørsmålet du har stilt eller hvor sannsynlig det er at du liker et nytt produkt, innhold eller tjeneste. Anbefalingssystemer er svært viktige verktøy for å oppdage innhold, og er bl.a. en av grunnene til at vi i dag har meget effektive søkemotorer.
Jo mer dine venner ligner deg, jo mindre vil summen av vurderingene de gjør peke mot sannheten
Et av de første og mest berømte anbefalingssystemene er PageRank. PageRank er en algoritme brukt av Googles søkemotor til å rangere svar på søkeord etter relevans. Den er kalt opp etter Larry Page, en av gründerne bak Google. PageRank avgjør hvor viktig et nettsted er ved å telle hvor mange nettsteder som lenker til det. Den underliggende antakelsen er at jo mer relevant en nettside er, jo flere nettsider lenker til den. Intuisjonen bak denne antakelsen kommer for øvrig fra akademia: De mest relevante artiklene på et forskningsfelt er de som har flest siteringer i vitenskapelige tidsskrifter.
PageRank er utformet spesifikt for å rangere nettsider etter relevans. For å forutsi hvor godt du vil like innhold du ennå ikke kjenner, er det typisk metoder kalt sosial filtrering (collaborative filtering) som brukes. For å avgjøre om du vil være interessert i innholdet, tas to typer informasjon i betraktning. Det første er: Hvor godt likte du lignende innhold? Og det andre: Hvor godt likte brukere som ligner mest på deg dette innholdet? Antakelsen her er at du mest sannsynlig vil like det dine venner og folk som ligner deg liker.
Anbefalingssystemer og flertallsvotering
Noe som kanskje ikke er så opplagt, er at anbefalingssystemer, særlig PageRank og sosial filtrering, har flertallsvotering i sin kjerne.
Kanskje overser vi dette fordi vi tenker på votering — stemmegivning — som den seriøse handlingen vi foretar en gang hvert fjerde år når vi går til valglokalet og stemmer på partier og politikere. På Internett “stemmer” vi hele tiden ved stadig å velge ett av et utvalg alternativer: Den lenken som mest trolig gir oss det vi er ute etter; den søteste videoen; den mest spennende nyhetsartikkelen. Men hva som står øverst på listen av valg som vi blir tilbudt og faktisk velger fra er også bestemt av valgene til de fremmede menneskene som ligner mest på oss på Internett.
Uavhengig “stemmegivning” er ikke en realitet på nett. Men er dette et problem når det gjelder å finne frem til sannheten?
Uavhengighetsbetingelsen i Condorcets juryteorem er veldig streng og selv off-line vanskelig å oppfylle i praksis. Krishna Ladha og andre har undersøkt hvor stor korrelasjon det kan være mellom velgere før Condorcets teorem ikke lenger gjelder. Hans konklusjon er at effektiviteten ved flertallsvotering avtar etter hvert som korrelasjonen mellom velgere øker. Dette betyr at jo mer dine venner ligner deg, jo mindre vil summen av vurderingene de gjør peke mot sannheten.
Ladha viser også at sannsynligheten for at majoriteten av korrelerte stemmer gir riktig svar avhenger av antallet stemmer. Store grupper er relativt robuste og tåler høyere gjennomsnitt på korrelasjonskoeffisienten. Med andre ord, jo mer historie, erfaringer og informasjonskilder du deler med dine venner, jo større må gruppen av venner være for at flertallets vurdering av et spørsmål peker mot sannheten. Det er liten statistisk sannsynlighet for at flertallet i en liten gruppe av svært nære venner vil finne det riktige svaret på et binært spørsmål.
Det er grenser for flertallsvoteringens evne til å finne sannheten
Heldigvis er det mange fremmede på Internett. Dette er observasjonen Masterton, Olsson og Angere gjorde. De så skyggen av Condorcets juryteorem i PageRank: Sannsynligheten for at en nettside er relevant øker med antallet “stemmer” den får fra andre nettsider. Masterton, Olsson og Angere undersøkte hvor god PageRank er til å finne det riktige svaret på et spørsmål. Deres svar: temmelig god. Mer presist, de viser at PageRanks lenke-baserte rangering av nettet kan forsvares vitenskapsteoretisk. Disse forskernes empiriske analyse bygger naturligvis på visse forutsetninger om uavhengigheten av nettsider.
Hvordan sosial filtrering bidrar til å gjøre om flertallets beslutninger til sannhet er et uutforsket spørsmål som vi må ta alvorlig. Flertallsvotering er en svært intuitiv og enkel måte å iverksette demokrati på, og det er i kjernen av mange valgsystemer rundt om i verden. Hvis man i en gruppe har behov for å velge et alternativ i en sak, sikrer flertallsvotering at så få mennesker som mulig er misfornøyd med gruppens valg. Condorcet ga flertallsvotering ytterligere legitimitet ved å vise at den også er en god metode for å vise vei til sannheten, noe vi forstår intuitivt når vi befinner oss på jernbanestasjonen i en ny by. Men det er grenser for flertallsvoteringens evne til å finne sannheten, og dette er noe vi må være klar over.
På nett som i det virkelige liv er instinktet vårt å stole på de manges oppfatning, men er de mange oppfatningene vi ser virkelig forskjellige? Kanskje er de bare omhyggelig utvalgt av en algoritme for å reflektere det algoritmen har regnet seg frem til at vi ønsker å se. Når vi vet dette, kan vi kanskje ta juryteoremene og arbeidet til Condorcet og hans etterfølgere til hjelp, og finne bedre løsninger.
Litteratur
Włodek Rabinowicz (2016). Aggregation of Value Judgments Differs from Aggregation of Preferences. 10.1163/9789004312654_003
Krishna K. Ladha (1995). Information pooling through majority-rule voting: Condorcet’s jury theorem with correlated votes. Doi: http://dx.doi.org/10.1016/0167–2681(94)00068‑P
George Masterton, Erik J. Olsson and Staffan Angere (2016). Linking as voting: how the Condorcet jury theorem in political science is relevant to webometrics. Doi:10.1007/s11192-016‑1837‑1
Franz Dietrich and Kai Spiekermann (2016). Jury theorems. Working paper.