Condorcets juryteorem og sannhet på nettet

Facebook-venner eller nettets fremmede – hvem er det best å lytte til når du skal orientere deg i nyhetsbildet?

Read the Eng­lish ver­sion of this article.

Frisk mor­gen­luft møter deg når du stiger av nat­to­get og ut på per­rongen på jern­banes­tasjo­nen. Det er første gang du er der, og du er litt des­ori­en­tert. I hvilken ret­ning lig­ger utgan­gen? Instink­tet ditt er å ta samme vei som flesteparten av folkene som for­later toget sam­men med deg. Suk­sess! Men virk­er denne strate­gien for å finne sannheten alltid like godt? Vi ser ut til å være veldig glad i den, ikke bare på jern­banes­tasjon­er, men også når vi vel­ger regjering.

Demokrati kom­mer fra det greske ordet Demokra­tia som betyr “styre ved folket”. Implisitt forbinder vi demokrati med ærlighet og ret­tfer­dighet. Vi tolk­er “styre ved folket” som å styre i tråd med det mest almin­nelige indi­vidu­elle valg. Denne ideen om at det som i almin­nelighet reg­nes som sant, mest sannsyn­lig er sant, er ikke uten viten­skapelig basis, men bare hvis bestemte vilkår overholdes.

Bør du søke etter sannheten bak nyhetene ved å sjekke hvilke artik­ler med vur­deringer av aktuelle hen­delser som deles hyp­pigst av dine Face­book-ven­ner? Vi kan komme nærmere et svar på dette i et lite, men inn­fly­telses­rikt verk kjent som Con­dorcets jury­te­o­rem.

Condorcets juryteorem: Vilkår og betingelser

Mar­quis de Con­dorcet var en fran­sk filosof og matem­atik­er som levde på det sene 1700-tal­let; han var aktiv innen tidlig statsviten­skap. Con­dorcet levde på samme tid som, og var venn med, Leon­hard Euler og Ben­jamin Franklin, han var abolisjon­ist (mot­stander av slaver­i­et) og en tidlig forsvar­er av men­neskerettigheter og like ret­tigheter for kvin­ner og fargede.

Con­dorcet var en av de første til å ta i bruk matem­atikk i sam­funnsviten­skapene. Han er mest kjent for sitt arbeid knyt­tet til fler­talls­beslut­ninger eller ‑voter­ing.

Fler­tallsvo­ter­ing, eller fler­tallsstyre (major­i­ty rule), er en kollek­tiv beslut­ningsme­tode som vel­ger ut det alter­na­tivet som får et fler­tall av stemmene. Prin­sip­pet er intu­itivt enkelt, men det kan operasjon­alis­eres med ulike matem­a­tiske funksjon­er hvis det er mer enn to alter­na­tiv­er å velge blant eller et likt antall per­son­er kan stemme. Con­dorcets Essay on the Appli­ca­tion of Analy­sis to the Prob­a­bil­i­ty of Major­i­ty Deci­sions ga to resul­tater som vi fort­satt diskuter­er og bruk­er i dag – Con­dorcets metode for fler­talls­beslut­ninger og Con­dorcets juryteorem.

I sitt jury­te­o­rem iden­ti­fis­er­er Con­dorcet hvor godt egnet fler­talls­beslut­nin­gen er til å finne frem til det rik­tige — sanne — svaret på et ja-nei-spørsmål. La oss si at det dreier seg om et ukjent fak­tum om ver­den, som for eksem­pel om været vil bli fint i mor­gen, eller om det finnes intel­li­gent liv i uni­ver­set uten­for vårt sol­sys­tem. Sannheten om disse fak­taene finnes, men er av ulike årsak­er ikke tilgjen­gelig for oss, eller for øye­b­likket ikke tilgjengelig.

Con­dorcet beviste at hvis vi spør et tilstrekke­lig stort antall men­nesker et binært spørsmål — hvis vi ber dem si at ja, været blir fint i mor­gen, eller nei, det blir ikke fint – da er det svaret som gis av fler­tal­let som har høyest sannsyn­lighet for å være rik­tig. Videre er det slik at jo flere vi spør, jo større er sannsyn­ligheten for at fler­tal­let vil “finne” sannheten.

Imi­dler­tid er det bare når visse betingelser er opp­fylt at teo­remet gjelder. Og disse betingelsene er tem­melig strenge.

Den første, implisitte betingelsen er at vi forsøk­er å komme frem til sannheten om ett spørsmål, ikke flere spørsmål sam­tidig som kan­skje er relatert til hverandre.

Den andre, tem­melig opplagte betingelsen er at spørsmålet vårt må være slik (kalt ver­didom i lit­ter­a­turen, se Rabi­now­icz 2016) at det forut­set­ter at det finnes et sant svar. Ikke alle spørsmål god­tar ver­didom­mer som svar; noen spørsmål gjelder prefer­anser. Hvis du og jeg vur­der­er om vi har lyst til å spise salat eller pas­ta til mid­dag, er det et spørsmål om prefer­anse. Jeg fore­trekker kan­skje salat, du fore­trekker pas­ta, og ingen av oss tar feil. Men hvis vi diskuter­er hvilken av disse ret­tene som er best for helsen, ville vi felle en ver­didom. Hvis jeg men­er at salat er sun­nere, og du men­er pas­ta, da må en av oss ta feil. Det er ikke logisk inkon­sis­tent hvis jeg vet at salat er bedre for helsen, men likev­el fore­trekker å spise pas­ta. Siden det ikke eksis­ter­er en sannhet når en vur­der­er prefer­anser, kan ingen sannhet finnes.

Nico­las de Con­dorcet (1743–94) — fort­satt aktuell. Bildet henger i slot­tet i Ver­sailles. (foto: Wiki­me­dia Commons)

Den tred­je betingelsen som må være opp­fylt for at Con­dorcets teo­rem skal gjelde, er at kildene til ver­didommene må være ekspert­er. Heldigvis er defin­isjo­nen av ekspert tem­melig løs i matem­atikk og økono­mi. En ekspert defineres som en per­son som kan gjette bedre enn et myn­tkast. Eller formelt: En ekspert er en per­son som har en høyere sannsyn­lighet enn 50 pros­ent for å gi et rik­tig svar på et ja-nei-spørsmål. Hvis jeg prøver å bestemme meg for om jeg skal gå til ven­stre eller høyre, og kaster en mynt 100 ganger, er det ikke garan­tert at det er rik­tig å gå til ven­stre selv om 80 av myn­tkas­tene gir dette svaret. I dette til­fel­let, hvis pålite­ligheten til kildene er min­dre enn 50 pros­ent, er det bedre å velge en til­feldig kilde og spørre om ved­k­om­mendes avgjørelse, enn å stole på flertallsbeslutningen.

Den fjerde og strengeste betingelsen for å bruke Con­dorcets jury­te­o­rem, gjelder den sta­tis­tiske uavhengigheten mel­lom kildene. To kilder er sta­tis­tisk uavhengig av hveran­dre hvis det binære svaret (ja eller nei) fra en av kildene ikke påvirk­er sannsyn­ligheten for om den andre kilden ville svare ja (eller nei) på det samme spørsmålet. Intu­itivt krev­er uavhengighet at kildene ikke drøfter sak­en med hveran­dre, ikke blir påvir­ket av en inn­fly­telses­rik opin­ion­sled­er, ikke har samme eller lig­nende erfar­ing eller opplæring, og ikke del­er samme infor­masjon (se Lad­ha 1995).

Betingelsen om kildenes uavhengighet er veldig strikt, men den ble opp­fylt av folke­meng­den som for­lot toget sam­men med deg. Men­neskene i meng­den kjente hveran­dre ikke og koordinerte ikke beslut­nin­gen med hveran­dre. De har også lært uavhengig av hveran­dre hvor utgan­gen er, siden de har tatt toget ofte, eller har sett et skilt til utgan­gen som du ikke fikk med deg. Folke­meng­den på toget oppfør­er seg dermed som uavhengige infor­masjon­skilder. De er også ekspert­er, i hvert fall de fleste av dem, siden de vet hvor utgan­gen er.

Sosiale medier og kildematerialets uavhengighet

Når det gjelder dine Face­book-ven­ners del­ing av lenker til artik­ler, er betingelsen om uavhengighet ikke opp­fylt – og dette henger sam­men med hvor­dan Face­book fungerer.

Det er åpen­bart at dine ven­ner er folk som påvirk­er hveran­dres meninger i kraft av å delta sam­men i et sosialt nettverk. Dette er også ofte folk som del­er lig­nende erfaringer og bak­grunn. Disse kor­re­lasjonene (sam­vari­asjo­nen) eksis­ter­er nød­vendigvis mel­lom vur­derin­gene deres, og påvirk­er hvor­dan meninger og syn­spunk­ter formes mel­lom ven­ner. Dette er noe vi som sam­funn sak­te er i ferd med å bli klar over.

Kon­septet som lang­somt trenger inn i vårt dig­i­tale liv er fil­ter­boblen.

En fil­ter­boble er en til­stand som blir skapt for en net­tbruk­er når en per­son­alis­ert søkeal­go­ritme gjet­ter hva slags infor­masjon bruk­eren ønsker å se. Som resul­tat av dette blir ikke bruk­eren ekspon­ert for infor­masjon som ikke støt­ter hans eller hennes synspunkt.

Fil­ter­bobler kan føre til at en bruk­er til og med har gått glipp av rel­e­vant infor­masjon som ellers er velk­jent i samfunnet.

Hvis du ikke burde høre på vennene dine for å finne sannheten, burde du kan­skje heller sjekke hva folk på net­tet som du ikke kjen­ner sier. Hvorvidt den dig­i­tale folke­meng­den av fremmede vil føre deg mot sannheten, avhenger av hvor­dan de finner nytt innhold som de senere kan dele, like eller avsky.

For å være sikker på at majoriteten av vur­deringer hjelper deg med å finne sannheten, må du være sikker på at kildene de fremmede har brukt ikke snakker med hveran­dre og at de får infor­masjon fra ulike uavhengige kilder. La oss her anta at nyhetene som rap­porteres på nett virke­lig er orig­i­nale artik­ler heller enn bare meninger og sam­men­fat­ninger av en hånd­full nyhetsmeldinger.

Verktøyene som velger ut nettinnhold for deg

Inter­net­tet har gjort det mulig for folk å kom­mu­nis­ere med hveran­dre i et større omfang enn noen gang før. Det har også gitt mange mulighet til å ytre seg og bli sett og hørt. Dette havet av uen­delige mengder innhold kan vi umulig ha full over­sikt over, så hvor­dan finner vi det innhold­et som vi mest sannsyn­lig er inter­essert i? Denne jobben gjøres av anbe­fal­ingssys­te­mer.

Et anbe­fal­ingssys­tem er pro­gram­vare som forut­si­er hvor sannsyn­lig det er at en bestemt tekst (eller annet innhold) er tek­sten du er på jakt etter. Avhengig av kon­tek­sten sys­temet brukes i, betyr dette hvor dekkende svaret er på spørsmålet du har stilt eller hvor sannsyn­lig det er at du lik­er et nytt pro­dukt, innhold eller tjen­este. Anbe­fal­ingssys­te­mer er svært vik­tige verk­tøy for å oppdage innhold, og er bl.a. en av grunnene til at vi i dag har meget effek­tive søkemotorer.

Jo mer dine ven­ner lign­er deg, jo min­dre vil sum­men av vur­derin­gene de gjør peke mot sannheten

Et av de første og mest berømte anbe­fal­ingssys­temene er PageR­ank. PageR­ank er en algo­ritme brukt av Googles søke­mo­tor til å ran­gere svar på søke­ord etter rel­e­vans. Den er kalt opp etter Lar­ry Page, en av grün­derne bak Google. PageR­ank avgjør hvor vik­tig et nettst­ed er ved å telle hvor mange nettst­ed­er som lenker til det. Den under­liggende antakelsen er at jo mer rel­e­vant en nett­side er, jo flere nettsider lenker til den. Intu­isjo­nen bak denne antakelsen kom­mer for øvrig fra akademia: De mest rel­e­vante artik­lene på et forskn­ings­felt er de som har flest siteringer i viten­skapelige tidsskrifter.

PageR­ank er utformet spe­si­fikt for å ran­gere nettsider etter rel­e­vans. For å forut­si hvor godt du vil like innhold du ennå ikke kjen­ner, er det typisk metoder kalt sosial fil­trering (col­lab­o­ra­tive fil­ter­ing) som brukes. For å avgjøre om du vil være inter­essert i innhold­et, tas to typer infor­masjon i betrak­t­ning. Det første er: Hvor godt lik­te du lig­nende innhold? Og det andre: Hvor godt lik­te brukere som lign­er mest på deg dette innhold­et? Antakelsen her er at du mest sannsyn­lig vil like det dine ven­ner og folk som lign­er deg liker.

Anbefalingssystemer og flertallsvotering

Noe som kan­skje ikke er så opplagt, er at anbe­fal­ingssys­te­mer, særlig PageR­ank og sosial fil­trering, har fler­tallsvo­ter­ing i sin kjerne.

Kan­skje overs­er vi dette for­di vi tenker på voter­ing — stem­me­givn­ing — som den ser­iøse han­dlin­gen vi fore­tar en gang hvert fjerde år når vi går til val­glokalet og stem­mer på parti­er og poli­tikere. På Inter­nett “stem­mer” vi hele tiden ved stadig å velge ett av et utvalg alter­na­tiv­er: Den lenken som mest trolig gir oss det vi er ute etter; den søteste videoen; den mest spen­nende nyhet­sar­tikke­len. Men hva som står øverst på lis­ten av valg som vi blir tilbudt og fak­tisk vel­ger fra er også bestemt av val­gene til de fremmede men­neskene som lign­er mest på oss på Internett.

Illus­tra­tion: Moshanin/Wikimedia Com­monscba

Eksem­pel på hvor­dan sosial fil­trering fungerer.

Uavhengig “stem­me­givn­ing” er ikke en realitet på nett. Men er dette et prob­lem når det gjelder å finne frem til sannheten?

Uavhengighets­betingelsen i Con­dorcets jury­te­o­rem er veldig streng og selv off-line vanske­lig å opp­fylle i prak­sis. Krish­na Lad­ha og andre har under­søkt hvor stor kor­re­lasjon det kan være mel­lom vel­gere før Con­dorcets teo­rem ikke lenger gjelder. Hans kon­klusjon er at effek­tiviteten ved fler­tallsvo­ter­ing avtar etter hvert som kor­re­lasjo­nen mel­lom vel­gere øker. Dette betyr at jo mer dine ven­ner lign­er deg, jo min­dre vil sum­men av vur­derin­gene de gjør peke mot sannheten.

Lad­ha vis­er også at sannsyn­ligheten for at majoriteten av kor­rel­erte stem­mer gir rik­tig svar avhenger av antallet stem­mer. Store grup­per er rel­a­tivt robuste og tåler høyere gjen­nom­snitt på kor­re­lasjon­sko­eff­isien­ten. Med andre ord, jo mer his­to­rie, erfaringer og infor­masjon­skilder du del­er med dine ven­ner, jo større må grup­pen av ven­ner være for at fler­tal­lets vur­der­ing av et spørsmål peker mot sannheten. Det er liten sta­tis­tisk sannsyn­lighet for at fler­tal­let i en liten gruppe av svært nære ven­ner vil finne det rik­tige svaret på et binært spørsmål.

Det er grenser for fler­tallsvo­terin­gens evne til å finne sannheten

Heldigvis er det mange fremmede på Inter­nett. Dette er obser­vasjo­nen Mas­ter­ton, Ols­son og Angere gjorde. De så skyggen av Con­dorcets jury­te­o­rem i PageR­ank: Sannsyn­ligheten for at en nett­side er rel­e­vant øker med antallet “stem­mer” den får fra andre nettsider. Mas­ter­ton, Ols­son og Angere under­søk­te hvor god PageR­ank er til å finne det rik­tige svaret på et spørsmål. Deres svar: tem­melig god. Mer pre­sist, de vis­er at PageR­anks lenke-baserte ranger­ing av net­tet kan forsvares viten­skap­ste­o­retisk. Disse forskernes empiriske analyse byg­ger naturligvis på visse forut­set­ninger om uavhengigheten av nettsider.

Hvor­dan sosial fil­trering bidrar til å gjøre om fler­tal­lets beslut­ninger til sannhet er et uut­fors­ket spørsmål som vi må ta alvorlig. Fler­tallsvo­ter­ing er en svært intu­itiv og enkel måte å iverk­sette demokrati på, og det er i kjer­nen av mange val­gsys­te­mer rundt om i ver­den. Hvis man i en gruppe har behov for å velge et alter­na­tiv i en sak, sikr­er fler­tallsvo­ter­ing at så få men­nesker som mulig er mis­fornøyd med grup­pens valg. Con­dorcet ga fler­tallsvo­ter­ing ytterligere legit­imitet ved å vise at den også er en god metode for å vise vei til sannheten, noe vi forstår intu­itivt når vi befinner oss på jern­banes­tasjo­nen i en ny by. Men det er grenser for fler­tallsvo­terin­gens evne til å finne sannheten, og dette er noe vi må være klar over.

På nett som i det virke­lige liv er instink­tet vårt å stole på de manges opp­fat­ning, men er de mange opp­fat­nin­gene vi ser virke­lig forskjel­lige? Kan­skje er de bare omhyggelig utval­gt av en algo­ritme for å reflek­tere det algo­rit­men har reg­net seg frem til at vi ønsker å se. Når vi vet dette, kan vi kan­skje ta jury­te­o­remene og arbei­det til Con­dorcet og hans etter­føl­gere til hjelp, og finne bedre løsninger.

Litteratur

Włodek Rabi­now­icz (2016). Aggre­ga­tion of Val­ue Judg­ments Dif­fers from Aggre­ga­tion of Pref­er­ences. 10.1163/9789004312654_003

Krish­na K. Lad­ha (1995). Infor­ma­tion pool­ing through major­i­ty-rule vot­ing: Con­dorcet’s jury the­o­rem with cor­re­lat­ed votes. Doi: http://dx.doi.org/10.1016/0167–2681(94)00068‑P

George Mas­ter­ton, Erik J. Ols­son and Staffan Angere (2016). Link­ing as vot­ing: how the Con­dorcet jury the­o­rem in polit­i­cal sci­ence is rel­e­vant to webo­met­rics. Doi:10.1007/s11192-016‑1837‑1

Franz Diet­rich and Kai Spiek­er­mann (2016). Jury the­o­rems. Work­ing paper.

TEMA

S

osiale
medier

67 ARTIKLER FRA VOX PUBLICA

FLERE KILDER - FAKTA - KONTEKST

INGEN KOMMENTARER

Kommentarfeltet til denne artikkelen er nå stengt. Ta kontakt med redaksjonen dersom du har synspunkter på artikkelen.

til toppen