Uitgelegd: de Amerikaanse voorspellingsmodellen voor verkiezingen en wat er mis is gegaan in 2016 en 2020
Hoewel de stemmen nog steeds worden geteld en de gegevens nog steeds worden gezeefd, zijn Amerikaanse analisten begonnen na te denken over de hele verkiezingsvoorspellingsindustrie, die een veel grotere overwinning voorspelde voor verkozen president Joe Biden dan wat we vorige week zagen.

Bijna de dag na de Amerikaanse verkiezingen gaven opiniepeilers en verkiezingsvoorspellers grif toe dat hun modellen en enquêtes het weer eens mis leken te hebben.
Hoewel de stemmen nog steeds worden geteld en de gegevens nog steeds worden gezeefd, zijn Amerikaanse analisten begonnen na te denken over de hele verkiezingsvoorspellingsindustrie, die een veel grotere overwinning voorspelde voor verkozen president Joe Biden dan wat we vorige week zagen.
Hoe creëren Amerikaanse statistici hun verkiezingsvoorspellingsmodellen?
Modellen combineren twee soorten nummers. De eerste zijn de fundamenten - de factoren die kiezerskeuzes bepalen. Bijvoorbeeld hoe de status van de economie van invloed is op de kansen van de gevestigde exploitant of het feit dat een partij die drie keer op rij wint, in de afgelopen 70 jaar maar één keer is voorgekomen.
Andrew Gelman en Merlin Heidemanns van de Columbia University, die een peilingsaggregatiemodel voor The Economist hebben gemaakt, schreven: Zoals de meeste voorspellingen, past ons model eerdere patronen van kiezersgedrag toe op nieuwe omstandigheden ... 'Hoe vaak zijn eerdere kandidaten in vergelijkbare posities doorgegaan om te winnen?” Als die historische relaties stuklopen, zal onze voorspelling mislukken.
Vervolgens kijken onderzoekers naar de peilingen (antwoorden van representatieve steekproeven). Het model neemt het gemiddelde van de peilingen, weegt elk volgens hun steekproefomvang en corrigeert vervolgens voor eventuele vooroordelen. Nate Silver, een boegbeeld in de verkiezingsvoorspellingsgemeenschap en de redacteur van de gevestigde data-outlet FiveThirtyEight, onderscheidt zich specifiek van een opiniepeiler en stelt dat het de taak van zijn organisatie is om te begrijpen hoe verkeerd de peilingen kunnen zijn om probabilistische voorspellingen te maken.
Het uiteindelijke model combineert de fundamenten met de peilinggemiddelden. Met deze twee soorten informatie voeren de onderzoekers een groot aantal simulaties uit om te achterhalen hoe vaak een kandidaat meer dan 270 kiesmannen krijgt. Als Biden in 1000 simulaties 500 keer wint, heeft hij 50 procent kans om te winnen. Naarmate de verkiezingsdag nadert, geven onderzoekers meer gewicht aan de peilingen dan aan de fundamenten.
Ook in Uitleg | Waarom de gekozen president van de VS Joe Biden waarschijnlijk niet zal wegen op Kasjmir
Wat gebeurde er in 2016?
De wiskundige orakels van de Amerikaanse verkiezingen hadden vol vertrouwen een overwinning van Hillary Clinton voorspeld. Gerespecteerde mainstream-onderzoekers gaven Clinton een voorsprong tot vier punten. Ze eindigde met 2,1 procentpunt in de populaire stemming. FiveThirtyEight kreeg het moeilijk met de voorspelling dat Hillary Clinton 70% kans had om het Witte Huis te winnen. Silver zei dat mensen de verkiezingsresultaten uit hun verband trekken.
The Economist schreef: De onwaarschijnlijke overwinning van Trump in 2016 zorgde ervoor dat veel kwantitatieve verkiezingsvoorspellers er gek uitzagen. Sam Wang, een professor aan Princeton, zwoer dat hij een insect zou eten als de heer Trump, van wie hij zei dat hij in november 2016 slechts 1% kans had om te winnen, zelfs maar in de buurt zou komen van de overwinning. (Hij koos een krekel.) Klik om Express Explained op Telegram te volgen
Post-mortems van instellingen zoals de Association of Public Opinion Research kwamen tot de conclusie dat de peilingen het gewicht van kiezers zonder universitair diploma hadden onderschat. De Upshot van de New York Times ontdekte dat het ontbreken van gewichten naar opleidingsstatus de steun van Trump met vier punten verkeerd berekende, wat overeenkomt met de fout. In veel opzichten was het een simpele onderschatting van het aantal kiezers dat blank was en geen universitair diploma had. In een andere fout stemden late beslissers uiteindelijk meer op Trump dan voorspeld, en de algehele opkomst van de Trump-kiezer overtrof de verwachtingen.
De statistici beweerden dat ze de fouten hadden verholpen en zeiden dat ze hun lessen uit 2016 hadden geleerd.
Wat gebeurde er in 2020?
Het lijdt geen twijfel dat de peilingen (opnieuw) hebben gemist. Maar we zullen niet weten met hoeveel totdat alle stemmen zijn geteld (inclusief schattingen van afgewezen stembiljetten). Dan beoordelen we opnieuw. Maar ik denk dat het eerlijk is om nu te zeggen dat Trump op zoveel manieren, waaronder politieke peilingen, sui generis is, tweette directeur van Monmouth Poll Patrick Murray de dag na de verkiezingen.
Enquêtes toonden aan dat Biden in het laatste deel van het campagneseizoen een voorsprong van ten minste acht procentpunten had. Hij zal hoogstwaarschijnlijk eindigen met een overwinning van vier tot vijf procentpunten. Zelfs de eigen privé-peilingen van beide campagnes onderschatten de Republikeinse kandidaten.
Op staatsniveau waren de voorspellingen nog meer uit. RealClearPolitics en FiveThirtyEight overschatten Biden in elke swing-state behalve Arizona. Vooral Florida was er ver naast; met bijna vier punten nam Trump de staat die peilingen gemiddeld voor Biden hadden voorspeld met drie punten. De New York Times en de Washington Post hadden Biden op een voorsprong van 17 en 11 punten in Wisconsin. Tot nu toe is het een verschil van één procentpunt. Congresraces waren nog erger, met democraten die overrompeld waren door hun verliezen.
Peilingen (met name op districtsniveau) hebben ons zelden meer op een dwaalspoor gebracht en het zal lang duren om uit te pakken, tweette Cook Political Report-redacteur Dave Wasserman de dag na de verkiezingen.
Lees ook | Wil je een voorproefje van president Biden? Bekijk het campagnepad
Wat ging er mis?
Het is te vroeg om te zeggen, maar de theorieën beginnen door te sijpelen. Een theorie van Zeynep Tufekci is dat er niet genoeg gegevens uit het verleden zijn om nauwkeurig fundamenten te creëren, omdat factoren bij verkiezingen elke keer zo substantieel veranderen.
Andere mogelijke antwoorden kunnen liggen in de uiteindelijke opkomstgegevens. Nate Cohn van de New York Times zegt dat ofwel 2020 een nieuwe reeks problemen opleverde, ofwel dat de problemen van 2016 misschien nooit zijn opgelost. Hij neigt naar het eerste, vooral omdat de opleidingsweging de voorspellingen niet veranderde. Uit peilingen bleek dat blanke kiezers zonder een universitair diploma op Biden zouden stemmen tegen een hoger percentage dan Clinton, maar de uiteindelijke resultaten toonden aan dat ze niet veranderden zoals voorspeld. Een andere fout zat in de berekeningen van senior kiezers, van wie werd voorspeld dat ze 23 punten meer op Biden zouden stemmen dan op Trump. Maar in werkelijkheid stemden senioren niet tegen hogere tarieven op Biden.
Cohn wijst erop dat dit geen mislukkingen zijn bij het inschatten van de grootte van groepen, maar meer hun houding. Dit houdt verband met rechtse beweringen van een zwijgende meerderheid die op Trump stemt maar hun politieke overtuigingen verbergt. Na de mislukkingen van 2016 verloren peilingen hun geloofwaardigheid en waren misschien minder Trump-aanhangers bereid om enquêtevragen te beantwoorden.
Een voor de hand liggende potentiële sleutel in de cijfers was de pandemie. Peilingen van vóór de pandemie toesloeg (tussen oktober 2019 en maart 2020) waren nauwkeuriger dan toen de verkiezingen naderden. Eén theorie suggereert dat democraten in deze tijd vaker werden opgesloten en vaker op peilingen reageerden dan republikeinen. De reacties namen in die tijd wel toe en hotspots begonnen meer steun voor Biden te tonen. Met andere woorden, dit was geen verhoogde steun voor Biden; dit was een toename van de kans dat een Biden-supporter zou reageren.
Gaat het om inhoudelijke problemen of presentatie?
Sommige politieke experts zeggen dat het probleem eerder de presentatie van de cijfers aan een massapubliek is dan een probleem van de cijfers. Als Biden bijvoorbeeld 65 procent krijgt om de verkiezingen te winnen, betekent dit dat hij bijna een kans van één op drie heeft om te verliezen. De meeste kiezers die een kans van 65 procent horen, stellen zich echter een grote kans voor.
Concurrenten beweren dat politieke orakels zulke grote foutenmarges en voorbehouden hebben gecreëerd dat ze kunnen zeggen dat ze gelijk hadden, ongeacht het resultaat, waardoor ze in feite nutteloos werden. Silver heeft het verhaal dat de peilingen verkeerd waren zwaar berispt en schreef dat zijn organisatie terecht had voorspeld dat Biden een normale of zelfs iets grotere peilingfout zou kunnen overleven en toch zou kunnen winnen. Kiezers en de media moeten hun verwachtingen rond peilingen herijken - niet per se omdat er iets is veranderd, maar omdat die verwachtingen een onrealistisch niveau van precisie vereisten - terwijl ze tegelijkertijd weerstand bieden aan de drang om 'alle peilingen weg te gooien'... Als je zekerheid wilt over verkiezingen resultaten, peilingen zullen je dat niet geven - althans, meestal niet.
Iain Armitage salaris
Hoe reageren instellingen en mensen?
Terwijl de analisten hun argumenten het liefst in strijd met elkaar presenteren, lijkt de algemene reflectie over de hele linie relatief samenhangend: de obsessie met peilingen verminderen.
Veel van de Amerikaanse democratie hangt af van het kunnen begrijpen wat onze medeburgers denken. Dat is een grotere uitdaging geworden omdat Amerikanen zichzelf in ideologische bubbels opdelen... Publieke opiniepeilingen waren een van de laatste manieren waarop we moesten begrijpen wat andere Amerikanen werkelijk geloven. Als peilingen niet werken, vliegen we blind, schreef David Graham van de Atlantische Oceaan.
Sommigen hebben het hele getallenspel zelf geproblematiseerd, niet alleen 2016-gewichten versus 2020-gewichten. Zilver werd beroemd door het voorspellen van honkbalwedstrijden, maar in tegenstelling tot honkbal... heeft dit spel niet altijd een voorspelbare set regels waar alle spelers zich aan houden. Er zit veel meer ruis in het signaal dat een algoritme kan verstoren, zegt Slate-politicoloog Joshua Keating.
We zouden het geld dat we uitgeven aan opiniepeilingen moeten nemen en we moeten het ter plaatse organiseren. Ik heb begrepen dat Trump een jaar lang mensen op de grond had in Florida. Ik zou graag zien dat we minder afhankelijk zijn van peilingen omdat het steeds minder perfect wordt om ons te krijgen wat we willen, zei congreslid Pramila Jayapal in een webinar de dag na de verkiezingen.
Mis het niet uit Explained | Waarom Amerikanen het oneens zijn over het verlenen van een staat aan Puerto Rico en Washington, D.C.
Nieuwsorganisaties investeren op dezelfde manier meer in internettrendanalyse en lokale berichtgeving om de peilingsfouten te compenseren.
Tufekci zei: In plaats van de pagina te vernieuwen om voorspellingen bij te werken, hadden mensen het enige moeten doen dat de uitkomst daadwerkelijk beïnvloedt: stemmen, doneren en organiseren. Zoals we hebben ontdekt, valt al het andere binnen de foutenmarge.
Deel Het Met Je Vrienden: