美國總統大選:民調會不會(又)出錯? - 換日線
文章推薦指數: 80 %
進入到像538(FiveThirtyEight,美國一專長民意調查的部落格,現屬於ABC 新聞)或者其他同樣由「預測模型」所建構的網站,並非奠基於單一的民調數據,而是 ...
換日線Crossing-最貼近你的國際新視野
主打
編輯部原創
策展專區
CrossingCampus
時事現場
海外職場
專欄作者
訂閱季刊
頻道
人物故事
People
國際趨勢
Trends
文史藝術
Humanities
生活風格
Lifestyle
觀點評論
Perspectives
編輯嚴選
Editors'Picks
換日線X施羅德
上架,夢想人生
關於我們
歷年季刊
團隊成員
大事記
搜尋
投書
歷年季刊
團隊成員
大事記
註冊
登入
首頁
國際趨勢
政治
美國總統大選:民調會不會(又)出錯?
MikeCalcagno
2020/10/13
6802
PhotoCredit:網路共享資源
2016年川普一反民調結果贏得大選,不禁讓人們懷疑:民調哪裡出了錯?2020年會重蹈覆轍嗎?本文為你詳細解答。
作為在台灣的美國移民,我的「責任」之一便是向台灣朋友們解釋美國究竟發生了什麼事。
雖然我過去兩年來幾乎一直都住在台灣,我仍然十分關注家鄉動態,因此我很樂意提供我的見解。
可以想見,近來我最常被問到的問題就是「誰會贏得美國總統大選?」有時候問題中會夾雜著一定程度的懷疑,像是「你真的覺得拜登會擊敗川普嗎?!」或「鑒於X、Y、Z或W議題,川普怎麼還能保有競爭力?」這些問題往往包裝著另一個真正的問題,並將引導出一段有趣的討論,也是今天專欄的主題:「我看到拜登在一些民調裡領先,不過萬一民調結果錯了呢?」
「民調本來就是錯的」
請注意:民調結果「本來就是」錯的。
也就是說,民調的本質是一個選民觀點的近似值,它並不完整,而且事實上,幾乎每一個像樣的民調和民調專家都明確地認知到他們是錯的,並且嘗試以誤差值量化他們可能出錯的程度。
在誤差值之外,不同的民調機構,在同一天針對同一場選舉做民調,通常也會得出不同的答案,有時候甚至超越彼此的誤差值。
舉例來說,ABC新聞和《華盛頓郵報》的民調顯示拜登可能在全國選民中領先12個百分點,另一個機構的結果卻可能只領先了8個百分點,甚至也可能高達16或低至4個百分點。
面對這樣的落差,人們可能會問「哪個民調才對?」或者「哪個民調最好?」很多人最後會仰賴特定民調,該民調通常能夠提供他們希望成真的結果;他們會認定該民調才是「對的」,其他民調則是「偏頗的」或「錯的」。
事實上民調的方法不同,特別是他們代表與接觸選民的方式,甚至是決定誰更可能投票而誰較不可能的方式均有不同;因此才會產生這樣的結果:某些備受尊崇的民調結果傾向共和黨,其他受到同樣尊崇的民調結果則傾向民主黨,但這些傾向都是肇因於其方法,而非透過刻意操作或基於偏見所得出的結果。
進入到像538(FiveThirtyEight,美國一專長民意調查的部落格,現屬於ABC新聞)或者其他同樣由「預測模型」所建構的網站,並非奠基於單一的民調數據,而是許多民調數據的總和,伴隨著其他因素比如經濟、任期、選戰獲得的關注度,和很重要的,民調機構歷來的品質,被和相互關聯的上千個不同民調結果,以及前次選舉的實際結果綜合衡量。
圖/Newsmax
舉例而言,比起認定ABC新聞和《華盛頓郵報》的民調結果是「對的」(因為你喜歡這個答案),538的模型假設所有的選舉結果,包括你比較偏愛的那一個,都是錯的,並且嘗試透過大量其他針對全國和各州的民調結果,做出「它們可能錯到什麼程度」的模型。
在最近的例子裡,路透社和益普所(Ipsos)在同一天進行民調,同樣得出拜登領先12個百分點的結果,南加大朵恩塞夫學院(USCDornsife)在9月26日到10月9日間,針對潛在選民的兩個不同小組所做的民調,則分別得出拜登領先11和12個百分點的結果。
與其問誰才是對的而誰又是錯的,538僅僅將所有民調結果當作數個不盡完整的證據,並且將之與數個結果相反的證據放在一起予以衡量,並創造出對於選舉結果的新預測。
在這樣的情況下,根據538,多數的證據顯示,拜登領先11-12個百分點可能高估了拜登的支持度,他們認為拜登「只有」領先10.1個百分點(仍然領先很多,也是拜登自2020年3月模型開跑以來領先最多的一次)。
不過幾天前,預測的結果顯示拜登只領先了9個百分點,雖然當時也有民調顯示拜登領先16個百分點。
飽受爭議的預測模型
當我針對「選舉將會如何」發表個人意見時,我主要根據的便是預測模型。
我在2008年接觸到538,當時奈特.西爾弗(NateSilver)透露,他就是模型的作者,以及舉辦民調的這個小網站的創辦人。
奈特是一個受過訓練的資料科學家和記者,我最早接觸到他的模型並不是因為政治,而是因為他發表在一個熱門的棒球數據網站上的模型──PECOTA(球員數據比較及優化測算模型,全名為PlayerEmpiricalComparisonandOptimizationTestAlgorithm)。
自從538網站開辦以來,有兩件事情是(我本人作為一個數學狂人)非常感謝的:首先,奈特對於模型運作的方式百分之百的透明,另外很重要的是,他不會為了回應看來奇怪/錯誤的事件或預測結果,而不停地改變模型。
他建立模型,公開其假設,然後讓它日復一日地運作下去,直到新的民調結果出爐。
奈特的模型在2008年的選舉中精準到令人毛骨悚然,並且在2012年的選舉中重複其壯舉。
他輕易地用其模型革新了大選預測之餘,還使之更為普及,而他也成了一個世代的書呆子和數學狂人們眼中的英雄──他們很高興看到自己領域的東西,以如此具有說服力的方式,被應用在政治領域。
圖/TGRTHaber
然而最近,奈特的模型和他的預測受到大量熱議:他既被指控偏袒自由派(提供漂亮的民調數字供自由派宣傳,以確保其候選人當選),也被批評偏袒保守派(人為操作讓雙方的支持度更接近,以確保網站流量),更遭各種外行人批評其方法與假設──從他如何處理未決定的選民(undecidedvoters,編按:指尚未決定是否投票,或要投給哪位候選人的選民),到提前投票,再到他如何計算「機構效應」(houseeffects)這種內行人才懂的數學細節,或者其他模型的組成──有些觀點有其根據也值得討論,但很多只不過是以花稍的方式表達「我們不喜歡你的結果」而已。
更有甚者,他繼續因2016年大選那歷史性的、人盡皆知的「錯誤」而飽受攻擊──川普成功取得了美國大選歷史上自1948年杜魯門擊敗杜威以來,最出人意表的勝利。
對我來說,這個在2016年之後對於538的批評,有趣之處在於奈特的模型實際上給了川普比當時幾乎任何其他(合理的)模型更大的勝算。
2016年,538給了川普幾乎30%的勝選率,相較其他民調結果都低於10%,有時甚至低於1%。
11月8日,選前兩天,538預測川普有35%的勝選率。
事實是,奈特絕對會百分之百同意人們從2016年得出的結論,即認為「川普證明了『民調是錯的』」。
民調可能是錯的這個事實,正是538一開始會存在的原因。
當然,更大的問題在於,2016年時538哪裡出了錯?我們可以合理的預期2020年也將發生同樣的事情嗎?我為接下來要談到比較複雜的邏輯向你說聲抱歉,但我相信某些小細節對於了解2020年的情況是必要也有用的。
2016年的民調到底哪裡出了錯?
在2016年大選日的早上,奈特和他的團隊放在網站上的總統大選最終預測如下:
圖/FiveThirtyEight
柯林頓被預期將以3.6個百分點的差距贏得全國選民票,以及平均約302-235張的選舉人票(註一)。
這個預測並非絕對,在模型的運作中,它不僅預測柯林頓贏的機率,事實上也包括川普勝選、柯林頓慘輸的可能性。
而上面的這張地圖就是這些各式預測的總結。
現在,要了解2016年哪裡出了差錯,我們必須聚焦於這5州──佛羅里達州(FL)、北卡羅萊納州(NC)、賓夕法尼亞州(PA)、密西根州(MI)和威斯康辛州(WI)。
這些州對於密切鎖定2020年大選的人來說應該不陌生,民調專家和選舉活動都特別執著於這5州,原因正是2016年發生的事情。
柯林頓有拿下這幾州的優勢,她在佛羅里達和北卡羅來納的優勢較小(所以圖中以淺藍色呈現),但根據538預測的可能性,這兩州的結果本質上就宛如擲硬幣般(換句話說,川普有50%的機率贏得這些州)。
此外,這些州的結果在統計上並非獨立,兩個州的人口統計資料相近且部分重疊,所以佛州的民調「誤差」可能也會出現在北卡。
538模型一個重要的特徵是注意到這些州彼此之間的關聯性。
美國大選並非50個獨立州的選舉,而是50個某種程度上彼此相關的選舉,並以全國結果作為整體。
這點在模型表現中代表的是,通常,如果你有兩州的機率都是50/50,那麼一個候選人同時贏得兩個州的機率將是25%(½*½=¼)。
然而,因為結果相互關聯,兩個州在投票時做出相同選擇的機率也更高。
這個關聯性也適用於賓州、密西根和威斯康辛的組合:在這些州之中,柯林頓民調獲得的支持度更高,模型只給了川普每個州20%的勝選率,但因為這些州相互關聯,所以同時贏得這3州的機率不是8%,而是接近20%。
川普當時的確處於劣勢,但他絕非注定失敗。
最後柯林頓輸掉了這5州,由川普贏得選舉。
佛州和北卡為川普打破預期,更重要的是,模型低估了川普在賓州和上中西部的支持度,所以他也以1%的極小差距贏得了那些州。
柯林頓確實贏得了選民票,但只贏了2個百分點而非預測中的3.6個,而此類柯林頓表現不如預期的情況在全國各州非常一致,即使是在她拿下的州也一樣。
所以我們可以從該次結果中學到什麼呢?首先,是的,模型是「錯的」,模型(和放進模型中的民調數據)高估了柯林頓的支持度。
但是它也並非脫離現實。
因為有太多距離相近的情況,導致這些極小幅度的高估──在全國僅差了1.5%──在選舉人團中造成了巨大的改變。
我們學到的第二課是,那些可能性介乎約25-30%的事件,即使並非最可能發生的情況,也並非那麼全無可能。
一個人在一組相同數字、四種不同花色的撲克牌中,抽出紅心的機率是25%,但如果你正好就抽到紅心,幾乎沒有人會驚訝這件事發生了,有時你就是比較走運。
而在選舉之中,有時候你也會走霉運,並可能錯過那些能幫助你做出更好預測的資訊。
2016年柯林頓錯失的訊息是,未決定選民在選舉日會如何抉擇,特別是鑒於迫近選舉時才爆出的「醜聞」──聯邦調查局在當年10月28日,選舉宣傳將近尾聲時,表示將重啟對希拉蕊.柯林頓電子郵件一案的調查。
在2016年直到選舉之前,美國有多到不尋常的未決定選民,他們之中有很多人最後決定投給川普。
另一個被遺漏的重要訊息則是上中西部州關鍵的民調數據。
歐巴馬在2008和2012年均輕鬆拿下這些州,很多人因而假定歐巴馬在上中西部的「藍牆」(BlueWall)會守住。
柯林頓在選戰最後並沒有認真在這些州拉票,而是選擇鎖定佛州、北卡和內華達這些民調接近的州。
圖/WPGMMedia 臉書專頁
2020年大選會重蹈覆轍嗎?
那麼2016年的情況和2020年的現在有哪些相似之處呢?我認為今昔對比,至少有3個重大的不同:
一、拜登在全國選民票預期領先的比例(10.1%)遠高於柯林頓(3.6%)。
柯林頓當時在全國被高估了1.5%。
如果民調專家今年也有同樣的失準,那麼拜登仍然領先8-9%,並且,即使憑藉川普在選舉人團中的優勢,拜登幾乎不可能在贏得全國8%選民票的情況下仍然輸掉選舉。
如果拜登在選民票中領先8.5%,他將輕易拿下選舉人團。
二、2020年的未決定選民遠比2016年少。
柯林頓和川普在2016年時的民調支持度均未超過50%,因此在進入10月底時,還有相對更多的未決定選民(也有些選民考慮除共和黨和民主黨外的第三黨候選人),佔了選民的約10-12%。
2020,拜登在民調中的支持度通常都超過50%,未決定選民即使在最競爭的幾個州平均也只佔了4-5%。
三、今年的民調做得更多。
或許是受到2016年的「創傷」,民調專家在這輪選舉中更為積極,不僅是在如密西根、威斯康辛和賓夕法尼亞州這些兵家必爭之地,在其他州亦然。
有些相對而言的盲點確實存在,但在任何傳統上較競爭的州,這次都密集地做了民調。
即使是在共和黨的鐵票倉德州,民調次數也差不多。
更多的民調表示在任何單一民調中的誤差會被抵銷(它只是眾多數據的其中一部份),我們在民調中得到的數據也會更新、更即時。
綜上所述,在11月3日,我認為拜登較可能會贏。
根據現在的538數據,川普有15%的機率反敗為勝,並且如我們所討論的,有15%可能性的事件不太可能會發生,但非完全不可能;所以如果發生黑天鵝效應,川普靠選舉人票連任也沒什麼好驚訝的。
不過要發生這種情況,從現在起到11月3日得發生劇烈的變化,嚴重打亂選舉並讓選民們改變心意。
2020是瘋狂的一年,大選仍存在著大量的不確定性與疑問,但是現階段並沒有足夠的未決定選民來替川普追上和拜登間的差距,即使民調結果不盡正確。
川普需要「出大事」才能贏,雖然他還是可能辦到,但我不相信「大事」可以如同民調誤差這麼簡單。
預測模型提供我們很好的方法,思考民調本身的不精確性。
此刻,模型告訴我們的是:拜登將在11月當選。
備註:本文由作者授權《換日線》編輯部翻譯及編輯,欲閱讀英文原文請參考〈USPolitics:Whatifthepollsarewrong?〉
執行編輯:邱佑寧
核稿編輯:林欣蘋
美國
政治
總統大選
關聯閱讀
【即時】美國總統大選首場辯論會:六大議題重點整理、媒體評析(持續更新)
【評論】在一連串的「十月驚奇」後,我這個民主黨員如何看待副總統候選人辯論會?
作品推薦
【美國移民在台灣】我的「威士忌人生」
AfteraseriesofOctober"Surprises,"howthisDemocratseestheVPdebate
參考資料
TOP
MikeCalcagno
MikeCalcagnoistheCEOandco-founderofSoopahGenius,Inc.,atechnologystartupbasedinTaipeiandSeattle.ACalifornianativeandgraduateofStanfordUniversity,heworkedforMicrosoftinSeattlefor17years,andthenasanartistandfilmmakerinJapanandKorea,beforemovingtoTaiwanin2018toserveasastrategicadviserforTaiwanAILabs.Hispassionsincludedocumentaryphotography,swingdancing,thewintersportofcurling,andhekeepsahopefuleyeonpoliticsinhishomecountry.
MikeCalcagno是科技新創美商超級聰明有限公司的CEO和共同創辦人,駐點於台北和西雅圖。
加州人,畢業於史丹佛大學。
他在西雅圖的微軟任職17年,其後於日本和韓國擔任藝術家及影片製作人,2018年搬到台灣,擔任台灣人工智慧實驗室的策略顧問。
他的熱情包括紀實攝影、搖擺舞和冬季運動冰壺。
他滿懷希望地關注家鄉政治。
看更多
上一篇
年輕世代怒吼王室改革,為何「踩到紅線」?泰國民主的崎嶇路,從數不清的政變談起
下一篇
美國大選、疫情、聯邦最高法院(上)金斯伯格大法官逝世,引發的真正爭議
你可能有興趣的文章
政治Politics
美國總統大選2020:民調是否依然可信,專家分析如何看懂
政治Politics
【美國大選】我不是川普鐵粉,我只是反對傲慢地解讀民主(下):「藍瘦、香菇」,希拉蕊是怎麼輸的?
政治Politics
川普入主白宮,純為白人至上主義的終極復辟,絕非美國底層「庶民選總統」的勝利
政治Politics
臺中青年轉動城市新「捷」奏
廣編企劃|【中國信託銀行理財會客室】超前部署,創造跨世代理財新價值
熱門文章
1
拜登和習近平終於「見面」了!開場友好,在台灣問題上展現分歧──雙方的底線在哪裡?(BBCNews中文)
2
雪季來了!加拿大國內旅遊(Staycation)風潮正盛──我的渡假首選:藍山滑雪勝地
3
美國有錢人,跟你想的不太一樣:勤儉、低調、靠自己
4
我在加拿大家事法庭隱密室,目睹「親密伴侶暴力」一再重演──憾事發生前,你我都能做的事
5
「不要追求成功,要追求幸福。
」──台師大TEDx年會演講(下)
6
從不會說日語,到贏得日本雇主頒發「最有價值奬」──專訪Deloitte資深戰略顧問MelodyLin
合作推薦
合作推薦
換日線Crossing-最貼近你的國際新視野
歷年季刊
團隊成員
大事記
Copyright©2021天下雜誌.Allrightsreserved.版權所有,禁止擅自轉貼節錄
隱私權政策 著作權聲明
延伸文章資訊
- 1連專家也一頭霧水為何2020年美國政治民調是幾十年來最不準的
好幾個月的民調壓倒性地顯示拜登獲勝。 2016年,民調機構低估了川普在關鍵州的支持率。他在通往白宮四年任期的道路上出人意料 ...
- 2這次美國大選民調到底準不準?紐時:挺川普的「害羞選民」
美國總統大選結果未定,但已知開票情況顯示,總統川普與挑戰者拜登得票比選前民調接近,在多個搖擺州勝負難分。民調準度較4年前略有改善, ...
- 3民調失準了嗎?2020年美國總統大選民調研析,鮮時事評析
2020年美國總統大選時,許多美國機構所進行的選前民調都不約而同指出,代表民主黨挑戰現任共和黨籍總統川普(Donald Trump)的拜登(Joe Biden),將以極大比數贏得普選票 ...
- 42020美國總統選舉: 如何解讀民調結果? - RFI
自從4月8日,桑德斯推出選舉,拜登正式被推舉為民主黨總統候選人之後,民調結果始終顯示,拜登的支持率持續領先,但是,四年前的選舉中民調也曾經顯示了 ...
- 5美國大選2020:BBC分析民調特朗普或拜登誰領先?
美國選民在11月3日投票選出下一屆總統,共和黨的現任總統特朗普(又譯:川普)面對民主黨拜登的挑戰。 拜登在前總統奧巴馬時期擔任過副總統,此次將代表 ...