Economist Nov 9th 2016

民調發生很大的錯誤,且往最糟的那個可能性去。在美國總統前夕,全國民調顯示希拉蕊領先約4%,而賭盤跟統計模型則將這個數字轉成70%至99%的勝率。最後走鐘:根據紐約時報旗下網站「Upshot」的預測,希拉蕊仍可能以超過一個百分點的差距贏得普選。但在州等級的預測,就產生了極端的錯誤。民調預測希拉蕊可以在威斯康辛州贏5%;但現在她可能輸2.5%。民調認為川普在俄亥俄州會以2%的微小差距獲勝;但現在川普贏了超過8%。川普在密西根州、賓州的民調都輸了4%,但看起來可在這兩州都以1%的差距獲勝。這些民調如何出錯?

所有的調查結果都由兩種變數結合而成:選民組成、每個群體的預期投票行為。因為有些群體 — 比如說年輕的西班牙裔男性 — 比其他群體(比如說白人女性)更不愛表態,民調機構通常會將收到的回覆加權,以符合他們預期的選民圖像。錯誤民調的產生,可能源於各群體中受訪者樣本的代表性不夠,也可能源於錯誤預測每種選民的投票行為。

從選舉地圖來看,解釋了為何川普能勝選。在白人選民教育程度較高的州(如科羅拉多州跟維吉尼亞州),民調結果完美地反映了選舉結果。相反地,在一些許多白人選民未取得大學學歷的北部州,川普推翻了民調 — 包括一些現在可能還是會輸,但差距比預期小很多,比如說明尼蘇達州。最簡單的解釋會是,選民比民調機構所預見的還更傾向川普 — 所謂「害羞川普」現象,也就是選民對於要承認支持川普這件事,有些保留。選前的民調,並沒有太能看出這樣的現象:民調顯示川普在這個群體(譯按:未取得大學學歷的白人選民)取得30%的巨大領先。但值得注意的是,即便這個數字看得出來他們傾向投給川普,全國的出口民調顯示,川普在這個群體取得的領先是39%。考慮這些選民佔了威斯康辛州、密西根州、俄亥俄州和賓州合格選民的58%(雖然最後真正出來投票的人沒那麼多) — 九個百分點的誤差,佔了整個錯誤民調的一大部分。也有可能教育程度較低的白人,過去比較不傾向投票,而這些人的數量比民調機構預測地多。

在川普驚愕勝利後的各種結果中,對民調這個產業所造成的影響,可以說是最不重要的。但是應該會激勵民調業者加倍努力,進行更準確地預測,而不只是仰賴人口普查,然後把結果丟到簡單的可能選民(like-voter)螢幕中。對外行人來說,這次的結果,是對民調不確定性的一種毀滅性提醒,也是對民調結果過於自信的一種警告。正如物理學家波耳(Niels Bohr)的名言,「預測是很困難的 — 尤其是針對未來」。

原文

arrow
arrow
    全站熱搜

    mlkj24 發表在 痞客邦 留言(0) 人氣()