在上兩屆美國大選,特朗普的表現都比民調反映的要好,令民調失準成了近年備受討論的現象。一直以來,以「data-driven」為招牌的民調/預測網站如RealClearPolitics(RCP)、FiveThirtyEight(538),以及包括《紐約時報》、CNN 等媒體公布的民調數據,一直是各方研判選情的主要訊息來源。然而在2016年,根據 RCP 綜合各家民調數據分析,第三次辯論前後,希拉莉領先特朗普7%;直至選舉日前,仍領先3%。《紐約時報》等預測特朗普當選率僅為10%左右;對特朗普最樂觀的538網站,也僅為29%。
這些網站的預測究竟如何得來?
基本上,都是以原始民調為基本數據,調查過程一般包括電話訪問、網絡調查,前者依然最被傳統媒體依賴。民調機構通常通過隨機抽樣,選擇電話號碼,然後根據事前的一系列假設、樣本代表的不同群體進行「加權」,從而推測各群體的投票傾向。對於以「州數據」為基礎的預測,調查機構一般累積各州民調,再得出候選人的選舉人票得票率。與此同時,也有直接進行全國民調的機構,但因不能契合選舉人票制,一般只作參考。
總之,無論是哪種民調,最後都未能預計特朗普當選。
按照RCP等分州累積的民調,在大選日早上,希拉莉預計穩得206張選舉人票,特朗普有164張,剩下168張則屬「搖擺州」。而密歇根、賓夕法尼亞兩州民調,都顯示希拉莉勝出,誤差為4%;俄亥俄和威斯康星兩州特朗普的得票率比預計高出6%;北卡羅來納州則高出4.5%。
有一個宏觀觀察可提供一些啟示:教育程度較低的白人社群在大選中,對特朗普的支持率似乎被嚴重低估了。根據英國《每日電訊報》分析,「州大學以下教育水平的白人人口數佔該州人口總數比例」和「民調預測與實際投票結果之差異」兩者,呈現顯著的正面關連。換言之,教育程度低的白人社群佔總人數比例越高的州,越有「低估特朗普支持率」的傾向。
在這基礎上,我們可以首先假設,「不回應偏差」(non-response bias)可能導致特定人群在前期民調中「失語」。
例如,受教育程度較低的農村社群,一直是民調機構難以大規模觸及的採訪對象,卻在上兩次大選中,被特朗普競選團隊作出針對性動員,投票積極性極高。他們在前期民調中發聲的比例,顯然低於實際投票比例,無論怎樣加權,都難以預測。
更有甚者,主流媒體在大選初期,已經通過各家民調數據「唱衰」特朗普,部分反建制情緒濃厚的選民,可能天然對民調機構(及其背後的建制勢力)感到反感,直接在採訪中拒絕回應,例如聽見《紐約時報》就嗤之以鼻。這部分人,也是影響民調準確度的因素。
(待續)
*改編自沈旭暉《信報財經新聞》文章
▶️ FOMO:演算法控制下的美國大選兩極評論
https://www.youtube.com/watch?v=pyNHUm1JFQU
堅離地書院 College
2024-11-02 06:25:32 +0000 UTCGood Year
2024-11-01 09:25:49 +0000 UTCKTH
2024-11-01 09:01:16 +0000 UTC