2016年8月26日星期五

民調可靠嗎?

撮要:選舉民調就從來都有誤差,但其實我們每天都利用很多未必是百份百準確的資訊去做決定,而人類就是能靠這些資訊,做出靠譜的決定。但民調是一連串的紀錄,它告訴你一個趨勢,令人對選情有個梗概。民調是會隨時間愈接近選舉而變得愈趨準確的,加上運用科學方法讓不同的數據來源互相修正,做出更準確的「合併報告」,我們就能從紛亂的數據中,理出個梗概來。

前言

「民調可靠嗎?」從來是選舉分析者永恆地要面對的問題。除非是如北韓那種不用選都知道誰會贏的地方之外,選舉民調就從來都有誤差。事實上,有分析更指出,不單止民調誤差必然存在,而且如果一個地方的民調上屆很準確的話,來屆那地方的民調就多數會不準確。(很奇怪吧!)

沒有神準的資訊,人類依舊能做靠譜的決定

那麼,為何我們還要看民調呢?那我就要問:我們看不看天氣報告和風暴消息?看不看財經評論?再進一步,我們坐的士前,會不會叫司機證明自己未來一小時的旅程不會撞車才願意上車?

其實,其實,我們每天都利用來自各方面有用的資訊去作出明智的決定,即使這些資訊當中絶大部分都未必可以預先證實是準確無誤的。民調其實都一樣,它不是水晶球,今天就能告訴你十二日後三百七十萬人的選擇;但民調是一連串的紀錄,它告訴你一個趨勢,雖然那個趨勢可以波動很大很大,但有時候它也是可以有跡可尋的。而且民調是會隨時間愈接近選舉而變得愈趨準確的,所以,它是有參考價值的,只是看的時候,不要天真地覺得「這就是選舉結果」就可以了。

「合併」的威力

另外,如果坊間同時有很多不同的民調,都指向某些結果,我們就可以相信那個結果是較大機會發生。但要普通人能一眼就看出數個或更多民調共同描繪出的形勢,是很困難的,這時候就是統計分析發揮功效的地方了。憑著各有千秋的統計工具,如較通用的線性迴歸分析(Linear regression analysis),或較新穎精密的隨機森林(Random forest),我們就能從紛亂的數據中,理出個梗概來。而雷動計劃的技術團隊,正正就是在努力做這件事:利用統計工具將幾個獨立及以不同方式進行的民調之結果進行合併分析,便能減少各自可能出現的偏差和不足的數據,從而得出一個比個別民調更準確的綜合分析報告。這不單是數學上可能,而且在技術上也己經開始成熟,因為在前沿的資訊科技世界中不少具預測能力的數學模型和程式,都是以這個基礎開發出來的。

建制怎樣看數據?

最後,講了那麼多,我們應看看我們的建制派:他們每次究竟投放多少資源去做民調和票站調查呢?按鍾庭耀的講法,規模大約是港大民調的二十倍。其實,若民調是沒有用的,他們犯不著這麼費勁好做民調吧。

除了基於個人觀察和對世局的認知,選民亦需要一個客觀獨立的數據分析以作參考減少個人主觀的偏見,然後聰明、合理地決定投出有價值的一票。我認為,這就是民調對選民的價值了。

原文刊於 獨立媒體

沒有留言:

發佈留言