2016年8月31日星期三

【策略選民全員預演】9月1日 晚上8點

想知道9月3號選舉日前夕,策略選民會收到甚麼訊息?有甚麼事要一齊協商?

上次預演,協商過程充滿火花,亦令參與者更理解甚麼是「策略投票」,投票當日要有甚麼資訊和考量。最後大家一齊表決投票策略,達成共識。策略選民平等參與,協商過程民主理性,絕對不是配票。

雷動聲吶稍後會發訊息邀請你並所有完成問卷的策略選民,一齊參加9月1日的全員預演。屆時會開放多個討論小組,根據模擬的選情分析,一同協商投票策略。

9月1號,晚上8點到12點,約定你!

加入方法:
1. 請先下載 Telegram
http://bit.ly/dl-tgm

2. 啟動雷動聲吶
http://bit.ly/votsonar

3. 完成問卷調查

2016年8月29日星期一

立會選民轉軚解構 — 八月篇

作者:追數人


引言

立法會選舉工程現正如火如荼,準確衡量形勢是為必要。坊間之民意調查普遍不具有追蹤性,難以確切了解選民取態之變動。而雷動聲吶之優勢在於能追蹤使用者意向的同時保障其身份私隱。為使候選人更緊貼了解自己及其陣營的選情,雷動聲吶在七月份曾發表追蹤使用者意向的研究,並在選舉人名單落實後繼續進行數據分析。現把研究發現羅列如下。


研究方法

雷動聲吶是一個以Telegram為平台的民調系統,是次研究採用其八月第一次(七至十三號)及第二次(十四至二十號)民調的數據,並以參與者的Telegram ID作配對。為使研究結果更易理解,本研究只在八月首次民調時每區選取支持率最高之三名候選人。本文將以幾方面探討他們在兩次民調間支持率的變化,現羅列如下:


  1. 首次(七至十三號)及第二次(十四至二十號)民調支持度。兩次民調間支持度之分數以「相對首次支持度改變」表示。
  2. 舊有支持者轉投其他陣營(轉軚)的比例。例如候選人A在首次民調獲20%支持,第二次民調時有10%人轉軚,轉軚率則為(10%/20%)*100%=50%。
  3. 主要轉軚者的去向及他們在整體轉軚者中所佔的比率。承上例,在10%轉軚選民中,當中有2%轉而支持候選人B,那麼B所佔總轉軚人士的比例便為(2%/10%)*100%=20%。
  4. 候選人在八月第二次民調的支持者中主要的新票源。例如某候選人在第二次民調獲20%支持,而當中有2%人在首次民調支持候選人C,該票源便佔支持度的(2%/20%)*100%=10%。


研究結果



共有3,387名參與者參與八月首兩次民調。當中各區支持率三甲如下。
九龍西:(小麗民主教室)劉小麗名單、(青年新政)游蕙禎名單、(公民黨)毛孟靜名單
九龍東:(東九龍社區關注組)陳澤滔名單、(人民力量)譚得志名單、(公民黨)譚文豪、梁家傑名單
香港島: (公民黨) 陳淑莊名單、(人民力量) 劉嘉鴻名單、(香港眾志) 羅冠聰名單
新界西:(公民黨) 郭家麒名單、(社民連/人民力量) 黃浩銘、陳偉業名單、朱凱廸名單
新界東:(人民力量) 陳志全名單、 (社民連) 梁國雄名單、 (公民黨) 楊岳橋名單
超級區議會:(民主黨) 涂謹申名單、(民主黨) 鄺俊宇名單、(街工) 梁耀忠名單


各區轉軚率為:九龍西(23.8%)、九龍東(25.4%)、香港島(27.3%)、新界西(20.8%)、新界東(24.0%)、超級區議會(24.8%)


九龍西 (N=470)

首次支持度
第二次支持度(相對首次支持度改變)
第二次轉軚其他名單%
主要轉軚到的對手名單(佔轉軚%)
第二次主要新票源(佔支持度)
劉小麗
21.3%
29.4% (+8.1%)
9.0%
游蕙禎 (33.0%)
吳文遠/毛孟靜 (各+8.7%)
游蕙禎
18.3%
16.6% (-1.7%)
24.4%
劉小麗 (47.6%)
毛孟靜 (+5.1%)
毛孟靜
22.1%
19.4% (-2.8%)
25.0%
劉小麗 (46.2%)
游蕙禎/譚國僑/未決定 (各+3.3%)


除劉小麗,其他候選人在第二次民調支持率稍跌。改變取向的選民介乎不足一成至兩成多,當中主要轉至游蕙禎及劉小麗。47.6%曾經支持游蕙禎的選民轉投劉小麗,比率是為三者最多。在八月第二次民調,各有8.7%支持劉小麗的選民曾在第一次民調支持吳文遠或毛孟靜,比率為三者最高。


九龍東 (N=461)

首次支持度
第二次支持度(相對首次支持度改變)
第二次轉軚其他名單%
主要轉軚到的對手名單(佔轉軚%)
第二次主要新票源(佔支持度)
陳澤滔
15.8%
17.4% (+1.5%)
20.5%
譚得志 (53.3%)
未決定 (+7.5%)
譚得志
22.8%
28.6% (+5.9%)
13.3%
陳澤滔 (35.7%)
陳澤滔 (+6.1%)
譚文豪、梁家傑
31.0%
29.5% (-1.5%)
21.0%
譚得志 (53.3%)
陳澤滔/胡志偉 (各+3.7%)


除譚文豪、梁家傑,其他候選人在八月第二次支持率有所上升,當中譚得志有將近6%的升幅。改變取向的選民介乎不足一成多至兩成多,當中主要轉至譚得志及陳澤滔。53.3%曾經支持譚文豪、梁家傑的選民轉投譚得志,比率是為三者最多。在八月第二次民調,有7.5%支持陳澤滔的選民曾在第一次民調未有決定,比率為三者最高。


香港島 (N=750)

首次支持度
第二次支持度(相對首次支持度改變)
第二次轉軚其他名單%
主要轉軚到的對手名單(佔轉軚%)
第二次主要新票源(佔支持度)
陳淑莊
27.6%
25.2% (-2.4%)
16.9%
羅冠聰 (34.3%)
許智峯、單仲偕 (+2.6%)
劉嘉鴻
9.6%
10.8% (+1.2%)
5.6%
羅冠聰 (50.0%)
羅冠聰 (+4.9%)
羅冠聰
24.1%
24.4% (+0.3%)
15.5%
未決定 (32.1%)
陳淑莊 (+6.6%)
除陳淑莊支持率稍跌,其他候選人在第二次民調支持率微升。改變取向的選民介乎不足一成至一成多,當中主要轉至羅冠聰。50.0%曾經支持劉嘉鴻的選民轉投羅冠聰,比率是為三者最多。在八月第二次民調,有6.6%支持羅冠聰的選民曾在第一次民調支持陳淑莊,比率為三者最高。


新界西 (N=771)

首次支持度
第二次支持度(相對首次支持度改變)
第二次轉軚其他名單%
主要轉軚到的對手名單(佔轉軚%)
第二次主要新票源(佔支持度)
郭家麒
15.2%
15.2% (+0,0%)
17.1%
朱凱廸 (35.0%)
未決定 (+5.1%)
黃浩銘、陳偉業
24.0%
23.2% (-0.8%)
15.1%
朱凱廸 (21.4%)
朱凱廸 (+3.4%)
朱凱廸
21.3%
22.6% (+1.3%)
10.4%
黃浩銘、陳偉業 (35.3%)
黃浩銘、陳偉業 (+3.4%)
三位候選人在八月第二次支持率大致穩定,只有朱凱迪微升1.3%。改變取向的選民介乎大約一成至不足兩成,當中主要轉至朱凱迪及黃浩銘、陳偉業。35.0%曾經支持郭家麒的選民轉投朱凱廸,比率是為三者最多。在八月第二次民調,有5.1%支持郭家麒的選民曾在八月第一次民調未有決定,比率為三者最高。


新界東 (N=735)

首次支持度
第二次支持度(相對首次支持度改變)
第二次轉軚其他名單%
主要轉軚到的對手名單(佔轉軚%)
第二次主要新票源(佔支持度)
陳志全
16.8%
18.9% (+2.1%)
12.1%
梁頌恆 (21.1%)
楊岳橋 (+6.2%)
梁國雄
10.9%
12.8% (+1.9%)
16.7%
陳志全 (47.1%)
未決定 (9.2%)
楊岳橋
21.8%
18.5% (-3.3%)
21.6%
陳志全 (25.0%)
未決定 (2.3%)


除楊岳橋,其他候選人在八月第二次民調支持率稍升。改變取向的選民介乎一成多至兩成多,當中主要轉至梁頌恆及陳志全。47.1%曾經支持梁國雄的選民轉投陳志全,比率是為三者最多。在八月第二次民調,梁國雄有9.2%的支持者曾在八月第一次民調未有決定。


超區 (N=3387)

首次支持度
第二次支持度(相對首次支持度改變)
第二次轉軚其他名單%
主要轉軚到的對手名單(佔轉軚%)
第二次主要新票源(佔支持度)
涂謹申
17.5%
16.1% (-1.4%)
28.7%
梁耀忠 (29.4%)
未決定 (+5.9%)
鄺俊宇
15.8%
17.9% (+2.1%)
22.6%
梁耀忠 (27.3%)
梁耀忠 (+6.9%)
梁耀忠
22.3%
23.9% (+1.6%)
20.4%
鄺俊宇 (27.3%)
涂謹申 (+6.2%)
除涂謹申,其他候選人在八月第二次支持率稍升。改變取向的選民接近三成,當中主要轉至梁耀忠及鄺俊宇。29.4%曾經支持涂謹申的選民轉投梁耀忠,比率是為三者最多。在八月第二次民調,有6.9%支持鄺俊宇的選民曾在八月第一次民調曾支持梁耀忠,比率為三者最高。


總結



兩次民調期間,普遍候選人/陣營的支持率沒有明顯升/跌幅。與七月民調比較,各區最具知名度的候選人亦大致不變。

各區轉軚率亦有顯著下降,屬預料之中。在支持率較高的候選人中,轉軚的選民比率介乎一至兩成,可見選民已大致確認理想人選。然而,當中不難發現一些遊離票源。例如七月時陳志全所流失的選票主要轉至梁國雄,及至八月時則是梁頌恆。與之前相反,梁國雄在八月把票數倒流給陳。從坊間其他民調顯示,二人選情均未見明朗。到底陳梁能否攜手進入議會,或是要犧牲其中一方,便需要支持者們好好衡量。

是次研究亦有其限制。Telegram並非覆蓋廣泛選民的平台,而且雷動計劃的參與者亦偏向支持泛民或本土陣營,故是次結果未必能代表全港市民之意向。勝券在握者固然可繼續支持,同時亦有需要找出未有充足勝算的候選人,並留意其選票流向。在策略選民的角度而言,是次結果將有助其在立法會選舉時的最終決定。

2016年8月27日星期六

【策略選民第一次預演】28/8 20:00

策略選民預演的目的,是讓大家可以了解群組在3/9投票日前夕的運作。模擬題目為想象內容。

預演時間表如下:
1. 27-28 Aug 策略選民在雷動聲吶中收到邀請,接受版規加入群組
2. 28 Aug 20:00 策略選民群組開始討論模擬題目,並在系統表達意向
3. 28 Aug 23:59 策略選民群組討論結束,群組關閉





【選舉論壇時間表】27-29/8

【選舉論壇時間表】

星期六 (27/8)
--------
新界東-上午8時 📻 商業一台
香港島 -下午1時 📺 無綫J5
新界西-下午7時 📺 港台電視31

星期日 (28/8)
--------
新界西-上午8時 📻 商業一台
超級區議會-下午1時 📺 無綫J5
超級區議會-下午7時 📺 港台電視31

星期一 (29/8)
--------
新界東-上午8時 📻 港台一台
香港島-下午6時 📺 Now 331台

策略投票,寸土必爭!

2016年8月26日星期五

民調可靠嗎?

撮要:選舉民調就從來都有誤差,但其實我們每天都利用很多未必是百份百準確的資訊去做決定,而人類就是能靠這些資訊,做出靠譜的決定。但民調是一連串的紀錄,它告訴你一個趨勢,令人對選情有個梗概。民調是會隨時間愈接近選舉而變得愈趨準確的,加上運用科學方法讓不同的數據來源互相修正,做出更準確的「合併報告」,我們就能從紛亂的數據中,理出個梗概來。

前言

「民調可靠嗎?」從來是選舉分析者永恆地要面對的問題。除非是如北韓那種不用選都知道誰會贏的地方之外,選舉民調就從來都有誤差。事實上,有分析更指出,不單止民調誤差必然存在,而且如果一個地方的民調上屆很準確的話,來屆那地方的民調就多數會不準確。(很奇怪吧!)

沒有神準的資訊,人類依舊能做靠譜的決定

那麼,為何我們還要看民調呢?那我就要問:我們看不看天氣報告和風暴消息?看不看財經評論?再進一步,我們坐的士前,會不會叫司機證明自己未來一小時的旅程不會撞車才願意上車?

其實,其實,我們每天都利用來自各方面有用的資訊去作出明智的決定,即使這些資訊當中絶大部分都未必可以預先證實是準確無誤的。民調其實都一樣,它不是水晶球,今天就能告訴你十二日後三百七十萬人的選擇;但民調是一連串的紀錄,它告訴你一個趨勢,雖然那個趨勢可以波動很大很大,但有時候它也是可以有跡可尋的。而且民調是會隨時間愈接近選舉而變得愈趨準確的,所以,它是有參考價值的,只是看的時候,不要天真地覺得「這就是選舉結果」就可以了。

「合併」的威力

另外,如果坊間同時有很多不同的民調,都指向某些結果,我們就可以相信那個結果是較大機會發生。但要普通人能一眼就看出數個或更多民調共同描繪出的形勢,是很困難的,這時候就是統計分析發揮功效的地方了。憑著各有千秋的統計工具,如較通用的線性迴歸分析(Linear regression analysis),或較新穎精密的隨機森林(Random forest),我們就能從紛亂的數據中,理出個梗概來。而雷動計劃的技術團隊,正正就是在努力做這件事:利用統計工具將幾個獨立及以不同方式進行的民調之結果進行合併分析,便能減少各自可能出現的偏差和不足的數據,從而得出一個比個別民調更準確的綜合分析報告。這不單是數學上可能,而且在技術上也己經開始成熟,因為在前沿的資訊科技世界中不少具預測能力的數學模型和程式,都是以這個基礎開發出來的。

建制怎樣看數據?

最後,講了那麼多,我們應看看我們的建制派:他們每次究竟投放多少資源去做民調和票站調查呢?按鍾庭耀的講法,規模大約是港大民調的二十倍。其實,若民調是沒有用的,他們犯不著這麼費勁好做民調吧。

除了基於個人觀察和對世局的認知,選民亦需要一個客觀獨立的數據分析以作參考減少個人主觀的偏見,然後聰明、合理地決定投出有價值的一票。我認為,這就是民調對選民的價值了。

原文刊於 獨立媒體

2016年8月25日星期四

策略投票,還是自求多福?

雷動計劃=策略投票運動

雷動計劃,說穿了就是一個全港性的策略投票運動。策略投票的意思是,投票者會本著「票值最大化」的想法去投票,將票投給最需要他一票的候選人,令投票者的陣營可以得到最多的議席。議會是表決議案的場合,不能單打獨鬥,想要自己的政治理想更有效地在議會中落實,就一定要有更多與自己立場相近的候選人當選可行。所以,策略地投票令最多非建制陣營的候選人當選,就是在香港這個爛議會選舉制度下,最理性的投票選擇。

要達到「票值最大化」這個目的,策略選民需要幾件武器:
  1. 愈準愈好的選舉預測
  2. 客觀有效,認受性高的選舉分析
  3. 有效的傳訊工具,令策略選民可以互通訊息
  4. 一個令所有策略選民都可以切實執行,週詳的行動計劃
雷動計劃已經為所有策略選民準備好上述武器,任君使用。

選舉預測怎樣做?

策略選民所需的選舉預測資訊,是由其中一個雷動計劃參與團體「公民數據」負責。公民數據負責做三件事:
  • 建立民意收集和聯繫的通訊平台《雷動聲吶》
  • 推動和建立更多的數據來源,如推動選情市場,推動學術機搆開放原始民調數據,組織近百名義工執行街頭民調工作等
  • 數據分析,將港大民研的數據,街頭民調和雷動聲吶,按適當的統計方法製作成有價值的「合併民調報告」
「合併民調報告」揉合了不同的數據,令它有條件比單以任何一組數據製成的報告有更好的預測能力。但這是怎樣做到的呢?方法是:

  1. 先將每個名單劃分進數個組別,不同組別代表票源是來自由「本土」到「保皇」政治光譜的選民。
  2. 將雷動聲吶的數據和港大民研的數據做比較,得出雷動聲吶參與者和港大民研的參與者在政治光譜的差異。由於大家都是來自香港選民人口,所以如果出現偏差,政治光譜偏差應較多發生在取樣沒較不符合隨機要求的雷動聲吶數據。我們就按照這個方法,為雷動聲吶數據進行加權調整。

    不同政治光譜在兩組數據中的差異
    不同政治光譜在兩組數據中的差異
  3. 我們會將數據分開六個選區來做比較。分組比較後,我們就可以知道雷動聲吶參與者相比港大民調數據,傾向非建制光譜的情況大概是怎樣,然後我們就可以按比例,逐個調低雷動聲吶支持非建制的樣本的加權。
  4. 把雷動聲吶數據調整後,我們就會用下列方法將港大民調數據與調整後的雷動聲吶數據進行合併:
• 由於雷動聲吶中只有少數親建制立場的參加者,所以支持者來自親建制候選人的得票數全數以港大民調結果作計算。

• 至於支持度來自非建制立場參加者的候選人,其在雷動聲吶中的數據將以港大民調結果,用「最小均方差估計」(MMSE)的方式合併。(「最小均方差估計」 為一種通用的統計方法,用最淺白概括的解釋,即是以樣本數增多,就適當提高加權值的一種方法。)

那我們就得到一個集合了各組數據的合併報告,成為比單看來自一組數據的選舉預測有效反映出來了。


雷動聲吶綜合分析報告
雷動聲吶綜合分析報告

數據偏差怎麼辦?

雷動聲吶的數據存在偏差,這時我們預計之內的事。其實任何現實世界收集的數據都有偏差,分別只是大小的問題。但有偏差的數據(biased data)不並是純綷的噪音(random noise),更不代表當中就沒有資訊內容(information)。只要我們能進行適當的數據勘探(data mining),我們仍能從中抽取資訊,令選舉預測更加準確。

我們是這樣處理和減少數據偏差帶來的不利影響:
  1. 上文已經解釋過,我們藉分析雷動聲吶參與者的政治傾向來與港大民研數據來比對,處理了雷動聲吶數據的部分偏差
  2. 除此之外,我們將會在下週推出的第三份報告中,開始引入街頭民調的數據,進一步改善偏差。
  3. 因為雷動聲吶系統容許我們追蹤每個參與者每次的投票變化,所以我們還會引入一些條件來為數據的可靠度做加權分析。用淺白的語言說,如果個別樣本的投票傾向在歷次民調中更改激烈,或者剛剛才加入雷動聲吶,那我們用統計方法便會減少他們的比重;相反,如果某樣本在歷次投票的光譜相近,我們就相應增加這樣本的比重,餘此類推。這套方法也會在第三份報告開始引入。
有關雷動聲吶受到有組織的影響,上我們亦一早預料到,並且已經有對策。我們在數月前撰寫的常見問題中,是這樣說的:


Q:如何防止參與者提供假資料影響數據分析?

A:首先,任何民調基本上都沒法阻止參與者提供假資訊。可是,從港大民調一向的紀錄,證明參與者提供假資訊對民調準確度的影響並不嚴重。

另外,雷動聲吶利用Telegram的設計,綁定每個電話號碼的戶口只能投票一次。這大大減輕了重覆投票問題,也增加了擾亂者的運作成本。

但如果真的有人或組織發起向雷動聲吶發放假消息的話,因為雷動聲吶的樣本基數大(目標為十萬個以上),他們也要動員相當人數和應(千人或以上)才足夠破壞數據準確度。一個動員那麼多人的行動,在消息流通的時間和強度,和滾動調查中的蛛絲馬跡,我們就可用統計技巧找出擾亂的出現和其程度,然後藉追查分佈來以減除干擾,並調整誤差值。

雷動聲吶常見問題

所以,要做到神不知鬼不覺的惡意擾亂並不容易,總會有跡可尋。一旦是有跡可尋,就不難以數據分析的方法去解決。就舉日前網上有人發起一起票投九龍西某候選人的事件為例子,因為參加者都只是響應網上動員而非真誠支持該候選人,所以在數據處理時我們會消除這些干擾。而事實上,我們亦在很短時間內就已經找出那大約一千位企圖擾亂數據的樣本,並會於未來的合併報告中減輕加權或排除。有趣的是,或者是媒體的流傳,干擾事件後,我們反而額外增加了千多位朋友(不計干擾者)參與民調。長遠來看,干擾者的行為或許反而幫助了系統改善數據質素。

當然,我們還有一些備用方案,去處理更細緻的擾亂,有需要時我們亦會使用。

(待續)