2011年4月23日 星期六

思考方法 – 數據分析

「量化虛詞」有很多時候是用來「概括表述」一些有關數據的形容詞,之所以歸類為「虛詞」是因為量化詞並無確實的數據概念,這從以下例子可見一班:多數、少數、通常、例外、大部份、有機會、可能會...等等。

一般我們辯論所接觸到到數字問題都離不開社會民生等統計數據,也有闡釋哲學關係的表述亦屬於此類,前者例如「大部份市民意見」(比重判斷)、後者如「人定勝天」(確定判斷)

正確的數據處理方法可以加強思想的準確性,使得辯論時可以避免無謂的爭拗。例如曾經有過一些社會福利的命題如《應立例子女供養父母》,反方提出「會引起不必要的家庭爭拗」,然後就列舉一大堆「家庭衝突事件」、再加一兩個對簿公堂的案件,就結論出「會引起爭拗」。

心水清的讀者當然知道「會不會」不單只是一個語理概念這麼簡單,而是指涉政策會否造成某一種「可以量化及判斷的因果關係」,兩者不能混淆!

在傳統邏輯律之中,有例外就是命題不成立,但命題涉及的是一個社會現象或者在科學統計,當中經常可以有「例外」。正如某某人吃了老鼠藥而沒有死(例如劑量過輕或搶救及時等等原因,最近的說法是 made in China,並不表示作為普遍概念可以說「吃老鼠藥不會死人」!
至於「政策命題」,要爭拗的有很多時候不是「邏輯」這麼簡單,而是社會民生事務,因此對於統計學上的「因果關係」需要格外留意。
類似的數字問題也出現在「最低工資」的討論之中,例如雷鼎明教授在2008916日信報刊出相關的討論《最低工資的社會代價》,其中就何謂弱勢社群/受影響社群的分析如下:
假設最低工資原本是4000元,但政府立法把它增至6000元,即50%的增幅。在未增加前,共有弱勢社群一百人,其中五十人收入在40006000元之間,餘下的五十人在60008000元之間。增加最低工資後,較高薪不是這麼弱勢的後者飯碗不會被打破,但更弱勢的五十人則有部分會失業。假設失業的是四十人(原本月薪只稍低於6000元的或尚可保住職位,因為有些僱員被炒後,餘下的要負起更大的工作量,所以僱主願意留住他們。)。
從以上例子看來,最低工資增加50%,弱勢社群的就業表面上只是下降了40%(由一百人降至六十人),所以需求彈性是0.8,似乎不高。不過,正確的計算應只集中在真會受影響的一群,亦即五十個最低薪人士中有四十人失業,真正弱勢社群就業人數下降了80%,需求彈性是1.6(其實對於本來薪金有50006000元的人來說,工資升至6000元並非50%的增長)!
換言之,按雷鼎鳴教授的分析,所謂「影響」不能只看整體數字,而是要看基數,亦即原本已經拿到最低資水平以上的勞工,由於根本不受影響,根本就不應包括在基數之內。
日常所見的所謂民意調查等都可算是高級文字游戲,所以在處理這類題目的時候一定要了解清楚到底應該用什麼論證方法。葉保強在《思考與理性思考》中也有不少篇幅論述數字游戲,可作詳細參考。
試舉一個很常見的誤用因果關係的「統計分析」案例 :在20027月初,香港《基督教服務處》「用電話訪問了一百名年齡介乎六 至九歲的兒童」,以了解兒童的創意與解決問題能力的關係。調查顯示,兒童的創意愈高,解決問題的能力便愈高,兩者存有正比關係。因而該組織發言人謂:要提高兒童的「創意」,才能有助他們「解決問題」。
表面看來這個研究沒有什麼問題,但假如詳細考慮一下分析技術是否應用得宜、結論是否可靠、建議是否合理等等,當中實在大有問題。
1.          電話訪問是否正確的「調查方法」,尤其當被訪問的對象只是小朋友的時候?
2.          何謂「創意」?何謂「解決問題的能力」,到底根據什麼客觀條件及理論加以斷定?
3.          也正是數據分析的重點,到底兩個數據何謂有「正比關係」,而「正比關係」是否第同「因果關係」?
相信心水清的讀者到第三步的時候都會明白,所謂「對症下藥」實在一點也不容易,因為「下藥」容易「對症」難!成藥有很多,但藥石亂投的大有人在。
例如上述倡議「提高兒童的創意能力」沒有錯、倡議「提高兒童解決問題的能力」也沒有錯,但將兩個陳述綜合起來,倡議「通過提高兒童的創意能力可以提高解決問題的能力」,這個綜合結論的因果關係就很有問題。因為在統計學上,「正比關係」只是指兩個指標數據有相同的趨勢,但並不表示兩個因素之間一定有互相影晌的「因果關係」。數據也可以表示:兩者有可能同時受「第三因素」決定、甚至可以是反過來表示「創意受解決問題的能力所決定」!


沒有留言:

張貼留言