2010年12月2日 星期四

"如何用數字唬人"

數字最大的陷阱,並不在數字本身,而是人們處理這些數字的散漫態度。


如果要舉例說明玩弄數字的遊戲,還有什麼比前陣子有名的三氯氰胺事件更適合呢?

政府對於三氯氫胺的檢驗標準,在短短的一兩週間,從
無規定->0檢出->2.5ppm->0檢出->0.5ppm->?
就是這個比蒙地卡羅賽道還曲折的的政策輪轉,加深民眾的恐懼及不信任感。

不知道大家是不是還記得之前分享的"誰說人是理性的?"這本書,其中有一項造成人們出現偏差決策的因素就是「接受相對性的資訊」。這本書所說的,就是製作這些相對性數據的手段,以及識破它們的邏輯與方法。

Mental-02

這本書裡面提到主軸大多是有關統計數字的陷阱。以我個人的觀察,這些數字並不一定是被分析者刻意捏造出來的;而是這些分析者在分析前就「深信」某個argument,而後再嘗試從統計角度去找出蛛絲馬跡的結果:最常見的一種是無母數檢定沒過,為了得到想要的成果,直接忽略常態分佈適性的負面結論逕行成對T檢定。有些人稱這種現象為data fishing。舉凡樣本重複計算、(有意或無意間)引用不適當統計方法等,都是常見的data fishing手法。
而行家們對於這種行為相當感冒,認為data fishing的人們侮辱了統計這個專業,讓它在批判者的眼中成為了「東方萬靈丹」(snake oil)。


個人需引以為戒,大多數的統計手法雖然不難,但工具選擇的邏輯要相當的謹慎。

沒有留言: