臥底經濟學家的10堂數據偵探課
💡 含金量高,許多觀念與Google的資料分析課程相應,讀起來特別有感
開門見山 十條戒律
- 第一,我們該學習停下來,注意自己對某一種說法的反應,而非憑感覺接受或排拒。
- 第二,我們該找方法,結合「鳥之眼」和「蟲之眼」看事物,也就是應用統計學視角,加上從個人經驗來看。
- 傾聽(全方位聆聽,把注意力放在聆聽對方,不要一邊聽,一邊想接下來要說什麼;提問,以釐清問題。
- 第三,取得數據時,我們該看看上面的標,問自己是否了解這些數據真正想描的東西。
- 第四,我們該尋求比較和背景,任何主張都得從更大的角度來看。
- 第五,我們該看看統計數據的背後,了解這些數據是怎麼來的-還有哪些數據可能已經消失了。
- 第六,數據擺在我們眼前時,我們要問,其中少了哪些人?如果把他們加進來,我們的結論是否會有所不同?
- 第七,我們應該要對演法和驅動演算法的大數據集尖銳的問題。我們要了解,如果不公開、不透明,就無法相信這些算法和數據。
- 第八,第八,我們應該更關注官方統計數據的基石-以及英勇捍衛這些數據的統計學家。
- 第九,我們不能只看漂亮圖表的表面,還必須仔細看看圖表的底下。
- 第十,我們必須保持開放的心態,問自己適不適可能錯了,以及事實是否已經有所改變。
但在一切之上,需要好奇來驅使
好奇心發生,通常是在已知與想知之間的缺口,這是好奇心的甜蜜點;善用這點,能讓我們對一切都更有興趣。
內容摘要與感想
素樸實在論
我們很容易把自己的觀點,認為是普遍的觀點,這樣主觀的想法,常常會與「現實」大相逕庭,因此不管在預測或是解讀數據時,需要保持更客觀的心;當然結合「蟲之眼」也不是壞事,但也不要忘了「鳥之眼」。
情緒
當我們看到某個數據時,很可能因為自己的某種立場,導致某種情緒,不管是沾沾自喜還是辯護,都會讓我們對數據產生不同的解讀,因此當面對數據時,需要稍微冷靜一下,不要太快下結論。
專家陷阱
當我們擁有某種專業知識,又充滿了動機時,很有可能導致更糟糕的偏誤;時時檢視到底我們是先有立場,還是先看數據。
真正的問題是什麼
當我們想要回答問題,必須理解問題真正的意義
數據文字的定義
當我們在審視數據時,要注意數據中用字的定義是否與我們想像一樣,否則做出來的數據分析很有可能是一場空。
數據地標
當我們面對一個不熟悉的數據時,要去找參照物,才能知道這個數字是大是小。
數據資料的來源
當數據資料來源有偏誤時,結果也會是有偏誤的;如果資料是從他人而來,要審視他們的條件,而如果由我們而來,也要盡可能找到潛在的假設。
大數據的缺失
我們看到大量的數據,就會假設他能代表全體,但永遠要一直思考到底裡面少了什麼人與什麼東西。
數據相關性的重要
即便我們發現數據間的趨勢,不了解原因,可能說服自己就是這樣,但是其中的關聯性,還是很重要,不可以就這樣認定他們的相關性,而要去了解原因。
大數據迷思
當代取得數據越來越簡單,會誤信數據的好用程度更高,但不管數據再大仍然會有小數據的問題,而且可能情況會更糟。
公開數據的重要
如果數據只給政府使用,那對改善政府一點用也沒有,而當這數據(前提是可靠)可以提供給人民時,我們可以好好督促政府,其實這樣政府也能更有效率地改善自己呀。
Comments