💡 含金量高,許多觀念與Google的資料分析課程相應,讀起來特別有感

開門見山 十條戒律

  • 第一,我們該學習停下來,注意自己對某一種說法的反應,而非憑感覺接受或排拒。
  • 第二,我們該找方法,結合「鳥之眼」和「蟲之眼」看事物,也就是應用統計學視角,加上從個人經驗來看。
  • 傾聽(全方位聆聽,把注意力放在聆聽對方,不要一邊聽,一邊想接下來要說什麼;提問,以釐清問題。
  • 第三,取得數據時,我們該看看上面的標,問自己是否了解這些數據真正想描的東西。
  • 第四,我們該尋求比較和背景,任何主張都得從更大的角度來看。
  • 第五,我們該看看統計數據的背後,了解這些數據是怎麼來的-還有哪些數據可能已經消失了。
  • 第六,數據擺在我們眼前時,我們要問,其中少了哪些人?如果把他們加進來,我們的結論是否會有所不同?
  • 第七,我們應該要對演法和驅動演算法的大數據集尖銳的問題。我們要了解,如果不公開、不透明,就無法相信這些算法和數據。
  • 第八,第八,我們應該更關注官方統計數據的基石-以及英勇捍衛這些數據的統計學家。
  • 第九,我們不能只看漂亮圖表的表面,還必須仔細看看圖表的底下。
  • 第十,我們必須保持開放的心態,問自己適不適可能錯了,以及事實是否已經有所改變。

但在一切之上,需要好奇來驅使

好奇心發生,通常是在已知想知之間的缺口,這是好奇心的甜蜜點;善用這點,能讓我們對一切都更有興趣。

內容摘要與感想

素樸實在論

我們很容易把自己的觀點,認為是普遍的觀點,這樣主觀的想法,常常會與「現實」大相逕庭,因此不管在預測或是解讀數據時,需要保持更客觀的心;當然結合「蟲之眼」也不是壞事,但也不要忘了「鳥之眼」。 素樸實在論 蟲之眼鳥之眼

情緒

當我們看到某個數據時,很可能因為自己的某種立場,導致某種情緒,不管是沾沾自喜還是辯護,都會讓我們對數據產生不同的解讀,因此當面對數據時,需要稍微冷靜一下,不要太快下結論。 情緒

專家陷阱

當我們擁有某種專業知識,又充滿了動機時,很有可能導致更糟糕的偏誤;時時檢視到底我們是先有立場,還是先看數據。 專家陷阱

真正的問題是什麼

當我們想要回答問題,必須理解問題真正的意義 真正的問題是什麼

數據文字的定義

當我們在審視數據時,要注意數據中用字的定義是否與我們想像一樣,否則做出來的數據分析很有可能是一場空。 數據文字的定義

數據地標

當我們面對一個不熟悉的數據時,要去找參照物,才能知道這個數字是大是小。 數據地標

數據資料的來源

當數據資料來源有偏誤時,結果也會是有偏誤的;如果資料是從他人而來,要審視他們的條件,而如果由我們而來,也要盡可能找到潛在的假設。 數據資料的來源

大數據的缺失

我們看到大量的數據,就會假設他能代表全體,但永遠要一直思考到底裡面少了什麼人與什麼東西。 大數據的缺失

數據相關性的重要

即便我們發現數據間的趨勢,不了解原因,可能說服自己就是這樣,但是其中的關聯性,還是很重要,不可以就這樣認定他們的相關性,而要去了解原因。 數據相關性的重要

大數據迷思

當代取得數據越來越簡單,會誤信數據的好用程度更高,但不管數據再大仍然會有小數據的問題,而且可能情況會更糟。 大數據迷思

公開數據的重要

如果數據只給政府使用,那對改善政府一點用也沒有,而當這數據(前提是可靠)可以提供給人民時,我們可以好好督促政府,其實這樣政府也能更有效率地改善自己呀。 公開數據的重要

Comments