雜訊:人類判斷的缺陷

天線得得得b

142 回覆
4 Like 1 Dislike
天線得得得b 2021-09-19 10:48:09
我和一組超級預測家分享了列維廷關於費米預測的討論,眾人齊聲同意他的觀點。桑迪·希爾曼告訴我,作為一名研究大氣模型的科學家,費米預測對他的工作至關重要,已經“融入我自己的思維方式中”。

我們將會看到,這是預測者的巨大優勢。 (注:超級預測家認為費米風格——敢於承認錯誤——對他們的工作至關重要。

以一位暱稱是“補鞋匠”的超級預測家為例。他來自弗吉尼亞,是一名軟件工程師。 2012年,他要回答尼日利亞政府是否會與“博科聖地”進行正式談判,此時他對這個國家知之甚少。於是,補鞋匠從外部視角開始,評估了過去與恐怖主義組織談判的整體成功率,並單獨就“博科聖地”的情況進行了評估。評估結果為,與“博科聖地”談判的成功率為0,與暴亂分子談判的整體成功率為40%,然後他將兩個值進行平均計算。接下來他轉向內部視角,評估談判雙方的選擇。政府希望保留有利條款,以便與溫和的穆斯林溝通,後者則希望成為政府與恐怖組織之間的權力掮客。 “博科聖地”也許至少有興趣表現出想要談判的樣子。補鞋匠還留意到有許多傳聞說“博科聖地”將會展開對話,但他考慮到該組織的殘暴,就沒有計算這些傳聞的影響,因此他猜測談判發生的概率是30%。最後他取外部視角和內部視角的平均值,得到25%,並規定隨著最終期限的臨近,逐步降低這個估計值。以上所有費米式猜測的最終結果是:他在這個問題上的布萊爾得分位於前10%之內,該問題使許多人受到將要發生對話的傳聞影響而導致誤報。

再以超級預測家瑞加娜·約瑟夫為例。她處理的問題與中國暴發致命性禽流感疫情的風險有關,這是這位政治風險分析師的新課題。她興趣廣泛,工作範圍包括研究數字媒體所受到的限制和給美國奧林匹克女子擊劍隊做培訓,但她沒有任何流行病學背景。她也是從外部視角開始:禽流感造成的傷亡人數超過閾值的次數佔多大比例?大約為80%。不過,流感發病期已經過去一個季度了,因此她將比例降為60%。接著約瑟夫轉向內部視角,注意到公共健康政策有改進,預警指示系統也更加完備。這些因素使概率降為40%,並隨著時間推移逐步降低。最終結果:雖然她的布萊爾得分算不上特別出色,但是好於85%的預測者。

還有威爾頓·常。他過去是一名在伊拉克戰鬥過的軍官。他評估的是敘利亞自由軍2013年佔領阿勒頗的可能性。首先從外部視角入手:軍事實力明顯佔優的進攻一方佔領像阿勒頗這樣面積廣闊的城市地區需要多長時間?簡要回答:5~10年,因此成功的基本概率為10%~20%。接著威爾頓借助內部視角發現,作為一支實力佔優的軍隊,敘利亞自由軍還略欠火候,因此他降低了概率值。最終結果:威爾頓在該問題上的布萊爾得分位於前5%之內。令人驚訝的是,有很多主觀假設成為相當出色的預測的基礎。我們的選擇不是是否要進行粗略的預測,而是公開還是私下進行。 )
天線得得得b 2021-09-19 10:50:57
倫澤蒂一家人住在栗子大道84號的一棟小房子裡。弗蘭克·倫澤蒂44歲,在一家搬家公司擔任記賬員。瑪麗·倫澤蒂35歲,在一家托兒所兼職。他們有一個孩子,5歲的湯米。弗蘭克的父親過世了,母親卡米拉和一家人生活在一起。

我的問題是:倫澤蒂養一隻寵物的可能性有多大?

為了回答這個問題,大多數人會將目光鎖定在這家人的細節上。 “倫澤蒂是一個意大利名字,”有人會想,“弗蘭克和卡米拉也是。這也許意味著弗蘭克和許多兄弟姐妹一起長大,但他只有一個孩子。他很可能想要一個大家庭,可是負擔不起。所以,有理由認為他通過養寵物來彌補小家庭的遺憾。”還有人會這麼想,“人們為孩子養寵物,倫澤蒂只有一個孩子,而且湯米歲數還小,不能照顧寵物。因此,似乎不太可能”。這種編故事式的推理可能非常具有說服力,當他們能看到的細節比我在這裡所提供的豐富得多時,更是如此。

可是超級預測家不會被任何細節所束縛,至少一開始不會這樣。他們要做的第一件事是查詢養寵物的美國家庭的比例。

統計學家稱之為“基本比例”,即某種事物在同類中的普遍程度。丹尼爾·卡尼曼給它起了個更容易聯想到視覺的名稱——“外部視角”(outside view),與“內部視角”(inside view)相反,後者指的是特定事例的細節。用谷歌搜索幾分鐘,我們知道大約62%的美國家庭擁有寵物。這是外部視角。從外部視角著手意味著,我的第一次預測是倫澤蒂養寵物的概率為62%。然後我要轉向內部視角,也就是所有關於倫澤蒂一家的細節,通過對細節的分析來調整初始值。

如果比爾·弗萊克被問到中國和越南在未來12個月內是否可能因為邊界糾紛發生武裝衝突,他不會立即去探究中越邊界糾紛的具體細節和二者關係現狀,而是研究過去兩國武裝衝突的頻率。 “假設每5年中國和越南發生一次敵對行為,”比爾說,“我會用5年復發模型預測未來。”在給定的某一年,根據外部視角的提示,爆發衝突的概率是20%。確定這個概率後,比爾再分析今天的形勢,調整預測數字。
天線得得得b 2021-09-19 10:54:20
研究人員發現,要求人們假設他們的初始判斷是錯誤的,然後認真思考錯誤原因,接著做出新的判斷,產生第二次預測,並與第一次相結合,僅僅做到這幾點,就能大幅提高準確性,使得第二次預測就像是其他人的成果。 (注:Stefan Herzog and Ralph Hertwig,“The Wisdom of Many in One Mind,”Psychological Science20,no.2(February2009):231–37.)此外,要求人們在幾個星期之後再進行第二次預測,也能產生同樣的效果。這種方法以“群體的智慧”這個概念為基礎,被稱為“內心的群體”。擁有億萬資產的金融家喬治·索羅斯就是一個例子。正如索羅斯經常提及的那樣,他成功的關鍵在於習慣跳出自身束縛來思考問題,這樣,他能夠評判自己的想法,產生不同視角,“他人”的視角。 (注:George Soros,Soros on Soros:Staying Ahead of the Curve(New York:Wiley,1995).)
天線得得得b 2021-09-19 10:57:42
然而,這些人都是普通人。預測是他們的業餘愛好。他們唯一的回報只是一張禮券和在臉譜上炫耀的權利。那麼,為什麼他們投入這麼多精力呢?一個答案是找樂子。 “認知需求”是一個心理學術語,用來概括從事並且享受繁重腦力勞動的偏好。認知需求強烈的人喜歡填字遊戲和數獨遊戲,難度越大,表現越好。超級預測家在認知需求測驗中得分很高。

不過,說到底,超級預測家的表現與人格特徵和智力的關係,不如與行為的關係那麼密切。聰明的謎題終結者也許具備尚未開發的預測潛能,可是,如果他沒有興趣質疑自己寄予深厚感情的基本觀念,那麼,相較於智力平庸但更擅長自省式思維的人,前者通常處於劣勢。最重要的不是你所擁有的不成熟的思維能力本身,而是如何運用它。

看看道格·洛奇。他的天生愛好一目了然,但他認為這並不一定保證自己成為人生贏家。他會培養這種愛好。道格知道,當人們把讀書當作樂趣時,他們自然會被志同道合者所吸引。於是,他創建了一個數據庫,其中包含數百個信息來源,從《紐約時報》到鮮為人知的博客,盡數收錄其中。這些信息來源按照思想傾向、主題和地理來源分類,打上標籤。接著,他編了一套程序,設定了強調多樣性的原則,以此來選擇接下來要讀的書。得益於這個簡單發明,道格必然經常接觸到不同視角。他不僅是思維開放,而且是主動地開放思維。

對超級預測家而言,觀念是要接受檢驗的假設,而不是要護衛的珍寶。簡化超級預測,使它像汽車保險槓上的口號那麼簡單,這事不難,如果我必須這麼做,就一定能做到。
天線得得得b 2021-09-19 11:03:05
更重要的是,輕視觀念的更新是個巨大的錯誤。我們所說的更新,不是不加思考地根據美國有線電視新聞網的任何報導調整自己的預測。合理的更新需要運用在初始預測中用到的技能,通常要求非常嚴格,甚至可能更具挑戰性。
天線得得得b 2021-09-19 11:03:22
反應不足和反應過度都可能降低準確性。在極端情況下,二者都能夠毀掉本來相當準確的預測。
天線得得得b 2021-09-19 11:05:51
請注意蒂姆的變動幅度有多麼小:完全沒有30或40個百分點的劇烈振盪;平均變動非常小,只有3.5%。這至關重要。少數幾次小幅調整會使蒂姆看起來反應不足,而多次大幅調整又會讓他顯得反應過度。但如果採用多次小幅調整,蒂姆就可以在斯庫拉和卡律布狄斯之間安全航行了。

我們可以將這樣細小的變動稱為“懷疑單元”,用它作為思維工具,也許看起來有些奇怪。不過,如果你的思維能達到蒂姆的細分程度,自然也會那樣做。
天線得得得b 2021-09-19 11:06:16
不會根據新信息調整預測觀點的預測者將無法抓住新信息的價值,而對新信息如此敏感以至於完全根據新信息來做預測的預測者將失去舊信息的價值,而這些舊信息正是之前預測的基礎。小心翼翼地在新舊信息之間尋找平衡的預測者能夠抓住二者的價值,將其註入新預測中。要做到這一點,最好的方法是邁小步、勤更新。
天線得得得b 2021-09-19 11:08:05
對凱恩斯而言,失敗是學習的機會:認識錯誤,發現新的選擇,再次嘗試。
天線得得得b 2021-09-19 11:09:03
只要掌握一本小冊子的內容,我們的培訓指南(見附錄)可以使你的預測準確率提高近10%。這些試驗還顯示了書本知識的影響和實踐的影響是如何相互作用的。讀過小冊子的人從實踐中受益更多,反之亦然。運氣青睞有準備的頭腦。培訓指南幫助我們從個人經歷中抽取正確的經驗教訓,達到外部視角和內部視角的平衡。反過來,個人經歷幫助我們將現實世界的內容注入乏味的公共知識的抽象概念中。
天線得得得b 2021-09-19 11:10:34
給志向遠大的超級預測家的“十誡”

1.鑑別分類
舉個例子。 “12年後的2028年,誰會當選美國總統”,這個問題現在是不可能預測的。

當然,越接近預測對象的截止日期,分類就越難。假設你在2015年3月充滿信心地預測2016年選舉的獲勝者是誰,你的自信有多少是合理的?簡單的答案是,不太多,但是仍然比預測2028年選舉結果時要多得多。我們至少可以縮小2016年的競選者範圍,將目標鎖定在少數有希望的人身上,這可比2028年隱藏的大量未知可能性(像艾森豪威爾這樣的)要好多了。

某些類別的結果出了名的根本無法預測(例如油價、貨幣市場)。但是我們通常看不出事件結果的不可預測程度有多深,直到我們耗費較長時間努力理清分析思路時,才會意識到它確實難以預測。請注意,這裡有可能出現兩個基本錯誤。一是,可能沒有嘗試預測潛在的可以預測的事物;二是,可能將時間浪費在預測不可預測的事物上。就你現在所面對的情形而言,哪種錯誤影響更大?
天線得得得b 2021-09-19 11:16:27
2.將看似棘手的問題分解為容易處理的子問題

引導自己形成恩里科·費米那樣的既幽默滑稽又嚴謹自律的風格。費米在設計世界上第一個原子能反應堆之前,喜歡回答“宇宙中存在多少個外星文明”這樣令人頭疼的問題,答案都是他自己估計的。像他那樣,將問題分解為可知和不可知的部分。對尚未確定答案的部分一概視為未知。說出自己的假設並加以驗證。大膽猜想,勇於試錯。寧願迅速發現錯誤,也不要用模糊的措辭隱藏錯誤。

超級預測家認為費米式方法是工作的一部分。否則,面對看似不可能量化的問題,例如阿拉法特是否釙中毒、禽流感、石油價格、“博科聖地”、阿勒頗之戰、債券利差等問題,他們怎麼能得出定量答案呢。

3.正確平衡內部視角和外部視角

4.正確平衡對證據的反應不足和過度反應

觀念更新對於好的預測的意義,就如同刷牙和用牙線剔牙之於良好的口腔衛生。這個過程可能枯燥,有時還讓人難受,但是長期來看它是有益處的。話說回來,不要因為觀念更新有時比較容易,就認為無論何時它都不難。熟練的更新需要預測者從嘈雜的信息流中梳理出細微的信號,並且始終拒絕主觀意願的誘惑。

5.尋找每個問題中發生作用的相互衝突的因果之力

在古典辯證法中,命題與對立命題相遇,產生的是綜合性命題。在蜻蜓的複眼中,一幅圖像與許多不同的圖像相遇,最後一定融合為單一畫面。數字畫規則在這裡完全失效。綜合性命題是一門藝術,需要融合不可簡化的主觀判斷。如果你精於此道,參與這個合成過程將會讓你從純粹的鴿派或鷹派轉變為古怪的混血生物——鴿鷹。你的觀點也會變得細膩,就像這樣:更強硬或更溫和的政策何時更能發揮效用。

6.按照問題自身特性劃分盡可能多的不確定性等級,但要適可而止

幾乎沒有任何事物必然出現,或者完全不可能出現。而“也許”這個詞所傳遞的信息又不是那麼明確。因此,我們的不確定性需要的設置不止三種。細微差異的確重要。我們能夠劃分的不確定性等級越多,預測能力就越強。

在紙牌遊戲中,如果你比對手更善於區分賭注勝算為六四開與四六開(或者55%與45%)的差別,你就能獲得優勢。剛開始將表達不明確的直覺轉化為用數字表示的概率時,你會感覺不自然,但你可以完成這個過程,它所需要的僅僅是耐心和練習。超級預測家向我們詮釋了有志者事竟成的道理。

7.正確平衡信心不足與過分自信、慎重與果斷

8.探尋錯誤背後的問題,但要謹防後視偏差

9.激發他人的最大潛能,同時也讓他人激發你的最大潛能

10.掌握騎自行車的技術

執行上述每一條都需要像騎自行車那樣防範矯枉過正的錯誤。正如你不可能僅僅通過看物理學課本就學會騎自行車,也不可能讀完培訓手冊後就成為超級預測家。學習需要實踐,實踐產生明確的反饋,使你完全清楚自己將會成功(“我進展順利!”)還是將會失敗(“完蛋了!”)。另外,請記住,實踐不只是完成預測的動作,不是漫不經心地讀讀新聞,然後就拋出一堆概率數字。和其他各種已知形式的專業技能一樣,超級預測也是經過深思熟慮的深度實踐的產物。

11.活學活用

“(在戰爭中)遵守強制性規定不可能的,”赫爾穆特·馮·毛奇警告說,“因為絕不會有兩種完全相同的情形。”
天線得得得b 2021-09-19 11:17:53
他們的哲學思想通常是這樣的:

謹慎:沒有事情是一定的,超級預測家總是持有懷疑心。

謙虛:現實是無限複雜的。超級預測家謙虛但不自卑。

不確定性:沒有什麼事是注定的,也沒有什麼事是必鬚髮生的。

他們的能力和思維方式通常是這樣的:

主動開放的思維:任何信仰都可以是一種假設,可以被測試。

知識淵博、有“認知需求”:理智的好奇心,享受對智力和精神挑戰的快樂。

吾日三省吾身:善於自我反省和批評,吸收各種反饋意見。有數學邏輯:善於運用數學工具分析問題,對數字敏感。

他們的預測方法通常是這樣的:

實事求是:不咬定一種分析方法不變。

善於分析:有能力退一步看到更多種可能性。

海納百川:接受價值觀不同的觀點,並將它們為自己所用。

善於學習:當事情變化時,能夠適時改變自己的想法。

思辨直覺:超級預測家善於意識到人情緒和認知上的偏見或傾向。

他們的職業道德通常是這樣的:

成長心態:相信沒有最好只有更好。

持之以恆:不管要花費多長時間都能堅持做下去。

我在這裡只是泛泛而談。不是所有的品質都是同等重要的。成長為超級預測家的預測者中最堅定的那一批人就是永遠的貝塔,這代表了執著於更新觀念和自我提升的程度。預測者的堅定意誌所發揮的作用大約是其最接近的對手——智力——的3倍。借用托馬斯·愛迪生的名言,超級預測約有75%來自汗水,25%來自靈感。

不是每個超級預測家都具有上述所有品質。成功的途徑有很多,某方面有不足,可以有多種方法彌補,同時在其他方面強化堅定的意志。不過,永遠的貝塔的預測能力確實表明,如果一個人無意投入巨大精力去實現“培育神經元突觸”的個人目標,那

麼,無論他的智商多麼高,這種缺陷都是難以彌補的。

雖然前面描述了許多,但還是漏掉了一個因素:他人的影響。在我們的私生活中,在工作場所,我們很少完全孤立地預測未來。我們是群居物種。我們共同做決定。這引出了一個重要問題。

一群超級預測家一起工作時,會是怎樣一番景象?
天線得得得b 2021-09-19 11:19:48
請看看超級預測所需的思維方式,並思考一下它如何與領導者要展現的精神風貌相匹配。
如果領導者認為一切都不是確定的,他又怎能自信,並且激發大家的自信呢?
如果他們的思維如此遲鈍,觀念如此煩瑣,自我批評意識過於強烈,他們又怎能有決斷力,避免“思維癱瘓”呢?
如果新信息很容易讓他們調整觀點,甚至認為自己判斷錯誤,他們又怎能懷著永不言敗的決心執行決策?

構成超級預測基礎的是一種謙卑思想:現實世界的複雜性令人吃驚,我們理解現實的能力有限,錯誤在所難免。沒有人在描述溫斯頓·丘吉爾、史蒂夫·喬布斯和其他任何偉大領袖時,用到“謙卑”這個詞。呃,也許甘地適合這個詞,但請試著說出第二位和第三位適合用“謙卑”來描述的領袖。

再想想超級團隊的運作方式。他們受到指導來組建高效率團隊,不過,團隊內沒有任何強迫行為。沒有等級關係,沒有命令,沒有正式的領導。這些無政府主義小細胞也許像論壇那樣提供無休止的思考和再思考,這些正是超級預測家喜歡做的事,但是他們幾乎算不上可以讓成員聚集起來完成某項任務的組織。那樣需要建立組織架構,需要一位管理組織的領導者。

這看起來像是嚴峻的困境。領導者必須是預測者,同時也是領導大家的人,可是,似乎其中一個角色成功所需的因素會阻礙另一個角色的成功。
天線得得得b 2021-09-19 11:23:42
“在戰爭中,一切都不確定。”赫爾穆特·馮·毛奇寫道。 (注:Helmuth von Moltke,Moltke on the Art of War:Selected Writings,ed.Daniel J.Hughes,trans.Daniel J.Hughes and Harry Bell(New York:Ballantine Books,1993),p.175.)19世紀末,毛奇領導普魯士軍隊,分別於1864年打敗丹麥、1866年打敗奧地利、1871年打敗法國,從此名揚四海。這一系列勝利最終導致德國統一。他關於戰爭的著作受到偉大的理論家卡爾·馮·克勞塞維茨的影響,對參與兩次世界大戰的德國軍隊的發展產生了深遠影響。

可是毛奇並非拿破崙式的人物。他從未認為自己是有遠見的領導者,像旗手一樣指揮自己的軍隊。他培養領導人和建設組織的方法完全不同。

普魯士軍界長期以來相信不確定性的存在,他們還發明了擲色子的桌上游戲,以此作為在棋類比賽中失利的可能性的預兆。但是,“一切都不確定”作為毛奇的信條,其含義需要仔細梳理一番。最迫切的是絕不要完全相信你的計劃。

“沒有任何行動計劃在(我軍)與敵軍主力第一次遭遇後仍然確定可靠。”

他寫道。這番言論經過數十年的精煉和重複已經不復當初,現在的士兵知道的是“與敵軍遭遇後,一切計劃都要調整”。這要簡潔多了。不過,請注意,毛奇的原話更加細緻入微,這是其思想的典型特徵。他寫道,“死守規矩是不可能的”,這句話適用於任何環境。在戰爭中,“絕不會有任何兩種情形是完全相同的”,即興發揮必不可少。 (注:Ibid.,p.228.)

毛奇相信,他的軍官能夠勝任職責。除了軍事訓練外,他們還會接受現代人所認為的人文教育,重點是批判思維。即使是主要講解純軍事問題的課程,也會要求學生們努力思考。當時在其他國家,包括美國,教師只是列出問題,告訴學生正確答案,要求他們點頭接受並記住答案。而在德國軍事學院,教師列出假想情景,學生受邀提出排兵布陣的方案,然後大家集體討論。分歧不僅是允許存在的,而且是教師所期待的,甚至他的觀點也會受到學生挑戰,因為他“明白自己是一群志同道合者中的一員”,歷史學家約爾格·慕特(Jörg Muth)評論說。就連將軍的觀點也會受到深究。 “德國下級軍官常被要求說出他們的見解。在一場由幾個師參加的大規模演習結束之後,他們還可以批評演習結果,然後才是參加演習的將軍發言。”(注:Jörg Muth,Command Culture:Officer Education in the U.S.Army and the German Armed Forces,1901–1940,and the Consequences for World War II(Denton,TX:University of North Texas Press,2011),p.167.)
天線得得得b 2021-09-19 11:25:54
彼得雷烏斯說過,“士兵所攜帶的最強大工具不是武器,而是頭腦”,他對思維靈活性的執著在軍隊中仍然存在爭議。 “哈姆雷特就是顧慮重重。”

理性應對不和諧聲音是一件難事。 “檢驗是否具備一流的智力,要看能否同時持有兩個相對立的觀點,並且仍然能夠正常工作。”
天線得得得b 2021-09-19 11:26:56
2014年夏,超級預測家不僅僅是憑藉超級運氣才取得如此成就的事實已經很明顯,卡尼曼則直言不諱地問我:“你認為他們是自身與眾不同,還是做事與眾不同?”

我的答案是:“二者都有點。”誠然,他們在智力和思維開放性方面確實比普通人得分更高,儘管也沒有高到創紀錄。但是導致他們如此出色的因素中,自身因素的影響還是少一些,更多的影響來自他們所做的事,例如,辛勤研究,認真思考,自我批評,吸收和融合其他人視角,非常細化的判斷,以及永不停息地更新預測。

不過,他們能堅持多久?我們看到,理論上人們可以運用第二系統的自覺思考來挑出第一系統無意識的快速反應所造成的錯誤。超級預測家在這方面付出了巨大努力。可是,持續的自我審查令人筋疲力盡,而知道答案的感覺又是那麼美妙。所以,毫無疑問,即使我們當中最出色的人也會不可避免地倒退到更加容易的直覺思維模式中。
吹水台自選台熱 門最 新手機台時事台政事台World體育台娛樂台動漫台Apps台遊戲台影視台講故台健康台感情台家庭台潮流台美容台上班台財經台房屋台飲食台旅遊台學術台校園台汽車台音樂台創意台硬件台電器台攝影台玩具台寵物台軟件台活動台電訊台直播台站務台黑 洞