貝葉斯思維指南:如何在不確定中做出更優(yōu)決策
信念并非非黑即白,而是存在程度差異。貝葉斯主義提供了一套用概率進(jìn)行推理的工具。本文通過醫(yī)學(xué)檢測(cè)、NBA投籃、大學(xué)錄取等貼近生活的案例,教你在充滿不確定性的情況下做出更好決策。無論你是在規(guī)劃孩子的教育投資,還是面臨重要的職業(yè)選擇,貝葉斯思維都能幫助你讓觀點(diǎn)與證據(jù)更匹配。
當(dāng)別人問你相信什么時(shí),比如相信鬼神嗎?相信全球變暖嗎?相信愛嗎?人們常說,信念決定了你是誰,也決定了你該做什么:“做你認(rèn)為正確的事?!?/p>
這些問題往往要求非黑即白的答案,但生活遠(yuǎn)非如此簡(jiǎn)單。對(duì)于許多重要問題,三個(gè)選項(xiàng)都不夠用?,F(xiàn)在,我正在研究孩子的教育規(guī)劃,學(xué)校的選擇取決于諸多變量:他們能進(jìn)入什么樣的學(xué)校?什么樣的學(xué)校適合他們?如果我們換一種投資方式,未來兩年、五年、十年會(huì)有怎樣的回報(bào)?
假設(shè)有人試圖幫我:“這很簡(jiǎn)單,你相信大女兒會(huì)被xx大學(xué)錄取嗎?”我不知道該如何回答。我不相信她一定會(huì)被錄取,也不相信她一定不會(huì)。我覺得概率略高于50%,但遠(yuǎn)非確定。
過去幾十年有一個(gè)重要的概念突破:信念是有程度的。我們不只是“相信”或“不相信”某件事,大部分思考和決策都由不同程度的信心驅(qū)動(dòng)。這些信心程度可以用0到100%的概率來衡量。當(dāng)我為孩子的教育投資時(shí),只問“我相信股票會(huì)跑贏債券嗎”過于簡(jiǎn)化。我不可能知道答案,但可以嘗試為每種結(jié)果給出有依據(jù)的概率估計(jì),再據(jù)此平衡投資組合。
用概率推理并非易事。多年研究表明,我們大多數(shù)人從小就被教育用非黑即白的方式思考。我們會(huì)表達(dá)中間程度的信心,但不擅長(zhǎng)用這些概率進(jìn)行推理。研究一次次揭示出普通人在概率思維中的系統(tǒng)性錯(cuò)誤。
幸運(yùn)的是,18世紀(jì)有一位名叫托馬斯·貝葉斯的牧師,他對(duì)概率數(shù)學(xué)的研究催生了如今的貝葉斯統(tǒng)計(jì)運(yùn)動(dòng)。你可能聽過“貝葉斯”這個(gè)詞,其核心是一套用概率推理的工具包,它告訴你如何用數(shù)字衡量信心程度、測(cè)試這些程度是否合理,以及如何隨時(shí)間管理它們。
最后一點(diǎn)尤為重要。對(duì)于任何給定的說法,不同時(shí)間的信心程度是不同的。等大女兒考完試,我會(huì)獲得關(guān)于她大學(xué)前景的新證據(jù),并據(jù)此調(diào)整信心程度。貝葉斯主義提供了執(zhí)行這項(xiàng)工作的方法。
在本指南中,我將介紹幾個(gè)基本的貝葉斯思想來改進(jìn)概率推理。我不能保證讓你成為完美的概率推理者,但這能幫你開始更好地讓觀點(diǎn)與證據(jù)相稱,在不確定性面前做出更優(yōu)決策。

思維工具1:接納不確定性
貝葉斯主義的第一步是摒棄非黑即白的思考方式。貝葉斯主義者希望超越“要么相信要么不相信”的二分法,將信念視為有程度的事物,這些程度可用0到100%的量表衡量。若確定某事件會(huì)發(fā)生,信心就是100%;若確定不會(huì)發(fā)生,就是0%。
但貝葉斯主義者建議不要走極端。很少有情況能合理地確定某事一定會(huì)發(fā)生或不會(huì)發(fā)生。1971年,貝葉斯主義者丹尼斯·林德利在《做決策》一書中,贊賞地引用了奧利弗·克倫威爾的格言:總要“認(rèn)為你可能是錯(cuò)的”。除非某事件嚴(yán)格來說不可能,否則不應(yīng)確定它不會(huì)發(fā)生。
也許我們不該給任何可能發(fā)生的事賦予0的信心。但我們都聽過有人說某種可能性是“百萬分之一”,認(rèn)為它幾乎不會(huì)發(fā)生,可約等于零?林德利也曾說,他可以給“月球是綠奶酪做的”賦予百萬分之一的信心。
用概率推理時(shí)常見的錯(cuò)誤是認(rèn)為百分點(diǎn)的零頭——尤其是接近0%或100%的極端值——無關(guān)緊要。任何有幸獲得高質(zhì)量現(xiàn)代產(chǎn)前護(hù)理的父母,都會(huì)看到基因檢測(cè)報(bào)告顯示胎兒患某些疾病和出生缺陷的概率。我記得和懷孕的妻子一起看0.0004%和0.019%這樣的概率,琢磨該擔(dān)心什么、可以忽略什么。這么小的概率差異很難直觀把握,但0.019%幾乎是0.0004%的50倍。
看到0.0001%(百萬分之一)這樣的概率值,很容易假設(shè)它和0%的差別只是舍入誤差。但概率為0%的事件真的不會(huì)發(fā)生,而0.0001%的事件卻一直在發(fā)生。如果你有幾分鐘和一些零錢,拋20次硬幣,無論觀察到什么正反面序列,那個(gè)具體序列出現(xiàn)的概率都小于百萬分之一。

為更好地評(píng)估幾乎不可能和幾乎確定的事,貝葉斯主義者有時(shí)會(huì)從用百分比衡量概率切換到用賠率衡量。如果我給你買了足夠的彩票讓你有0.001%的中獎(jiǎng)機(jī)會(huì),給你朋友買了讓他有0.1%的機(jī)會(huì),你可能會(huì)想自己該有多生氣。
轉(zhuǎn)換成賠率形式,你朋友有1/1000的機(jī)會(huì),而你只有1/100000。用賠率表達(dá)概率清楚地表明,你朋友每有100張彩票,你只有1張,澄清了這兩個(gè)接近零的概率其實(shí)有重要差異。
思維工具2:學(xué)會(huì)逆向推理
貝葉斯牧師做了什么讓整個(gè)統(tǒng)計(jì)運(yùn)動(dòng)以他命名?在貝葉斯之前,概率理論關(guān)注“直接推理”問題,比如告訴你擲兩個(gè)公平的六面骰子,計(jì)算它們的和是8的概率。更抽象地說:給你一個(gè)關(guān)于世界上某個(gè)概率過程的假設(shè),計(jì)算它產(chǎn)生某種特定證據(jù)的概率。
貝葉斯感興趣的是逆向問題:給定已觀察到的證據(jù),假設(shè)為真的概率是多少?這叫“逆向推理”。比如擲兩個(gè)骰子和是8,每個(gè)骰子顯示6的概率是多少?或者更實(shí)際的例子:如果醫(yī)學(xué)測(cè)試呈陽性,患病的概率是多少?
統(tǒng)計(jì)學(xué)家稱這個(gè)逆向問題為“貝葉斯定理”,因?yàn)樨惾~斯最早給出答案。貝葉斯定理是個(gè)方程,基本思想是:當(dāng)獲得新證據(jù)時(shí),應(yīng)轉(zhuǎn)向讓該證據(jù)更可能的假設(shè)。
假設(shè)你測(cè)試某種罕見疾病呈陽性,這種疾病只影響0.1%的人口,測(cè)試相當(dāng)可靠:90%的患者測(cè)試呈陽性,健康人只有10%的時(shí)間會(huì)得到假陽性。你測(cè)試呈陽性,患病的概率有多大?
很多人的第一反應(yīng)是概率很高——也許80%或90%。測(cè)試很可靠,而且呈陽性了。但快速計(jì)算一下:假設(shè)對(duì)隨機(jī)選擇的10000人進(jìn)行測(cè)試,其中約10人會(huì)患病,所以他們中有9人會(huì)得到陽性結(jié)果;另一方面,約9990人不會(huì)患病,由于測(cè)試給健康人10%的時(shí)間假陽性,這9990個(gè)健康人會(huì)產(chǎn)生約999個(gè)假陽性。所以測(cè)試10000人后,會(huì)得到總共1008個(gè)陽性結(jié)果,其中只有9個(gè)(不到1%)實(shí)際患病。
再次,處理極端概率情況時(shí),用賠率思考會(huì)有幫助。強(qiáng)力支持某個(gè)假設(shè)的證據(jù)(比如剛才描述的可靠醫(yī)學(xué)測(cè)試)會(huì)把該假設(shè)的賠率乘以10倍甚至100倍,但如果賠率起點(diǎn)足夠小,乘以10會(huì)從1/1000帶到1/100。
思維工具3:警惕辛普森悖論
貝葉斯主義者經(jīng)常處理?xiàng)l件概率。當(dāng)考慮某個(gè)特征在人群的某個(gè)子群體中有多普遍,而非整體人群時(shí),就會(huì)出現(xiàn)條件概率。比如隨機(jī)挑選一個(gè)中國(guó)人,他們不太可能都喜歡芝麻醬,但假設(shè)他們?cè)诒狈介L(zhǎng)大,喜歡的概率就高得多。
條件概率的行為相當(dāng)反直覺,人們認(rèn)為顯而易見的簡(jiǎn)單原則會(huì)以壯觀的方式失效,最清楚的例子是辛普森悖論。
我們都學(xué)會(huì)了不要從單個(gè)例子得出寬泛概括,或假設(shè)小群體能代表整體。一個(gè)只通過芝麻醬評(píng)判中國(guó)人口味偏好的外國(guó)人會(huì)被嚴(yán)重誤導(dǎo)。由于粗心或壞運(yùn)氣,我們可能偶然進(jìn)入一個(gè)不同于其他子群體的子群體,帶有整體人群不反映的特征。
但辛普森悖論展示了更怪異的東西:有時(shí)群體的每個(gè)子群體都有某個(gè)特定特征,但整個(gè)群體卻不顯示那個(gè)特征。
在2016-17NBA賽季,詹姆斯·哈登(當(dāng)時(shí)在休斯頓火箭隊(duì))的兩分球命中率高于德瑪爾·德羅贊(多倫多猛龍隊(duì)),三分球命中率也高于德羅贊,然而德羅贊的總投籃命中率——兩分球和三分球合計(jì)的命中百分比——卻高于哈登。哈登兩種投籃都更好,且這是投籃命中率里唯一的兩種投籃,德羅贊卻總體更好,這怎么可能?

職業(yè)籃球迷會(huì)知道,對(duì)任何球員來說,兩分球都比三分球容易投中,但哈登頑固地堅(jiān)持給自己增加難度。在2016-17賽季,他嘗試的兩種投籃數(shù)量幾乎相同(777次三分球?qū)?56次兩分球),而德羅贊嘗試的兩分球是三分球的10倍多。即使哈登每種投籃都更好,德羅贊做出了戰(zhàn)略決策,更頻繁地嘗試高命中率投籃而非低命中率投籃,所以他總體成功率更高。
同樣的現(xiàn)象出現(xiàn)在1970年代調(diào)查加州大學(xué)伯克利分校研究生院的性別偏見時(shí)。1973年,44%的男性申請(qǐng)者被伯克利研究生院錄取,而只有35%的女性申請(qǐng)者成功。然而統(tǒng)計(jì)研究發(fā)現(xiàn),各個(gè)系(實(shí)際做錄取決定的)錄取男女的比例大致相等,甚至更多地錄取女性。問題是有些系比其他系難得多(對(duì)所有申請(qǐng)者),而女性不成比例地申請(qǐng)更有選擇性的領(lǐng)域。
當(dāng)然,這并不能消除所有偏見的可能性。一項(xiàng)研究發(fā)現(xiàn)女性申請(qǐng)更擁擠的領(lǐng)域是因?yàn)樗齻儧]有得到本科數(shù)學(xué)背景來學(xué)習(xí)資金更充足(因此能錄取更多學(xué)生)的學(xué)科。但關(guān)于條件概率的更廣泛觀點(diǎn)成立:你不能假設(shè)整體人群反映其子群體的趨勢(shì),即使那些趨勢(shì)出現(xiàn)在所有子群體中,還必須考慮特征在子群體之間的分布。
思維工具4:持續(xù)更新信念
約瑟夫·巴特勒說:“概率是生活的真正指南?!必惾~斯牧師教我們使用那個(gè)指南,并隨著生活改變、學(xué)到新東西而隨時(shí)間更新它。
貝葉斯法則是個(gè)方程,若想要數(shù)字細(xì)節(jié),可在指南末尾找到資源。但更新信心的基本方法是:從先驗(yàn)觀點(diǎn)開始,考慮新證據(jù)——?jiǎng)倢W(xué)到的一切,包括知道的學(xué)習(xí)方式;在考慮的假設(shè)中,確定哪些讓證據(jù)更可能;然后把信心轉(zhuǎn)向那些假設(shè)。
先驗(yàn)觀點(diǎn)從哪里來?如果你是貝葉斯主義者,帶入某個(gè)特定調(diào)查的觀點(diǎn)會(huì)受到過去收集的證據(jù)的影響。你不只是應(yīng)用一次貝葉斯法則,每次獲得關(guān)于某個(gè)主題的新信息,就更新關(guān)于該主題的觀點(diǎn),那些新更新的觀點(diǎn)為未來的下一次更新提供先驗(yàn)。
你持續(xù)演化的世界圖景就像奧托·諾伊拉特的船的形象:“我們就像在公海上必須重建船只但永遠(yuǎn)無法從底部重新開始的水手......”
沒有兩個(gè)人有相同的證據(jù)歷程,沒有兩個(gè)人在生活中有相同的觀點(diǎn)序列。當(dāng)遇到不同觀點(diǎn)時(shí)應(yīng)該記住這些不同的路徑。
但我們也應(yīng)該記住一個(gè)美麗的貝葉斯數(shù)學(xué):如果每次更新觀點(diǎn)時(shí)都應(yīng)用貝葉斯法則,那么無論觀點(diǎn)從哪里開始,收集越來越多的證據(jù)會(huì)讓它們?cè)絹碓浇咏嫦?。如果我們繼續(xù)學(xué)習(xí)、繼續(xù)更新,貝葉斯的指南會(huì)引導(dǎo)我們到達(dá)目的地。
本文來自微信公眾號(hào)“開智學(xué)堂”(ID:openmindclub),作者:Michael,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




