科學大家丨群體是如何放大噪聲的

科學大家丨群體是如何放大噪聲的
2021年09月28日 10:32 新浪科技綜合

  來源:《噪聲:人類判斷的缺陷》

  出品:湛廬文化,新浪科技《科學大家》

  撰文:[以色列]丹尼爾·卡尼曼(Daniel Kahneman),[法國]奧利維耶·西博尼(Olivier Sibony),[美國]卡斯·桑斯坦(Cass R。 Sunstein)

  個體判斷中存在噪聲的結果已經很糟糕了,但群體決策中的噪聲危害更甚。群體決策可能會由于一些無關因素而朝任何一個方向改變。誰先發言、誰后發言,誰說話更自信,誰穿著黑色衣服,誰和誰挨著坐,誰在某個時刻笑了 / 皺眉了 / 呈現出其他身體姿勢……所有這些因素都會影響結果。相似的群體每一天都會做出各種不同的決策,如雇用、晉升、破產、溝通策略、環境保護條例、國家安全、大學錄取或新產品發布等方面的決策。

  我們在前文曾提到,對多個個體的判斷進行匯總可以減少噪聲, 而這里又強調群體會放大噪聲,似乎顯得很奇怪。然而,受群體動態 過程的影響,群體也會放大噪聲。有做出的判斷與正確答案接近的明 智的群體,但也有追隨暴君的群體、增加市場泡沫的群體、相信奇跡或受共同幻想支配的群體。微小的差別可能導致一個群體堅定地說 “是”,而本質上相同的另一個群體卻堅定地說“否”。群體成員之間的互動會導致數量巨大的噪聲,這也正是我們此處強調的重點。無論是對于相似群體之間的噪聲,還是對于單個群體中的噪聲,上述假設都是成立的。因此,無論是單個群體還是多個群體,都是如此。我們應該把這些群體對某個重要問題的判斷視作一系列可能性中的一個。

  音樂中的噪聲

  為了尋找證據,我們從一個看似不太可能的地方開始:普林斯頓大學社會學教授馬修·薩爾加尼克(Matthew Salganik)和他的合作者開展了一項關于音樂下載的大型研究。實驗人員創建了一個由幾千人組成的控制組(某流行音樂網站的訪客)。控制組成員可以試聽并下載 72 首新歌中的 1 首或多首。這些歌曲的名字都很生動:《深陷橘子皮》《啃》《眼罩》《棒球術士 v1》《粉紅侵略》等。還有一些歌曲名字跟我們的問題看起來好像十分相關:《最好的錯誤》《我是個錯誤》《信念高于答案》《生活的神秘》《祝我好運》《走出困境》等。

  在控制組中,被試未被告知其他人說了什么以及做了什么等額外的信息,這樣一來,他們就可以獨立判斷自己喜歡哪一首歌或希望下載哪一首歌。但薩爾加尼克及其同事還創建了其他 8 個組,對應 8 種群體情境,并將成千上萬的被試隨機分配到這些情境中。這 8 組被試獲知的所有其他信息都是相同的,但有一處不同:人們可以看到同組中的其他人先前下載過哪些歌曲。例如,如果《最好的錯誤》是該組中深受喜愛的歌曲,那么所有成員都可以看到;同樣,如果一首歌完全沒有人下載,他們也可以看到。

  因為不同的群體在任何重要的維度上均無差別,這項研究看起來就像是重復了 8 次。你可能會推測,好聽歌曲的排名會上升,而不好聽歌曲的排名則會下降,如果是這樣,這些不同群體中的歌曲排名應該相同,或至少相似,即不同群體之間沒有噪聲。事實上,這也是薩爾加尼克及其同事試圖去探討的問題,他們考察的是一種特定的噪聲源:社會影響。

  該研究的核心發現是:不同群體中的歌曲排名差異巨大,也就是說,在不同群體之間存在大量噪聲。在某個群體中,《最好的錯誤》可能非常成功,而《我是個錯誤》則非常失敗;在另一個群體中,《我是個錯誤》極其成功,但《最好的錯誤》的表現則一塌糊涂。如果一首歌一開始就備受歡迎,它隨后也一定會表現得更好,而如果它一開始沒有獲得這種優勢,那么結果就難說了。

  可以肯定的是,最差的歌曲(在控制組中表現最差)排名不可能靠前,最好的歌也不太可能墊底,而對于其他歌曲而言,任何事情都有可能發生。正如作者所強調的那樣:“相比于獨立判斷,人們在有社會影響的條件下,更難預測哪些歌曲會成功。”簡而言之,社會影響在不同群體之間產生了明顯的噪聲。如果你仔細思考,你就會知道,單個群體內部也會存在噪聲,因為他們很容易就喜歡一首歌或不喜歡一首歌,這取決于這首歌一開始是否受歡迎。

  正如薩爾加尼克及其同事隨后所展示的,群體的結果很容易被操縱,因為流行程度會自我強化。在后續實驗中,他們動了點小心思,對控制組中的歌曲排名進行了反轉。換句話說,他們謊報了這些歌曲的受歡迎程度,人們看到的最好的音樂其實是最差的音樂,反之亦然。研究人員隨后觀察了訪客們的反應,結果是,最不受歡迎的歌曲深受喜愛,而原來最受歡迎的歌曲則表現非常差。即使研究人員誤導了人們哪些歌曲是受歡迎的,但在人數非常大的群體中,受歡迎和不受歡迎程度受排名的影響是相同的。唯一的例外是,隨著時間的推移,控制組中最好聽的歌曲會逐漸變得更流行,這意味著反向排名也沒有讓它墊底。但是,對于絕大多數歌曲而言,反向排名決定了它們的最終排名。

  我們很容易看出這項研究與一般性的群體判斷的關系。假設有一個包含 10 名成員的小群體,他們要決定是否采用某項大膽的新舉措。如果一兩個支持者先發言,他們很容易使整個團隊轉向他們偏好的方向。如果最先發言的是持懷疑態度的人,情況也是如此,至少當人們能夠互相影響時是如此。事實上,群體中的成員常常會互相影響,因此,僅僅是因為先發言的人不同,或者一開始下載某首歌的人更多, 類似的群體會做出非常不同的判斷。《最好的錯誤》和《我是個錯誤》的流行現象在各種專業判斷中也存在。如果群體沒有收到類似歌曲排名的信息,比如對某一大膽舉措的熱烈支持,該舉措可能僅由于其支持者未發言而無法推進下去。

  不僅僅是音樂下載,其他領域也一樣

  如果你是一個多疑的人,你可能會認為音樂下載只是一個特例, 或者至少與其他的群體判斷不同,然而,在其他領域也出現了類似的結果。我們來看一下在英國的公民投票(簡稱公投)中,人們對不同提案的支持情況。在公投中決定是否要投支持票時,人們自然要判斷這是不是一個好的主意。這種模式類似于薩爾加尼克及其同事的研究:最初涌現的流行度會自我強化,如果某項提案在第一天沒有受到關注,那么它很快就會沉寂。在政治領域就像在音樂實驗中一樣,支持與反對在很大程度上依賴于社會影響,具體而言,依賴于人們是否能看到其他人投的是支持票還是反對票。

  美國康奈爾大學社會學家邁克爾·梅西(Michael Macy)及其合作者在音樂下載實驗的基礎上構建了另外一個實驗,目的是弄清楚: 他人的觀點是否會影響人們的判斷,使得相應的政治觀點受到民主黨人的歡迎,而遭到共和黨人的反對(或者相反)。答案簡單明了:是的。在網絡群體中,如果民主黨人看到某一觀點一開始就受到其他民主黨人的支持,那么他們就會采納這一觀點,并最終導致大部分民主黨人支持這一觀點。但是,如果另一個網絡群體中的民主黨人看到, 某一觀點一開始就受到共和黨人的支持,那么這些民主黨人就會拒絕接受這一觀點,并最終導致大部分民主黨人都拒絕接受該觀點。簡而言之,政治觀點同歌曲一樣,最終的命運取決于最初的受歡迎程度。正如梅西等研究人員指出的那樣:“少數先行者的隨機差異”會對整個群體產生顛覆性的影響——讓共和黨人和民主黨人都欣然接受一系列與彼此的立場毫不相關的觀點。

  我們還可以思考一個一般性的群體決策問題:人們在網上如何對各種評論做出判斷。耶路撒冷希伯來大學教授列夫·穆奇尼克(Lev Muchnik)及其同事在一個網站上開展了一項實驗,他們向人們呈現不同的故事,并允許人們發表評論,以及對這些評論投贊成票或反對票。研究人員可以人為地、自動化地給一些評論投出第一張贊成票。你可能會想,在成百上千名訪客中,使某條評論多出一張初始贊成票根本無足輕重,這個想法合情合理,卻是錯的。在看到第一張贊成票之后(別忘了這完全是人為操作的),下一個訪客對該評論投贊成票的可能性增加了 32%。

  令人驚訝的是,這一效應隨著時間的推移一直在持續。5 個月后, 開始時人為投出的那張贊成票,使得該評論的平均贊成票得票率增加了 25%。最初的一張贊成票竟然產生了如此大的影響,這表明噪聲確實存在。不管最初那一票是為何而投,它都使整體的受歡迎程度發生了巨大的改變。

  這項研究為群體態度的轉變以及群體內為何存在噪聲提供了一條線索:相似的群體會做出非常不同的判斷,而同一群體做出的判斷也僅僅是一系列可能性中的一種。群體成員表達的贊成、中立、反對意見,其作用也類似于一開始投贊成票或反對票。如果群體中的一個成員立即表示贊同,那么其他成員也就有理由這么做。毫無疑問,當群體贊同某些產品、人、活動或思想時,可能并不是因為它們的內在優點,而是因為“提前投票”發揮了作用。當然,穆奇尼克的研究針對的是大規模群體,但同樣的結果也會出現在小規模群體中,甚至更加富有戲劇性,因為最開始投下的贊同某個計劃、產品或判決的贊成票經常會對他人產生更大的影響。

  這里有一個相關的觀點。我們曾經指出群體智慧效應指的是,如果你召集一大群人,問他們一個問題,他們的答案的平均值更有可能接近真實答案。對判斷進行匯總是一種減少噪聲,進而減少誤差的非常好的方法,但是如果人們互相交流,那情況又會如何呢?你可能認為這樣做是有好處的。畢竟人們可以互相學習的,從而找出正確答案。

  在一些非常有利的條件下,互相分享知識、深思熟慮的群體確實會做得很好。然而,獨立做出判斷是發揮群體智慧的前提條件,如果人們不是自己做出判斷,而是依賴于其他人,那么群體并不會更明智。

  有些研究已經表明了這一點。在簡單的評估任務——評估城市里的犯罪數量、一段時期內增長的人口、不同國家國界線的長度等任務中,只要群體成員獨自做出判斷,群體會更明智;如果他們知道了其他人的評估,比如一個 12 人小組的平均估計值,那么群體比個體的表現還要糟糕。正如研究者指出的那樣,社會影響是有問題的,因為它們降低了群體多樣性,但并沒有減少群體的誤差。具有諷刺意味的是,即便一點點社會影響都會降低群體智慧,但對多個獨立判斷進行適當的匯總則可以產生令人難以置信的準確結果。

  信息級聯,極易放大群體判斷的噪聲

  我們描述的一些研究中包括“信息級聯”(information cascades)。信息級聯很常見,它可以解釋為什么一些相似的商業群體、政治群體以及其他群體會做出完全不同的決策,以及為什么一些小的變化會產生如此不同的結果乃至噪聲。只有歷史真實發生了,我們才能看到, 而對于許多群體以及群體決策而言,存在著各種各樣的可能性,而最終得以實現的只是其中的一種。

  要想理解信息級聯是如何發揮作用的,我們可以想象在一間大辦公室中有 10 個人,他們在決定要雇用誰來擔任一個重要職位。候選人有 3 位,分別是托馬斯、山姆和朱莉。假設群體成員是按順序發表自己的觀點的,每一個人都會認真聆聽其他人的判斷。阿瑟第一個發言,他認為托馬斯是最佳人選。芭芭拉現在知道了阿瑟的判斷,如果她也認為托馬斯是最佳人選,她肯定會認同阿瑟的意見。假如她不確定誰是最佳人選而她信任阿瑟,她可能也會認同托馬斯是最佳人選。因為她足夠信任阿瑟,所以她支持了阿瑟的判斷。

  現在輪到查爾斯發言。阿瑟和芭芭拉已經表明了他們想雇用托馬斯,但查爾斯有自己的想法。基于他自己掌握的有限信息(他非常清楚自己的信息很有限),他認為最佳人選不是托馬斯,而是朱莉。雖然查爾斯有自己的想法,但他也有可能會忽視自己已知的信息,而只是附和阿瑟和芭芭拉。如果此事發生,那并不是因為查爾斯懦弱,而是因為他是一個尊重他人的傾聽者。他可能只是認為:阿瑟和芭芭拉都選托馬斯,他們肯定有自己的理由。

  第四位發言人是戴維,除非戴維認為他自己掌握的信息確實比前幾人更有說服力,否則他也會附和前幾個人的意見。如果戴維也這樣了,那么戴維就處在一個“信息級聯”中。事實上,如果戴維有非常充分的理由認為阿瑟、芭芭拉和查爾斯的選擇是錯誤的,那么戴維可能會表示反對。但如果他缺乏充分的反對理由,那么他就會做出和前幾個人同樣的選擇。

  重要的是,查爾斯和戴維可能了解托馬斯或其他候選人的一些信息,并且有自己獨到的看法,而阿瑟和芭芭拉并不知道這些信息和獨到的看法。如果這些信息得以分享,那么這些非公開的信息可能會改變阿瑟和芭芭拉的意見。如果查爾斯和戴維先發言,他們不僅能表達關于候選人的意見,而且可能提供對其他決策者產生影響的信息。但由于查爾斯和戴維是后發言的,所以他們的非公開信息就只有自己知道。

  假設現在大家也想聽聽后續參與投票的人—— 埃麗卡、弗蘭克和喬治的觀點。如果阿瑟、芭芭拉、查爾斯和戴維都認為托馬斯是最佳人選,即使埃麗卡等人有理由認為其他人選可能更合適,阿瑟等人也還是會做出相同的選擇。當然,如果答案明顯是錯的,埃麗卡等人會反對這種越來越趨于一致的意見,但如果錯誤沒有那么明顯呢?這個例子的吊詭之處在于,阿瑟最初的判斷啟動了一個過程,其他人被引導進了信息級聯中,即便有些支持托馬斯的人實際上根本沒有任何看法,甚至有人認為托馬斯根本不是最佳人選,但最終結果依然是所有人都選擇了托馬斯。

  當然,這個例子是人為設定的,然而在各種群體中,類似的事情經常發生。人們傾向于向他人學習,如果先發言的人似乎喜歡某個事物或者想去做某件事,人們會表示認同。如果人們不懷疑這些先發言的人,或缺少一個明確的理由認為后者是錯誤的,那么至少在這些情況下,人們會選擇認同。

  我們想重點強調的是:信息級聯會導致噪聲可能出現在多個群體之間,有時出現的可能性甚至非常大。在上面的例子中,是阿瑟先發言,并且他看好托馬斯。假設是芭芭拉先發言,而她更看好山姆,或是假設阿瑟的感覺稍微有點不同——他更喜歡朱莉,那么,一個可能的結果是,群體最終會傾向于選擇山姆或朱莉,但并不是因為他們更好,而是因為信息級聯。這也是音樂下載實驗及同類實驗中的核心發現。

  需要注意的是,人們進入信息級聯并不意味著他們是非理性的。如果人們不確定要雇用誰,追隨他人未必不是明智之舉。隨著持同一觀點的人越來越多,認同他們的選擇仍然是明智的。然而,這里有兩個問題:首先,人們往往會忽視一種可能性,即大部分人也跟他們一樣處于信息級聯中,因此他們也沒有做出自己獨立的判斷。當看到 3 個、10 個、20 個人都欣然接受某種結論,我們可能會低估他們受前面的人影響的程度。即使他們的一致性反映的只是最初幾個人的觀點,但我們可能會認為這種一致性反映了某種群體智慧。其次,信息級聯可能會導致整體朝著完全錯誤的方向前進,畢竟,阿瑟對托馬斯的判斷可能是錯的。

  當然,信息不是導致群體成員互相影響的唯一原因,社會壓力也是很重要的因素。在公司或政府機構中,人們可能會通過保持沉默來避免自己顯得不友好、愛爭吵、遲鈍或愚蠢。人們希望成為團隊中的一員,這就是為什么人們通常會追隨他人的觀點和行為。人們可能認為自己知道什么是對的或什么有可能是對的,但他們表面上仍然傾向于與群體或少數優先發言者保持一致,從而在團隊中保持良好的風度。

  剛剛講到的招聘故事也如出一轍,人們選擇托馬斯并不是因為他們通過彼此分享的信息了解到了托馬斯的優點和長處,而是因為他們不希望被看成愚蠢或不合群的人。阿瑟支持托馬斯的這一最初判斷可能會引發一種從眾效應,最終對埃麗卡、弗蘭克或喬治施加了強大的社會壓力——僅僅因為其他人都喜歡托馬斯,所以埃麗卡等人也選擇了托馬斯。就像信息級聯一樣,社會壓力也會形成“信息級聯”:人們可能放大了先發言者所持有的信念。如果人們支持托馬斯,那么他們這樣做可能不是因為他們真的喜歡托馬斯,而是因為一個優先發言的人或一個有權勢的人支持托馬斯。這樣一來,群體成員的一致性進一步增加,社會壓力水平也增加了。這是一個在公司或政府機構中非常常見的現象,它可能會增加人們對錯誤判斷的信心,并導致人們一致支持這個錯誤的判斷。

  社會壓力會導致不同群體之間產生噪聲。如果在公司中,某個人組織召開了一次會議,希望對公司發展方向做出重大改變。會議的發起者可能最先發表一番言論,進而導致人們一致支持這種改變。他們的一致性可能是社會壓力的產物,而并不是自己的觀點。同樣,如果另一個人在會議一開始就表明了不同的觀點,或者最初的發言者保持沉默,討論可能會朝著一個不同的方向發展。總之,非常相似的群體可能會由于社會壓力的影響而到達不同的終點。

  群體極化,討論往往會滋生更極端的結論

  在美國和其他一些國家,刑事案件和一些民事案件通常是由陪審團參與審判的。人們希望陪審團成員經過互相商議,做出比個體更明智的決策。然而,針對陪審團的研究揭示了一種會產生噪聲的社會影響:群體極化(group polarization)。這一概念指的是,人們在互相交流時,往往會提出比原有傾向更極端的觀點。例如,在一個 7 人群體中,如果大部人都認為在巴黎設立一個新的辦事處是一個好主意,討論之后,群體的決定可能會變成:在巴黎設立一個新的辦事處是一個極好的主意。內部討論常常會導致群體更自信、更團結、更極端,三者通常以更大的熱情展現出來。群體極化不僅發生在陪審團中,也發生在要做出專業判斷的團隊之中。

  我們通過一系列實驗研究了陪審團在“產品責任案”中做出的懲罰性損害賠償的決策。每位陪審員的決策對應一筆賠償金額,目的是懲罰公司的不合規行為,并對其他公司起到威懾作用。我們會在第15 章更加詳細地討論這項研究。為了說明群體極化問題,我們來看一個實驗,該實驗比較了現實世界中的陪審團和“統計中的陪審團”。首先,我們向 899 名被試呈現案件情境,并要求他們獨立做出判斷:

  用具有 7 個等級的量表來表達他們的憤怒程度、懲罰傾向,以及給出相應的賠償金額。隨后,基于這些被試的反應,我們利用計算機模擬出數百萬個“統計陪審團”,即隨機匹配的虛擬的 6 人群體。在每一個統計陪審團中,我們采用 6 人的中位數作為最終的裁決結果。

  我們發現,這些統計陪審團的裁決非常一致,也就是說,噪聲大大減少了。噪聲水平的降低是因為對裁決結果進行了機械性的匯總, 即對個體的獨立判斷進行平均會減少噪聲。

  然而,現實世界的陪審團不是“統計陪審團”,陪審員們會針對一起案件交流各自的觀點。你有理由懷疑這些經過深思熟慮的陪審員是否真的會傾向于做出與評級為中位數的成員一致的判決。為了探明這一點,我們緊接著做了第二項研究。這項研究召集了 3000 多名有

  陪審員資格的人,由他們組成 500 多個 6 人一組的陪審團。

  答案簡單明了:總是互相商議的陪審團比統計陪審團具有更多的噪聲。這清楚地反映了由于社會影響帶來的噪聲,互相商議增加了噪聲。

  這項研究還有一個有趣的發現。如果 6 人中評級為中位數的成員只有中等程度的憤怒,并且傾向于對相關人員從輕處罰,那么陪審團商議后的判決通常會更寬容;相反,如果各項選擇均為中位數的成員非常憤怒,并且傾向于進行嚴厲懲罰,那么經過交流之后,陪審團會更憤怒,他們做出的判決也更嚴厲。當用賠償金額來表達這種憤怒時,陪審團商議后的賠償金額要比金額的中位數高。實際上,27% 的陪審團選擇的賠償金額通常與陪審員選擇的最高賠償金額相等,甚至會比后者更高。能夠相互交流的陪審團的噪聲不僅比“統計陪審團”更高,而且加重了其成員原有的傾向。

  回想一下關于群體極化的基本發現:人們彼此交流之后,明顯變得比原來更加極端了,我們的實驗證明了這一現象。陪審團成員在商議后要么變得更加寬容(當評級為中位數的成員傾向于寬容時),要么變得更加嚴厲(當評級為中位數的成員傾向于嚴厲時)。同樣,傾向于實施金錢懲罰的陪審團在商議之后也會變得比評級為中位數的成員更加嚴厲。

  對群體極化的解釋類似于對信息級聯的解釋:信息發揮著重要作用。如果大部分人傾向于進行嚴厲懲罰,那么群體成員會聽到很多認為有必要進行嚴厲懲罰的觀點——反方的觀點更少了。如果群體成員能夠互相交流,那么他們會朝向處于主導地位的觀點轉變,導致群體更加團結一致、更加自信、更加極端。而且,如果人們在意自己在群體中的聲譽,他們也會朝著占主導地位的觀點轉變,這樣也會導致群體極化。

  當然,群體極化會產生誤差,并且經常如此,但我們的主要關注點在于變異性。正如我們所看到的那樣,對判斷進行匯總會減少噪聲,也正因為如此,判斷數量越多,判斷的品質越好,這也是為什么“統計陪審團”比單個陪審團噪聲更少。同時,我們發現能夠相互交流的陪審團會比“統計陪審團”產生更多噪聲。當處于相似情境中的群體最后表現出巨大的差異時,其原因往往在于群體極化,其結果是產生巨大的噪聲。

  在商業、政府以及其他機構中,信息級聯和群體極化都會導致群體在應對同一問題時產生巨大差異,最終的判斷結果取決于少數人——那些率先發言的人或有巨大影響力的人,這是一個值得注意的問題,因為個人的決策有很大的噪聲。我們已經看到,水平噪聲和模式噪聲會使得群體成員的觀點產生不應有的差異,而且該差異比我們預期的更大。我們已經看到疲勞、情緒、可以比較等情境噪聲會影響率先發言的那個人的判斷,群體互動則會放大這種噪聲。結果,經過商議的群體會比僅僅對個體判斷進行平均的統計群體產生更大的噪聲。

  由于企業或政府部門的一些重大決策都是在商議之后做出的,我們尤其要對這種風險保持警覺。組織及其領導應該采取一些方法來控制其成員在判斷中的噪聲,比如對群體商議進行管理,從而減少噪聲而不是增加噪聲,我們提出的減少噪聲的策略,其目的就在于此。

文章作者[以色列]丹尼爾·卡尼曼(Daniel Kahneman)

  群體決策中的噪聲

  似乎任何事情都取決于它最初的受歡迎程度,因此,我們最好想盡一切辦法來讓自己發行的產品在第一個星期就獲得巨大成功。

  正如我一直懷疑的那樣,政治或經濟理念就像電影明星。如果人們認為其他人喜歡,那么這種理念就會大受歡迎。

  我一直很擔心,當我的團隊聚在一起時,我們會更自信、更團結、對我們所選擇的行動方針更加堅定。我認為,我們的內部流程可能存在一些問題。

新浪科技公眾號
新浪科技公眾號

“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)

創事記

科學探索

科學大家

蘋果匯

眾測

專題

官方微博

新浪科技 新浪數碼 新浪手機 科學探索 蘋果匯 新浪眾測

公眾號

新浪科技

新浪科技為你帶來最新鮮的科技資訊

蘋果匯

蘋果匯為你帶來最新鮮的蘋果產品新聞

新浪眾測

新酷產品第一時間免費試玩

新浪探索

提供最新的科學家新聞,精彩的震撼圖片