不久前,讀完了《拆穿數據胡扯》,頓感這是一本遲來的好書,一來是因為我們已經對很多“噪聲”習以為常,且深受其害,如果我們能早些明白這些“噪聲”的來龍去脈,那么也許就會豁然開朗;二來如果我們能把書中提到的一些方法用到科普實踐之中,也許可以少走一些彎路。
該書談論的是我們每天都在遇到甚至是從事的一種行為,那就是扯淡。雖然沒有去統計,但是我敢說扯淡這個詞是書中出現頻率最高的一個詞。兩位作者認為,“扯淡就是全然不顧事實、邏輯連貫性或實際傳播的信息,而是利用語言、統計數字、數據圖表和其他表現形式,通過分散注意力、震懾或恐嚇等方法,達到說服或打動聽話人的目的”“扯淡的目的根本不是表述事實,而是利用某種修辭手段來掩蓋事實”。
書中指出,“……要解決當前扯淡泛濫的問題,需要的不僅僅是看清它的本質,還要照亮所有角落,讓扯淡無所遁形,增加扯淡傳播的難度。”作者們通過娓娓道來的敘述,回應了他們提出的這個論斷。
首先,作者們追根溯源,主張扯淡無處不在,它起源于更廣泛意義上的欺騙。雖然我們常說“科技讓生活更美好”,不過兩位作者卻認為技術的進步并沒有消除扯淡的問題,反而讓其更加惡化。比如在社交媒體大行其道的時代,“標題黨”也是某種意義上的扯淡,它是一種“空熱量”,因為有研究發現,最成功的標題都沒有闡述事實,而只是給你一種情感體驗。算法是很多平臺賴以獲取用戶黏性的利器,但是某一平臺的算法并不是為了幫我們了解更多信息,而是為了讓我們在該平臺上保持活躍度,否則我們就有可能會跑到其他平臺上去了。這實際上就會導致所謂的“過濾器泡泡”和“回音壁效應”,這本身也是一種扯淡的表現。就此而言,“扯淡在點擊驅動的大規模網絡化社交媒體世界中比在以前的任何社會環境中更容易傳播”。
其次,科學也會牽涉到扯淡的問題。兩位作者對此著墨甚多。把相關性呈現為因果性往往是扯淡的一個表現,也是一種扯淡的做法。比如在大眾媒體的報道中,往往會基于相關性就認為存在因果關系,而我們在這上面讀到的很多權威性推薦意見,依據的都是關聯性,沒有證據證明存在因果關系,也就是所謂的“在此之后,因此之故”。
作者們之所以主張“數字成了扯淡者的殺手锏”,是因為僅僅數字正確是不夠的,還需要將它們放在合適的上下文中,以便讀者或聽眾能夠正確地理解它們。否則,這些數字就有可能會成為某種意義上的扯淡。在這方面,兩位作者給出了大量的案例來支撐自己的主張,而且他們還認為并非所有的東西都可以用數學公式來表示,他們將其界定為數學濫用。
在科學的易感性問題上,兩位作者著重探討了p值(用來判定假設檢驗結果的一個參數)及其操縱的問題。科學研究領域很少或者說不發表負面(用科學術語來說是,陰性的)研究結果實際上也是某種p值操縱,這會導致發表的偏倚。而媒體報道又進一步放大了這些偏倚,因為新聞報道往往不明確說明他們所報道的只是初步的研究結果,更糟糕的是,他們幾乎不會報道之前報道過的研究后來沒有成功的消息,“難怪公眾會被那些不能確定紅酒到底是好是壞的科學家攪得暈頭轉向,也難怪他們很快就對所有媒體產生了懷疑”。當然,兩位作者在這一章的最后重申,科學依然是重要的,我們需要相信科學。
最后,經過本書前面大部分的鋪墊之后,兩位作者給出了如何辨別這些現象的一些小妙招,比如,我們要學會“質疑信息來源”,我們要注意“小心不公平的比較”,我們要知道“從數量級上考慮”,我們要去“避免證真偏差”,以及我們需要“考慮多個假設”等。
(作者系中國科普研究所副研究員、中國科普作家協會理事)