很多人都對預測未來的工作績效感興趣,不只是自己的,還有別人的。因此,績效預測是用來考察預測性判斷的實用例子。例如,一家大公司在招聘高管時,聘請了一家專業諮詢公司對兩名候選人莫妮卡和娜塔莉進行評估,並以取值為1~10分的量表對兩人的領導力、溝通能力、人際交往能力、職業技能、應聘動機等維度進行打分(見表9-1)。你的任務是:預測她們在兩年後的工作績效,並用1~10分來評分。
大多數人在面對此類問題時,只是簡單地盯著每一行數字並心算出平均分,然後快速做出判斷。如果你也是這樣,那麼你可能會得出這一結論:娜塔莉是更優人選,因為莫妮卡的平均分比她差一兩分。
針對此問題,你採取的這種方法被稱為“診斷性判斷”(clinical judgment)。在此過程中,你會考慮相關信息,或許再快速計算一下,然後利用直覺做出判斷。事實上,診斷性判斷就是我們在這本書中簡單描述的判斷過程。
現在假設你以實驗參與者的身份完成了上述預測工作。莫妮卡和娜塔莉的數據來自一個信息數據庫,其中記錄了此前聘用的數百名經理的信息,以及這些經理在5個維度上的得分。你可以使用那些評分來預測兩人的工作績效,而現在你還獲得了兩人的實際工作績效數據。那麼,想一想你對這兩人的診斷性判斷有多接近她們的實際績效呢?
這個例子大致來源於一項關於績效預測的真實研究。如果你曾參加過該項研究,你可能會對自己的預測結果非常不滿意。一家國際諮詢公司聘請了擁有博士學位的心理學家來做預測,結果發現,預測與績效評估的相關係數僅為0.15(PC=55%)。也就是說,當他們評估一名候選人優於另一名候選人時,他們所偏愛的候選人最終獲得更高績效的可能性僅為55%,比隨機選擇的結果高不了多少。顯然,這不是一個令人滿意的結果。
也許你會認為,預測準確性之所以這麼差,是因為評分信息對預測沒有用。因此,我們不禁要問:對候選人的評分到底包含了多少有用的預測信息?如何將它們進行整合才能獲得與實際表現相關性最高的預測分數?
有一種標準的統計方法可以回答上述問題。在上述研究中使用這種方法,可以使相關係數達到0.3(PC=60%)。結果雖然仍不盡如人意,但至少優於診斷性預測。
這種方法叫作“多元回歸”(multiple regression),它是對各種預測因素的平均值進行加權後獲得預測分數的方法。多元回歸可以找到一組最佳權重,使整合後的預測分數與目標變量之間的相關性最大。最佳權重可以使預測的均方誤差最小——這就是最小平方法在統計學中舉足輕重的有力證明。你可能認為,與目標變量相關性越密切的預測因素,其權重也應該越大;而無用的預測因素,其權重應該為0。然而事實上,權重也可能是負數,例如候選人乘公交的逃票次數在預測其工作績效上的權重就可能是負的。
多元回歸是一個“機械性預測”(mechanical prediction)的例子。機械性預測種類繁多,從簡單規則(如僱用完成高中學業的人)到復雜的人工智能模型不等。 “線性回歸”(linear regression)模型是最為常見的一種,因此該模型也被稱為“判斷和決策研究的主力軍”。為方便起見,我們將線性回歸模型稱為“簡單模型”(simple models)。