北大光華:AI越來越聰明,為何還是難以取信于人?


AI越來越聰明,為何還是難以取信于人?
未來某一天,你早晨起床感覺身體不適,于是前往市中心最好的醫(yī)院做檢查,該醫(yī)院提供人類醫(yī)生和AI醫(yī)生診斷服務(wù)。一番檢查之后,人類醫(yī)生拿著診斷報告對你說:“你的身體正常,最近多休息即可。”但AI醫(yī)生卻說:“你目前確實(shí)身體健康,但我們根據(jù)大數(shù)據(jù)分析和基因檢測發(fā)現(xiàn),你在50歲后患有xxx癥的概率是21%,一旦發(fā)作將很危險。好消息是,現(xiàn)在已經(jīng)有新藥可以來預(yù)防它了,能將發(fā)病風(fēng)險降到1%以下,只是服用這種新藥可能會讓你失眠和脫發(fā),但建議你盡早服用?!蹦敲矗銜爮娜祟愥t(yī)生的建議,還是會聽從AI醫(yī)生的建議呢?
這是一個艱難的選擇,但可以想見,隨著人工智能技術(shù)的發(fā)展,在未來我們會遇到更多類似的場景?,F(xiàn)有的一些案例和研究卻表明,即使算法建議的質(zhì)量很高,人們也往往不愿意采納算法的建議。北京大學(xué)光華管理學(xué)院劉玉珍教授、孟涓涓教授利用“借貸領(lǐng)域”的數(shù)據(jù)探究了在人機(jī)合作的框架下是否存在“算法厭惡”現(xiàn)象,并解析其背后的機(jī)制。
本課題的部分研究成果已經(jīng)被國際頂級期刊
《我,機(jī)器人》劇照
01
AI比人類更有“識人之明”?
該研究聚焦于借貸領(lǐng)域,邀請人類決策者和人工智能根據(jù)提供的借款人的資料打出一個“還款分”(分?jǐn)?shù)越高代表借款人還款可能性越高),并與實(shí)際還款情況進(jìn)行對比。
研究選取了4895個樣本,其中有1103位違約者和3792位履約者,采用10分制打分方法。研究顯示,人類決策者對違約者的平均打分是 5.22,對履約者的平均打分是5.44。而AI對違約者的平均打分是3.21,對履約者的平均打分是6.94。也就是說在平均意義上,人工智能對還款概率的預(yù)測,比人類所做的預(yù)測更為準(zhǔn)確。
圖 1 人類決策者(左)和機(jī)器學(xué)習(xí)算法(右)預(yù)測的“還款分”比較
那么是否部分具備“識人術(shù)”的人,可以超越人工智能算法呢?我們用統(tǒng)計學(xué)上的一個指標(biāo)AUC(area under the receiver operating characteristic curve)來量化衡量“還款分”的質(zhì)量,取值越大代表質(zhì)量越高。圖2展示了每個決策者的AUC值的分布和人工智能的AUC值(右側(cè)虛線代表人工智能的預(yù)測質(zhì)量),可以看到,即使是辨人識人能力較強(qiáng)的那部分人類決策者,也無法超越人工智能。
圖 2 人類決策者的“還款分”質(zhì)量分布
02
人類愿意采用算法的決策嗎?
目前人工智能在很多任務(wù)上都可以超越人類的水平,但是有趣的是,人類很多時候并不愿意采用人工智能的建議,結(jié)果造成了效率的損失。這種現(xiàn)象被稱為“算法厭惡”。比如最近還有一項關(guān)于語音推銷機(jī)器人的研究(Luoet al. 2019.)可以生動地說明這種現(xiàn)象,現(xiàn)實(shí)中人們對人工智能存在著較為回避的態(tài)度。當(dāng)顧客不知道與自己對話的推銷員是機(jī)器人時,語音機(jī)器人和人工推銷員的推銷效果一樣好;但是當(dāng)顧客知道與自己對話的是機(jī)器人的時候,語音機(jī)器人的推銷效果相比人工推銷員下降了79.7%。
該研究進(jìn)一步探索在借貸領(lǐng)域是否存在相似的“算法厭惡”。研究團(tuán)隊評估了人類決策時對人工智能所提供的“還款分”所賦予的權(quán)重,并將其與最優(yōu)權(quán)重進(jìn)行對比。這是首次在人機(jī)交互的場景下使用權(quán)重的方式對算法厭惡進(jìn)行評估。在回歸分析中,算法給出的還款分每上升1分(滿分為10分),決策者認(rèn)為還款概率將上升6.7個百分點(diǎn),而實(shí)際上還款概率上升了8.9個百分點(diǎn),這說明決策者對人工智能的權(quán)重誤差為-2.2個百分點(diǎn)。這一結(jié)果說明,大部分決策者都傾向于低估人工智能提供的信息的重要性,即他們存在算法厭惡。
03
過度自信導(dǎo)致“算法厭惡”
在人類的決策情景中,產(chǎn)生算法厭惡的因素是什么?該實(shí)驗(yàn)結(jié)束后調(diào)查了參與者認(rèn)為自己與人工智能在“還款分”打分任務(wù)中的相對表現(xiàn)。圖2的結(jié)果表明,沒有任何參與者的預(yù)測比人工智能更準(zhǔn)確,因此研究團(tuán)隊把所有回答自己比人工智能做得好的參與者標(biāo)記為“過度自信”,其余參與者標(biāo)記為“非過度自信”。兩類參與者對人工智能的權(quán)重誤差見圖3。其中灰色代表“過度自信”組,白色代表“非過度自信”組。
圖 3 人類-人工智能決策組中人類決策者對人工智能賦予的權(quán)重分布
在圖3中,過度自信組的權(quán)重偏誤分布在非過度自信組的左側(cè),說明過度自信的人的算法厭惡程度高于非過度自信的人。在回歸分析中,過度自信可以很大程度上解釋人們對人工智能信息的算法厭惡現(xiàn)象。
過度自信是人類常見的行為偏誤,表示人們高估自己能力、低估他人能力的傾向。本研究發(fā)現(xiàn),算法厭惡雖然是人工智能時代的新概念,但其本質(zhì)上與過度自信這種常見的非理性行為高度相關(guān),只是這里的“他人”即“人工智能”。
現(xiàn)實(shí)中人們的決策經(jīng)常會犯很多錯誤,展現(xiàn)出非理性的行為。一種觀點(diǎn)認(rèn)為人工智能替代人類決策可以讓決策變得更加理性。然而,我們的研究發(fā)現(xiàn),人類“非理性”的成分本身可能阻礙了這一進(jìn)程。這是在研究人機(jī)共處關(guān)系中特別需要注意的。
04
人類對于AI的常見誤解
除了過度自信,還有哪些因素可能會影響人們對算法的態(tài)度呢?
首先,人們存在對算法錯誤的預(yù)期。換言之,人們可能不了解機(jī)器學(xué)習(xí)算法的工作原理——現(xiàn)在的機(jī)器學(xué)習(xí)可以達(dá)到何種預(yù)測質(zhì)量,算法已經(jīng)涉及哪些任務(wù)類型,與算法從錯誤中進(jìn)行反饋迭代的能力。對于這一原因,解決方式是從信息提供的角度,提高公眾掌握的算法知識水平。就像金融知識教育可以改進(jìn)人們的投資行為一樣,研究團(tuán)隊倡議進(jìn)行機(jī)器學(xué)習(xí)智識教育,來提高人們在生活中對算法的接受度。例如,有研究曾發(fā)現(xiàn),當(dāng)人們看到算法犯錯的時候,即使他們知道算法比人類表現(xiàn)好,仍會更不愿意接受算法,而向人們闡明算法可以從犯錯中吸取經(jīng)驗(yàn),逐漸迭代提高準(zhǔn)確率,則可以提高人們對算法的接受度。
其次,采用算法決策會讓人覺得缺乏對決策的掌控感。解決方式是讓人類成為決策的一環(huán),而不是讓人工智能全權(quán)代理人類去做決策。例如,增加人們對最終結(jié)果的修改權(quán),以增加人們對人工智能預(yù)測的接受度。
還有,人們傾向于認(rèn)為,算法所擅長的僅僅是在既有數(shù)據(jù)框架下做決策,而人類身處的復(fù)雜的真實(shí)世界,這是算法所不能通過一些標(biāo)準(zhǔn)化的數(shù)據(jù)所理解的?;谶@一原因,人們不愿意采用算法去做涉及倫理的決策(例如交通、法律、醫(yī)藥、軍事領(lǐng)域),因?yàn)樗麄冋J(rèn)為算法不能思考,也不能感受。有文獻(xiàn)曾研究人們是否相信推薦系統(tǒng)對哪個笑話更好笑的判斷。結(jié)果發(fā)現(xiàn),即使知道推薦系統(tǒng)做得比人類好,人們也寧愿相信自己的朋友、家人,甚至是陌生人,而非推薦系統(tǒng),理由是他們認(rèn)為推薦系統(tǒng)的建議難以理解。
社會因素也影響著人們對于算法的態(tài)度。有研究發(fā)現(xiàn)媒體對機(jī)器學(xué)習(xí)的正面或負(fù)面報道對人們的態(tài)度有顯著影響,其中帶有“科學(xué)研究表明”的字樣更會增加這一影響。社會中其他人對算法的接受度也有所影響。例如,如果觀察到他人曾經(jīng)采用過算法完成某一任務(wù),人們自己也會更愿意采用算法。
最后,是否采用算法也有市場因素。在競爭市場中,人人都選擇算法推薦,并不能提高自己的競爭力,所以堅持選擇人工,保留自己的優(yōu)勢。并且,人們有時會為了保持一定形象而寧愿選擇堅持人工決策。例如,醫(yī)院的患者會認(rèn)為沒有算法輔助的醫(yī)生的診療水平更高,還會認(rèn)為機(jī)器學(xué)習(xí)算法在診斷中會忽視自己的獨(dú)特性。那么,醫(yī)生反過來也就只好堅持自己診斷,不依賴機(jī)器學(xué)習(xí)算法。
小結(jié)
人工智能對生產(chǎn)力和效率的提升有目共睹,很多人認(rèn)為這可以大大改善人類的決策、降低非理性行為的影響。但是該研究發(fā)現(xiàn)人們普遍存在著算法厭惡傾向,而這種傾向可能限制了人工智能技術(shù)的使用和效率的提升。這種傾向又和人們固有的非理性行為(過度自信)緊密相關(guān)。在數(shù)字化轉(zhuǎn)型過程中,管理者在引進(jìn)人工智能的同時,應(yīng)注意采取措施降低自身、員工、顧客等相關(guān)方對算法的偏見,促使人們更優(yōu)地采用算法,提升決策質(zhì)量。
課題組成員:陳澤陽博士、劉玉珍教授、孟涓涓教授、王曾博士
劉玉珍,獲得2017年中國金融研究杰出貢獻(xiàn)獎,孫冶方金融創(chuàng)新獎。在行為金融和市場微觀結(jié)構(gòu)領(lǐng)域有著卓越的學(xué)術(shù)成就,主要的應(yīng)用領(lǐng)域?yàn)樨敻还芾?,量化股?quán)產(chǎn)品設(shè)計,證券市場制度,投資人保護(hù)與教育。在國際頂尖學(xué)術(shù)期刊
長期參與監(jiān)管部門的政策制定咨詢。為北京大學(xué)金融發(fā)展研究中心主任,上海證券交易所學(xué)術(shù)委員,上交所高級金融專家,證券公司獨(dú)立董事。曾擔(dān)任北京大學(xué)光華管理學(xué)院金融系系主任,金融碩士項目主任。
孟涓涓,現(xiàn)任北京大學(xué)光華管理學(xué)院應(yīng)用經(jīng)濟(jì)系系主任、教授。曾獲得2017年北京大學(xué)教學(xué)優(yōu)秀獎與光華管理學(xué)院厲以寧教學(xué)獎。本科就讀于北京大學(xué)光華管理學(xué)院金融系,博士就讀于美國加州大學(xué)圣迭戈分校經(jīng)濟(jì)系。孟涓涓長期專注于行為經(jīng)濟(jì)學(xué)與行為金融學(xué)的研究。她的研究成果發(fā)表在諸多國外一流學(xué)術(shù)期刊上。
(本文轉(zhuǎn)載自北京大學(xué)光華管理學(xué)院 ,如有侵權(quán)請電話聯(lián)系13810995524)
* 文章為作者獨(dú)立觀點(diǎn),不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。
備考交流

掃碼關(guān)注我們
- 獲取報考資訊
- 了解院?;顒?/li>
- 學(xué)習(xí)備考干貨
- 研究上岸攻略
最新動態(tài)
推薦項目
活動日歷
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 07/03 預(yù)約席位 | 7月3日交大安泰EMBA招生說明會
- 07/05 最高可獲得2萬元獎學(xué)金| 上理管院專業(yè)學(xué)位項目2026聯(lián)合招生發(fā)布會&MBA/MPA/MEM職業(yè)賦能工坊第三期開放申請中!
- 07/05 財務(wù)人必修的戰(zhàn)略思維課|復(fù)旦MPAcc公開課報名
- 07/05 財務(wù)人必修的戰(zhàn)略思維課|復(fù)旦MPAcc公開課報名!
- 07/05 【預(yù)告| 7.5北大國發(fā)院EMBA體驗(yàn)日】“導(dǎo)師·同學(xué)共話會” 邀您走進(jìn)北大承澤園
- 07/05 上海場 | 清華-康奈爾雙學(xué)位金融MBA項目上海場公開課暨招生說明會誠邀您參與!
- 07/05 上海交大MTT招生開放日
- 07/05 鄭州活動預(yù)告 | 7月5日交大安泰MBA全國巡展即將來到中原大地,招生政策、考生激勵、項目生態(tài)一場活動全掌握!
- 07/05 海π智鏈 商道新生 | 2026東華大學(xué)MBA/EMBA/MPAcc/MEM/MF/MIB培養(yǎng)體系煥新發(fā)布會即將啟幕!
- 07/05 活動報名 | 7月5日深圳招生直通車,15年零售餐飲O2O行業(yè)學(xué)長以夢為馬,為何選擇交大安泰MBA?