清華經(jīng)管教授陳國青在人文清華講壇發(fā)表主題演講《大數(shù)據(jù):顛覆的力量》


2019年6月10日,清華大學(xué)經(jīng)濟(jì)管理學(xué)院EMC講席教授陳國青在人文清華講壇發(fā)表主題演講《大數(shù)據(jù):顛覆的力量》,為大家深度解讀大數(shù)據(jù)時代和大數(shù)據(jù)思維,以及大數(shù)據(jù)帶來的沖擊、挑戰(zhàn)和機(jī)遇。
【MBAChina網(wǎng)訊】2019年6月10日,清華大學(xué)經(jīng)濟(jì)管理學(xué)院EMC講席教授陳國青在人文清華講壇發(fā)表主題演講《大數(shù)據(jù):顛覆的力量》,為大家深度解讀大數(shù)據(jù)時代和大數(shù)據(jù)思維,以及大數(shù)據(jù)帶來的沖擊、挑戰(zhàn)和機(jī)遇。
特此分享由人文清華講壇整理編發(fā)的演講全文,以饗讀者。全文約1萬字,讀完約15分鐘。
大家好!
今天非常高興能有這個機(jī)會跟大家一起分享大數(shù)據(jù)的話題。大數(shù)據(jù)已經(jīng)成為了我們耳熟能詳?shù)脑~匯和概念。實際上它已經(jīng)變成了我們這個時代的符號,這個符號是什么樣子?對于我們又意味著什么?
今天,我想圍繞著若干個對于大數(shù)據(jù)的認(rèn)識,詮釋什么是大數(shù)據(jù)、大數(shù)據(jù)時代,以及我們置身其中所要遇到的、見到的、面對的那些變化、沖擊、挑戰(zhàn)。同時,我們也可以從中發(fā)現(xiàn)和把握大數(shù)據(jù)帶來的機(jī)遇以及可能的創(chuàng)新和發(fā)展空間。
英國脫歐、美國大選有數(shù)據(jù)公司的影子
大數(shù)據(jù)已經(jīng)提出若干年了,大數(shù)據(jù)本身在概念和應(yīng)用上已經(jīng)與我們越來越密切了。今天在開始大數(shù)據(jù)這個話題前,先從兩個國際事件說起。
一個是糾結(jié)了很長時間的英國首相要辭職了,另外一個是美國不斷“退群”,最近又四處打貿(mào)易戰(zhàn)。實際上這兩個事件都是由三四年前兩個轉(zhuǎn)折性的事件引發(fā)的,這就是英國脫歐和美國大選。這三四年來,大家已經(jīng)看到這些事件在他們國家?guī)淼纳鐣毫?、對世界格局的沖擊,以及對我們比較熟悉的國際秩序、多邊關(guān)系的挑戰(zhàn)。
非常巧的是這兩個事件的背后都有一家公司的影子,就是英國劍橋分析公司,簡稱CA。這家公司是一個數(shù)據(jù)公司,它用數(shù)據(jù)做選民分析,做助選服務(wù)。實際上這家公司參與了脫歐,特別是最后美國的大選。這家公司的服務(wù)主要做的是心理畫像,它根據(jù)收集到的大量數(shù)據(jù),包括千萬級的Facebook數(shù)據(jù),采用國際心理學(xué)界比較有名的Ocean心理模型來刻畫選民的人格特征,它能刻畫一個人喜歡什么、擔(dān)憂什么、對什么感興趣、宗教的取向以及價值的態(tài)度。用這家公司CEO的話來講“我們可以預(yù)測每個美國成年人的人格特征”。其實這家公司并不是那么出名,還有更加出名的公司也在選舉中提供各種服務(wù),但是其他公司的服務(wù)基本都基于人口統(tǒng)計學(xué)的信息,也就是性別、膚色、宗教、收入、年齡、教育等信息,但是這家公司從另外的視角,即從心理的視角刻畫一個人的心理歷程或者叫做數(shù)字腳印,這個視角卻是別的公司沒有關(guān)注的。另一方面,他們可以獲得更加細(xì)粒度的數(shù)據(jù),使得心理層面、人格層面的刻畫成為可能。這就是我們所說的大數(shù)據(jù)的影響。
當(dāng)然,這家公司的影響也是有限的,一個選舉、一個大的事件還受諸多其他因素影響,但是這些因素的疊加造成了我們現(xiàn)在看到的,包括這幾年演化出來的世界格局的改變。
大數(shù)據(jù)時代的兩個階段
實際我們現(xiàn)在處在一個數(shù)據(jù)的海洋當(dāng)中。
2019年的春運(yùn)是世界上最大的人口遷徙,有30億人次的流動。2018年“雙十一”有2135億的銷售額度?,F(xiàn)在,每天會產(chǎn)生450億的微信條目。手機(jī)的網(wǎng)民已經(jīng)達(dá)到8.17億??傮w來說,我們國家的GDP數(shù)字經(jīng)濟(jì)占比已經(jīng)達(dá)到了34.8% ,超過了1/3,這方面實際能夠體現(xiàn)出我們這個社會已經(jīng)開始越來越數(shù)字化了。
說起大數(shù)據(jù)、大數(shù)據(jù)時代,主要的時代背景是什么呢?我們現(xiàn)實世界有多大程度上可以被數(shù)據(jù)表示?用一個形象的話來講,我們的社會像素正在急劇提升。這個“像素”來自到處可見的感測設(shè)備——探頭、智能手機(jī)、可穿戴設(shè)備、車載設(shè)備,林林總總。這些使我們這個社會的數(shù)字化程度越來越高,數(shù)據(jù)的粒度因此也越來越細(xì)。也就是說,數(shù)字化生活的兩個要素之一:像素,數(shù)據(jù)的粒度已經(jīng)具備。像素夠高的時候我們要干什么?形象地說是“成像”,就像手機(jī)、相機(jī),像素越高成像的質(zhì)量可能越好,因此,成像是我們數(shù)字化生活中另外一個重要的要素,像素和成像對應(yīng)起來,就把數(shù)據(jù)和算法聯(lián)系起來了,這就是我們所說的大數(shù)據(jù)時代。
大數(shù)據(jù)時代可以分成兩個階段,我們用商務(wù)的形態(tài)來說明這個問題。
第一階段是數(shù)據(jù)商務(wù)階段。不斷地把現(xiàn)實生活中的要素,人財物,都進(jìn)一步數(shù)據(jù)化,同時根據(jù)這些數(shù)據(jù)化的人財物進(jìn)行算法的應(yīng)用。
第二階段是算法商務(wù)階段。當(dāng)像素足夠高的時候,重點就變成了成像了,也就是說,重點變成算法應(yīng)用。
數(shù)據(jù)商務(wù)階段和算法商務(wù)階段都圍繞著數(shù)據(jù)和算法進(jìn)行,但是重點有所不同。數(shù)據(jù)商務(wù)階段就像做菜一樣,數(shù)據(jù)化的過程就是不斷準(zhǔn)備材料的過程,不停地增加和豐富材料,然后根據(jù)已有的材料提供不同的菜品。但是算法商務(wù)階段是材料已經(jīng)足夠豐富了,這個時候要比的就是手藝了,你是不是能夠做得更好、更多。這就是我們所說的算法進(jìn)階及應(yīng)用創(chuàng)新,如‘智能+’,我們可以用更加高尖的智能技術(shù),包括人工智能的很多技術(shù)在現(xiàn)有的大規(guī)模數(shù)據(jù)下進(jìn)行應(yīng)用。
大數(shù)據(jù)的數(shù)據(jù)特征
那么什么是大數(shù)據(jù)?可以從4 個維度來理解,即 4V:volume(規(guī)模)、variety(多樣)、value(價值)、velocity(速度)。大家對這四個維度沒有什么大的爭議,但是對它們的含義的理解還是有相當(dāng)不同的認(rèn)識的。
第一規(guī)模,我們稱之為超規(guī)模。大數(shù)據(jù)規(guī)模會很大,但是沒有絕對的量綱,沒有說一定要達(dá)到多少G、多少P、多少Z才是大數(shù)據(jù),這個不一定,因為大數(shù)據(jù)的大規(guī)模和問題、領(lǐng)域有關(guān)。只要這個大的規(guī)模超出了這個領(lǐng)域和問題的傳統(tǒng)邊界,那就是大規(guī)模里的超規(guī)模。
第二多樣,即富媒體的意思。現(xiàn)在80%-90%的數(shù)據(jù)都是文本、語音、圖像、視頻,不再是特別傳統(tǒng)的二維的整齊的結(jié)構(gòu)化的數(shù)據(jù)了。
第三價值。我們處在數(shù)據(jù)的海洋中,四周都是數(shù)據(jù),但是跟我個人有關(guān),跟我企業(yè)有關(guān)的那種有價值的信息相對少了,因為數(shù)據(jù)量的分母太大了,即密度在降低,這個后面直接的隱喻就是要深度挖掘才能發(fā)現(xiàn)我們希望的價值。
第四速度。數(shù)據(jù)就像開著的水龍頭一樣,源源不斷地出來,而不是我們上傳下載圖片要等很久。因此,大數(shù)據(jù)里的數(shù)據(jù)是一個流數(shù)據(jù)的概念。
大數(shù)據(jù)的問題特征
那么,什么樣的問題才是大數(shù)據(jù)問題?這要看它的問題特征。
第一個特征,是粒度縮放。粒度縮放是指我們碰到的這個問題的要素一定是數(shù)據(jù)化的,即這個要素不管是宏觀的還是微觀的,一定要可以通過數(shù)據(jù)表示。同時,可以像地圖一樣,可以在特別大的范圍和特別細(xì)的范圍之間縮放,能夠在宏觀、微觀之間進(jìn)行映射。
第二個特征,是大數(shù)據(jù)外部性導(dǎo)致的特征,稱之為跨界關(guān)聯(lián)??紤]問題的時候要看視角,問題邊界是在哪兒,如果考慮問題的時候這個邊界到了傳統(tǒng)邊界之外,就是跨界了,而且你把這個外部的要素和內(nèi)部要素聯(lián)系起來了,所以你在關(guān)聯(lián)。比如管理學(xué)中,傳統(tǒng)企業(yè)管理最常見的就是怎么把業(yè)務(wù)流程做好,優(yōu)化流程,提高質(zhì)量,同時改進(jìn)人力資源環(huán)節(jié)、財務(wù)環(huán)節(jié),制定企業(yè)戰(zhàn)略,基本是站在企業(yè)內(nèi)部看不同的部門,站在里面稍微往左看一看是供應(yīng)商,稍微往右看一看是客戶。企業(yè)花了很多努力,突然有一天一個人在網(wǎng)上拍了一板磚,說這個企業(yè)產(chǎn)品有問題、服務(wù)不好,還沒有容得辯解,成百上千萬跟貼,瞬間就把企業(yè)的產(chǎn)品、形象、品牌定格成了某一個形象、某一個狀態(tài),然后企業(yè)可能還很委屈,因為覺得這些人既不是我的客戶,也不是我的員工,他們好像就是原本跟企業(yè)沒有聯(lián)系的社會大眾,但是他們的口碑卻對產(chǎn)品、質(zhì)量、品牌、形象產(chǎn)生影響。因此,當(dāng)管理決策的視角不僅是考慮內(nèi)部,而且要考慮外部和企業(yè)相關(guān)的因素時,這個問題就開始變成大數(shù)據(jù)問題了。你要跨界,跨出你的傳統(tǒng)邊界。
第三個特征,全局視圖。大數(shù)據(jù)實際是希望了解全貌的,它最后是要看畫像,因為前面我的每一個點、每一個環(huán)節(jié)的數(shù)據(jù)叫做粒度縮放,同時和我相關(guān)的要素我又關(guān)聯(lián)了,但是我最后要干什么?要了解全貌,要有個人畫像、企業(yè)畫像、政府畫像、社會畫像等,所以這個畫像本身又是全景式的,從范圍來講是全景式的,從內(nèi)涵來講,我們希望既關(guān)聯(lián)又因果。
舉兩個簡單的例子看一看大數(shù)據(jù)問題的一些特點。
一個例子是旅游。比如某個景點,經(jīng)常在一些時間和假期人滿為患,有時候服務(wù)跟不上,人太擁擠,因此可能出現(xiàn)游客不滿意投訴的現(xiàn)象。如果作為景點管理方,我想改進(jìn)它,我可以增加員工、提高運(yùn)力,但是我增加了車、增加了人的時候,可能第二天或者另外一個季度的這個時間段沒有那么多人來。所以如果我們僅從景點這個邊界出發(fā)來提供優(yōu)化的方案,解決質(zhì)量的問題就很困難。實際上如果要解決景點的問題,一定要走到景點之外,比如旁邊的餐飲、酒店、交通、氣象如何,以及附近有沒有其他景點、其他活動,當(dāng)我們考慮了景點內(nèi)外要素時,就有了跨界關(guān)聯(lián)的屬性,作為整個的旅游我們來看景點內(nèi)外時,我們有這樣一個全局的視圖,我們面對的就是一個大數(shù)據(jù)問題了。
另外一個例子是共享單車。有的人會認(rèn)為共享單車其實就是我們的代步工具,但是這是傳統(tǒng)的概念?,F(xiàn)在一般每輛共享單車都有自己的感應(yīng)器和定位裝置,也就是說感測的數(shù)據(jù)粒度到了車和部件。這時候就不單是一個單車了,可能我走到什么地方,共享單車的App就告訴我附近有什么商圈、酒店、餐館,我在什么地方買東西可能還可以用移動支付,當(dāng)視角從單車走到了其他行業(yè)、要素時,就開始跨界關(guān)聯(lián)了。可能在這個地區(qū)人特別多,共享單車不夠,可能在另外的地方單車冗余了,因此,共享單車的平臺應(yīng)該清楚什么地方需要車,什么地方不需要車,怎么樣調(diào)動,這就是全局視圖。當(dāng)共享單車具備粒度縮放、跨界關(guān)聯(lián)和全局視圖時,共享單車的運(yùn)營、優(yōu)化,就是一個大數(shù)據(jù)問題。
這些年社會上比較流行一個論斷,說“大數(shù)據(jù)只講關(guān)聯(lián)不講因果”。這個論斷雖然有一定道理,但是總體來講是誤導(dǎo)的。特別是在重要決策的時候,如果涉及到的后果可能會有嚴(yán)重的人財物的損失,然后我告訴你說“你就這么干吧,沒有為什么”,誰敢做決策?所以在大數(shù)據(jù)環(huán)境下做管理決策,既要看關(guān)聯(lián)也要看因果。另外,因果是認(rèn)識論的基本訴求,我們要知道原因。
大數(shù)據(jù)沖擊各行各業(yè)
我們作為個人不僅是數(shù)據(jù)的接收者,也是數(shù)據(jù)的生產(chǎn)者。一方面我們下載、閱讀瀏覽,因此我們在消費(fèi)數(shù)據(jù);另一方面,我們又上傳、撰寫、參加各種活動,各種活動就可以留下我們的很多痕跡,因此我們也在留痕,我們實際又在產(chǎn)生數(shù)據(jù)。在這樣一個既是消費(fèi)又是生產(chǎn)的環(huán)境中,我們從方方面面已經(jīng)和數(shù)據(jù)分不開了。
大數(shù)據(jù)已經(jīng)在沖擊各行各業(yè)。
比如經(jīng)濟(jì)金融領(lǐng)域。股價的預(yù)測其實一直是個難題,傳統(tǒng)的股價預(yù)測,實際是通過一些專業(yè)的模型來估計風(fēng)險、收益、評價企業(yè),有專門的理論和方法來估計股價。但是影響股價的除了這些因素之外還有人們的“期望”,而估計“期望”是非常難的,因為“期望”既涉及外部因素環(huán)境,又涉及心理預(yù)期?,F(xiàn)在一個新視角是考慮公眾關(guān)注,比如搜索。若對某些企業(yè)比較關(guān)心,可能就搜索其企業(yè)狀況、新聞事件,這種搜索體現(xiàn)了大眾對于具體企業(yè)的股票價格和價值走向的關(guān)心。這是一個跟過去特別不同的角度,因為這不是特別專業(yè)的角度,它是從專業(yè)外人士的行為來估計的角度。這種關(guān)注和搜索與股價的走勢有相當(dāng)強(qiáng)的關(guān)聯(lián)度。這和幾年前谷哥通過搜索來估計流感是一樣的,實際上它不是采用了所謂流行病學(xué)的專業(yè)模型,而是某段時間很多人有癥狀,頭疼、咳嗽、吃了什么藥,大家有很多信息的交換,這種交換的強(qiáng)度、交流的走向,恰恰可能跟流行病的流行模式非常相關(guān)。所以,我們也可以從搜索的角度來估計它和股價之間的影響和關(guān)聯(lián)度。但是,要特別指出,雖然搜索和股價的走勢有聯(lián)系,但是光這一個因素來估計股價是不夠的,還有大量的因素需要專業(yè)模型。因此,一方面能夠擴(kuò)展或者沖擊傳統(tǒng)的定式和視角,另外應(yīng)該把其他專業(yè)視角引入進(jìn)來,大數(shù)據(jù)的股價預(yù)測應(yīng)該是包括內(nèi)部與外部、專業(yè)與非專業(yè)因素的模型構(gòu)建。
大數(shù)據(jù)也開始在改變會計學(xué)。傳統(tǒng)的會計學(xué)衡量企業(yè)的狀況是通過三張報表:資產(chǎn)負(fù)債表、現(xiàn)金流量表、利潤表,這三張報表反映了一個企業(yè)的運(yùn)營能力、償債能力和盈利能力。雖然這三張報表是非?;A(chǔ)和非常重要的,但是大家突然發(fā)現(xiàn),有一大類企業(yè)是高風(fēng)險的,特別是一些IT企業(yè)、創(chuàng)業(yè)企業(yè)、新行業(yè)企業(yè),長期負(fù)債,但是同時又有非常高的市值,人們又有非常強(qiáng)的忠誠度,如果用這三張報表衡量,似乎不能完全體現(xiàn)它的價值,也就是說,傳統(tǒng)會計學(xué)的三張報表可能就不夠用了。因此,人們在呼喚“第四張報表”的出現(xiàn),業(yè)界和學(xué)界都在做研究。長周期、高負(fù)債、高不確定性企業(yè)的價值可能受到的是口碑、忠誠度、品牌、公允價值,包括無形資產(chǎn)的影響。這些東西我們可以稱之為數(shù)據(jù)資產(chǎn)。所以,這是從會計學(xué)的角度來看我們碰到的一個沖擊,很多新的現(xiàn)象導(dǎo)致呼喚新的模型、新的理論框架出來。
大數(shù)據(jù)也在為體育界帶來變革。現(xiàn)在我們都在積極籌備冬奧會,我們國家有少數(shù)冰雪項目水平比較高,但總體的水平不是特別高。主要的問題是長期的傳統(tǒng)做法比較粗獷、比較經(jīng)驗型。冰雪項目中有一大類是姿態(tài)類項目,運(yùn)動員的關(guān)節(jié)、角度、力量和跳躍的高度、旋轉(zhuǎn)的速度以及動作的完成質(zhì)量密切相關(guān),現(xiàn)在大家已經(jīng)意識到這個問題,因此有些隊會用手機(jī)照一些照片、視頻,但是數(shù)據(jù)粒度沒有到關(guān)節(jié)這項,也沒有到姿勢、力量和角度上,所以數(shù)據(jù)粒度不夠。第二,視角也不夠,可能需要更加專業(yè)的采集設(shè)備,更加專業(yè)的還原設(shè)備來完成。比如現(xiàn)在簡單的二維的圖像應(yīng)該變成動態(tài)三維的還原,并且可以分解,這樣就可能幫助總體的競賽水平得到提高。
別的項目,像籃球、像NBA就做得非常好,通過收集肌肉、血液、心臟、動作、戰(zhàn)術(shù)、團(tuán)隊等全景式的數(shù)據(jù)來幫助訓(xùn)練和比賽,因為這些因素都有可能影響整個比賽的結(jié)果。像壘球、網(wǎng)球的角度、落點、戰(zhàn)術(shù)都有不同的大數(shù)據(jù)分析??梢?,科技體育這幾年有巨大的空間,傳統(tǒng)的師傅帶徒弟,師傅的傳幫帶確實非常重要,但是應(yīng)該有更細(xì)粒度,更加多角度、更加全景式的手段,采用大數(shù)據(jù)技術(shù)來提升整體的競賽水平。
大數(shù)據(jù)在藝術(shù)上也有很多影響。傳統(tǒng)繪畫,不管是古典的還是現(xiàn)代的畫,都有自己的素材和表現(xiàn)形式?,F(xiàn)在出現(xiàn)了一種新的素材——數(shù)據(jù)素材,也就有了新的表現(xiàn)形式。比如飛機(jī)航班的數(shù)據(jù)軌跡就可以構(gòu)成一幅新穎的畫。由數(shù)據(jù)作為素材,有新的視角進(jìn)來,作為一個整體的新型創(chuàng)作出現(xiàn)。
大數(shù)據(jù)已經(jīng)影響到經(jīng)濟(jì)、管理、體育、藝術(shù)等領(lǐng)域,在其他的領(lǐng)域也有非常多的應(yīng)用,比如農(nóng)業(yè)就有蔬菜革命、精準(zhǔn)扶貧,這些都是利用大數(shù)據(jù)的例子。在醫(yī)療健康領(lǐng)域,醫(yī)院內(nèi)醫(yī)院外,得病和未得病之間的關(guān)聯(lián),也是大數(shù)據(jù)問題。文學(xué)上通過大數(shù)據(jù)技術(shù)對一些詞語、作者、關(guān)系、背景等進(jìn)行分析。
哲學(xué)里一個重要的方向是認(rèn)識論和方法論,這里包括我們近些年提煉出來的新的研究成果。傳統(tǒng)的哲學(xué)認(rèn)識論追求探索因果關(guān)系,因此基本叫做模型驅(qū)動范式,也就是說通過刻劃變量之間的聯(lián)系,比如自變量和因變量,通過構(gòu)建這兩個之間的函數(shù)關(guān)系,比如線性、非線性等等,可以知道一個自變量一個單位的變化會導(dǎo)致因變量有幾個單位的變化,這里試圖反映變量之間的邏輯的因果上的機(jī)理。但是,這個模型驅(qū)動的范式在大數(shù)據(jù)時代會受到一些挑戰(zhàn),或者說它碰到一些問題時會捉襟見肘。比如,當(dāng)數(shù)據(jù)變量的組合數(shù)特別多時,當(dāng)很多變量是潛變量和隱變量時,當(dāng)很多的變量雖然重要,但是不可測不可獲時,還有當(dāng)數(shù)據(jù)的樣本規(guī)模特別大時,這些問題用傳統(tǒng)的模型驅(qū)動的做法就會比較困難。因此,就出現(xiàn)了一個新的范式轉(zhuǎn)變,催生了大數(shù)據(jù)驅(qū)動范式。這個范式想表達(dá)的是,對于管理決策,我們希望能夠?qū)崿F(xiàn)既有關(guān)聯(lián)又有因果的訴求,這個新范式簡單地說由外部嵌入、技術(shù)增強(qiáng)和使能創(chuàng)新三方面構(gòu)成。外部嵌入是指引入視角之外的變量,有些變量我們知道重要,但是沒有辦法放進(jìn)模型里,比如我知道股價,我預(yù)測股價有個計量模型,但是如果今天這個公司出了一個事情,或者是上面有個新聞,或者行業(yè)里有個新的政策,我們覺得可能會影響股價,但是這些變化很可能是視頻、語音或者文本,沒有辦法融入到傳統(tǒng)的模型中去。所以,需要引入外部視角。這些圖像、視頻、新聞文本要引入進(jìn)來,就是要使得我們引入的變量可測、可獲,這就是第二條,技術(shù)上要增強(qiáng)。當(dāng)這些變量引入進(jìn)來的時候,我的變量空間就發(fā)生了變化,這個時候我們可能會研究新的X到Y(jié)的轉(zhuǎn)換,也就是變量關(guān)系和映射要重新定義和審視,這就是使能創(chuàng)新。這是大數(shù)據(jù)驅(qū)動范式框架的三個方面。
歷史學(xué)其實也和大數(shù)據(jù)密不可分。傳統(tǒng)的歷史記錄內(nèi)容都是帝王將相、英雄豪杰、國家、政治、重大的軍事事件等等,很難在歷史中看到平民和我們自己。一個是過去的粒度不夠,第二手段也不行,存不下來。大數(shù)據(jù)環(huán)境下就可能自下而上反映歷史。比如國家圖書館互聯(lián)網(wǎng)信息戰(zhàn)略保存項目,和新浪合作,把新浪公開的相關(guān)博客文章作為歷史資料記錄下來,通過自上而下與自下而上的史學(xué)觀的融合,使得我們可以在更細(xì)粒度上反映歷史和社會,同時也可以獲得更加全面的歷史畫面。
法律也和大數(shù)據(jù)相關(guān)。比如下載一個App,憑什么問我要這么多權(quán)限?我不給權(quán)限行不行?沒有辦法,不給就不能用。我在網(wǎng)上購物、瀏覽,我的痕跡、數(shù)據(jù)腳印,都被公司采集了,我有沒有權(quán)利說你把我的這些痕跡抹掉、遺忘掉?這就是被遺忘權(quán)。所謂被遺忘權(quán)是指數(shù)據(jù)主體有權(quán)要求數(shù)據(jù)控制者永久刪除有關(guān)數(shù)據(jù)主體的個人數(shù)據(jù),有權(quán)被互聯(lián)網(wǎng)遺忘,除非數(shù)據(jù)的保留有合法的理由。2018年歐盟出臺了《通用數(shù)據(jù)保護(hù)條例》,強(qiáng)調(diào)了被遺忘權(quán),我們國家2018年的高考Ⅱ卷一篇閱讀文章的題目,也是要考生來思考、評論這個被遺忘權(quán)的問題。這也是由大數(shù)據(jù)激發(fā)出來的新問題,對傳統(tǒng)的法學(xué)研究產(chǎn)生了新的挑戰(zhàn),或者說帶來了新的發(fā)展空間。
人工智能的難點是黑盒子問題
大數(shù)據(jù)的沖擊力量現(xiàn)在看來還在加劇,其中有一個力量非常值得關(guān)注,那就是人工智能。
當(dāng)人工智能遇到大數(shù)據(jù)的時候,現(xiàn)在井噴式的發(fā)展才變成了可能。其實人工智能是現(xiàn)在這個時代中很多技術(shù)的一類,它本身已經(jīng)發(fā)展好幾十年了,但是為什么在近些年才得到了快速發(fā)展?其實人工智能技術(shù)和這幾個關(guān)鍵詞有關(guān),那就是“ 學(xué)習(xí)、訓(xùn)練、推理、演化、智能、智慧”,也就是說,它是關(guān)于這些關(guān)鍵詞的一類技術(shù)。特別重要的一點,它要根據(jù)大量的數(shù)據(jù)來進(jìn)行學(xué)習(xí)和預(yù)測,就是從數(shù)據(jù)中學(xué)習(xí),建立模型,并用于預(yù)測未來。過去為什么不行呢?比如本來想學(xué)一個圓,但是過去的數(shù)據(jù)只有一個半圓,你說它怎么能學(xué)出這個圓呢?所以,進(jìn)入大數(shù)據(jù)時代,當(dāng)我們的數(shù)據(jù)有足夠的粒度和像素的時候它才成為可能,因為人工智能的主流技術(shù)首先是要基于大規(guī)模數(shù)據(jù)進(jìn)行學(xué)習(xí)。其次,人工智能算法本身需要非常強(qiáng)的計算能力,也就是算力,只有在大數(shù)據(jù)時代,有了云計算平臺、數(shù)據(jù)傳輸、數(shù)據(jù)的流通、數(shù)據(jù)的管理、諸如5G技術(shù)等,才能為進(jìn)一步的大數(shù)據(jù)應(yīng)用創(chuàng)造條件,為人工智能的發(fā)展提供非常好的環(huán)境和支撐?,F(xiàn)在可以看到我們身邊其實已經(jīng)有很多人工智能產(chǎn)品了,比如工業(yè)機(jī)器人、財務(wù)機(jī)器人、作業(yè)機(jī)器人、下棋機(jī)器人、能做詩作畫作曲的機(jī)器人等,這些機(jī)器人可以做很多我們過去認(rèn)為不可能的事情。
人工智能在未來會波濤洶涌,一浪高過一浪地發(fā)展。但是它本身也有局限,目前的大數(shù)據(jù)技術(shù)特別是深度神經(jīng)網(wǎng)絡(luò)這樣的技術(shù),基本上屬于“黑盒子”的技術(shù),可以算得非常準(zhǔn),但是“為什么”還說不大清楚。在這種情況下,在一些重要的應(yīng)用領(lǐng)域就受到局限,因為如果不知道“為什么”就不敢用這個方法做重要決策,如果不能通過非常清楚的機(jī)理來說明,實際它未來的應(yīng)用也是有局限的?,F(xiàn)在,業(yè)界和學(xué)界都在攻關(guān)“可解釋人工智能”,實際就是人工智能在輸入和輸出之間,在數(shù)據(jù)和預(yù)測的結(jié)果之間,從數(shù)學(xué)上來講需要一點定理,一些形式化的機(jī)理。從認(rèn)識論上來講需要一些因果關(guān)系。
現(xiàn)在這么熱鬧的人工智能,很多都是過去成果的工程化和產(chǎn)品化。它本身的理論突破,包括提到的可解釋性,也是大家在未來關(guān)注的重點。
不管怎么說,人工智能的應(yīng)用已經(jīng)深刻地影響到我們了。作為人類,我們自己創(chuàng)造了一個“亞種”叫做機(jī)器人。機(jī)器人的行為是不是都在我們?nèi)说脑O(shè)想之中呢?會不會干一些我們想不到的事情呢?似乎這個擔(dān)憂是必要的。所以機(jī)器行為學(xué)應(yīng)運(yùn)而生。當(dāng)人知道和我們打交道的是機(jī)器人時,人到底會有什么不同?機(jī)器如果只是模擬人的行為,那么我們用不用擔(dān)心它會做一些其他的事情?當(dāng)人和機(jī)器人一起互動時,會不會有其他的一些問題出現(xiàn)?這些問題實際是很革命性的。傳統(tǒng)社會學(xué)、管理學(xué)、經(jīng)濟(jì)學(xué)、心理學(xué)等都是研究人、由人構(gòu)成的組織的行為,由人形成的網(wǎng)絡(luò)的行為。隨著各式各樣的機(jī)器人越來越多地出現(xiàn)在我們身邊,越來越多地替代人的工作,越來越多地挑戰(zhàn)人們在智力、計算上的能力,這個擔(dān)憂或者這樣的研究是非常必要的。所以,我們要研究機(jī)器如何塑造人類的行為,人類如何塑造機(jī)器的行為,以及人機(jī)協(xié)作的行為。最新的《自然》雜志上有一篇文章也是呼喚學(xué)界、業(yè)界關(guān)注機(jī)器的行為以及機(jī)器和人的行為。
運(yùn)用大數(shù)據(jù)要重視商業(yè)倫理
實際大數(shù)據(jù)的使用本身有很多令人擔(dān)憂之處。雖然科技發(fā)展飛速,但是人們使用科技是帶有價值取向的。
比如大數(shù)據(jù)殺熟。在傳統(tǒng)的營銷、管理里面我們都希望了解客戶的行為,更好地為他們服務(wù)。在市場的環(huán)境下我們也說,既然有人愿意用高價買,那就可能要給他提供更好的服務(wù)。但是在大數(shù)據(jù)環(huán)境下,這種處理有個度的問題。第一客戶是否知道他的信息被收集,第二他是否愿意真的出高價買。作為企業(yè)來講,又有經(jīng)營哲學(xué)上的思考。企業(yè)是以盈利為中心,還是以客戶為中心?當(dāng)以客戶為中心時,客戶滿意與否就變成了主要的KPI,就是主要的決策考量,如果光考慮企業(yè)的盈利,而不考慮客戶,可能就不太會考慮用戶的感受。實際上大數(shù)據(jù)殺熟是在商業(yè)倫理層面的問題。
還有剛才提到的App權(quán)限的濫用,以及數(shù)據(jù)的泄露,回到我們最開始提到的劍橋分析公司的例子,當(dāng)時的CEO說“在美國所有的數(shù)據(jù)都可以買到”。因此這家公司2018年就陷入了數(shù)據(jù)泄露和商業(yè)倫理的丑聞,最終關(guān)門了。不管怎么說,在大數(shù)據(jù)這個時代我們跟數(shù)據(jù)打交道就會碰到一系列社會問題、法律問題、道德問題,需要在企業(yè)層面、商業(yè)層面,在社會和政府層面立法立規(guī),在個人層面、在道德的層面大家來共同努力解決這些問題。技術(shù)發(fā)展特別快,這些問題的出現(xiàn)也變得越來越重要,我們應(yīng)該有特別強(qiáng)的緊迫感,來更好地面對這些問題。
感測和響應(yīng)大數(shù)據(jù)時代
過去的20年我們經(jīng)歷了特別大的技術(shù)變化。20年前,中國網(wǎng)民是62萬,互聯(lián)網(wǎng)普及率只有0.03%,網(wǎng)站一千多家?,F(xiàn)在中國網(wǎng)民有8.29 億,互聯(lián)網(wǎng)普及率達(dá)到 59.6%,網(wǎng)站523 萬個,上網(wǎng)時間每天人均4小時。
在這樣的時代中,簡單地總結(jié)一下,我覺得就是兩個詞,“感測”和“響應(yīng)”。時代的變化太快,我們應(yīng)該敏銳地主動地感測和了解這個變化,同時不管是企業(yè)還是個人要作出自己的準(zhǔn)備和自己的響應(yīng),因為大數(shù)據(jù)作為一個時代會伴隨我們相當(dāng)長的時間。在未來的某一天,可能由大數(shù)據(jù)衍生出一個新的概念、一個新的內(nèi)涵、一類新的技術(shù),可能會變成一個新時代的符號,所以當(dāng)下我們要面對大數(shù)據(jù),未來我們要融入新時代。
(本文轉(zhuǎn)載自清華大學(xué)經(jīng)濟(jì)管理學(xué)院 ,如有侵權(quán)請電話聯(lián)系13810995524)
* 文章為作者獨(dú)立觀點,不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。
備考交流

掃碼關(guān)注我們
- 獲取報考資訊
- 了解院?;顒?/li>
- 學(xué)習(xí)備考干貨
- 研究上岸攻略
最新動態(tài)
推薦項目
活動日歷
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 10/05 金融MBA考生請注意 | 2026中央財經(jīng)大學(xué)金融學(xué)院金融MBA招生說明會(第二場)線上開啟
- 10/11 重磅活動上新 |從理性角度解碼經(jīng)濟(jì)現(xiàn)象!交大安泰MBA授課師資于冷教授全真試聽課堂,帶你打開經(jīng)濟(jì)學(xué)的視界!
- 10/12 報名丨邂逅南航南通站——MBA/MEM/MPAcc公開課暨項目交流會
- 10/16 聯(lián)考沖刺必備 | 10月16日交大安泰MBA網(wǎng)報填寫指導(dǎo)暨筆試技巧分享會開啟報名,沖刺經(jīng)驗+填報指導(dǎo)為你的聯(lián)考保駕護(hù)航
- 10/18 【預(yù)告| 10.18北大國發(fā)院EMBA體驗日】鄧子梁:中國企業(yè)出海形勢與戰(zhàn)略分析
- 10/19 10月19日最后一期 | 2026中央財經(jīng)大學(xué)金融學(xué)院第七期“金融MBA體驗營”暨專家會客廳報名開啟