亚洲欧美中文日韩在线v日本,亚洲精品永久在线观看,亚洲av日韩av永久无码色欲,亚洲成a人片777777,亚洲人成网站在线播放942

諾獎(jiǎng)得主薩金特教授論“人工智能的來源”

北京大學(xué)匯豐商學(xué)院
2022-11-09 17:40 瀏覽量: 5629
?智能總結(jié)

諾獎(jiǎng)得主薩金特教授論“人工智能的來源”

日前,2011年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主、北大匯豐薩金特?cái)?shù)量經(jīng)濟(jì)與金融研究所榮譽(yù)主任托馬斯·薩金特(Thomas J. Sargent)教授主編的《薩金特?cái)?shù)量經(jīng)濟(jì)與金融研究所時(shí)訊》(第四期)正式上線。其中,薩金特教授在其為時(shí)訊撰寫的獨(dú)家首發(fā)文章《人工智能的來源》中,分享了對人工智能與機(jī)器學(xué)習(xí)的理解與思考,以下為全文內(nèi)容。

托馬斯·薩金特

作為一個(gè)并不全面的見證者,我在本文中描述了人工智能與機(jī)器學(xué)習(xí)是如何被發(fā)明的,并列舉了該領(lǐng)域的重要人物以及他們的思想。

1簡介

這篇文章與人類、人工智能以及學(xué)習(xí)相關(guān)。我所謂的人工是指“非人類”。在描述人工智能和機(jī)器學(xué)習(xí)之前,為了表達(dá)我對自然和人工智能的理解,我將首先通過描述有智識(shí)的人類通過結(jié)合先天與后天技能來完成的兩類重要活動(dòng),即識(shí)別模式和做出選擇。智能的其他方面是對時(shí)間和空間的認(rèn)識(shí),以及對其他人的同情和共鳴。一代又一代的父母把從上一輩傳承的技能和觀點(diǎn),以及自己學(xué)到的新思想傳給孩子。在描述了伽利略·伽利雷(Galileo Galilei)和查爾斯·達(dá)爾文(Charles Darwin)如何將他們的先天才能與教科書上的知識(shí)相結(jié)合,繼而創(chuàng)造出科學(xué)上的突破之后,我將講述現(xiàn)代研究人員如何設(shè)計(jì)出能夠識(shí)別模式和做出選擇的計(jì)算機(jī)程序1。

我在這篇文章里提及了許多“樹”,即各種概念和技術(shù),這對普通讀者來說可能是新事物,但我希望我對機(jī)器學(xué)習(xí)這片“森林”的描述是清楚的。若有讀者好奇地想了解更多復(fù)雜的“樹”,我建議他們使用專業(yè)在線搜索引擎或查看本文結(jié)尾處參考文獻(xiàn)中的內(nèi)容。

2人類智能

我從認(rèn)知心理學(xué)家史蒂芬·平克(Steven Pinker)的《白板》(The Blank Slate)第13章的內(nèi)容開始講。平克這本書(2003)的第13章題為《走出我們的深淵》。如果你是高中生或大一新生,或是喜歡思考教育的目的,推薦你閱讀這一章?;趯θ祟愓J(rèn)知障礙的理解,史蒂芬·平克對在高中和大學(xué)應(yīng)該學(xué)習(xí)什么內(nèi)容以及為什么學(xué)習(xí)提供了建議。他在開章描述了進(jìn)化使我們自然擅長的一些技能,以及我們必須借助學(xué)習(xí)才能獲取的其他技能。

在人類10萬年的歷史和史前史中,進(jìn)化未賦予人類的那些技能其實(shí)并不重要。但是,現(xiàn)代生活使一些進(jìn)化未賦予我們的東西變得前所未有地重要。平克總結(jié)出了四個(gè)此類學(xué)科。

1.物理學(xué)關(guān)于重量、時(shí)間、空間、運(yùn)動(dòng)、能量、熱和光的理論。

2.生物學(xué)關(guān)于生命、出生和死亡的理論。

3.統(tǒng)計(jì)學(xué)描述不確定性以及識(shí)別和解釋相對頻率的方法。

4.經(jīng)濟(jì)學(xué)關(guān)于工作、生產(chǎn)、分配、價(jià)格和數(shù)量的描述。

在現(xiàn)代生活中,只有了解了這四個(gè)領(lǐng)域才能做出明智的個(gè)人和公共決策。但我們的“直覺”經(jīng)常讓我們在這些領(lǐng)域中犯錯(cuò)。出于行文目的,暫且將“直覺”定義為我們進(jìn)化出來的能夠快速理解各種情況的思維方式。它的同義詞或許是“常識(shí)”,即我們本能地就能夠理解的東西。史蒂芬·平克描述了我們自然、直覺的理論在這四個(gè)領(lǐng)域中是如何將我們引入歧途的,只有通過受教育才能改進(jìn)。

平克列舉了一些四個(gè)領(lǐng)域相關(guān)的絕佳例子,以說明我們的常識(shí)和直覺并不能幫助我們理解現(xiàn)代物理學(xué)。根據(jù)理查德·費(fèi)曼(Richard Feynman)和其他杰出的物理學(xué)家的說法,“常識(shí)”難以幫助我們理解廣義相對論和量子力學(xué)。平克講述了我們?nèi)绾芜M(jìn)化出統(tǒng)計(jì)計(jì)算的能力,這種能力在過去靠狩獵和采集為生時(shí)很有幫助,它讓我們能夠計(jì)算一些事件出現(xiàn)的幾率。但是,相比從前,今日的重要風(fēng)險(xiǎn)事件發(fā)生的幾率非常低。而我們的自然稟賦不擅長應(yīng)對小概率事件。因?yàn)樵诠矝Q策中無法正確平衡低概率風(fēng)險(xiǎn)事件的成本和收益,我們付出過昂貴的代價(jià)。平克描述了進(jìn)化如何給了我們的祖先一套關(guān)于生產(chǎn)和交換的經(jīng)濟(jì)理論,然而這些理論并沒能讓我們理解勞動(dòng)分工、分配、市場、中間商、中介、穩(wěn)定市場的投機(jī)行為和利潤。事實(shí)上,我們天生就誤解了這些東西,在反復(fù)發(fā)生的針對中間商和貿(mào)易商、投機(jī)者和流動(dòng)性提供者的征用和大屠殺中,經(jīng)常出現(xiàn)悲慘的后果,而受害者往往是少數(shù)民族成員。

這些認(rèn)知缺陷為平克在該書第13章呼吁重新設(shè)計(jì)課程的建議提供了理論基礎(chǔ)。平克將教育描述為一種補(bǔ)償我們先天的認(rèn)知限制、利用我們先天學(xué)習(xí)能力的技術(shù)。他呼吁對學(xué)術(shù)課程進(jìn)行大刀闊斧的改革,傳授那些能幫助我們在現(xiàn)代社會(huì)享受生活和做出正確決定的技能:生物學(xué)、統(tǒng)計(jì)學(xué)和經(jīng)濟(jì)學(xué)。他也承認(rèn),多教授這些科目意味著少教授其他科目。

2.1人工智能和我們天生的認(rèn)知極限

通過閱讀第13章,我們可以了解人類是如何寄希望于“人工智能”來補(bǔ)充并超越與生俱來的自然人類智能。

這里潛藏著一個(gè)悖論,即創(chuàng)造人工智能和機(jī)器學(xué)習(xí)的主要技術(shù)工具來自物理學(xué)、生物學(xué)、統(tǒng)計(jì)學(xué)和經(jīng)濟(jì)學(xué),而這些領(lǐng)域正是我們先天認(rèn)知有限的。換句話說,我們試圖在自己天生不擅長的領(lǐng)域創(chuàng)造人工智能和機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)和人工智能的早期先驅(qū)和實(shí)踐者通過透徹地學(xué)習(xí)以及富有想象力地使用現(xiàn)有的最優(yōu)化分析技術(shù),來彌補(bǔ)他們在自然認(rèn)知方面的不足。

3兩位機(jī)器學(xué)習(xí)的先驅(qū)

3.1伽利略

Galileo Galilei

意大利物理學(xué)家、數(shù)學(xué)家、天文學(xué)家及哲學(xué)家

因?yàn)樘岢厍驀@太陽旋轉(zhuǎn),17世紀(jì)初偉大的意大利數(shù)學(xué)家、科學(xué)家、物理學(xué)家、天文學(xué)家伽利略(1564-1642)最終被宗教裁判所逮捕。在被逮捕的許多年前,伽利略從事了一項(xiàng)研究,我認(rèn)為這項(xiàng)研究演繹了“機(jī)器學(xué)習(xí)”方法的本質(zhì)。伽利略(1)設(shè)計(jì)并進(jìn)行實(shí)驗(yàn)來收集數(shù)據(jù);(2)反復(fù)觀察數(shù)據(jù),試圖發(fā)現(xiàn)模式;(3)通過擬合一個(gè)函數(shù)來減少數(shù)據(jù)的維度;(4)將該函數(shù)解釋為自然界的一般規(guī)律。伽利略的策略為機(jī)器學(xué)習(xí)和人工智能的意義提供了一個(gè)絕佳例子,也許是第一個(gè)例子。

自然地,我說的是伽利略的“斜面實(shí)驗(yàn)”以及他對數(shù)據(jù)進(jìn)行的處理和降維。伽利略試圖發(fā)現(xiàn)控制落體動(dòng)力的自然規(guī)律。也許你在想“這很容易,只要應(yīng)用艾薩克·牛頓(Isaac Newton)的萬有引力定律就行了”。不要太著急下定論:牛頓這時(shí)候還沒有出生呢。當(dāng)時(shí)被廣為接受的主流理論是亞里士多德(Aristotle)在2000年前宣稱的:較重的物體比較輕的物體下落得快。

伽利略想用實(shí)證方法來研究亞里士多德的理論。為什么不直接扔下不同重量的球,以便測量它們下落的速度呢?伽利略無法這樣做,因?yàn)椴徽摱嘀氐那蚵湎碌乃俣榷急犬?dāng)時(shí)的鐘能準(zhǔn)確測量的速度快得多。因此,伽利略決定建造不同角度的光滑斜面,并調(diào)整角度,使落下的球的速度足夠慢,這樣他就可以用他擁有的時(shí)鐘測量它們沿平面的移動(dòng)速度。對于一個(gè)長度l和高度h的平面,比率h/l決定了平面的角度。伽利略扔下一個(gè)球,仔細(xì)測量了球沿平面移動(dòng)的距離d,將之計(jì)作球被扔下后經(jīng)過的時(shí)間t的函數(shù)。他做了一個(gè)有兩欄的表格,其中記錄了ti 和di(i = 1,...),n為他在每個(gè)實(shí)驗(yàn)中的n個(gè)測量時(shí)間。對于一個(gè)給定的實(shí)驗(yàn),他將di和ti繪制在一起。他對各種不同重量的球進(jìn)行了實(shí)驗(yàn),設(shè)置了不同的l和h (即斜面的不同角度)。然后他凝視自己記錄的圖表,發(fā)現(xiàn)一個(gè)驚人的現(xiàn)象:在所有的圖表中,行進(jìn)的距離與經(jīng)過的時(shí)間的平方成正比,與球的重量和平面的角度無關(guān)。他推斷出一個(gè)公式:

請注意,出人意料的是,球的重量不在右邊的函數(shù)中。因此,球的下落速度顯然是與它的重量是無關(guān)的。因此,通過對他的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行函數(shù)擬合,伽利略同時(shí)完成了數(shù)據(jù)降維和概括。他發(fā)現(xiàn)了一個(gè)自然法則,這個(gè)法則成為50年后艾薩克·牛頓思想的一個(gè)重要啟發(fā)。

伽利略的斜面實(shí)驗(yàn)具有現(xiàn)代機(jī)器學(xué)習(xí)和人工智能的所有要素。他一開始不知道世界是如何運(yùn)作的,也沒有一個(gè)好的理論。他所做的完全是無理論的。所以他進(jìn)行了一系列的實(shí)驗(yàn),收集了數(shù)據(jù)表,每個(gè)實(shí)驗(yàn)一個(gè)表,以球的重量以及斜面的長度l和高度h為索引。他從許多數(shù)據(jù)表中推導(dǎo)(即“擬合”)出一個(gè)函數(shù),結(jié)果發(fā)現(xiàn)這個(gè)函數(shù)只由一個(gè)新數(shù)字決定,即“參數(shù)”g。2

我并不完全理解是什么啟發(fā)了伽利略去設(shè)計(jì)他的實(shí)驗(yàn),收集那些測量數(shù)據(jù),并通過擬合函數(shù)來減少測量數(shù)據(jù)的維度。不過我確實(shí)知道伽利略擁有的工具,以及本可以幫助他、但他卻沒有的工具。尤其是,他不知道微分和積分計(jì)算——幾十年后,這些工具才被費(fèi)馬(Fermat)、牛頓和萊布尼茨(Leibniz)發(fā)明出來。但伽利略確實(shí)非常了解幾何和代數(shù),也十分熟悉歐幾里得(Euclid)和阿基米德(Archimedes)。如果沒有這些工具,純粹的靈感和對亞里士多德理論的懷疑態(tài)度是遠(yuǎn)遠(yuǎn)不夠的。3

3.2達(dá)爾文

Charles Robert Darwin

英國的博物學(xué)家、生物學(xué)家、進(jìn)化論的奠基人

下一個(gè)故事有關(guān)經(jīng)濟(jì)理論在達(dá)爾文(1809 - 1882)的“自然選擇物種進(jìn)化”學(xué)說中所起的作用。哈耶克(Hayek)(2011 年,附錄 B)引用了西蒙·N·巴頓(Simon N. Patton)于1899 年發(fā)表的一段聲明:“......正如亞當(dāng)·斯密(Adam Smith)是最后一個(gè)道德家和第一個(gè)經(jīng)濟(jì)學(xué)家一樣,達(dá)爾文是最后一個(gè)經(jīng)濟(jì)學(xué)家和第一位生物學(xué)家?!?/p>

達(dá)爾文使用原始經(jīng)驗(yàn)主義和降維來構(gòu)建他的理論。他不知道基因是什么,也不知道DNA是什么。他“知道”的是觀察他培育的鴿子和自然界的動(dòng)植物所收集來的一個(gè)龐大的數(shù)據(jù)集。僅通過研究鴿子的數(shù)據(jù),他就推斷出了三個(gè)基本原則中的兩個(gè)。

1.自然變異

2.新變化的統(tǒng)計(jì)繼承

作為一名鴿子育種者,達(dá)爾文利用這兩個(gè)原則來選擇理想的性狀,然后依靠統(tǒng)計(jì)遺傳來培育新的鴿子品種。幼鴿從父母那里獲得了一些特征。“查爾斯·達(dá)爾文的選擇”,而不是自然選擇指導(dǎo)其育種。有很長一段時(shí)間,達(dá)爾文并不知道在自然中選擇的原理是什么。然后,他閱讀了托馬斯·馬爾薩斯(Thomas Malthus)的《人口原理對社會(huì)未來進(jìn)步的影響》。馬爾薩斯描寫了一場斗爭,這種斗爭是因人口繁殖速度超過食物產(chǎn)量增速而引發(fā)的。在此前提下,食物的可得性制約著人口數(shù)量,個(gè)體需要為生存斗爭。馬爾薩斯這方面的論證為達(dá)爾文提供了他缺失的那塊拼圖:從生存斗爭中產(chǎn)生的自然選擇。出生的嬰兒數(shù)量超過了食物所能喂養(yǎng)的數(shù)量。達(dá)爾文(1859)的引言部分將其第三個(gè)基本原則歸功于馬爾薩斯。

3.競爭選擇——為了生存的斗爭

一些杰出的博弈論者和經(jīng)濟(jì)學(xué)家現(xiàn)在經(jīng)常使用進(jìn)化論作為經(jīng)濟(jì)和社會(huì)動(dòng)態(tài)的來源。也許這些人認(rèn)為他們從達(dá)爾文那里得到了啟發(fā)。但實(shí)際上達(dá)爾文理論的一個(gè)重要部分是從經(jīng)濟(jì)學(xué)家那里得到的。正如哈耶克(2011 年版,附錄 A)指出的,達(dá)爾文1838年對亞當(dāng)·斯密的研究為他提供了生物進(jìn)化自然選擇理論的一個(gè)關(guān)鍵組成部分。哈耶克(2011)還指出,文化進(jìn)化論早在1800年之前就已被經(jīng)濟(jì)學(xué)家和社會(huì)學(xué)家廣泛接受。

達(dá)爾文的研究策略是一個(gè)將龐大的數(shù)據(jù)集降維,以提取基于三個(gè)基本原則的低維模型的很好的例子。數(shù)據(jù)收集,運(yùn)用三個(gè)基本原則進(jìn)行數(shù)據(jù)降維,最后進(jìn)行理論概括:多么非凡的研究策略!

像伽利略一樣,達(dá)爾文也不是從零開始。他在生物學(xué)、地質(zhì)學(xué)和經(jīng)濟(jì)學(xué)方面都很博學(xué)。對這些領(lǐng)域既有知識(shí)的深刻理解是他能夠突破已知、進(jìn)行創(chuàng)新的基礎(chǔ)。他是一個(gè)“宏觀”的人,因?yàn)樗睦碚摰那皟蓚€(gè)支柱,即新特征的變異和繼承,并沒有“微觀基礎(chǔ)”。對于在他的三個(gè)支柱理論下,需要多長時(shí)間,生物的進(jìn)化才能夠與古生物學(xué)與生物學(xué)已知的證據(jù)相符合,他也說得很模糊。?

4人工智能

上文都在談?wù)撊祟惖闹腔酆挽`感,現(xiàn)在讓我們轉(zhuǎn)向人工智能或機(jī)器學(xué)習(xí)。它是什么呢?

我所說的人工智能是指模仿人類完成一些“智能”事情的計(jì)算機(jī)程序?!皺C(jī)器學(xué)習(xí)”主要是通過使用微積分和統(tǒng)計(jì)來完成模式識(shí)別。參照伽利略運(yùn)用斜面實(shí)驗(yàn)測量下落物體速度的方法,設(shè)計(jì)者開發(fā)出能夠進(jìn)行機(jī)器學(xué)習(xí)和人工智能的計(jì)算機(jī)芯片和程序。因此,將函數(shù)視為“如果-那么”語句的集合。將“如果”部分想象為函數(shù)中的橫坐標(biāo) x,并將“那么”部分想象為y縱坐標(biāo)。使用計(jì)算機(jī)識(shí)別模式涉及:(1)將數(shù)據(jù)劃分為x和y部分,(2)猜測f的函數(shù)形式,然后(3)使用統(tǒng)計(jì)的方法從不同的x和y數(shù)據(jù)中推斷f?!敖y(tǒng)計(jì)學(xué)”這門學(xué)科提供了用于推斷或“擬合”函數(shù)f的工具。

舉一個(gè)簡單的例子。假設(shè)在地球上的給定位置,您在一年中的每一天都記錄了從日出到日落的“白天”長度,在x軸上按照1到365記錄天數(shù),在y軸上記錄從日出到日落的時(shí)長,制作一個(gè)以x和y為兩列的表格。該表有365乘以2等于730個(gè)數(shù)字?,F(xiàn)在繪制并凝視它們。猜測函數(shù)y=cos(α +βx )也許能很好地總結(jié)這些數(shù)據(jù)。使用微積分求使函數(shù)擬合得很好的兩個(gè)參數(shù)α,β的值,它們最小化了

你會(huì)發(fā)現(xiàn)這個(gè)函數(shù)擬合得很好(盡管不完美)。通過總結(jié)數(shù)據(jù)(也可稱為進(jìn)行“數(shù)據(jù)壓縮”或“數(shù)據(jù)縮減”),我們得以找出了一個(gè)經(jīng)驗(yàn)法則(一個(gè)函數(shù))來“概括”我們的發(fā)現(xiàn),并可以使用這個(gè)法則來預(yù)測365天樣本以外的“白天”時(shí)長。

5人工智能工具

機(jī)器學(xué)習(xí)和人工智能的核心方法來自以下學(xué)科:?

1.物理學(xué)

2.生物學(xué)

3.統(tǒng)計(jì)學(xué)

4.經(jīng)濟(jì)學(xué)

接下來我們將逐一分析這四個(gè)學(xué)科。

5.1物理學(xué)

歐拉(Euler)、拉格朗日(Lagrange)和漢密爾頓(Hamilton)在18世紀(jì)和19世紀(jì)的研究成果擴(kuò)充和完善了運(yùn)用微積分最優(yōu)化時(shí)變函數(shù)的積分方法。這為21世紀(jì)哈密頓·蒙·卡特羅(Hamiltonian Monte Carlo)的模擬技術(shù)奠定了基礎(chǔ),該技術(shù)繼而推動(dòng)了復(fù)雜的貝葉斯估計(jì)和機(jī)器學(xué)習(xí)的技術(shù)發(fā)展??藙谛匏梗–lausius)、玻爾茲曼(Boltzmann)和吉布斯(Gibbs)在19世紀(jì)創(chuàng)造了用統(tǒng)計(jì)學(xué)來描述熱力學(xué)的概念。他們根據(jù)熵定義了熱力學(xué)第二定律,熵是似然比的期望值,即一個(gè)概率分布與另一個(gè)概率分布的比率。其中一個(gè)概率分布是一個(gè)平坦的均勻分布,它在統(tǒng)計(jì)上代表完全無序,另一個(gè)分布則在精確的、統(tǒng)計(jì)學(xué)意義上代表“有序”。在20世紀(jì)末和21世紀(jì)初,熵為許多機(jī)器學(xué)習(xí)算法提供了一種測量擬合模型的概率分布與數(shù)據(jù)經(jīng)驗(yàn)分布之間差異的方法。保羅·薩繆爾森(Paul Samuelson) (1947) 和他的同事們將這些技術(shù)和其他技術(shù)從數(shù)學(xué)物理學(xué)引入經(jīng)濟(jì)學(xué),這將為人工智能和機(jī)器學(xué)習(xí)更多工具的發(fā)展奠定基礎(chǔ)。

5.2數(shù)學(xué)生物學(xué)

生物學(xué)從時(shí)間和空間上研究物種的繁殖和變異模式。模式可以從“宏觀”和“微觀”層面上檢測,這取決于研究的單位——個(gè)人、動(dòng)物、DNA、RNA,或組成它們那些更小的分子。生物學(xué)的數(shù)學(xué)理論(例如,費(fèi)爾德曼(Feldman,2014) 和費(fèi)爾森斯坦(Felsenstein,1989)通過以隨機(jī)差分或微分方程的形式構(gòu)建動(dòng)態(tài)系統(tǒng)來將這些模式構(gòu)成數(shù)學(xué)體系。在微觀層面,主要涉及將DNA編碼為二進(jìn)制字符串,以便分析師在該字符串上通過切割和重組進(jìn)行突變和有性生殖的數(shù)學(xué)運(yùn)算。例如,參見霍蘭德(Holland,1987)。

5.3統(tǒng)計(jì)學(xué)

現(xiàn)代數(shù)理統(tǒng)計(jì)認(rèn)為“概率”有兩種可能的含義:?

? 頻率論者認(rèn)為,概率是在觀察一個(gè)非常大的獨(dú)立且同分布的隨機(jī)變量樣本后可以預(yù)期的相對頻率。

? 貝葉斯解釋,概率是關(guān)于未知隱藏“狀態(tài)”或“參數(shù)”的不確定性的主觀表達(dá)。

現(xiàn)代統(tǒng)計(jì)學(xué)運(yùn)用一系列工具來:(1) 制定一個(gè)函數(shù)集,這些函數(shù)的具體形式取決于一系列參數(shù),有時(shí)參數(shù)還取決于更高層的超參數(shù);(2) 從樣本中推斷或“估算”這些參數(shù);(3) 以一個(gè)理性人的角度,描述這些推斷的不確定性;(4)使用這些擬合函數(shù)的概率版本進(jìn)行“樣本外”預(yù)測。這些機(jī)器學(xué)習(xí)的基本技術(shù)依賴于對微積分的應(yīng)用,正如我們之前提過,伽利略當(dāng)時(shí)并沒有這些工具。

5.4經(jīng)濟(jì)學(xué)經(jīng)濟(jì)學(xué)是研究人類群體如何有目的地利用和分配稀缺資源的學(xué)科?,F(xiàn)代經(jīng)濟(jì)理論是自洽環(huán)境中的多人決策理論。在一致的經(jīng)濟(jì)模型中的抽象智能人是“理性的”,因?yàn)樗麄兲幚碛邢迌?yōu)化問題皆基于他們對自身所處環(huán)境的共同、正確的理解。?這種多人決策理論的兩個(gè)主要類別是?

? 博弈論

? 一般均衡理論

這些理論中的主要因素和內(nèi)容包括

? 約束

? 不確定性

? 去中心化和并行優(yōu)化

? 交易網(wǎng)絡(luò)的賬本

? 價(jià)格

? 競爭

在這些模型中,一個(gè)個(gè)體的決策規(guī)則構(gòu)成了其他個(gè)體選擇問題的約束集的一部分。這種約束通過模型的“均衡條件”產(chǎn)生。個(gè)體約束優(yōu)化問題的解中,可以導(dǎo)出個(gè)人價(jià)值,其中包含用以分配資源的有用信息。

這些經(jīng)濟(jì)模型描述了“并行處理”和去中心化的決策過程。一個(gè)被稱為“均衡”的安排有助于調(diào)和不同個(gè)體之間的自私?jīng)Q策以及物理資源的限制。嚴(yán)格的均衡概念在這兩個(gè)主流框架中占據(jù)主導(dǎo)地位。定義均衡是一件事,計(jì)算均衡則是另一回事。因此,著名的經(jīng)濟(jì)理論家們多年來一直在與維度的詛咒斗爭、尋求計(jì)算競爭均衡分配和價(jià)格體系的可靠方法。對這一事業(yè)做出了里程碑意義的貢獻(xiàn)的經(jīng)濟(jì)理論家有艾羅與赫維克茲(Arrow and Hurwicz,1958)、艾羅(Arrow et al.,1959)、艾羅(Arrow,1971)、二階堂與宇澤(Nikaido and Uzawa,1960)以及斯卡夫(Scarf,1967)、斯卡夫(Scarf et al.,2008)。這些算法運(yùn)用了計(jì)算方案,追蹤個(gè)人和社會(huì)價(jià)值量,以及人們想要的商品和活動(dòng)的數(shù)量與社會(huì)安排之間的差距。

計(jì)算均衡的研究工作最終發(fā)現(xiàn),均衡的計(jì)算與有限理性個(gè)體向均衡的收斂之間具有密切聯(lián)系。布瑞與克雷普斯(Bray and Kreps,1987)以及馬賽特與薩金特(Marcet and Sargent,1989)提出了“在均衡中學(xué)習(xí)”和“學(xué)習(xí)均衡”之間的重要區(qū)別。馬賽特與薩金特(Marcet and Sargent,1989)和薩金特(Sargent et al.,1993)通過使用隨機(jī)近似的數(shù)學(xué)方法(例如,見格拉迪夫(Gladyshev,1965))來研究向理性預(yù)期均衡的收斂。據(jù)我所知,關(guān)于隨機(jī)近似的最初工作始于霍特林(Hotelling,1941)、傅利曼與薩維奇(Friedman and Savage,1947)。他們試圖構(gòu)建一種統(tǒng)計(jì)抽樣方法,來精確地解出一個(gè)未知函數(shù)在給定點(diǎn)的最大值。?

舒比克(Shubik,2004)和巴克(Bak et al. ,1999)的相關(guān)工作構(gòu)建了一些博弈,他們利用這些博弈來思考價(jià)格制定者對均衡過程的促進(jìn)作用。(在一般均衡模型中,只有價(jià)格接受者,沒有價(jià)格制定者)。舒比克的工作運(yùn)用了他對一個(gè)課題的專業(yè)知識(shí),這個(gè)課題存在于一般均衡理論和博弈論的夾縫中,對機(jī)器學(xué)習(xí)和人工智能有重要意義,它就是:

? 貨幣理論

本著舒比克(Shubik,2004)的精神,思考貨幣理論的一個(gè)好方法是,注意到它的目的是解釋均衡價(jià)格向量是如何被實(shí)際生活在一般均衡模型中的個(gè)體設(shè)定的。艾羅和德布魯(Debreu)的經(jīng)典一般均衡模型描述了均衡價(jià)格向量的特性,但對誰來設(shè)定這個(gè)價(jià)格向量以及如何設(shè)定卻保持沉默。相反,一個(gè)模型之外的“神靈”神秘地宣布了一個(gè)價(jià)格向量,同時(shí)出清了所有的市場。一個(gè)均衡價(jià)格向量保證了每個(gè)個(gè)體的預(yù)算約束得到滿足。在一般均衡模型中,貿(mào)易是多邊的,預(yù)算約束在一個(gè)中心化的賬戶中得到協(xié)調(diào)。相反,貨幣理論是關(guān)于一個(gè)分散的系統(tǒng),該系統(tǒng)中的人們只是偶爾在一系列雙邊會(huì)面中見面,并通過使用“交換媒介”交換商品和服務(wù)。交換媒介可以是耐用金屬(金或銀)、代幣(便士、紙質(zhì)“美元”或“英鎊”)、流通的債務(wù)憑證,或者銀行、清算所或中央銀行的賬目條目。奧斯特羅伊與斯塔(Ostroy and Starr,1974)、奧斯特羅伊與斯塔(Ostroy and Starr,1990),以及最近的湯森(Townsend,2020)總結(jié)了該流派的研究。加密貨幣理論是這些研究的直系后代。

我再介紹一下博弈研究對機(jī)器學(xué)習(xí)的貢獻(xiàn)。幾十年來,應(yīng)用經(jīng)濟(jì)學(xué)家已經(jīng)構(gòu)建了計(jì)算博弈均衡的算法,支撐這些計(jì)算的關(guān)鍵工具包括逆向歸納法(動(dòng)態(tài)規(guī)劃)和樹狀搜索。由于要研究的可能狀態(tài)的維度呈指數(shù)增長,減少要研究狀態(tài)的數(shù)量對于在近似均衡方面取得進(jìn)展至關(guān)重要。在這方面,minimax算法和α-β剪枝搜索算法是主要的方法,可參考克努斯與摩爾(Knuth and Moore,1975)的著作和https://www.youtube.com/watch?v=STjW3eH0Cik,可以了解α-β剪枝搜索的描述,并看到相應(yīng)的計(jì)算系統(tǒng)和“適者生存”的想法。一條相關(guān)的研究路線研究了一群天真地基于對手過去的行動(dòng)進(jìn)行優(yōu)化的玩家是否會(huì)收斂到納什均衡。可參見蒙德勒與沙普利(Monderer and Shapley,1996)、霍夫鮑爾與桑德霍爾姆(Hofbauer and Sandholm,2002)、福斯特與楊(Foster and Young,1998)、弗得伯格(Fudenberg et al.,1998)。當(dāng)收斂成立時(shí),這種“虛構(gòu)游戲”算法提供了一種計(jì)算均衡的方法,可參見蘭伯特三世(Lambert Iii et al. ,2005)。

5.5約翰·霍蘭德(John Holland)在約1985年提出的人工智能愿景

John Henry Holland

美國科學(xué)家、復(fù)雜理論和非線性科學(xué)的先驅(qū)、遺傳算法之父

著名的計(jì)算機(jī)科學(xué)家約翰·霍蘭德1?是一位先驅(qū)者。他結(jié)合了我們提到的所有技術(shù)領(lǐng)域的思想,為生活在給定環(huán)境中的決策者構(gòu)建了計(jì)算機(jī)模型。在這種環(huán)境中,決策者別無選擇,只能按照艾羅(Arrow,1971)的思路,“在實(shí)踐中學(xué)習(xí)”?;籼m德(Holland,1987)介紹了他的這一方法,馬里蒙(Marimon et al.,1990)描述了在多人經(jīng)濟(jì)環(huán)境中的具體應(yīng)用?;籼m德方法的一個(gè)重要部分是全局搜索算法,他稱之為“遺傳算法”。它通過用字符串表示函數(shù)的參數(shù)來搜索“崎嶇不平的景觀”,這些字符串可以被隨機(jī)匹配成一對字符串,并進(jìn)行切割和重新組合。這是霍蘭德表示“性繁殖”的機(jī)械方式。這樣的“遺傳算法”包含了他所說的“分類器”系統(tǒng)的一部分?;籼m德的分類器系統(tǒng)包括:(1)一連串的“如果-那么”語句,其中一些必須相互競爭,以獲得在線(即實(shí)時(shí)的)決策權(quán)。(2)一種將“如果-那么”語句編碼為二進(jìn)制字符串的方法,該字符串可以進(jìn)行隨機(jī)突變、切割和重組;(3)一個(gè)為單個(gè)“如果-那么”語句分配獎(jiǎng)勵(lì)和成本的計(jì)算系統(tǒng);(4)破壞和創(chuàng)建新的“如果-那么”語句的程序,包括基于DNA切割和重組的隨機(jī)突變和有性繁殖;以及(5)一種篩選出適合決策規(guī)則的競爭性斗爭?;籼m德分類器系統(tǒng)已經(jīng)被證明能夠?qū)W會(huì)在動(dòng)態(tài)環(huán)境中保持耐心,就像拉蒙·馬里蒙(Ramon Marimon)總結(jié)的那樣,在由霍蘭德的人工智能個(gè)體組成的世界中,“耐心需要經(jīng)驗(yàn)”?;籼m德分類器成功地計(jì)算出了一個(gè)動(dòng)態(tài)經(jīng)濟(jì)模型的“穩(wěn)定”納什均衡,該模型的作者們事先并沒有意識(shí)到這個(gè)均衡的存在,盡管事后,他們能夠驗(yàn)證霍蘭德分類器交給他們的“猜測”??蓞⒁婑R里蒙(Marimon et al.,1990)的介紹。

5.6當(dāng)今的人工智能

DeepMind的計(jì)算機(jī)程序AlphaGo實(shí)現(xiàn)了一項(xiàng)了不起的成就,它成功地掌握了圍棋游戲,并打敗了人類圍棋冠軍選手。可參見王(Wang et al.,2016)。AlphaGo的創(chuàng)造者所采用的方法讓我想起了美食的烹飪過程——在一把原料中加入一丁點(diǎn)另一種原料,品嘗一下,再加入其他原料……在烹飪AlphaGo的成分中,包含了從動(dòng)態(tài)規(guī)劃、湯普森采樣(見湯普森(Thompson,1933))和隨機(jī)逼近(見霍特林(Hotelling,1941)、傅利曼與薩維奇(Friedman and Savage(1947))、α-β樹搜索(見克努斯與摩爾(Knuth and Moore(1975))、Q-學(xué)習(xí)(見沃特金斯和達(dá)揚(yáng)(Watkins and Dayan(1992));蒙特卡洛樹搜索(見布朗(Browne et al.(2012))收集到的靈感。參數(shù)調(diào)整的經(jīng)驗(yàn)法則選擇是很重要的,它可以在“探索”和“利用”之間進(jìn)行權(quán)衡(弗得伯格與克雷普斯(Fudenberg and Kreps,1993)、(Fudenberg and Kreps(1995)中也是如此論述的)。

機(jī)器學(xué)習(xí)的其他最新進(jìn)展也引入了大量經(jīng)濟(jì)學(xué)和統(tǒng)計(jì)學(xué)的方法。計(jì)算最優(yōu)運(yùn)輸問題(例如,佩雷(Peyr′e et al.(2019))使用丹齊格(Dantzig)、康托羅維奇(Kantorovich)和柯普曼斯(Koopmans)的線性程序來衡量理論概率和經(jīng)驗(yàn)測量之間的差異。然后,它使用該衡量方法來構(gòu)建一種高效的計(jì)算方式,以匹配數(shù)據(jù)和理論。經(jīng)濟(jì)學(xué)家霍特林(Hotelling,1930)用黎曼幾何來表示統(tǒng)計(jì)模型的參數(shù)化系列。這個(gè)想法開啟了計(jì)算信息幾何學(xué)的先河,阿瑪里(Amari,2016)將這種方法系統(tǒng)化了。

6創(chuàng)造力的來源:模仿和創(chuàng)新

我描述了伽利略和達(dá)爾文是如何通過對前人研究結(jié)果和方法的掌握,并將其與前所未有的洞察力相結(jié)合,從而發(fā)現(xiàn)新的自然規(guī)律的。對先例的尊重,以及他們冒險(xiǎn)超越的能力,是這兩位天才的成果的突出特點(diǎn)。后來許多天才也采用了同樣的方法,如電磁學(xué)的發(fā)現(xiàn),以及富蘭克林(Franklin)、戴維(Davy)、法拉第(Faraday)、麥克斯韋(Maxwell)、邁克爾遜(Michaelson)、莫利(Morley)、愛因斯坦(Einstein)的一系列發(fā)現(xiàn)。他們每個(gè)人都不是從“白板”(湊巧的是,這恰好是上述平克著作的標(biāo)題)開始,而是從他們對前人的深刻理解和尊重開始的。每個(gè)人都看到了他們的前輩沒有看到的東西,往往是因?yàn)樗麄儾捎昧烁倪M(jìn)的觀察或推理方法。通過運(yùn)用法拉第不知道的數(shù)學(xué),麥克斯韋組織了一個(gè)令人驚嘆的統(tǒng)一和概括,將電磁動(dòng)力學(xué)的法則減少到12個(gè)方程,而海維斯德又很快將它減少到四個(gè)方程。這四個(gè)方程為愛因斯坦的狹義相對論創(chuàng)造了條件。11

看似與電磁學(xué)毫不相關(guān)的純理論數(shù)學(xué),卻與后來電磁學(xué)的發(fā)現(xiàn)恰好吻合。為了將幾何學(xué)轉(zhuǎn)換為代數(shù)并寫成函數(shù),笛卡爾(Descartes)發(fā)明了一個(gè)坐標(biāo)系統(tǒng)。50年后,牛頓和萊布尼茨利用笛卡爾坐標(biāo)系發(fā)明了微分和積分。十九世紀(jì)上半葉,高斯(Gauss)和他的學(xué)生黎曼(Riemann)完善了基于平行線相交的曲面幾何。里奇(Ricci)在此基礎(chǔ)上增加了一個(gè)明確的曲率概念。

愛因斯坦將這兩個(gè)獨(dú)立的、看似“毫不相關(guān)”的研究工作結(jié)合起來,一個(gè)是實(shí)際的物理現(xiàn)象,另一個(gè)是純粹的抽象數(shù)學(xué)。愛因斯坦在努力擴(kuò)展其狹義相對論時(shí),學(xué)會(huì)了如何使用黎曼幾何和里奇曲率,構(gòu)建了一個(gè)自洽的廣義相對論。12

科學(xué)進(jìn)步展示了“模仿”和“創(chuàng)新”兩者之間的互動(dòng),這種互動(dòng)在現(xiàn)代經(jīng)濟(jì)增長理論中也有所體現(xiàn)(例如,見班哈波柏(Benhabib et al.,2014)和班哈波柏(Benhabib et al.,2020))。在“模仿”階段,電磁學(xué)、相對論和數(shù)學(xué)領(lǐng)域的先驅(qū)者主要是復(fù)制前輩和老師的技術(shù);在“創(chuàng)新”階段則是在某種程度上超越前輩和老師,因?yàn)樗麄儽壤蠋煂W(xué)得更多、理解得更深。

7結(jié)論性評(píng)述

通過對物理學(xué)、生物學(xué)、統(tǒng)計(jì)學(xué)和經(jīng)濟(jì)學(xué)中的觀點(diǎn)的概述,我希望證明一個(gè)主張:即平克Pinker(2003)認(rèn)為我們在認(rèn)知上有先天局限的學(xué)科,正是被用來創(chuàng)造人工智能和機(jī)器學(xué)習(xí)的學(xué)科。這正是在學(xué)期間和離開學(xué)校以后繼續(xù)學(xué)習(xí)這些學(xué)科的又一個(gè)理由。在我看來,它們自身的美則構(gòu)成了另一個(gè)理由。

腳注1:哈耶克(Hayek, 2011, 附錄A)討論了自然和人工的其他定義。

腳注2:時(shí)至今日,觀察科學(xué)家如何應(yīng)用機(jī)器學(xué)習(xí)和人工智能,你會(huì)看到這些聰明人搜集了大量數(shù)據(jù)、然后以之?dāng)M合函數(shù)。De Silva et al. (2020)與Brunton and Kutz (2022)是其中兩個(gè)漂亮的范例。

腳注3:為了找到埋藏在第谷·布拉赫(Tycho Brahe) (1546-1601) 的已知行星位置時(shí)間戳測量表中的三個(gè)行星運(yùn)動(dòng)定律,約翰內(nèi)斯·開普勒(Johannes Kepler)(1571-1630) 使用了類似于伽利略的方法。李(Li)等人追隨開普勒的腳步,使用機(jī)器學(xué)習(xí)技術(shù)從布拉赫(Tycho Brahe)的數(shù)據(jù)中提取開普勒定律之一。如需了解開普勒和伽利略的科學(xué)方法的精彩描述參見溫伯格(Weinberg ,2015)。

腳注4: 當(dāng)時(shí)一些頂尖科學(xué)家并沒有馬上接受達(dá)爾文的理論。例如,開爾文(Kelvin)勛爵聲稱當(dāng)時(shí)盛行的地球估算年齡還遠(yuǎn)遠(yuǎn)無法論證達(dá)爾文的理論是否成立。

腳注5:因此,現(xiàn)代計(jì)算和人工智能的偉大發(fā)明者約翰·馮·諾依曼(John von Neumann)對這四個(gè)領(lǐng)域進(jìn)行了研究并做出了重大貢獻(xiàn)并非巧合。參見 Bhattacharya (2022) 了解更多有關(guān)馮·諾依曼的工作和生活的敘述。

腳注6:這個(gè)網(wǎng)站借助 Python 代碼探索了這兩種可能的有關(guān)概率意義,參見https://python.quantecon.org/prob_meaning.html。

腳注7:當(dāng)經(jīng)濟(jì)學(xué)家談到“理性預(yù)期”時(shí),他們指的是假設(shè)“對環(huán)境的普遍正確理解”?!袄硇灶A(yù)期”一詞修飾的是“模型”,而不是“人”。

腳注8:參見克雷普斯(Kreps,1997)進(jìn)一步了解這兩類模型的共同特征和缺點(diǎn),以及一些精彩的觀點(diǎn)和關(guān)于新方向的猜想,在我看來,這些新方向似乎預(yù)示了人工智能隨后會(huì)進(jìn)入經(jīng)濟(jì)學(xué)。

腳注9:霍特靈、弗里德曼和薩維奇的工作最后引出了“貝葉斯優(yōu)化”這一機(jī)器學(xué)習(xí)技術(shù)??蓞⒁娝怪Z克(Snoek et al. ,2012)。

腳注10:請參考https://en.wikipedia.org/wiki/John_Henry_Holland, https://www.nytimes.com/2015/08/20/ science/john-henry-holland-computerized-evolution-dies-at-86.html.

腳注11:愛因斯坦的辦公室墻上掛有麥克斯韋的照片。

腳注12:對這些事件的記錄詳見法梅洛(Farmelo,2019)著作的第三章。

來源:《薩金特?cái)?shù)量經(jīng)濟(jì)與金融研究所時(shí)訊》(第四期)

排版:小半

編輯:劉蕊

(本文轉(zhuǎn)載自北京大學(xué)匯豐商學(xué)院 ,如有侵權(quán)請電話聯(lián)系13810995524)

* 文章為作者獨(dú)立觀點(diǎn),不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。

收藏
訂閱

備考交流

  • 2024考研英語二備考群: 678595048
  • 2024管理類聯(lián)考復(fù)試調(diào)劑②群: 814776983
  • 2024海外碩士交流群: 895560072
  • 2024年MBA/MEM/MPAcc聯(lián)考備考群: 769561411
  • 免聯(lián)考調(diào)劑咨詢①群: 796631901
  • 2024考研政治沖刺群: 863373153
  • 海外碩士咨詢③群: 850595383
  • 免聯(lián)考碩士入學(xué)咨詢?nèi)海? 711046255
  • 2024考研復(fù)試調(diào)劑交流群: 902176003
免費(fèi)領(lǐng)取價(jià)值5000元MBA備考學(xué)習(xí)包(含近8年真題) 購買管理類聯(lián)考MBA/MPAcc/MEM/MPA大綱配套新教材

掃碼關(guān)注我們

  • 獲取報(bào)考資訊
  • 了解院校活動(dòng)
  • 學(xué)習(xí)備考干貨
  • 研究上岸攻略

最新動(dòng)態(tài)