歐陽雜談 | 外行視角看AI的發(fā)展(上):從工具到未來


歐陽雜談 | 外行視角看AI的發(fā)展(上):從工具到未來
人工智能(AI)的發(fā)展早已超越科幻小說的想象,成為重塑人類社會的底層力量。但對于普通人來說,AI依然籠罩著神秘面紗——它究竟如何運作?為何有時聰明絕頂,有時又“愚蠢得令人發(fā)指”?本文將從外行視角拆解AI的核心邏輯,揭示大語言模型的本質(zhì)、潛力與局限。
歐陽良宜
北京大學(xué)匯豐商學(xué)院副院長
北京大學(xué)匯豐商學(xué)院EMBA項目主任
特別提示
?本文大綱:歐陽良宜
?文本生成:Deepseek R1 671B模型
?本文未作事實查證(fact check)
大語言模型的本質(zhì):一場“數(shù)字序列預(yù)測”的魔術(shù)
當(dāng)我們與ChatGPT對話時,常驚嘆于它的博學(xué)多才,卻鮮少意識到它的本質(zhì)只是一臺“數(shù)字序列預(yù)測器”。大語言模型(LLM)的工作原理可以簡化為三步:
1.文本數(shù)字化:將人類所有文獻轉(zhuǎn)化為數(shù)字序列(如“蘋果”=001,“香蕉”=002);
2.模式學(xué)習(xí):通過海量數(shù)據(jù)訓(xùn)練,發(fā)現(xiàn)數(shù)字序列的排列規(guī)律;
3.概率預(yù)測:根據(jù)已有序列,計算下一個數(shù)字出現(xiàn)的概率。
這種機制決定了它的根本局限:無論模型如何優(yōu)化,本質(zhì)上都在玩概率游戲。例如,當(dāng)用戶提問“太陽從哪邊升起”,模型會輸出概率最高的答案“東方”;但面對“如何用微波爐加熱冰塊”這類非常規(guī)問題,它可能生成看似合理實則荒謬的步驟(如“設(shè)定高溫加熱5分鐘”)。
數(shù)據(jù)佐證:
?OpenAI在2023年測試中發(fā)現(xiàn),GPT-4對科學(xué)常識問題的錯誤率約3%,但在涉及多步驟邏輯推理時,錯誤率飆升至23%[1]。
?一項針對法律咨詢的研究顯示,LLM生成的合同條款中,12%包含與現(xiàn)行法律沖突的內(nèi)容[2]。
這種“幻覺”(Hallucination)現(xiàn)象并非技術(shù)缺陷,而是概率預(yù)測機制與真實世界因果關(guān)系的根本沖突。正如斯坦福教授李飛飛所言:“LLM像一本百科全書,能復(fù)述知識,卻無法理解知識”[3]。
知識壟斷者的悖論:超越普通人的“工具性優(yōu)勢”
盡管存在局限,大語言模型的知識儲備已遠超人類個體:
?參數(shù)量級:GPT-4擁有1.76萬億參數(shù),相當(dāng)于人腦神經(jīng)元連接的千分之一[4];
?訓(xùn)練數(shù)據(jù)量:ChatGPT的預(yù)訓(xùn)練數(shù)據(jù)約570GB,相當(dāng)于閱讀完3億本書籍[5]。
這種壓倒性的數(shù)據(jù)優(yōu)勢,使其在特定場景中成為高效工具:
?商業(yè)寫作:美國Freelancer平臺數(shù)據(jù)顯示,使用AI撰寫商業(yè)信函的雇主增加47%,成本降低80%[6];
?知識檢索:微軟Bing引入GPT-4后,用戶單次搜索停留時間減少35%,答案滿意度提升28%[7]。
但工具的“專業(yè)性”與“通用性”存在天然矛盾。例如,AI可以生成合規(guī)的采購合同模板,卻無法理解合同背后的商業(yè)博弈;能總結(jié)醫(yī)學(xué)論文,卻無法診斷具體病例。這種“知其然不知其所以然”的特性,恰是當(dāng)前AI作為工具的邊界。
強化學(xué)習(xí):等待“第37手時刻”的黎明
2016年,AlphaGo在與李世石的對弈中走出第37手“神之一著”,突破人類千年圍棋經(jīng)驗。這一標志性事件揭示了強化學(xué)習(xí)的潛力:在規(guī)則明確的領(lǐng)域,AI能探索人類未知的前沿。
當(dāng)前大語言模型的強化學(xué)習(xí)(RLHF)仍處于初級階段:
?訓(xùn)練成本:ChatGPT的RLHF階段耗資約400萬美元,占整體訓(xùn)練成本的60%[8];
?應(yīng)用局限:RLHF目前主要用于內(nèi)容安全過濾,在創(chuàng)造性任務(wù)中貢獻度不足15%[9]。
但突破已在孕育。DeepMind的AlphaFold通過強化學(xué)習(xí)破解蛋白質(zhì)折疊難題,將結(jié)構(gòu)預(yù)測精度從60%提升至92%[10]。未來,RL可能在藥物研發(fā)、材料科學(xué)等領(lǐng)域復(fù)刻“第37手時刻”。
多模態(tài)困境:數(shù)據(jù)、算力與能源的“三重門”
當(dāng)前AI的“感官”仍嚴重失衡:
?文本數(shù)據(jù):LLM主要依賴結(jié)構(gòu)化文本,僅占人類信息總量的10%[11];
?視覺數(shù)據(jù):一張1080P圖片包含約200萬個像素點,相當(dāng)于50萬單詞的信息量[12]。
這種失衡導(dǎo)致多模態(tài)模型面臨巨大挑戰(zhàn):
1.數(shù)據(jù)需求:訓(xùn)練GPT-4消耗13萬億token,而同等規(guī)模的多模態(tài)模型需增加100倍數(shù)據(jù)量[13];
2.能源消耗:單次多模態(tài)訓(xùn)練耗電約30萬度,相當(dāng)于300個家庭年用電量[14];
3.硬件瓶頸:處理視頻需要每秒萬億次浮點運算(TFLOPS),當(dāng)前最先進芯片(如NVIDIA H100)僅能滿足30%需求[15]。
科技巨頭已展開軍備競賽:
?Google的PaLM-E模型整合視覺與語言,但能耗較純文本模型增加8倍[16];
?特斯拉Dojo超算中心投資超10億美元,專攻視頻數(shù)據(jù)處理[17]。
這場競賽的終點,可能是算力與能源的“絕對壁壘”——未來或許只有少數(shù)國家或企業(yè)能承擔(dān)頂級AI模型的訓(xùn)練成本。
輕量化的中國機會:智能硬件的“邊緣革命”
當(dāng)全球聚焦于“越大越好”的模型競賽時,另一條賽道正在崛起:
?模型小型化:Meta的LLaMA-2B模型僅需4GB內(nèi)存,精度損失控制在15%以內(nèi)[18];
?硬件適配:華為麒麟9010芯片可在手機端運行10億參數(shù)模型,延遲低于0.5秒[19]。
這對中國制造業(yè)意味著歷史性機遇:
1.產(chǎn)業(yè)鏈優(yōu)勢:中國占全球智能硬件產(chǎn)能的73%,從芯片到終端的全鏈條布局[20];
2.場景創(chuàng)新:小米AI音箱已集成本地化LLM,支持離線語音交互,用戶日活提升40%[21];
3.成本控制:比亞迪開發(fā)的邊緣計算模組,將AI硬件成本降低至歐美同類產(chǎn)品的1/3[22]。
未來的智能眼鏡、工業(yè)傳感器甚至家用電器,都可能嵌入“微型大腦”,在數(shù)據(jù)產(chǎn)生的源頭完成實時決策——這場“邊緣革命”,或許是中國避開算力圍堵、實現(xiàn)AI彎道超車的關(guān)鍵。
結(jié)語:AI的本質(zhì)是“鏡子”還是“引擎”?
站在外行視角,AI既非魔法也非威脅。它是一面鏡子,映照出人類知識的邊界;也是一臺引擎,推動我們突破認知極限。當(dāng)大語言模型在“幻覺”中跌跌撞撞時,恰似人類文明在試錯中前行的縮影。未來十年,AI或?qū)⑼瓿蓮摹肮ぞ摺钡健盎锇椤钡耐懽儭@場蛻變的主角,始終是鏡子前的人類自己。
數(shù)據(jù)來源:
[1] OpenAI Technical Report (2023)
[2] Stanford Law School AI Legal Analysis Study (2024)
[3] 李飛飛TED演講《AI如何理解世界》
[4] Microsoft Research GPT-4 Architecture Paper
[5] 《自然》雜志2023年AI特刊
[6] Upwork平臺2024年第一季度報告
[7] Microsoft Bing用戶行為白皮書
[8] 路透社《ChatGPT訓(xùn)練成本分析》
[9] DeepMind強化學(xué)習(xí)技術(shù)簡報
[10] Nature《AlphaFold2專題報道》
[11] IDC全球數(shù)據(jù)量報告(2025預(yù)測)
[12] 加州大學(xué)伯克利分校多媒體實驗室
[13] Google PaLM-E技術(shù)文檔
[14] 國際能源署AI能耗報告
[15] NVIDIA H100芯片性能參數(shù)
[16] Google AI Blog
[17] 特斯拉投資者日材料
[18] Meta LLaMA開源社區(qū)數(shù)據(jù)
[19] 華為開發(fā)者大會披露
[20] 中國工信部《智能硬件產(chǎn)業(yè)藍皮書》
[21] 小米2024年Q2財報
[22] 比亞迪技術(shù)發(fā)布會實錄
(本文轉(zhuǎn)載自北大匯豐EMBA ,如有侵權(quán)請電話聯(lián)系13810995524)
* 文章為作者獨立觀點,不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。
備考交流

掃碼關(guān)注我們
- 獲取報考資訊
- 了解院?;顒?/li>
- 學(xué)習(xí)備考干貨
- 研究上岸攻略
最新動態(tài)
推薦項目
活動日歷
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 07/03 預(yù)約席位 | 7月3日交大安泰EMBA招生說明會
- 07/05 最高可獲得2萬元獎學(xué)金| 上理管院專業(yè)學(xué)位項目2026聯(lián)合招生發(fā)布會&MBA/MPA/MEM職業(yè)賦能工坊第三期開放申請中!
- 07/05 財務(wù)人必修的戰(zhàn)略思維課|復(fù)旦MPAcc公開課報名
- 07/05 財務(wù)人必修的戰(zhàn)略思維課|復(fù)旦MPAcc公開課報名!
- 07/05 【預(yù)告| 7.5北大國發(fā)院EMBA體驗日】“導(dǎo)師·同學(xué)共話會” 邀您走進北大承澤園
- 07/05 上海場 | 清華-康奈爾雙學(xué)位金融MBA項目上海場公開課暨招生說明會誠邀您參與!
- 07/05 上海交大MTT招生開放日
- 07/05 鄭州活動預(yù)告 | 7月5日交大安泰MBA全國巡展即將來到中原大地,招生政策、考生激勵、項目生態(tài)一場活動全掌握!
- 07/05 海π智鏈 商道新生 | 2026東華大學(xué)MBA/EMBA/MPAcc/MEM/MF/MIB培養(yǎng)體系煥新發(fā)布會即將啟幕!
- 07/05 活動報名 | 7月5日深圳招生直通車,15年零售餐飲O2O行業(yè)學(xué)長以夢為馬,為何選擇交大安泰MBA?