人工智慧的簡明總體經濟學
人工智慧的簡明總體經濟學
作者:Daron Acemoglu 麻省理工學院 2024 年 5 月 12 日
摘要
本文評估了有關人工智慧(AI)新進展可能對總體經濟造成重大影響的說法。研究從基於任務的 AI 影響模型出發,探討自動化和任務互補性。只要 AI 在個體經濟層面的影響源自任務層級的成本節約或生產力提升,其總體經濟效應就可以透過赫爾滕定理(Hulten's theorem)的變體來估算:國內生產毛額(GDP)和總體生產力的增長可以藉由受影響的任務比例及平均任務層級的成本節約來評估。
根據現有的 AI 影響範圍和任務層級生產力提升的估計,這些總體經濟效應雖然不容忽視,但仍屬溫和——預計 10 年內全要素生產率(TFP)的增長不會超過 0.66%。本文進一步指出,即便這些估計可能有所誇大。早期的證據多來自易於學習的任務,而未來的部分影響將來自較難學習的任務。這類任務涉及許多依賴情境的決策因素,且缺乏客觀的結果指標來評估成功表現。因此,未來 10 年 TFP 的預測增長更為保守,估計不到 0.53%。
本研究也探討了 AI 對薪資和不平等的影響。理論分析顯示,即使 AI 在某些任務中提高了低技能工人的生產力(而未為他們創造新任務),這可能反而加劇而非減少不平等。實證研究發現,AI 的進展不太可能如先前的自動化技術那樣加劇不平等,因為其影響在不同人口群體間分布較為均勻。然而,也沒有證據顯示 AI 會減少勞動收入的不平等。相反地,AI 預計將擴大資本收入和勞動收入之間的差距。
最後,AI 創造的某些新任務可能具有負面的社會價值(如設計用於網路操縱的演算法)。本文討論了如何將這些可能具有負面社會價值的新任務所帶來的總體經濟影響納入考量。
JEL 分類:E24、J24、O30、O33。
關鍵詞:人工智慧、自動化、ChatGPT、不平等、生產力、技術採用、薪資。
本文為《經濟政策》期刊所撰寫。在此特別感謝 Can Ye¸sildere 提供卓越的研究協助,同時也感謝 Leonardo Bursztyn、Mert Demirer、Lauren Fahey、Roberto Galbiati、Isabelle M´ejean、Shakked Noy、Sida Peng、Julia Regier 和 Whitney Zhang,以及參與麻省理工學院蘇洛紀念會議和經濟政策會議的與會者所提供的寶貴意見。我尤其感謝評論人 David H´emous 和 Benoˆıt Coeur´e 提供的深入見解和建議。同時也感謝 Pamela Mishkin 和 Daniel Rock 慷慨分享他們關於 AI 影響範圍的資料。我還要特別感謝在相關主題上與我合作的夥伴 David Autor、Simon Johnson 和 Pascual Restrepo,我從他們身上學到了許多,他們也對本文初稿提供了非常有價值的意見。最後,感謝 Hewlett 基金會的經費支持。文中如有任何錯誤,皆由本人負責。
緒論
人工智慧(AI)已經成為當今社會的焦點。關於 AI 能夠帶來快速甚至空前的生產力增長,以及為人類創造新的輔助途徑的願景,已經成為人們耳熟能詳的話題。毫無疑問,近期在生成式 AI 和大型語言模型方面的發展令人印象深刻,甚至可以說是令人驚嘆。這些模型能夠根據簡單的使用者提示生成文字、資訊和圖像,甚至可以創作莎士比亞風格的十四行詩。ChatGPT 於 2022 年 11 月 30 日首次發布,迅速成為歷史上擴散最快的科技平台,僅僅兩個月後就估計擁有一億月活躍使用者。
AI 無疑將對總體經濟、生產力、薪資和不平等產生影響,但這些影響都極難預測。儘管如此,過去一年仍出現了一系列的預測,主要集中在 AI 可能帶來的生產力增長上。一些專家認為,真正具有變革性的影響即將到來,包括能夠執行幾乎所有人類任務的通用人工智慧(AGI)。其他預測者的看法則較為務實,但仍預期 AI 會對經濟產出產生重大影響。高盛(Goldman Sachs)2023 年的報告預測,全球 GDP 將增加 7%,相當於 7 兆美元,且美國在未來 10 年的年均生產力成長率將提高 1.5 個百分點。麥肯錫全球研究所(McKinsey Global Institute)2023 年的最新預測顯示,生成式 AI 可能為全球經濟帶來高達 17.1 至 25.6 兆美元的額外增長,這還不包括先前估計的工作自動化所帶來的經濟成長。他們認為,AI 和其他自動化技術的整體影響可能使發達經濟體在未來十年的年均 GDP 成長率提高 1.5 至 3.4 個百分點。
這些大規模的經濟效應是否可信?如果確實會帶來生產力增長,誰將
Korinek 和 Suh(2024)預測未來十年國內生產總值(GDP)將有 100% 的「基準」成長,同時也考慮了更高的「激進」通用人工智慧(AGI)成長率可能性,如 GDP 增加 300%。許多人將近期發展視為 Kurzweil(2005)關於即將到來的「奇點」和「爆炸性」經濟成長預測的印證(Davidson,2021)。
這裡需要注意三點。首先,儘管最近的進展主要集中在生成式人工智慧,但本文探討的經濟動力適用於各類 AI。我使用的任務影響估計是基於對包括電腦視覺和建立在大型語言模型基礎上的軟體等一系列 AI 相關技術的預期改進。因此,除非特別強調生成式 AI,否則本文所述數據適用於所有人工智慧,通常簡稱為「AI」。
其次,本文聚焦美國經濟,因為關於 AI 的微觀經濟效應和受影響任務普及程度的現有證據主要來自美國。對其他工業化國家的影響應該相似,而對發展中國家的影響則更難確定,需要更深入的研究。
第三,一些評論者使用「生產力」指勞工人均產出(或平均勞動生產力),而其他人則指全要素生產力(TFP)。在整篇文章中,我區分了總體 TFP 和 GDP(人均/每位勞工)效應,並將微觀/任務層面的生產力提升視為與成本節約同義。
這次會有所不同嗎?一些專家和評論家持更樂觀態度。幾項「概念驗證」實驗研究記錄了生成式 AI 帶來的顯著生產力提升,主要是透過改善生產力較低或表現較差的勞工而實現(例如,Peng 等人,2023;Noy 和 Zhang,2023;Brynjolfsson 等人,2023)。這促使一些專家持謹慎樂觀態度(Autor,2024),而其他人則預測將出現「藍領工人的黃金時代」(《經濟學人》,2023)。
本文運用 Acemoglu 和 Restrepo(2018, 2019b, 2022)的框架為這些討論提供見解,特別聚焦於 AI 在中期(約 10 年)的總體經濟影響。我建立了一個基於任務的模型,其中生產單一最終商品需要執行一系列任務,這些任務可以分配給資本或勞動力,兩者具有不同的比較優勢。自動化對應於由資本(包括數位工具和演算法)執行的任務範圍的擴大。在這個框架中,AI 帶來的生產力成長——無論是以平均每位勞工產出的增長還是全要素生產力(TFP)成長來衡量——可以來自幾個不同的管道(參見 Acemoglu 和 Restrepo,2019a):
自動化(更精確地說是廣泛性的自動化)指的是 AI 模型接管並降低特定任務的成本。就生成式 AI 而言,各種中階文書工作、文本摘要、資料分類、進階模式辨識和電腦視覺等任務都可以有效地實現自動化,進而提高利潤。
任務互補性可以提升尚未完全自動化任務的生產力,甚至可能提高勞動力的邊際產出。舉例來說,執行某些任務的員工可能擁有更好的資訊或取得其他互補性資源。另一方面,AI 可能自動化某些子任務,同時讓員工能夠專精並提高他們在工作其他層面的生產力。
自動化的深化可能會發生,提高已自動化任務中資本的生產力。例如,已經自動化的 IT 安全任務可能由生成式 AI 更有效地執行。
AI 可能創造新任務,這些任務可能影響生產力。
在本文中,我主要聚焦於前兩個管道,但也會討論 AI 實現的新任務如何產生正面或負面影響。我不深入探討自動化的深化,因為(生成式)AI 影響的任務與前一波數位科技(如機器人、先進製造設備和軟體系統)自動化的任務不同。我也不討論 AI 如何透過改變科學研究過程帶來革命性影響(這種可能性已由神經網路在蛋白質摺疊研究的突破,以及 Google 子公司 DeepMind 發現的新晶體結構所展現),因為這類大規模進展似乎不太可能在 10 年內實現,而且目前的討論主要集中在自動化和任務互補性上。
我指出,當 AI 的個體經濟效應是由任務層面的成本節約(等同於生產力提升)所驅動時——無論是因為自動化還是任務互補性—— 其總體經濟後果將遵循 Hulten 定理的一個版本:GDP 和整體生產力的增長可以透過受影響任務的比例和平均任務層面成本節約來估算。這個方程式為 AI 對 GDP 和生產力的任何影響提供了約束。儘管這個方程式看似簡單,但實際應用卻遠非易事,因為對於哪些任務將被自動化或得到互補,以及成本節約的幅度,都存在巨大的不確定性。
儘管存在不確定性,我仍以說明性質進行了一項練習,利用近期多項研究的資料,特別是 Eloundou 等人(2023年)和 Svanberg 等人(2024年)的研究,以及前文提到的實驗性研究,得出了一些概略性數據。Eloundou 等人(2023年)首次系統性地估算了生成式AI和電腦視覺技術可能影響的任務範疇。然而,他們的方法並未完全區分這些影響是屬於自動化還是任務互補性,也未提供這些影響何時會實現及其成本節約幅度的資訊。關於電腦視覺技術,Svanberg 等人(2024年)則估算了在不同時間框架內,有多少比例的AI相關任務可能實現自動化。
在此框架下,新任務也包含了透過AI提高生產力的生產重組可能性。Bresnahan(2019年)和 Agrawal 等人(2023年)等學者特別強調了AI在促進這種重組中的關鍵作用。
Eloundou 等人(2023年)的研究發現,他們所測量的AI暴露度(我在下文使用)與機器人暴露度和手動例行任務測量之間呈現負相關。
具體而言,我使用了 Eloundou 等人(2023年)提供的最細緻資訊,即他們在 GPT-4 協助下編碼的「自動化指數」。這個指數顯示了AI可以執行特定任務或職業中多少比例的活動。儘管這個指數更偏重於自動化,但並未系統性地區分自動化和任務互補性。如我稍後會討論的,以及 Eloundou 等人自己也指出,他們的暴露度測量常常反映了生成式AI和相關數位技術可以執行某些任務的可能性。
我採用了 Eloundou 等人對AI影響任務的估算(不區分自動化和任務互補性),將其彙整到職業層面,並根據每個職業在美國經濟中的薪資佔比來衡量其重要性。這項計算顯示,20%的美國勞動任務受到AI影響。接著,我使用 Svanberg 等人對電腦視覺任務的估算,即在所有受影響的任務中,23%可被AI有效執行(對於其餘任務,研究者估計成本會超過效益)。我假設平均勞動成本節約為27%——這是 Noy 和 Zhang(2023年)以及 Brynjolfsson 等人(2023年)估算的平均值。考慮到產業勞動佔比,我將其轉換為整體成本節約,結果顯示平均整體成本節約為14.4%。
這項計算顯示,未來十年內,總要素生產力(TFP)的整體效應應不超過0.66%,即每年TFP增長率約為0.064%。即使我們考慮彭氏等人(2023年)提出的較高生產力增益(雖然這些增益不太可能廣泛適用),或納入GPU成本的進一步下降,這個數字仍維持在0.9%左右。
要將這些數據轉換為國內生產總值(GDP)估算,我們需要了解AI將如何推動資本存量增長。我首先假設資本存量的增長與TFP的增長成正比。這個假設與生成式AI似乎不需要用戶進行大規模投資(除了模型開發者和訓練者的投資外)的現實相符。incorporating這些投資效應後,預計未來十年GDP將增長0.93%至1.16%。若假設投資反應與早期自動化技術類似,並採用Acemoglu和Restrepo(2022年)的完整框架估算資本存量增長,GDP效應的上限可達1.4%至1.56%。然而,我的分析框架也闡明,如果資本產出比因TFP上升而增加,雖然可能使GDP增長超過TFP,但不會額外提升福利,因為額外投資是以犧牲消費為代價的。
我進一步論證,上述數字可能高估了AI對整體生產力的助益。原因在於,現有的生產力提升和成本節約估算主要集中在「容易學習」的任務上,這些任務自然也容易被AI掌握。相較之下,職業中的某些子任務能讓工作者專注並專精於其他活動,因此同時具有自動化和任務互補性質。此外,如果AI模型持續增加能源需求,雖然會提高測量的GDP,但對整體福祉並非有利。
AI對未來生產力和GDP的影響
AI對生產力和GDP的未來影響將主要來自「難以學習」的任務。這類任務的決策受多種情境因素影響,學習過程主要基於人類行為而非客觀結果衡量。預計AI在這些複雜任務中的生產力提升將不如簡單任務顯著。根據推測性假設,約73%的任務屬於容易類別,而困難任務的生產力提升可能僅為容易任務的四分之一。這意味著未來十年TFP和GDP的增長將更為溫和,上限估計分別為0.53%和0.90%。
AI生成新任務的影響
AI 創造的新任務有潛力大幅提升生產力。然而,某些 AI 生成的任務可能對社會產生負面影響,例如深度偽造(deepfakes)、誤導性數位廣告、令人上癮的社群媒體,或 AI 驅動的惡意電腦攻擊。雖然量化這些新任務的影響具有挑戰性,但近期研究顯示,此類任務帶來的負面影響可能相當顯著。舉例來說,社群媒體的負面效應已被估算,顯示某些 AI 生成的任務可能導致整體 GDP(國內生產毛額)和社會福祉的下降。
AI 對薪資和不平等的影響
AI 帶來的生產力提升不太可能導致顯著的薪資成長。即使 AI 提高了低績效和中績效工人的生產力,也不一定會減少不平等。在某些情況下,低技能工人生產力的提高實際上可能導致更嚴重的不平等。根據先前研究應用於 AI 情境的估計,預期 AI 的更密集使用不會導致實質性的薪資下降。
相較於早期自動化浪潮,AI 影響的任務在各人口群體中分佈更為均勻,因此受影響群體的範圍可能更廣。儘管如此,我估計 AI 不會減少不平等,反而可能對低教育程度女性(尤其是白人、本土出生的低教育程度女性)的實際收入產生負面影響。我的研究結果還表明,AI 將進一步擴大資本收入和勞動收入之間的差距。
在結論中,我認為,正如 Acemoglu 和 Restrepo(2018)最初提出的,更有利的薪資和不平等效應,以及更顯著的生產力效益,很可能取決於為一般工人,特別是中低收入工人創造新任務。雖然這在理論上是可行的,我也在其他文章中論述過如何實現(Acemoglu,2021 和 Acemoglu 等人,2023),但我也討論了為什麼這似乎不是當前人工智慧研究的重點。
總而言之,應該清楚的是,預測 AI 對總體經濟的影響是極其困難的,必須基於一些推測性假設。然而,本文的核心論點是,一個簡單的框架可以規範我們的思考和預測。如果我們認真看待這個框架和現有的估計,就很難得出 AI 會帶來非常大的總體經濟效益的結論。
本文的結構安排如下。下一節將概述本文使用的概念架構,並提出幾項關於總體生產力增長、投資反應、以及工資和不平等效應的理論見解。此外,還會討論易學與難學任務之間的關鍵差異及其對生產力的影響,並介紹好任務和壞任務的對比概念。第三節在此架構下對人工智慧(AI)的新突破進行初步量化分析。首先,根據未來十年可能受 AI 影響的現有任務比例,以及 AI 帶來的成本節省(即生產力提升)的現有估計,提出一個基準(上限)評估。接著,通過引入易學和難學任務的區別,並初步將受 AI 影響的任務分類為易學和難學兩類,來優化這項評估。我還嘗試將壞新任務對總體經濟的影響納入考量,這是一個更具推測性的嘗試。最後,我報告了近期 AI 進展對工資和不平等影響的估計。第四節以整體討論作為結論,附錄則提供了關於如何將任務分類為受影響和未受影響,以及易學和難學類別的額外資訊。
概念架構
本文的模型建立在 Acemoglu 和 Autor(2011)以及 Acemoglu 和 Restrepo(2018, 2019b, 2022)的基礎上。我將聚焦於架構的主要元素,讀者可參考這些論文以獲取更多細節和改進。本模型假設經濟是靜態的,涉及單一最終商品的生產,且所有市場都是競爭性的。
單一最終商品的生產是通過結合一組數量為 N 的任務來實現,使用以下生產函數:
Y = B(N) ∫0Z N y(z)σ dz
其中,Y(z) 表示任務 z 的產出,z ∈ [0, N],σ ≥ 0 是任務之間的替代程度,參數 B(N) 取決於 N,用以捕捉新任務可能帶來的系統性效應。為簡化表述,在接下來的內容中我將省略這種依賴關係。目前,替代程度 σ 可以是任何值,但合理假設 σ ≤ 1,因此任務之間是總體互補的。稍後,我會將任務之間的替代程度設定為 σ ≃ 0.5,這是根據 Humlum(2021)的估計,也被 Acemoglu 和 Restrepo(2022)採用。
任務可以使用資本或勞動力來生產,其生產函數如下:
任務 z 的生產函數為 y(z) = ALγL(z)l(z) + AKγK(z)k(z),其中 z 屬於 [0, N] 區間。AL 和 AK 分別代表勞動力增強和資本增強的生產力係數,γL(z) 和 γK(z) 表示勞動力和資本在特定任務中的生產力曲線,l(z) 和 k(z) 則分別表示分配到任務 z 的勞動力和資本量。這個生產函數顯示,資本和勞動力在不同任務中的生產力各異,但在同一任務中可完全替代。
Acemoglu 和 Restrepo 在 2018 年提出了這個經濟模型的動態版本,包含資本積累和內生技術選擇。2022 年,他們進一步擴展模型至多種勞動力類型和多個部門。2023 年,他們又考慮了非競爭市場的情況。這些擴展並不會顯著改變本文討論的主要結論。
模型中一個重要的簡化假設是,分配給勞動力的任務不需要任何資本或工具,這顯然與現實不符。Acemoglu 和 Restrepo(2018)的線上附錄提出了一個修正版的任務生產函數:
y(z) = ALγL(z)l(z)1−κkC(z)κ + AKγK(z)k(z)
其中 κ 介於 0 和 1 之間,kC(z) 代表任務 z 中與勞動力互補的資本,而 k(z) 則是用於自動化任務 z 的資本。由於 κ 小於 1,分配給勞動力的任務仍然比完全自動化的任務使用較少的資本。
在整個模型中,我們假設 γL(z)/γK(z) 隨著 z 增加而上升,這意味著勞動力在索引值較高的任務中具有比較優勢。因此,存在一個臨界值 I,使得索引小於或等於 I 的任務由資本完成,而高於 I 的任務則由勞動力完成。
為了簡化分析,我們將總人口標準化為 1,並假設不同工人擁有不同單位的有效勞動力。我們將勞動力分為高技能和低技能兩類,暫不考慮它們之間的比較優勢差異(這個假設後續會放寬)。高技能工人佔總人口的 ϕH 比例,每人擁有 λH 單位的有效勞動力;剩餘的 ϕU = 1 − ϕH 比例為低技能工人,每人擁有 λU 單位的有效勞動力,且 λU < λH。這種設定使得高技能和低技能工人可能執行相同的任務,同時工資不平等程度由 λH /λU 決定(這一特點後續也會進行調整)。
我們還假設所有勞動力供給都是非彈性的,因此總勞動力供給可表示為:
ϕU λU + ϕH λH = L
勞動力市場出清條件為:
L = ∫0N l(z)dz
其中 w 代表工資率。
資本則專門用於特定任務,我們假設用於任務 z 的資本是由最終產品線性生產的,其單位成本為:
R(z) = R(K)ρ(z)
其中:
K = ∫0N k(z)dz
經濟模型中的總資本存量扮演著關鍵角色。所有企業都將任務 z 的資本成本 R(z) 視為既定。方程式 (3) 的第一項表明,當經濟的資本存量增加時,資本的要求回報率可能上升。第二項則是針對特定任務的,反映了不同類型資本可能有不同成本的現實。對於尚未實現技術自動化的任務——即無法由資本生產的任務——我們可以將 γK(z) 設為 0,或者將 ρ(z) 設定為極高值。
此外,模型假設存在一個(非飽和的)代表性家庭,其消費最終商品(扣除資本支出),我們用 C 來表示這個家庭的消費。
均衡狀態
本模型聚焦於競爭均衡,它需要滿足以下常見條件:
任務 z(z ∈ [0, N])的分配遵循成本最小化原則。換言之,只有當 ALγL(z) < w AK γK(z).R(z) 時,任務 z 才由勞動力執行。
資本量 k(z) 的選擇旨在最大化 Y − R(z)k(z),其中 Y 的定義見方程式 (1)。
勞動力市場達到平衡,即方程式 (2) 成立。
值得注意的是,第一個條件設立了一個無害的平局規則:當面臨無差異情況時,企業會選擇使用資本來執行任務。基於這個規則,所有 z > I 的任務將由勞動力執行(即對所有 z ≤ I,l(z) = 0;對所有 z > I,k(z) = 0)。在基準模型中,無法確定執行這些任務的是高技能還是低技能勞動力,因此我們著重考慮整體有效勞動單位的數量。
在競爭均衡狀態下,所有由勞動力執行的任務必須滿足方程式 (4): σ^-1 σ^-1 σ^-1σ l(z)^-1 Y σ = w.1 AL γL(z)σ σ
這意味著對於任何兩個任務 z > I 和 z′ > I,我們有: l(z′) = γL(z′)^-1 . l(z) γL(z)^-1 (5)
特別值得注意的是,當 σ < 1 時,較少的勞動力會被分配到勞動生產力較高的任務中——這一特點的影響我將在後文詳細討論。結合勞動力市場出清條件 (2),方程式 (5) 可推導出: l(z) = R NγL(z)σ^-1I γL(z)^-1dz L (6)
此外,對於任何 z < I 的任務,僅使用資本,資本密度的一階條件可簡化為: σ^-1σ AK γK(z)σ^-1σ^-1 σ k(z)^-1σ Y 1σ = R(K)ρ(z) (7)
綜合方程式 (6)、(7) 和 (1),我們可以將 GDP 或總產出表示為:
Y = ∫[1 - R NγL(z)σ^-1dz] σ1dz AK σ(∫[I γK(z)^(BALL)σ^-1B σ^2-1] R I σ^-1) σ
這裡的分母反映了生產的迂迴性質。為確保經濟中的產出有限,我們假設:
∫[0 R(K)ρ(z)] γK(z)^(BALL)σ^-1B σ^2-1 dz AK σ < 1
如果不滿足這個條件,由於產出線性地生產機器,而機器又生產產出,總產出可能無限增長。根據 Acemoglu 和 Restrepo (2022) 的論證,只要滿足條件 (9),均衡就必然存在且唯一。
人工智慧對生產的潛在影響
在全面闡述均衡特徵之前,我們先來探討人工智慧(AI)可能如何影響這個經濟模型中的生產過程。
人工智慧(AI)促進了進一步的擴展性邊際自動化,提高了自動化程度(I)。這種自動化可能是由於 AI 降低了某些邊緣任務(即稍高於 I 的任務)的資本成本,或提高了機器或演算法執行這些任務的效率,從而增加了某些高於 I 的任務 z 的資本生產力 γK(z)。這類自動化的典型例子包括:生成式 AI 工具(如大語言模型)接管簡單的寫作、翻譯和分類任務,以及一些較為複雜的客戶服務和資訊提供相關任務;或者電腦視覺技術接管圖像識別和分類任務。
AI 能夠創造新的任務互補性,提升勞動力執行任務時的生產力。舉例來說,AI 可以為工作者提供更精確的資訊,直接提高其生產效率。在更一般化的模型中(見腳註 8),這種情況可以被視為 AI 降低了某些 z > I 任務中互補資本 kC(z) 的成本。另一種可能是,AI 自動化某些子任務(如為程式設計師提供現成的子程序),同時擴展人類的能力。
我將這種影響稱為「任務互補性」而非「勞動力增強」,原因有二:首先,它可能改變工作者執行的子任務分布,並在某些子任務中提升工作者的生產力;其次,「增強」一詞有時用來指代為勞動力引入新任務等互補活動,這些活動的效果與上述情況有顯著差異,我將在後文詳細解釋。
均衡工資與比較靜態分析
首先,我們將方程式(4)和(6)結合,得到均衡工資的表達式:
w = ∫[Y] σ1 (BAL)σ−1 ∫[Z] Nσ γL(z)σ−1dz 1σ.L I
這個方程式相當直觀。第一項表明工資與勞動生產力成正比(冪次為 1/σ),第二項反映了
希克斯中性技術進步和勞動增強型技術進步對勞動力邊際生產力的貢獻,第三項則代表任務分配對勞動力邊際生產力的影響。任何微小的技術變革(可能涉及生產技術的多個方面,如 B、AL 和 AK、γL(z) 和 γK(z)、以及 I 和 N)對工資的影響可以表示為:
d ln w = σ1d lnY + σ−1(d ln B + d ln AL) + 1d lnZNγL(z)σ−1dzL σ σ I
進一步擴展性邊際自動化(即 I 的增加)對工資的影響可以表示為:
d ln w dI = 1d ln YσdI − σ1R NγL(I)σ−1I γL(z)σ−1dz
一般而言,這個表達式的正負並不確定,意味著自動化可能提高或降低工資。具體來說,存在兩種相互對立的效應(Acemoglu 和 Restrepo,2018,2019b):
(a) 自動化總是對工資(和勞動需求)產生正面影響,因為它提高了生產力(或等效地,降低了成本)。這種正面的生產力效應由第一項表示;
(b)同時,自動化也會使勞工脫離原本執行的任務,這種負面的替代效應由第二項表示。在特殊情況下,當資本回報率 R(K) 為常數時,可以證實自動化會提高工資。然而,正如 Acemoglu 和 Restrepo(2018)所指出,當 R(K) 呈上升趨勢時,情況通常並非如此,因為替代效應可能超過生產力提升帶來的收益。
總的來說,(廣義邊際)自動化對均衡工資的影響與其生產力效應密切相關,接下來我將討論這一點。
在此之前,我還要指出,任務互補性的影響可能比一般假設的更為複雜。雖然提高特定任務的勞動生產力 γL(z) 會增加勞動力的邊際實物產出,但均衡工資是由勞動力的邊際產品價值決定的,這取決於任務價格的調整。當勞動力生產的任務變得更加豐富或更容易執行時,這些任務的價格會下降。在實證相關的情況下,即替代彈性 σ < 1 時,任務價格的下降幅度甚至可能超過實物生產力的增加。儘管如此,由於生產力的整體提升,均衡工資仍有可能上升。
特別是,對於任何可微分的規模報酬不變的生產函數 F(K, L),根據歐拉定理:F(K, L) = wL + RK。假設資本回報率 R 是固定的,那麼任何在初始要素投入下增加 F(K, L) 的技術變革必然會提高工資 w = F(K,L)−RK。但當資本 K 固定時,這一結論不一定成立,因為 R 的增幅可能超過 F(K, L)。在 Acemoglu 和 Restrepo(2018, 2019b)的研究中,資本存量被視為給定,因此可能出現負面影響。
在具有指數折現和時間可分離偏好的新古典增長模型中,R 在長期內是固定的。然而,Acemoglu 等人(2024)指出,在更一般的偏好設定下,R 往往會隨著自動化和其他技術變革而增加,因此可能導致負面的工資效應。
勞動力的整體收益可能有限
舉例來說,在保持自動化程度 I 和新任務數量 N 不變的情況下,當替代彈性 σ 等於資本在國民收入中的份額 sK 時,提高勞動生產力 AL 不會改變工資水平(Acemoglu 和 Restrepo,2018)。當 σ < sK 時,提高 AL 實際上可能降低實質工資。考慮到目前美國經濟中 sK 約為 0.4,而 Humlum 估計的 σ 約為 0.5,這意味著任務互補性或勞動力增強型技術進步不會顯著提高工資。即使這些技術變革確實提高了工資,它們也會像自動化一樣降低勞動份額(Acemoglu 和 Restrepo,2018, 2019b)。
最後,我要指出,自動化的深化(在人工智慧的情況下,由於引言中討論的原因,這種情況較少發生)和新任務的引入總是會提高工資。後者還會提高國民收入中的勞動份額,從而縮小資本和勞動收入之間的差距。我稍後會詳細討論新任務的影響。
2.4 胡爾滕定理
人工智慧對經濟的諸多影響,核心在於其對生產力的衝擊。為了評估這種影響的程度,我們可以運用胡爾滕定理。這個定理為具有規模報酬不變的競爭性經濟體提供了一個簡單公式,闡明了微觀層面的生產力提升如何轉化為總體經濟變化。由於本文討論的經濟模型是競爭性的,這個定理適用且能規範生產力效應。接下來我將解釋這個定理,為了簡化說明,我先假設經濟的資本存量 K 是固定的。
考慮技術各方面的微小變化(包括 B、AL 和 AK、γL(z) 和 γK(z)、I 和 N),這樣我們就能涵蓋人工智慧在自動化和現有任務互補性方面的潛在影響。回顧一下,GDP 可以等價地表示為任務產出的價格加權總和:
Y = ∫0N p(z)y(z)dz
由於我們考慮的是技術的微小變化,且競爭均衡是有效的,因此跨任務的要素重新分配和通過價格的間接效應將是二階小量,在計算 GDP 變化時可以忽略。那麼:
d ln Y = dY/Y = ∫0N p(z)dy(z)dz/Y = ∫0N χ(z)d ln y(z)dz
其中最後一個等式定義 χ(z) = p(z)y(z)/Y 為任務 z 佔 GDP 的份額。考慮到資本和勞動力是固定的,這也代表了總要素生產力(TFP)的變化,可以表示為:
d ln TFP = d ln Y|K = ∫0N χ(z)πL(z)dz,(12)
其中 πL(z) = d ln y(z) 是人工智慧帶來的任務 z 的生產力提升或成本節省。這裡再次強調,這些成本節省可能源於自動化或任務互補性。對 GDP 的總體影響可以表示為:
d ln Y = d ln TFP + sK d ln K,(13)
其中 sK 是資本在 GDP 中的份額。這個推導還闡明了(12)和(13)式適用於任何任務級生產函數,因此比先前討論的工資和不平等結果更具一般性。
如果人工智慧對生產力的主要影響是通過自動化實現的,那麼 πL(z) 代表資本替代勞動力帶來的成本節省。這些節省不應該很大。以機器人為例,專家報告估計成本節省約為勞動力成本的 30%(參見 Acemoglu 和 Restrepo,2020a)。然而,有理由預期人工智慧的成本節省可能更低,我稍後會詳細討論這一點。Noy 和 Zhang(2023)以及 Brynjolfsson 等人(2023)的研究(我稍後會詳細回顧)也得出了類似的結果——約為勞動力成本的 27%。目前還不清楚這些節省是否來自廣義邊際自動化。
換言之,實際國內生產總值(GDP)的變化可以表示為社會規劃者目標函數(例如,代表性家庭的效用函數,如果存在的話)價值的變化。根據包絡線定理,任務層級資源限制的拉格朗日乘數等同於價格,在評估參數或技術的微小變化對這個目標函數最大化值的影響時可視為已知。詳見 Hulten(1978)的研究。
資本對產出成長的貢獻也可以在一般情況下推導,類似於 Hulten 定理。具體來說,對於任何具有規模報酬不變的生產函數 F (K, L|A),其中 A 為技術變數,我們可得:d ln Y /dA = d ln F (K, L|A)/dA + (d ln F (K, L)/dK) · dK/dA。第一項 d ln F (K, L|A)/dA 即為總要素生產力(TFP)的變化率。在競爭性要素市場中,d ln Y = (RK/Y )d ln K,因此 d ln Y = d lnTFP+sK d ln K。此外,d ln sK = d ln K − d ln Y,故 d ln Y = (d lnTFP+sK d ln sK )/(1 − sK )。當資本產出比(或等同的資本份額)對技術變化的反應保持不變時,則 d ln Y = d lnTFP/(1 − sK ),這是我使用的第一個近似值。稍後,我會估計自動化預計會增加多少資本產出比,並據此更新估計。
Peng 等人(2023)的研究顯示,人工智慧對某些程式設計任務完成速度的影響更為顯著。然而,這些研究僅涉及一個非常狹窄的任務範圍——GitHub Copilot 可以用常見程式語言編寫的子程序——因此適用範圍有限,我將在穩健性檢驗中考慮這些結果。
或任務互補性
如前所述,這種區分對生產力效應的影響較小。實際上,勞動力成本節省需要轉化為整體成本節省,這可以通過使用各行業勞動力在總成本中的佔比來實現。舉例來說,若行業 i 中勞動力的佔比為 siL,則勞動力成本節省 πiL 將轉化為整體成本節省 πi = sLπi。取這些跨行業的平均值,並將此經濟範圍的成本節省表示為 ¯,我可以寫成:
d ln TFP = ¯ × 受人工智慧影響的任務佔 GDP 的比重。π (14)
我將在下文討論如何根據近期研究中關於人工智慧將影響哪些職業和任務的資料來估算這個比重。
簡易任務與複雜任務
如前所述,Peng 等人(2023)、Noy 和 Zhang(2023)以及 Brynjolfsson 等人(2023)的概念驗證研究聚焦於人工智慧可能帶來顯著效益的任務領域。這些領域要麼已有成熟的應用(如第一項研究中的 GitHub Copilot),要麼是某些企業已在積極運用生成式人工智慧的領域(如第三項研究中的客戶服務應用)。我認為,即使這些研究在其特定情境中的估計可靠,但從當前人工智慧技術相對容易完成的任務得出的結論,不能直接推論至整體經濟。更廣泛來說,區分「易學任務」(即外部學習,因此也包括人工智慧模型的學習容易的任務)和難以透過外部觀察獲得專業知識的任務是很有意義的。易學任務,也就是(生成式)人工智慧相對容易學習和執行的任務,具有兩個特徵:
有可靠且可觀察的結果指標
行動與結果指標之間存在簡單(低維度)的對應關係
舉例來說,如何煮蛋(或提供煮蛋指示)、驗證系統鎖定用戶的身份,或撰寫一些常見的程式設計子程序都屬於簡單任務。這些任務的預期結果明確:煮到適當程度的蛋、僅允許授權人員存取系統、或子程序是否正常運作。在這些情況下,成功的結果並不取決於多個維度行動的複雜互動。有了可靠、客觀的成功評估標準(如煮得恰到好處的蛋、在已知授權人員的前提下沒有安全漏洞、或不會當機的子程序),人工智慧模型就能相對直接地學會表現良好。此外,人工智慧模型還能從人類行為中學習,因為在這些任務中有表現出色的人類專家,例如專業程式設計師,而且由於有客觀的成功評估標準,可以識別出這些專家。
「困難任務」通常缺乏行動與預期結果間的簡單對應關係。在棘手問題中,達成預期結果的方法往往未知,且高度依賴情境因素,或相關情境範圍可能極廣,甚至需要創新的解決方案。此外,人工智慧系統通常缺乏足夠的學習資訊,或難以明確學習目標。舉例來說,診斷持續咳嗽的原因並提出治療方案就是一個棘手問題。造成長期咳嗽的過往因素之間可能存在複雜的交互作用,還需考慮諸多罕見情況。更甚者,這類問題缺乏大規模、精心整理的成功診斷與治療資料集。面對困難任務,人工智慧模型雖然仍能向人類決策者學習,但由於缺乏明確的成功指標,要識別並學習最頂尖專家的經驗也非易事。因此,人工智慧模型的表現往往趨近於人類決策者的平均水準,限制了大幅提升生產力和節省成本的潛力。
目前觀察到的人工智慧生產力提升主要來自簡單任務。我們可以合理預期,至少在初期,困難任務的生產力提升會相對有限。簡單任務的生產力提升源於人工智慧模型能以接近專業人員的水準執行這些任務,且/或成本低於人力。舉例來說,在Noy和Zhang(2023)的研究中,專家指的是那些能夠妥善總結和撰寫的人員。在這種情況下,預期結果容易確定,不需要新的問題解決方法(如果寫作任務更為複雜,情況可能就不同了)。
困難與簡單的區分,與Autor等人(2003)提出的例行與非例行區分不同。例行任務是指在穩定、可預測的環境中重複執行相同活動的任務(如編織或電話接線員工作)。在這類任務中應用數位科技,涉及相關軟體和硬體的步驟式程式設計。大量例行任務已實現自動化,而人工智慧的潛力在於執行非例行任務的能力,這點Susskind(2020)也有強調。某些非例行任務,如部分電腦程式設計或簡單文字撰寫,相對容易學習;而其他需要更多特定情境決策,且缺乏成功表現指標的任務,則難以透過外部觀察學習。
值得注意的是,這裡所指的「簡單任務」對人類而言未必容易。實際上,當人類執行成本高昂時,AI 在這類任務上的成本節省效果最為顯著。反之,某些被視為困難的任務,如需要直覺、經驗和判斷力的工作,對人類來說可能相對簡單,因為這些能力並非單純透過外部觀察就能習得。這就解釋了為何在處理困難任務時,AI 相較於人類的成本效益可能有限。
以 GPT-4 為代表的生成式 AI 模型,由於是在大量文本資料上訓練而成,因此特別擅長處理寫作等簡單任務。在這種情況下,生產力的提升主要體現在兩個方面:一是能夠以低成本將技能較低的員工的表現提升至專業水準;二是能夠協助大多數員工更快速地完成指定任務。在處理簡單問題時,AI 模型甚至可能發現人類專家未曾嘗試或意識到的解決方案,進一步提高生產力。
然而,在處理困難任務時,AI 的生產力提升面臨多重障礙。首先,由於缺乏明確的因果關係,AI 模型的訓練將變得更加困難。這不僅會影響早期的自動化嘗試,甚至可能阻礙 AI 輔助人類工作的效果,從而延遲生產力的提升。其次,在困難任務中實現人機協作也更具挑戰性。當缺乏明確的成功指標時(例如,如何正確診斷持續咳嗽的原因),AI 模型主要依賴於學習人類在類似情況下的行為。這導致 AI 難以超越人類的表現,也不太可能產生新的協同效應或提供與人類思維截然不同的見解。
如果本節的兩個前提成立——即未來十年內,AI 在困難任務上的生產力提升將慢於簡單任務,且 AI 在不久的將來將面對更多困難任務——那麼我們就需要對相關理論模型進行相應的調整,以反映這一趨勢。
舉例來說,假設人類通常直接將雞蛋放入冷水中煮沸,但如果在水煮沸後再放入雞蛋可以減少變異性,這就是某些AI模型可能會發現的洞見。AlphaZero在西洋棋中發現新的有效棋步,可視為同樣現象的體現,儘管這發生在更為複雜和有趣的問題領域。從這個角度來看,AlphaFold在蛋白質折疊研究上的重大突破可說是兼具簡單和困難的面向。就困難的一面而言,蛋白質折疊是一個高度多維的問題,行動與預期結果之間並無簡單的對應關係。然而,就簡單的一面來說,預期結果是可觀察的,因此只要有足夠的運算能力,AI模型就有可能超越人類的表現,正如AlphaFold所展現的那樣。
從數學角度來看,一般學習問題可以這樣形式化:存在一個結果映射函數f : X × Z → Y,其中X是行動空間,Z代表「上下文」空間,Y則是可能結果的集合。觀察到的結果是Y中真實結果加上某種噪聲過程(此處不詳述)後的版本。映射函數f是未知的。
原則上,AI可以通過兩種方式在這類問題中進行訓練。首先,透過對Y的充分觀察以及來自X × Z的輸入組合,AI模型可能學習到整個函數f或其某些受限版本。其次,如果Y不可觀察,那麼AI模型可能從人類的選擇中學習,這可以概括為一個對應關係G : Z ⇒ X,指明了人類面對上下文Z時可能採取的行動。如果X × Z維度很高,這兩種方法都可能面臨挑戰。然而,後一種學習方式較難產生比人類現有做法更優異或迥異的結果。它有時可以確保AI達到人類專家的水平(如果能夠識別出這些專家的話),但缺乏可靠的結果數據也可能使得識別專業知識變得困難。
——
具體而言,將受AI影響的任務中簡單任務的比例表示為μE,簡單和困難任務的平均成本節省分別表示為π̄E和π̄H,則公式(14)可改寫為:
d ln TFP = [μE π̄E + (1 − μE)π̄H] × 受AI影響的任務佔GDP的比重 (15)
我還嘗試使用這個更新後的全要素生產率(TFP)方程進行估算,結果顯示,相較於不區分簡單和困難任務的估算,考慮這一區別後的增益約減少25%。
投資反應
要從TFP反應推算出總體GDP反應,我們需要評估資本增加的幅度。這也與理解生成式AI可能引發多大規模的投資熱潮息息相關。
為了探討這個問題,我們來考慮一下因人工智慧(AI)而產生的技術變革。從方程式(7)可以看出,這種變革對資本和投資的影響可以表示為:
k(z) = Bσ−1AK σ−1γK (z)σσ−1Y , (R(K)ρ(z))
因此,我們得到:
d ln k(z) = (σ −1)d ln B +(σ −1)d ln AK +(σ - 1) d ln γK (z)+d ln Y −σd ln R(K)−σd ln ρ(z). (16)
在接下來的分析中,我假設 B 和 AK 保持不變。雖然未來 AI 可能會顯著改善科學研究和發明過程,或創造出新的高生產力任務,但我假設這些因素在未來十年內維持不變。
首先,讓我們考慮在某些已由資本執行的任務(z < I)中使用 AI 的情況。在這種情況下,AI 會增強並改善資本設備的表現。那麼我們可以得到:
d ln k(z) = (σ − 1) d ln [AK · γK (z)] + d ln Y − σd ln R(K).
值得注意的是,當 σ < 1 時,特別是當 σ 取經驗上合理的 0.5 值時,等式的第一項是負數。這意味著在資本密集型任務中,AI 增強型資本生產力的提高反而會減少投資和均衡資本存量。假設總投資增加,最後一項也是非正數。因此,資本已執行任務的資本存量比例增加的自然上限就是產出的比例增加。
此外,如果可自動化的任務範圍(I)擴大,新自動化任務的投資將從零增加到一個正值。然而,根據我下面的估算,只有少部分任務會被 AI 自動化,因此這種增加可能相對較小。基於這一考慮,我首先假設資本存量的比例增加與總體生產力的增加相同。接著,我會提供另一個估算,這個估算基於 Acemoglu 和 Restrepo(2022)的框架和結果,納入了產業間和任務間替代的完整結構。這將使我能夠估計資本份額的隱含變化,然後利用腳註 12 中的公式來計算更新後的投資反應和 GDP 估計。
最後,值得一提的是,在這個經濟模型中,消費者福利(和消費)與全要素生產率(TFP)除以一減去資本份額成正比(即 d ln C = d lnTFP/(1 − sK ))。特別是,如果資本產出比上升,且 GDP 的增加比方程式(13)所預測的更為顯著,那麼 GDP 的增長可能會高估消費者福利的實際增加,因為增加的投資是以減少消費為代價的(Acemoglu 和 Restrepo,2022)。
新任務的引入
引入新任務將提高生產力,這種效果原則上可能比自動化和任務互補性帶來的成本節約更加顯著。此外,新任務通常會推高工資水平。具體而言,我們可以使用與之前相同的分析步驟,
新任務對工資的影響可表示為:
d ln w / dN = (1/σ) · d ln Y / dN + (1/σ) · ∫[I, N] γL(z)^(σ-1) / γL(N)^(σ-1) dz + (σ - 1) / σ · B'(N) / B(N)
這個影響通常為正值且可能相當顯著。值得注意的是,新任務對工資和生產力的影響可能超過現有任務的成本節約效果。特別是當新任務能改善整體生產流程(由B項表示),或引入新的成本改善來源或互補功能時,這種情況更為明顯。新任務在促進工資和生產力成長,以及減少勞動收入不平等方面扮演著關鍵角色(參見Acemoglu和Restrepo,2018年的研究,以及Autor等人的研究)。在I附近,這個數值可由k(I) = B^(σ-1) · AK · (R(K)ρ(I))^(σ-1) · Y表示。若勞動密集型任務此前也使用資本,即σ-1γK(I)^σ,則增幅會較小但仍為正值。
人工智慧的負面影響
人工智慧可能會產生一些新任務,這些任務雖然能增加收入,卻可能降低消費者效用,例如透過引發成癮或操縮行為,或在生產環境中,透過惡意行為者的安全攻擊。為了描述這種情況,我們假設福利函數為W = C - E,其中E代表外部性,如錯誤資訊或操縱活動所造成的負面影響。在這種情況下,人工智慧產生的新任務對福利的影響可表示為:
dW / dN = dY / dN - dE / dN (18)
儘管這種負面福利影響的規模難以準確估量,但根據一些近期研究,我認為這些影響可能並非微不足道。具體而言,我使用了對方程式(18)中兩項相對大小的估計,並以人工智慧可能產生新的有害任務或社會危害活動的任務收入來代表第一項的規模。
人工智慧對工資和不平等的影響
許多評論者和專家對生成式人工智慧的進展持謹慎樂觀態度,認為它可能對勞動力有利,或至少不會像先前的數位技術浪潮(如機器人和軟體系統)那樣對工人造成嚴重的負面影響,因為那些技術主要用於自動化。這種樂觀看法可能通過三種潛在途徑實現:
人工智慧能提高現有勞動任務的生產力。這屬於任務互補性效應,可透過提高AL或自動化任務子集的γL(z),或提高非技術和高技能工人的生產力(λU和λH)來實現。然而,當σ < 1時,這類生產力提升反而會減少勞動份額,進而加劇資本和勞動之間的不平等。
若人工智慧帶來顯著的生產力提升,即使降低了勞動份額,也可能提高工資(參見Acemoglu和Restrepo,2018,2019b的研究)。這個途徑的關鍵在於上述生產力效應的規模,但無論如何,都會加劇資本和勞動之間的不平等。
(第三點內容未完全提供)
如先前所討論,一些初步研究顯示,在特定職業領域中,表現較差或專業知識較淺的工作者反而是生成式人工智慧的主要受惠群體。這引發了一個可能性:人工智慧可能對低技能工作者更具互補性,並可能縮小勞動收入的差距。在我的理論架構中,這種現象可以通過低技能工人生產力係數(λU)相對於高技能工人生產力係數(λH)的增加來解釋。然而,即便如此,只要替代彈性(σ)小於1,資本與勞動之間的不平等仍會擴大。
第四,若人工智慧創造了新的(優質)工作任務,這些任務將有助於減少資本和勞動之間的不平等。若有足夠多的新任務針對低技能工作者,這甚至可能縮小勞動收入的差距(參見Acemoglu和Restrepo,2018年的研究)。
現在,我將從理論角度論證,為什麼上述第一點和第二點不太可能成為推動工資增長的主要動力,或對不平等造成重大限制。首先,讓我們考慮勞動生產力(AL)增加1%(或勞動密集型任務的勞動生產力γL(z)等量增加)的情況。如前所述,這可能完全不會增加工資,或者只會導致微小的工資上漲。事實上,根據方程式(11),若不考慮生產力效應,對均衡工資的直接影響將是(σ − 1)/σ%的變化。在σ < 1的合理情況下,這個影響是負面的。雖然考慮生產力效應後,整體影響可能仍是工資上漲,但如前所述,當σ約等於資本在國民收入中的佔比時,整體影響幾乎為零。總之,如果沒有創造足夠數量的新任務,資本和勞動之間的不平等將會擴大,工資增長可能會受到限制。
那麼,低技能工作者獲益更多是否能減少不平等呢?在這個模型中,高技能工作者相對於低技能工作者的收入始終固定在λH/λU。因此,如果新技術降低了這個比率,確實會縮小高低技能工作者之間的差距。但這個結論也需要進一步檢視。Acemoglu和Restrepo(2022)指出,在更複雜的情境中,存在多個技能群體,會產生連鎖效應,受影響的群體可能會轉而競爭原本由其他群體執行的任務。在這種情況下,某些任務中高低技能工作者整體勞動生產力的提升,可能導致他們被排擠出這些任務,而連鎖效應可能最終對低技能工作者造成更大的不利影響。
雖然Acemoglu和Restrepo(2022)的研究框架中提到了這種對低技能工作者的潛在不利影響,但我尚未見到具體案例說明低技能工作者生產力提高如何會加劇不平等。因此,我將在下文提供一個這樣的理論例子。
低技能生產力提高如何導致更嚴重的不平等
讓我用一個簡單的例子來說明這種可能性,放寬高技能和低技能工人之間沒有比較優勢差異的假設。假設經濟一開始處於均衡狀態,其中 I 以下的任務由資本執行,而 I 和 N 之間的任務則由高技能和低技能工人共同完成。特別是,假設低技能工人在 I 和 I* 之間的任務中具有比較優勢,他們在這些任務中的生產力固定為 λU,而高技能工人在這些任務中的生產力也是固定的,等於 λH。
另外,假設高技能工人在 I* 和 N 之間任務的相對生產力為 ω,且 ω > λH / λU,這表明高技能工人在更高階的任務中具有比較優勢。然而,由於沒有絕對的比較優勢,均衡狀態可能涉及兩種類型的工人執行部分相同的任務。我們還假設任務之間的替代彈性 σ 小於 1。
讓我們從一個均衡狀態開始,其中高技能和低技能工人都執行 z ∈ (I, I*] 範圍內的任務,而只有高技能工人執行 z ∈ (I*, N] 範圍內的任務。在這個初始均衡中,技能工人的相對工資將由兩種類型工人在共同執行的任務中的相對生產力決定——即 z ∈ (I, I*] 範圍內的任務——並等於 λH / λU。
現在,假設由於人工智慧的進步,z ∈ (I, I*] 範圍內任務的勞動生產力提高了,而且這種進步對低技能工人更有利,因此 λH / λU 下降。我將說明這些進步可能會加劇不平等。因為 σ < 1,z ∈ (I, I*] 範圍內任務的價格下降幅度將超過勞動實際生產力的增幅,導致分配到這些任務的勞動減少。如果這種效應顯著,所有高技能工人可能會被轉移到其他任務,而這些任務所需的勞動量可能會低於低技能工人的供給。在這種情況下,人工智慧發展後的資源分配可能變成只有低技能工人執行 z ∈ (I, I*] 範圍內的任務,而低技能和高技能工人都執行 z ∈ (I*, N] 範圍內的任務。
此時,無論 λH / λU 下降多少,技能工人的相對工資將由兩種類型工人共同執行的任務決定,也就是 I* 以上的任務,因此相對工資將等於 ω,而 ω > λH / λU。結果是,不平等反而增加了。
這個模型結構類似於只有有限數量任務的情況——在這個例子中,相當於三個任務。但我使用連續任務的設定是為了與論文的其他部分保持一致。我在這裡強調的「矛盾」結果並不依賴於這種嚴格的結構或僅有兩種類型的勞動力這個假設。
因此,我剛剛證明了,即使在某些任務中低技能和高技能工人之間的生產力差距縮小,也可能導致更大的不平等。這意味著,人工智慧對整體不平等的影響並不能直接從其對不同技能工人在特定任務中表現的影響推斷出來,而需要更全面的實證研究。在下一節中,我將透過調整 Acemoglu 和 Restrepo (2022)的架構和估算方法來研究人工智慧對不平等的影響。
3 初步定量評估
本節將提供人工智慧近期突破可能在未來十年產生影響的初步定量評估。評估的核心將運用 Hulten 定理,以及最近對哪些任務可以使用人工智慧和電腦視覺技術自動化,並由此產生的成本節約估算。在獲得這些對全要素生產率(TFP)成長的估算後,我會根據一系列關於經濟資本存量反應的假設,將其轉換為國內生產總值(GDP)成長的估算。我還會討論如何估算人工智慧透過新的不良任務所產生的影響。最後,我將這些數據與 Acemoglu 和 Restrepo (2022)更詳細的架構結合,以獲得更具推測性的工資和不平等影響估算。在進行估算之前,我將先描述所使用的資料來源,進一步討論現有的生產力估算,並說明各種參數選擇的理由。
3.1 資料來源和參數選擇
本文估算的核心是方程式 (14),及其改進版本 (15)。要應用這個方程式,需要兩項資訊:
未來十年內受人工智慧(包括電腦視覺)影響的任務在國內生產總值中的佔比。
因人工智慧而在這些任務中的平均成本節約,¯.π
要精確估算這兩個數值是不可能的,因此我再三強調,本文的數據——事實上,包括文獻和公共討論中的其他估算——都應該謹慎解讀,視為參考性數據。儘管如此,已有一些研究對這些數值提供了洞見。我現在將討論這些研究成果以及我如何運用它們。
受人工智慧影響的任務在國內生產總值中的佔比
關於近期人工智慧和電腦視覺進展影響了哪些工作任務,Eloundou 等人(2023)提供了最為審慎的估計。他們運用兩種相關方法來分類受人工智慧和電腦視覺影響的任務。這兩種方法都以 O*NET(職業資訊網)的任務描述和詳細工作活動(DWA)為基礎。研究人員使用 GPT-4 對全部 19,265 項任務和 2,087 項 DWA 進行分類。他們還透過人工方式分類 DWA,並將這種 "人工" 編碼與基於 GPT 的測量進行交叉驗證,從而建立了一個更為概括的指標。在此,我著重討論基於 GPT 的測量,因為它能提供更細緻的分析,我稍後會詳細解釋。此外,Eloundou 等人(2023)區分了直接影響(α)測量,這是基於他們對大型語言模型(LLM)目前能力的評估。他們還開發了第二個更激進的測量(稱為 β 測量),考慮了假設的 LLM+ 模型可能產生的 "間接" 影響。這包括那些可能受到基於當前 LLM 和電腦視覺技術開發的新軟體和其他進展影響的任務。
Eloundou 等人在論文中報告的指標基於二元編碼,同時他們還構建了一個 "自動化" 指標。在這個指標中,他們的 β 測量包含了關於 LLM+ 可能影響活動程度的詳細資訊(分為 0%、25%、50%、75% 和 100%)。在接下來的分析中,我採用他們的自動化指標來利用這些細緻的資訊。這個指標雖然更強調自動化,但仍包含自動化和任務互補性的元素(因為他們根據哪些活動可以自動化的資訊來編碼詳細資訊)。特別是,正如作者自己指出的,生成式人工智慧的影響可能經常涉及某些子任務的自動化,使人類工作者能夠專注於其他活動。這個指標中包含的細緻資訊對我的研究目的特別有用,因為它評估了哪些任務或職業較不可能受到人工智慧影響。我將作者分類為 50% 或以下活動受人工智慧和電腦視覺影響的所有任務設為零,並將其餘的稱為 "受人工智慧影響的任務"。
要將這些估計轉化為我所需的數據,需要解決幾個問題:
雖然 Eloundou 等人的自動化指標強調自動化,但它仍包含了
他們還報告了第三個更為激進的測量,稱之為 ζ。這個測量更具推測性,專注於 LLM+ 最終可能執行的內容。根據作者的解釋,這種情況在近期內不太可能發生,因此我忽略了這第三個測量。
"增強" 或任務互補性的元素。這促使我做出以下解釋:將他們的測量與方程式(14)結合,將能捕捉到自動化和任務互補性帶來的成本節約。
為了將 Eloundou 等人的數據轉換為國內生產總值(GDP)佔比,我將相關任務整併為職業類別,然後利用薪資支出來彙整各職業數據。這些薪資支出數據來自美國勞工統計局(Bureau of Labor Statistics,BLS)2019 年至 2022 年的全國職業就業與薪資估計。經過這樣的處理,我得出受影響職業的薪資支出加權佔比為 20%。我將這個比例視為等同於受人工智慧(AI)影響的任務在 GDP 中的佔比。
Eloundou 等人的研究方法著重於判定哪些任務最終可由生成式 AI 和電腦視覺技術(如已整合於 Dall-E 中的技術)執行。然而,他們提供的資訊中有兩個關鍵面向尚未涵蓋。首先是未來十年內可能實現的任務影響程度;其次是在所有情境中使用 AI 是否符合成本效益(例如,AI 自動化是否經濟實惠)。Svanberg 等人(2024)就電腦視覺技術(Eloundou 等人所考慮技術的一個子集)試圖回答這些問題。我採用 Svanberg 等人的估算,並將其推廣至 Eloundou 等人考慮的所有任務。具體而言,Svanberg 等人的基礎估計顯示,在受電腦視覺影響的任務中,有 23% 可在十年內以可行且具成本效益的方式實現自動化。將這個比例應用於 Eloundou 等人的估計,我得出未來十年內受 AI 影響的任務在 GDP 中的佔比為 0.23 × 0.200 = 4.6%(佔所有任務或職業的比例)。
AI 帶來的成本節約
我對 π 的估計主要基於已提供 AI 提升生產力或降低勞動成本的「概念驗證」估算的實驗研究。這裡有三個重要考量:
這並非一個簡單的步驟。Svanberg 等人專注於電腦視覺的自動化應用,而 Eloundou 等人考慮的受影響技術範圍更廣,包括前面提到的任務互補性,並超越了單純的電腦視覺任務。可以想像,在未來十年內可以有效利用 AI 的任務比例在這兩個類別之間可能存在差異。可惜的是,我沒有其他資源來估算非電腦視覺 AI 的相關數據。Svanberg 等人還根據電腦視覺技術成本下降做出了進一步推測。他們的推測基於 Besiroglu 和 Hobbhahn(2022)的研究,該研究預測由於 GPU 運算能力的擴展,計算成本每年將下降 22%。然而,GPU 容量翻倍並不必然導致整體成本減半,這是因為存在邊際效益遞減、其他投入因素造成的瓶頸,以及當前技術架構的限制。因此,我並未將這些因素納入基準估算,但會在後續的穩健性分析中再次討論這個議題。
關於 AI 工具對任務表現影響的研究
研究 AI 帶來的成本節約效益
我對 π 的估算主要基於幾項實驗研究,這些研究提供了 AI 如何提升生產力或降低勞動成本的「概念驗證」估算。以下是三項關鍵研究的概述:
Peng 等人(2023)
實驗對象為使用 GitHub Copilot(由 OpenAI Codex 即 GPT-3 驅動)的自由職業程式設計師,任務為用 JavaScript 實作 HTTP 伺服器。
使用 AI 輔助的實驗組完成任務的速度比對照組快 55.8%。
Noy 和 Zhang(2023)
針對白領工作者進行的線上實驗,使用 ChatGPT-3.5 輔助寫作任務。
使用 ChatGPT 使任務完成速度提高 40%,品質評分提升 18%。
Brynjolfsson 等人(2023)
研究生成式 AI 工具在客戶服務領域的應用。
客戶服務人員的任務完成速度提高 14%。
---
值得注意的是,這些改善效果主要集中在表現較差、較缺乏專業技能的員工身上。事實上,Brynjolfsson、Li 和 Raymond 的研究估計,頂尖的五分之一員工幾乎沒有任何效率提升。
我認為這三項研究都展現了 AI 在廣義上帶來的勞動成本節約——具體而言,這些研究都包含了自動化和任務互補性的元素。以 Peng 等人研究中的 GitHub Copilot 使用者為例,研究者認為某些原本由程式設計師執行的子任務,如編寫常見程式片段,現在已由 Copilot 接手。
根據第 2.2 節的討論,我們可以假設用 JavaScript 編寫程式涉及 N 個子任務,這些子任務都需要完成才能成功開發程式。這些子任務包括:初步規劃(決定採用哪種方法、如何組織程式等)、編寫子程序、整合子程序、偵錯子程序、偵錯主程式,以及評估程式是否達到預期目標。當所有這些子任務都完成時,編寫特定程式的任務就算完成了。
我們可以將生成式 AI 視為接管了部分編寫子程序的任務。根據 Acemoglu 和 Restrepo(2018, 2019b)的理論框架,採用這項新技術將產生替代效應和生產力效應。假設這項技術在編寫某些子程序方面比人類更有效率(但人類仍需負責其他子任務,如規劃、偵錯和檢查),那麼整體表現將因生產力效應而提高。
這項任務對人力需求的變化取決於替代效應和生產力效應的相對大小,以及這項任務與其他任務之間的替代彈性(還有最終產品的市場需求彈性)。此外,當簡單的子程序被 Copilot 接管後,人類工作者可能得以專注於其他子任務,這可能產生任務互補性,進一步提升生產力。
我先前對程式設計的描述同樣適用於其他兩項研究。在這些研究中,ChatGPT 負責初步草擬內容,人類受試者則可將這些內容整合到自己的寫作中,並進行核實和修改。類似地,在 Brynjolfsson、Li 和 Raymond 的研究中,客戶服務人員被允許複製並貼上由生成式 AI 工具建議的文字。
我認為,這三項研究中的任務大致可以與 Eloundou 等人(2023)研究中所考慮的「容易受 AI 影響的任務」相比擬,儘管我稍後會論證這些任務更可能屬於容易學習的類別。因此,這些研究最能為我們提供關於 Eloundou 等人所指的「容易受 AI 影響的任務」的成本節約(或說生產力提升)資訊。
作為基準,我暫且不考慮品質效應(如前所述,這在三項研究之間並不一致),而專注於平均速度的增加,並將其解釋為平均成本節約。至於不平等的影響,我會在後面討論。最後,我以 Noy 和 Zhang(2023)以及 Brynjolfsson 等人(2023)的估計平均值作為基準,並將三項研究的平均值作為穩健性檢驗。之所以這麼做,是因為 Peng 等人的研究情境較不適用於其他任務和職業。他們研究的任務非常明確,且 GitHub Copilot 專門針對此類任務進行了大量訓練,這與我們關注的其他任務並無直接對應。在這些假設下,平均勞動成本節約為 27%(即 0.27)。
需要注意的是,這些數字指的是職業中的勞動成本下降,而許多任務同時涉及資本和勞動力的使用。在等式(14)中,我們關心的是整體成本節約。為了將勞動成本節約轉換為整體成本節約,我使用了 Eloundou 等人的產業層級估計,並將其與美國經濟分析局(BEA)的產業勞動份額數據結合,詳細方法見附錄。這得出平均(經 AI 影響調整)勞動份額為 0.535,因此 AI 帶來的平均整體成本節約約為 0.27 × 0.535 = 0.144。
如果我們將 Peng 等人的數據納入考量,平均勞動成本節約增加到 0.36,因此平均整體成本節約達到 0.193。
值得注意的是,2018年至2022年間,未經暴露度調整的平均(加權增值)勞動份額為0.576。這表明受人工智慧影響的任務大多集中在勞動份額略低於全國平均水平的產業。這一勞動份額估計與 Elsby 等人(2013)的研究結果相近,他們使用相同方法計算得出2010年至2012年非農私營企業部門的勞動份額為0.583。Elsby 等人的研究還顯示,即使採用其他納入自僱收入的方法,得到的數據也大致相似。
總體生產力增長:初步評估
我們可以將上一節得出的數據代入公式(14),對總體層面的生產力(TFP)增長進行初步評估。具體計算如下:
未來十年的 TFP 增長
未來十年受人工智慧影響的 GDP 佔比 × 受影響任務的平均成本節約。
根據上一節的數據,我們可以進行如下估算:
未來十年的 TFP 增長
0.046 × 0.144 ≃ 0.0066
換言之,這種基本估算方法顯示,未來十年人工智慧帶來的 TFP 增長約為0.66%。這意味著相較於沒有當前人工智慧和電腦視覺技術進展的基準情況,十年後的 TFP 將提高0.66個百分點,或者說年度 TFP 增長率將提高約0.064%。這雖然是一個不容忽視的影響,但仍屬溫和,遠低於一些人預測的革命性變化,也不及我在引言中提到的高盛和麥肯錫全球研究所預測的較為樂觀但仍屬實質的改進。
若採用 Peng 等人研究中較高的生產力數據,將0.144替換為0.193,則十年的 TFP 增長估算將達到0.89%,而非0.66%。
唯一能顯著改變這些數字的方法是提高未來十年受影響的任務比例。其中一種做法是誇大 Svanberg 等人的數據。這可能是因為生成式人工智慧(AI)與電腦視覺在可自動化任務比例上有所不同,或是這個比例在十年內會大幅上升。舉例來說,在 Svanberg 等人假設電腦視覺成本每年驟降 10% 的情境中,可自動化的任務比例可能高達 30%。這會使 AI 影響的國內生產總值(GDP)佔比提升至約 6%,相應地將未來十年的總體生產力(TFP)成長提高到約 0.9%。然而,即便如此,這個數字仍屬溫和,且每年 10% 的成本下降是相當樂觀的預估(因為即使 GPU 成本下降 10% 或 20%,考慮到程式設計、資料等其他投入,以及當前生成式 AI 架構的固有限制,也不會導致執行電腦視覺任務的成本下降 10%)。
最後,我要指出這些計算忽略了三個重要因素:
這些採用率數據忽視了美國企業界對 AI 的投資仍然極少的事實。Acemoglu 等人(2022)估計,2019年僅有1.5%的美國企業對 AI 有所投資,在製造業、資訊服務業和商業服務業以外的企業尤其如此。由於 Eloundou 等人(2023)考慮的許多任務是在中小企業中執行的,這種情況不太可能迅速改變。若生成式 AI 工具被少數公司壟斷,更可能減緩中小企業的採用速度。這表明,即使 0.046% 的 AI 影響 GDP 佔比可能已經是高估,實際數字可能更低。
任何重大技術在大規模採用時都會產生調整成本,因為其他組織層面也需要相應演變,這通常既昂貴又緩慢。在數位科技方面,Greenwood 和 Yorukoglu(1997)以及 Brynjolfsson 等人(2021)認為,生產力成長將呈 J 型曲線,前者預測數位科技的 J 曲線平緩期至少持續 20 年。若屬實,14.4% 的整體成本降低可能大大高估了未來 10 年的實際情況。
如前所述,Eloundou 等人(2023)列出的部分任務難以掌握,其生產力成長可能遠低於那些基於實驗研究、容易掌握的任務。
在下一小節中,我嘗試初步納入第三種可能性,但會忽略前兩種。儘管如此,這些考量使我得出結論,即使在未來十年內,人工智慧(AI)帶來的 0.66% 總要素生產力(TFP)增長可能已是這項技術中期效應的上限。
總體生產力收益:納入困難任務
在本小節中,我透過轉向方程式 (15) 來精進前一小節的估算,該方程式可以重寫為:
TFP 收益
受影響簡單任務的 GDP 佔比 × 簡單任務的平均成本節省
受影響困難任務的 GDP 佔比 × 困難任務的平均成本節省。
我採用 Noy 和 Zhang (2023) 以及 Brynjolfsson 等人 (2023) 的研究結果,將 27% 的勞動力成本節省應用於容易學習的任務。
前一節的討論顯示,大多數困難任務尚未受到影響或自動化,因此無法確知它們的成本節省程度。在這裡,我將這些生產力收益設定為 7%。我的理由如下:我認為 Peng 等人 (2023) 研究中涉及的任務對生成式 AI 來說相當容易學習,原因如前所述。Noy 和 Zhang (2023) 研究的任務也偏向簡單,導致約 40% 的成本節省,約為 Peng 等人成本節省的三分之二,而 Brynjolfsson 等人 (2023) 的客戶服務任務已趨向更複雜的範疇,這些任務的成本節省僅為 14%。我推測許多難以學習的任務對 AI 模型來說比 Brynjolfsson 等人研究中較簡單的客戶服務任務更具挑戰性。這促使我選擇他們研究中成本節省的一半,即 7%(這也約為我在上一小節使用的基準 27% 成本減少估算的四分之一)。
簡單和困難任務的成本節省數字再乘以 0.535 以轉換為整體成本節省——簡單和困難任務分別為 0.144 和 0.037。
為了獲得簡單和困難任務的佔比,我以 Eloundou 等人的資料和方法為基礎,然後開發一個程序,如同他們一樣使用 GPT-4 實施,將這些任務分類為簡單和困難。簡單任務的關鍵特徵是存在一個可觀察的結果和一個直接將行動或建議連結到問題特徵的簡單規則。
為實施這一程序,我從上述方法確定的 4,089 個受影響任務開始。這些任務中的每一個在 O*NET 上都有一個包含至少一個動詞的陳述。每個任務也歸屬於更高層次的詳細工作活動(DWAs)和(更粗略的)332 個中級工作活動(IWAs)。該程序分四個步驟進行:
動詞分類: 每項任務描述至少包含一個位於開頭且容易識別的動詞。這些主要動詞大致描繪了任務中「困難」或「容易」學習的部分。我們手動將任務分為簡單和困難兩類。完整的任務清單見附錄。舉例來說,簡單任務的動詞包括:計算、解決、計數、起草、評分、轉錄、分類、標準化、撰寫和記錄等。
(本步驟和本小節中的其他手動編碼工作由 Can Ye¸sildere 完成。)
這些動詞多與遵循明確步驟的簡單行為相關,且隱含有明確的成功衡量標準(如會計或評分)。相對地,困難任務的動詞包括:參與、建議、指導、診斷、教育、聘用、代表、作證和照顧。後者這組動詞描述的是較為開放式的活動,通常缺乏明確的成功衡量標準。而其他如分析、維護或檢查等動詞,則不屬於上述任一類別,被歸類為「不確定」。
中級工作活動(IWAs)的分類:IWAs 為動詞提供額外的情境背景,特別是針對單憑動詞無法充分描述的行為。我們手動將 332 個 IWAs 分類為簡單和困難任務。簡單 IWAs 的例子包括:評估專案可行性、維護銷售或財務記錄、解釋法規、政策或程序、簽發文件,以及向他人教授安全程序或標準等。困難的例子則包括:監測人類或動物的健康狀況、評估學術作品、評估資料的品質或準確性、維護安全,以及訓練動物等。這些例子再次印證了前面討論動詞時提到的原則——易於學習的活動通常具有明確的成功衡量標準和簡單的規則來達成目標,而難以學習的活動則缺乏這些特徵。
隱含狄利克雷分配(LDA)主題模型:儘管不同任務可能共用相同的 IWAs 和動詞,但每項任務的描述措辭都是獨特的,以反映其特定主題和更詳細的活動內容。例如,「撰寫審計報告」和「撰寫推薦信」雖然使用相同的動詞和 IWA,但所需的內容和技能卻大不相同。為了更精確地區分這些任務的背景,我們採用 LDA 將任務分群。LDA 是一種無監督的程序,它利用從每項任務描述中擷取的詞彙共現矩陣來對任務進行分群。該方法為每項任務分配一個屬於某個主題群組的機率(Blei et al., 2003)。我們將全部 19,281 項任務輸入演算法,使用 LDA 識別出 100 個群組,並計算每項任務屬於這 100 個群組之一的機率。
最後一步:我們的最終任務是計算每項暴露任務屬於容易或困難類別的機率。首先,我們從中隨機抽取 500 個樣本,並手動將其分類為容易或困難。接著,我們利用動詞分類、中級工作活動(IWAs)分類,以及從隱含狄利克雷分配(LDA)得出的機率,訓練一個梯度提升樹模型(Friedman, 2001),使其能夠匹配訓練樣本的手動分類結果。最後,我們運用這個演算法,為全部 4,089 個暴露任務分配了屬於容易或困難類別的機率。
根據 Eloundou 等人的研究,結果顯示 72.6% 的工資加權暴露任務屬於容易類別。這表示容易的暴露任務佔國內生產總值(GDP)的 3.3%,而剩餘的困難暴露任務則佔 GDP 的 1.3%。結合這些資訊和成本節省的假設,我們可以得出未來十年全要素生產力(TFP)增長的一個更精確的上限:
≃ 0.0053
這個結果比先前小節的估計更為保守,也更加合理。畢竟,自動化難以學習的任務,更不用說為它們創造互補性,將面臨更大的挑戰。無論如何,未來十年內的 TFP 增長看來都相當溫和。
從 TFP 到 GDP
根據人工智慧在未來十年對 TFP 的影響,我們可以利用方程式(13)計算出同期 AI 對 GDP 的總體影響。具體來說,這個方程式可以表示為:
未來十年的 GDP 增長 = 未來十年的 TFP 增長 + 資本份額 × 資本存量的比例增長。
作為一個簡單的基準,我們先假設資本存量的增長與 TFP 成正比,因此可以得出:
未來十年的 GDP 增長 = 未來十年的 TFP 增長 /(1 − 資本份額)。
舉例來說,該演算法將「維護設備服務記錄」歸類為簡單任務的機率高達 0.98,而「透過電話或面對面面試信用卡申請人」被視為簡單任務的機率僅為 0.098。由於寫作和起草被歸類為與簡單任務相關的動詞,因此涉及寫作的活動通常被認為是簡單的。然而,這可能低估了某些寫作相關任務的難度。例如,「撰寫報告或學術論文以傳達氣候相關研究結果」被歸類為簡單任務的機率為 0.67,這可能低估了在可預見的未來 AI 執行此類任務的實際難度。
以整個私營企業部門的資本份額 0.43 為基準,這意味著 GDP 增長將等於 TFP 增長乘以 1.75(≃ 1/(1 − 0.43))。因此,根據 TFP 增長 0.66% 的基準估計,AI 對 GDP 增長的初步估計為 10 年內 1.16%,若考慮到困難任務的存在,較保守的估計則為 0.93%。
在第 3.6 節中,當我對跨任務和跨行業的替代模式以及由此產生的投資反應進行建模時,將會更新 AI 進展對 GDP 的影響評估。
新增不良任務的影響
迄今為止的計算並未考慮 AI 引入的新任務所帶來的影響(這與 AI 可能在某些企業中實現的系統性調整相當,正如 Bresnahan (2019) 和 Agrawal et al. (2023) 所強調的)。要量化新任務的影響更具挑戰性。如果 AI 有助於創造能提高生產力的新任務,特別是有助於將不同技能水平的勞工重新納入生產流程,其影響可能會更加正面。
在此,我的目的僅是指出,就 AI 而言,由於某些新任務可能屬於「不良」類型,當我們單純從 GDP 數字來看時,可能會高估 AI 帶來的福利增長。為了初步論證這一觀點的重要性,我將借鑒兩個數據來源。
首先,Bursztyn 等人(2023)最近的研究為我們提供了一個具有啟發性的估算,揭示了社交媒體所帶來的問題程度。該研究針對大學生群體——最活躍的社交媒體使用者——進行了一項實驗,評估社交媒體對其效用的影響。研究人員詢問 TikTok 和 Instagram 用戶,需要多少補償才願意一個月不使用這些平台。結果顯示,用戶願意每月支付最高 59 美元(TikTok)和 47 美元(Instagram)來繼續使用這些平台,平均每位用戶每月為 53 美元。
然而,研究也發現,用戶願意每月支付 28 美元(TikTok)和 10 美元(Instagram)讓其社交圈內的所有人停止使用這些平台,平均每位用戶每月為 19 美元。若將非用戶納入分析,阻止所有人使用社交媒體的支付意願更上升至每月 47 美元(TikTok)和 13 美元(Instagram)。這表明,儘管人工智慧驅動的社交媒體平台可以為公司帶來利潤,但其對整體社會福祉的「淨影響」可能是負面的。在量化分析中,我們忽略了非用戶的影響(因為研究對象是大學生,即使不使用社交媒體,他們也比一般成年人更容易受到社交媒體活動的影響)。
在基準情況下,我們假設人工智慧驅動的平台能夠通過靈活調整數據收集和變現強度來實現差別定價,從而捕獲用戶全部(平均)53 美元的支付意願。取兩個平台的平均值後,我們得出結論:每 53 美元的收入會對用戶產生 19 美元的淨負面影響。換言之,這類新興「不良任務」的總體影響(相當於理論模型中的第18項)在比例上約為 -35.85%(≃ -19/53)。值得注意的是,如果假設社交媒體公司每位用戶每月實際獲得的收入少於 53 美元,那麼這個比例的分母將會更小,因此每美元收入所造成的比例損害將會更高。
我將 −0.36 這個數值與社群媒體和數位廣告的收入,以及惡意 IT 攻擊和相應的 IT 安全支出估算相結合,以計算新興不良任務的表面和實際收益。具體而言,2022 年 Meta(Facebook 和 Instagram)、Alphabet(Google 和 Youtube)、Snapchat、TikTok 和 Twitter("X")的總收入達 4,600 億美元,約佔美國 GDP 的 1.64%,而 IT 安全支出的下限為 780 億美元,佔美國 GDP 的 0.28%。假設惡意行為者在 IT 攻擊上的支出至少是這個數字的三分之一,綜合這三項估算,我得出的結果是美國 GDP 的 2%。這個數字可能大幅低估了新 AI 技術所衍生的其他操縱活動。另一方面,它也可能誇大了問題,因為只有部分數位廣告收入來自這類操縱活動(這點在 Google 搜尋的數位廣告收入上可能特別明顯)。因此,這裡的數字應該僅被視為參考性質。
以美國 GDP 的 2% 作為新興不良任務的收入,並運用 Bursztyn 等人(2023)的研究數據,可以推算出這些操縱活動的總負面影響為 GDP 的 0.02 × 0.36 = 0.072%(以消費等值單位計)。這個數字顯示了相當顯著的負面福利影響,若生成式 AI 的操縱性使用變得更加普及,這個影響可能會更大。相較之下,如果僅計算這些新任務帶來的收入,可能會得出它們將使 GDP 增加 2% 的結論。因此,這個討論提醒我們,在解讀所有來自生成式 AI 使用所帶來的 GDP 增長時應當謹慎,不應將其全部視為對消費者福利的正面影響。
Meta(1,300 億美元)、Alphabet(3,070 億美元)和 Snapchat(46 億美元)的數據來自這些公司 2023 年的 10K 報告。《財富》雜誌於 2023 年 12 月 12 日報導,X 在 2023 年的年收入為 25 億美元,而《金融時報》於 2024 年 3 月 15 日報導,TikTok 美國業務的收入已達到每年 160 億美元(參見《財富》和路透社報導)。
相關數據可參考 Statista。
35
薪資和不平等影響
最後,我評估生成式 AI 進展對薪資和不平等的影響。為此,需要擴展現有框架,納入在不同任務中具有不同比較優勢的多個人口群體,如 Acemoglu 和 Restrepo(2022)所述。為節省篇幅,我不在此詳述這種擴展,請讀者參考該文章。相反,我從他們文章中的以下方程式開始,這是前文(11)式在多部門和多人口群體設定下的推廣(但為簡化起見,未考慮任務互補性和勞動力增強變化):
d ln wg = Θg · 1d ln y + σ σ 1d ln ζ − σ 1d ln Γauto
在這個模型中,g 代表特定人口群體。根據相關研究,我們關注 500 個不同的人口群體,這些群體根據教育程度、年齡層、性別、族裔以及是否為本地出生來區分。模型中,d ln y 表示因技術變革而導致的 GDP 變化(反映生產力效應),σ 代表任務間的替代彈性,而 ζ 則是產業轉移向量(例如,某產業中任務自動化會影響價格,進而導致各部門間支出重新分配)。最關鍵的是,d ln Γauto 代表技術衝擊造成的各人口群體替代程度—它是一個包含 500 個項目的列向量。Θg 是傳播矩陣中第 g 列的向量,概括了其他人口群體被替代如何影響特定群體 g(這就是為何它要與所有群體的產業轉移和替代向量相乘)。
傳播矩陣呈現了完整的「漣漪效應」—即一個人口群體被替代後對其他群體的連鎖影響。當某群體離開原有工作崗位,轉而與其他群體競爭新的工作機會時,這種重新分配效應就會發生。這是為何某群體的直接生產力提升反而可能最終傷害該群體的關鍵機制(如前文所舉例說明)。同時,這也解釋了為何某一群體被替代可能對另一群體造成更大傷害。
Acemoglu 和 Restrepo(2022)估算的漣漪效應可能具有特定背景—意味著這些效應的強度可能與我先前研究中關注的 AI 和自動化技術所影響的任務有顯著差異。儘管如此,由於無法準確估算生成式 AI 技術未來影響的漣漪效應,我將採用這些現有的估算數據。
高中以下
高中畢業
大學肄業
大學畢業
研究所以上
8
7
6
5
4
可能的 AI 影響程度 (%)
3
2
1
0
$10
$13.3
$17.8
$23.7
$31.6
$42
$57
2018-2022 年平均時薪(對數刻度,以 2020 年美元計)
註解:本圖呈現了 500 個人口群體受 AI 影響的程度(包括簡單和複雜任務)。橫軸顯示每個群體在 2018 至 2022 年間的平均時薪,數據來源為美國社區調查五年樣本。圖中標記大小與各群體 2018-2022 年的平均就業人數成正比,不同顏色則代表該群體的教育程度。
另一個值得關注的問題是,迄今為止,我在評估人工智慧(AI)的影響時,同時考慮了自動化和任務互補性這兩個面向。在這個小節中,我將暫時擱置任務互補性,假設所有量化的AI影響都將以自動化的形式呈現。
我採用了Acemoglu和Restrepo(2022)的研究方法,從人口統計群體層面的d ln Γauto向量著手。為了建構相應的衡量指標,我選取了一組受AI影響的職業,然後利用不同人口統計群體在這些職業中的工資佔比,將AI造成的勞動力替代效應映射到人口統計群體層面。舉例來說,如果某個人口統計群體g在2019-2022年間有5%的工資來自全面受AI影響的職業,那麼該群體的d ln Γgauto值就是0.05。我還利用工資佔比將這些職業分配到不同產業,以計算AI對各產業成本和價格的影響。至於產業間的資源重新分配,我採用了與Acemoglu和Restrepo(2022)相同的計算方法,使用了他們對產業間替代彈性的參數設定。
如果存在任務互補性,它會提高受影響群體在剩餘子任務中的生產力,但同時也會相應減少自動化帶來的成本節省。假設任務互補性和自動化對同一職業內不同人口統計群體的影響是對稱的,那麼對研究結論的影響應該不大:儘管任務互補性帶來的生產力提升對工資的影響與自動化產生的成本節省略有不同(Acemoglu和Restrepo,2022),但整體結果應該大致相似。然而,如果某些群體從任務互補性中獲益更多(例如,因為他們在中等專業水平的勞動者中佔比較高,而這些勞動者可能從生成式AI工具中獲得最大收益),那麼分配結果可能會有顯著差異。由於我目前無法區分任務互補性和自動化各自的生產力效應,因此無法進一步探討這個問題。
本研究使用了與Acemoglu和Restrepo(2022)相同的49個美國經濟分析局(BEA)產業分類。
我採用了Humlum(2021)研究中σ = 0.50的估計值,並假設消費中產業間的替代彈性η = 0.2,這與Buera等人(2022)的研究一致,也是Acemoglu和Restrepo(2022)所採用的數值。
圖1對應於Acemoglu和Restrepo(2022)研究中的圖5b,呈現了AI影響程度在按2018-22年時薪排序的人口統計群體中的分布情況。結果顯示,相較於AI出現前的自動化技術(主要基於機器人、專用先進機械和軟體系統),AI的影響在不同人口統計群體間的分布更為平均。
該表格呈現了七個行,分別代表五個教育程度群體(根據教育水平匯總的人口統計群體)、整體勞動力平均水平和GDP。第一欄顯示了每個人口統計群體的人工智慧(AI)曝險度,採用了我們不區分簡單和困難任務的基準曝險度測量方法。第二欄呈現了AI曝險度對這些群體的直接影響,第三欄則包含了考慮產業間誘導替代和連鎖效應後的完整工資影響。接下來的四欄採用了區分簡單和困難任務的AI曝險度測量方法,其中第四欄為簡單任務的曝險度,第五欄為困難任務的曝險度。最後,第八欄呈現了Acemoglu和Restrepo(2022)的曝險度測量結果以作比較(請注意,該測量結果涵蓋36年期間,而非本研究的10年時間尺度)。比較第一欄、第四至五欄與第八欄的結果,證實了AI曝險度在各人口統計群體間的分布比AI出現前的自動化曝險度更加均勻。教育程度低於高中的勞工曝險度最低,其次是研究生,而大學學歷和副學士學位或曾就讀大學的勞工曝險度最高。
因此,預測的工資影響似乎不會對教育群體間的不平等產生顯著影響。聚焦於第七欄的估計結果(包含簡單和困難任務),教育程度低於高中的勞工工資增長略高——10年內約1.3%——但研究生與高中畢業生和大學畢業生之間的差距也略有擴大。事實上,群體間對數工資的標準差(按就業加權)略有增加,從0.35上升到0.36。第三欄中採用基準AI曝險度測量方法的結果也相當類似。
表 1:各教育群體的人工智慧曝險度與工資效應
註:本表彙整了人工智慧曝險度對不同教育群體及整體勞工實質工資的影響。前三欄採用不區分簡單和困難任務的人工智慧曝險度測量方法,第 4 至 7 欄則引入此區分。第 1、4 和 5 欄呈現各分類的人工智慧曝險度水平。第 2 和 6 欄顯示人工智慧曝險度的直接效應,第 3 和 7 欄則包含了考慮連鎖效應後的整體均衡工資影響。第 8 欄提供 Acemoglu 和 Restrepo(2022)1980-2016 年間直接任務置換的測量結果作為比較。各列代表不同教育程度群體、平均勞工及整體 GDP 的影響。傳播矩陣估計值涵蓋 1980-2016 年,參照 Acemoglu 和 Restrepo(2022)表 8 第 2 欄的報告。
圖 2:生產力效應、產業轉移、直接置換效應及連鎖效應的分解
A. 生產力效應 B. 加入產業轉移 C. 加入直接置換 D. 加入連鎖效應
教育程度: 低於高中 高中畢業 大學學歷 研究所以上
橫軸:2018-2022 年每小時工資(對數尺度,以 2020 年美元計)
註:本圖依據 Acemoglu 和 Restrepo(2022)的傳播矩陣估計,並結合本研究中對簡單和困難人工智慧任務的曝險度測量。第一個面板呈現純粹的生產力效應。第二個面板加入人工智慧曝險導致的產業轉移。第三個面板納入直接置換效應,最後一個面板則加入連鎖效應。橫軸顯示各人口群體 2018 至 2022 年的平均時薪,數據來自五年期美國社區調查。圖中標記大小與各群體 2018-2022 年的平均就業人數成正比,不同顏色代表教育程度。詳細說明請參閱正文。
最後,第 7 列呈現了對 GDP 的影響估計,考慮了模型中隱含的資本存量均衡增長。這假設所有資本存量調整將在 10 年內完成(實際可能需更長時間),且資本投資所需報酬率維持不變(大規模投資可能導致報酬率上升)。結果顯示,區分簡單和困難任務時,GDP 的最大增幅為 1.4%(不作此區分時為 1.56%)。因此,GDP 增長遠超平均工資,導致資本佔國民收入的比例上升約 0.31 個百分點。這證實了人工智慧的普及可能加劇資本與勞動之間的不平等。
32 然而,值得注意的是,對消費者福利而言,真正關鍵的是全要素生產力(TFP)的增長,因為額外投資來自消費,且可能涉及大量額外能源使用,如附註 6 所述。
0.025
0.020
0.015
0.010
0.005
0.000
0.005
0.010
0.025
0.020
0.015
0.010
0.005
0.000
0.005
0.010
低於高中學歷 高中畢業 部分大學學歷 大學畢業 研究所以上
註:本圖基於 Acemoglu 和 Restrepo(2022)1980-2016 年的傳播矩陣估計,並結合本研究中對簡單和困難人工智慧任務的曝險度測量。每個面板包含五個教育群體的工資效應估計。報告的數值為更詳細子群組估計值的加權平均(以 2018-2022 年平均就業人數為權重)。左上面板為本地出生白人男性,左下為所有其他男性,右上為本地出生白人女性,右下為所有其他女性。
Acemoglu 和 Restrepo(2022)的研究中,圖 7 著重分析了簡單和困難任務的人工智慧影響程度。研究發現,生產力效應在各群體間大致相同,且跨產業的變化並未導致顯著的不平等。值得注意的是,人工智慧的直接影響在不同人口群體和薪資分佈中較為均勻。與 Acemoglu 和 Restrepo(2022)的研究不同,本次分析顯示連鎖效應並未大幅改變不平等模式,主要是因為直接影響已相當均勻。然而,研究也發現低教育程度群體的經歷差異較大,導致群體間的薪資差距擴大。進一步分析顯示,低教育程度的女性,尤其是本地出生的白人女性,可能面臨實質薪資下降的風險。
結語與討論
ChatGPT 自 2022 年 11 月 30 日推出以來,迅速成為史上擴散最快的科技平台,短短兩個月內即吸引約 1 億月活躍用戶。其卓越的功能,加上 2023 年 3 月發布的更強大版本 ChatGPT-4,迅速吸引了公眾和經濟專家的關注。目前,預測大幅提升生產力的言論已屢見不鮮。
無可否認,包括 ChatGPT 在內的生成式人工智慧模型已取得令人矚目的成就,並有望帶來可觀的經濟效益。然而,其對總體經濟的實際影響程度仍有待觀察。
人工智慧技術在中期可能對總體經濟產生四種潛在影響:
人工智慧技術對經濟可能產生四種潛在影響:
全面革新經濟各個層面,大幅提升生產力,甚至使我們接近「奇點」。儘管這種可能性不能完全排除,但目前尚無實際證據支持此類革命性影響(Nordhaus,2021)。本文不探討這類影響。
在多項任務中提高生產力並降低成本,對總體經濟帶來相對溫和但仍顯著的影響。部分預測著重於這類改進,並得出相當可觀的數字,例如預估在十年內每年經濟成長率可提高 1.5 至 3.4 個百分點。
因自動化效應而影響薪資和不平等現象,或反之導致薪資大幅上漲,特別是對低薪勞工而言,如《經濟學人》(2023)所預測。
透過製造深度偽造、假訊息、操縱等負面因素影響總體經濟。
本文採用 Acemoglu 和 Restrepo(2018, 2019b, 2022)的任務基礎框架來評估第二和第三種影響,並嘗試在此框架下形式化第四種影響的運作機制。研究方法建立在現有實驗研究的基礎上,這些研究估算了在多種情境下使用生成式人工智慧工具所帶來的生產力提升和時間節省。藉由參考這些研究,本文明確採納了生成式人工智慧將提升生產力的觀點。
然而,將這些數據與 Eloundou 等人(2023)和 Svanberg 等人(2024)對受影響任務的估計相結合,得出的生產力影響遠低於多數評論家和經濟學家迄今的預測。考慮到許多已證實可節省成本的任務對人工智慧來說相對容易,而其他任務中人工智慧的整合將面臨更大挑戰——主要是因為這些任務可能涉及行動和脈絡間更複雜的互動,且缺乏明確可觀察的成功指標,因此需要人工智慧模型從先前執行相同任務的人類(平均)行為中學習——這些數字就變得更小了。
考量上述因素,我估計未來十年內,人工智慧進展對全要素生產力(TFP)的影響將相對有限。若不區分困難和簡單任務,其上限約為十年內總增幅百分之零點六六,或年均 TFP 成長增加約百分之零點零六四。若考慮到部分受人工智慧影響的任務較為複雜,這個上限則降至約百分之零點五三。由於自動化和任務互補性將帶動更多投資,對國內生產毛額(GDP)的影響會稍大。然而,我的計算顯示,未來十年內 GDP 的提升仍將相對溫和:若人工智慧引發的投資增長適中,十年內總增幅約為百分之零點九三至一點一六;若出現大規模投資潮,則可能達到百分之一點四至一點五六。
人工智慧若用於創造新任務和產品,固然可增加 GDP 並可能提升生產力成長。但當我們考慮到人工智慧生成的新任務可能具操縱性時,其對社會福利的影響可能更為有限。根據 Bursztyn 等人(2023年)關於人工智慧驅動社群媒體負面影響的研究數據,我針對社群媒體、數位廣告和資訊科技攻防支出進行了示例性計算。這些領域可能為 GDP 貢獻高達百分之二的成長,但若套用 Bursztyn 等人的數據,其對社會福利的影響可能為負百分之零點七二。這凸顯了我們必須審慎考量人工智慧所創造的新任務和產品對社會福利可能造成的負面影響。
最後,我大量參考了 Acemoglu 和 Restrepo(2022年)對人工智慧之前自動化技術在整體經濟中對生產力、薪資和不平等影響的估算,藉此推估新一波人工智慧進展的影響。由於可被人工智慧應用的任務在人口中分布較為均勻,相較於先前的自動化技術,我並未發現任何教育程度群體會遭受顯著的負面薪資影響。然而,這些估算也未顯示不平等現象會明顯改善。事實上,我的研究發現,低教育程度的女性可能面臨輕微的薪資下降,整體群體間的不平等可能略有上升,而資本與勞動收入之間的差距可能進一步擴大。
這些研究結果並不意味著人工智慧(AI)沒有重大效益。首先,在10年內全要素生產力(TFP)增加約0.53-0.66%,雖然幅度不大,但絕非微不足道。其次,更為重要的是,人工智慧可能透過其他方式帶來更顯著的效益。我在先前的研究中(Acemoglu,2021;Acemoglu和Restrepo,2020b)曾指出,若將人工智慧用於為勞工創造新任務,可能在生產力、薪資和縮小不平等方面產生更有利的結果,甚至可能提高薪資水平。這一論點對於生成式人工智慧尤其適用,因為它可以為勞工提供更優質的資訊並提升其專業知識,如Acemoglu等人(2023)所論證且本文將簡要說明的那樣。
目前,許多生產工作者,包括電工、維修人員、水管工、護理師、教育工作者、文書人員,以及越來越多的工廠藍領工人,都從事問題解決任務。這些任務需要即時、因應情境且可靠的資訊。舉例來說,當電工處理先進設備故障或電網短路時,由於缺乏足夠的專業知識和適當的故障排除資訊,往往難以解決這些問題。生成式人工智慧工具能夠迅速提供可靠資訊,可望大幅提升生產力。同樣地,將生成式人工智慧引入教室可能徹底改革教學方式,實現更高程度的個人化教學。這些工具可協助教師識別學生群體在特定課程內容上遇到的困難,並提出新的、因應情境的教學策略。人工智慧模型的可靠性將是成功創造此類新任務和提升教育品質的關鍵。
過去,電力和網際網路等變革性技術帶來的新任務和新產品,大幅提升了生產力。然而,這類進步並未納入我的估算中,主要有三個理由。首先,這類進步難以量化,且不在 Eloundou 等人(2023年)和 Svanberg 等人(2024年)研究的範疇內。其次,也是更關鍵的是,我認為目前不應將這些因素納入可能的總體經濟效應中。正如 Acemoglu(2021年)、Acemoglu 和 Restrepo(2020年b)以及 Acemoglu 和 Johnson(2023年)所指出的,這些並非當前產業關注的重點。相反,科技業似乎更專注於自動化和個人資料變現,例如透過搜尋引擎或社群媒體的數位廣告。這使得短期內難以創造出大量優質的新任務。第三,如 Acemoglu 和 Johnson(2023年)以及 Acemoglu 等人(2023年)所建議的,要實現更有益的成果,可能需要建立新的制度、政策和法規。
我認為,生成式人工智慧確實蘊含更大的潛力,是一項極具前景的技術。然而,若要充分發揮其效益,產業必須進行根本性的轉型。這可能包括對常見的生成式人工智慧模型(如大型語言模型)進行重大的架構調整,將重點從開發通用的人機對話工具,轉向提供可靠資訊,以提高各類工作者的邊際生產力。目前生成式人工智慧的通用特性,可能不適合提供這種可靠的專業資訊。簡而言之,如果我們的目標是為教育工作者、醫療專業人員、電工、水管工和其他技術工人提供可靠且實用的資訊,那麼我們是否真的需要能夠進行擬人對話並創作莎士比亞風格十四行詩的基礎模型(或現有類型的大型語言模型),這個問題仍有待商榷。
Daron Acemoglu 在《波士頓評論》2021 年發表的〈人工智慧的未來不必是反烏托邦〉一文中探討了人工智慧發展的樂觀前景。
David Autor 於 2011 年在《勞動經濟學手冊》中發表的研究,深入分析了技能、任務和技術對就業和收入的影響,為後續研究奠定了基礎。
Pascual Restrepo 在 2018 年發表於《美國經濟評論》的文章中,探討了人機競爭如何影響經濟增長、要素分配和就業狀況。
2019 年,多位學者在《人工智慧經濟學:議程》一書中,全面探討了人工智慧、自動化對勞動市場的影響。同年,Journal of Economic Perspectives 刊登的研究進一步闡述了自動化如何取代和重塑勞動力。
2020 年的研究則聚焦於機器人對美國就業市場的實際影響,以及人工智慧對未來勞動力需求的潛在效應。
2022 年至 2023 年的研究更深入探討了自動化對工資不平等、生產力和社會福利的影響。
Simon Johnson 的著作《權力與進步》回顧了人類與技術和繁榮的千年互動史。
近期研究包括 David Autor 等人探討支持勞工的人工智慧可能性,以及對自動化在企業層面影響的分析。
Martin K. Jensen 和 Pascual Restrepo 正在進行的研究聚焦於技術對長期工資的影響。
Ajay Agrawal 等人則探討了人工智慧的採用如何帶來系統性變革。
David Autor 最新的研究提出了運用人工智慧重建中產階級工作的構想。
Caroline Chin 等人即將發表的研究回顧了 1940 年至 2018 年間新興工作的起源和內容。
Frank Levy 和 Richard J Murnane 早在 2003 年就對近期技術變革的技能需求進行了實證研究。
最後,Tamay Besiroglu 和 Marius Hobbhahn 的技術報告分析了 GPU 價格效能的發展趨勢,反映了人工智慧硬體基礎的演進。
這些研究共同構建了一個全面的學術框架,有助於我們理解人工智慧和自動化如何重塑勞動市場、影響經濟增長,並帶來深遠的社會變革。
本文列舉了一系列探討人工智慧、經濟成長及勞動市場變遷的重要學術論文與研究報告。這些文獻橫跨2001年至2024年,反映了學界對人工智慧及相關科技如何影響經濟與社會的持續關注。
主要研究主題包括:
機器學習技術,如潛在狄利克雷分配和梯度提升機等演算法
人工智慧對經濟成長的影響評估
生產力與科技進步間的關聯
勞動市場的結構性變化,包括技能需求偏向和勞動份額變動
社群媒體對經濟的影響
大型語言模型(GPTs)可能對就業市場造成的衝擊
機器人技術的應用及其效應
邁向通用人工智慧(AGI)的發展前景與可能情境
這些研究來自眾多知名學術機構、研究組織和顧問公司,如國家經濟研究局、麥肯錫公司、高盛等,涵蓋理論分析、實證研究和前瞻性預測。
整體而言,這份文獻清單提供了一個全面的視角,有助於讀者深入了解人工智慧和自動化科技如何形塑現代經濟,以及可能對未來產生的深遠影響。這些研究不僅探討了技術本身,更著重於其對社會經濟結構的廣泛影響,為政策制定者、企業領袖和研究人員提供了寶貴的洞見。
線上附錄
A-1 任務受人工智慧影響的比例
Eloundou 等人(2023)基於 ONET 資料庫提出了任務層級的影響評估。ONET 按八位數標準職業分類(SOC)列出各職業的任務。我們將這些資料與美國勞工統計局(BLS)2019 年至 2022 年的職業就業和薪資統計(OEWS)連結,以計算經濟中受人工智慧影響任務的薪資加權比例。BLS OEWS 資料以六位數 SOC 層級報告,我們按以下方式整合這兩個資料來源:
2. 匯總至五位數:
接著,我們將六位數 SOC 職業匯總到五位數。對於同時包含有受影響程度估計和 BLS OEWS 薪資資訊的六位數職業的五位數職業,我們計算六位數職業的薪資份額加權平均值。這種加權方式確保了在匯總到五位數時保留六位數層級的詳細資訊。由於 BLS OEWS 不報告某些小型職業的薪資資訊,因此對於部分五位數職業,我們無法直接配對到具有受影響程度和薪資資料的六位數職業。在這種情況下,我們通過計算所有相應具有受影響程度資料的六位數職業的簡單平均值來估算五位數層級的受影響程度。這些步驟共同涵蓋了經濟總薪資的 99.3%。剩餘的五位數職業,佔薪資的 0.7%,在 Eloundou 等人(2023)的研究中沒有相關資訊,我們假設其不受人工智慧影響。這個匯總後的職業受影響程度指標用 Γ0 表示。
A-2 產業勞動份額和受人工智慧影響調整後的勞動份額
產業層級受人工智慧影響的程度 Γ 是按照 Eloundou 等人(2023)使用的方法計算,利用產業層級的職業分佈和職業受影響程度資料。
具體而言:
Γi = Σo Γo ποι,其中 Γo 是職業 o 受人工智慧影響的程度,而 ποι 是產業 i 中職業 o 的就業人數比例,這些資料來自 BLS OEWS。
非農私營企業的勞動收入份額通常以下列方式計算:sL = Σi∈I siY siL,Σi∈I siY,其中 siY 代表產業 i 的附加價值在非農私營部門 GDP 中的比重,siL 則是產業 i 的勞動附加價值份額。參照美國勞工統計局(BLS)和 Elsby 等人(2013)的方法,我們根據同產業受僱員工的平均時薪和自僱者的工作時數來估算自僱收入。由於工作時數數據僅在美國經濟分析局(BEA)提供的 14 個 NIPA 總體產業層級上可得,因此本研究僅涵蓋這 14 個產業。2018-2022 年間的勞動份額估計為 0.576,與 Elsby 等人(2013)使用相同方法對 2010-2012 年的估計相近。他們還報告了一個稍高的數值 0.593,這是基於另一種假設受僱員工和自僱者使用的資本隱含報酬率應相同的方法得出的。
考慮曝光度調整後的勞動收入份額 ˆL 計算如下:sˆL = Σi∈I ΓssYiL.iiY 是 Σi∈I Γi。這與先前計算的勞動份額 sL 的唯一區別在於加入了產業曝光程度 Γi 的調整,結果略低於 sL,為 0.536。
具體而言,我們採用了 BEA 提供的 2018-2022 年 NIPA 表格第 6 節的平均數據。工資與薪資數據來自表 6.2,產業附加價值來自表 6.1,自僱人數來自表 6.7,受僱員工工時來自表 6.9,公司稅收來自表 6.18。此外,我們依循 BLS 的做法,運用現行人口調查(CPS)來估算這 14 個產業中每個產業自僱者的每週工作時數。
這 14 個 NIPA 產業包括:(1)農林漁獵業,(2)礦業,(3)公用事業,(4)營建業,(5)製造業,(6)批發業,(7)零售業,(8)運輸及倉儲業,(9)資訊業,(10)金融、保險、不動產、租賃業,(11)專業及商業服務業,(12)教育服務業、醫療保健及社會救助業,(13)藝術、娛樂、休閒、住宿及餐飲服務業,以及(14)其他服務業(政府除外)。
簡單和困難任務
本文概述了分類「易學」(或「簡單」)和「難學」(或「困難」)任務的方法。以下提供更多細節。
我們以 Eloundou 等人的曝光度量為基礎,聚焦於任務的三個特徵:(i)主要動詞,(ii)重要工作活動(IWAs),以及(iii)由潛在狄利克雷分配(LDA)編碼的主題群集。
主要動詞:
O*NET 資料庫中的每項工作任務都有一個以至少一個動詞開頭的描述。這些「主要」動詞不僅能反映任務的性質,還能顯示該任務透過人工智慧自動化的難易程度。舉例來說,表示可客觀測量結果的動詞(如計算或量化),或涉及可預測規則且易於對應結果的動詞(如估計),往往與較容易自動化的任務相關。
我們手動將這些動詞分為簡單、困難和不確定三類。不確定類別包括難以明確分類的動詞,或同時涉及簡單和困難元素的動詞(這時上下文就顯得尤為重要,下文會詳述)。完整的動詞列表及其分類可在研究複製包中查閱,而最常見的困難和簡單動詞則列於本附錄的表 A-1 中。
中級工作活動:
ONET 中的每項任務都屬於一個層級結構,並與至少一個詳細工作活動(DWA)相關聯,DWA 是對任務的概括描述。每個 DWA 又至少與一個更高層級的中級工作活動(IWA)相關。ONET 總共包含 19,264 項任務和 332 個 IWA。雖然動詞能反映某項行為是否會產生可預測的結果,但 IWA 則提供了判斷結果可觀察性的上下文。例如,「解釋」這個動詞在向小學生講授關鍵概念時可能屬於難學類別,但在說明客廳遊戲規則時則可能屬於易學類別。考慮到這種上下文差異,我們手動將每個 IWA 分類為簡單或困難。研究複製包中也包含了 IWA 分類的詳細清單。
主題群集:
我們還運用了另一種無監督學習演算法——潛在狄利克雷分配(LDA)演算法(Blei 等人,2003年)——來確定概率主題群集。這些主題群集為演算法提供了額外的上下文層面。我們將 LDA 演算法應用於所有 19,264 項任務,生成了 100 個主題群集。LDA 演算法利用任務描述中的詞語共現情況,來確定每項任務屬於各個主題群集的概率。
我們將這三個步驟的輸出結果應用於我們的監督式學習模型,這是一個梯度提升分類器(GBC)(Friedman, 2001)。GBC 通過反覆生成分區來最大化訓練集的擬合度。我們從 4,089 個暴露任務中手動分類了 757 個來建立訓練集。GBC 為這 757 個任務產生最佳擬合,然後我們獲得分類器對剩餘任務的輸出結果。GBC 的輸入包括:動詞分類、中級工作活動(IWA)分類,以及來自潛在狄利克雷分配(LDA)的 100 個主題群集的機率分布。此外,我們還向 GBC 提供每個動詞與簡單或不確定任務相關聯的經驗頻率(以困難任務為省略類別),以及每個 IWA 在我們的訓練資料中與簡單任務相關聯的經驗頻率。這些資訊很有價值,因為它提供了每個動詞和 IWA 被分類的確定性程度的實證測量(類似於貝氏計算中的先驗概率)。當一個任務有多個主要動詞時,我們取這些動詞的平均值。
GBC 的擬合度相當理想。它與我們訓練資料的手動分類匹配度達到 90%,並且有 0.99 的曲線下面積(AUC)分數。作為輸出,我們計算每個任務易於學習或難以學習的機率。在計算調整後的總要素生產力(TFP)分數時,我們根據暴露程度(按照 Eloundou 等人的方法)乘以機率分數來權衡每個任務,以獲得經濟中易於學習任務的比重。有關 GBC 和訓練樣本的更多細節可在研究複製包中查閱。
最後,值得注意的是,由於 GBC 演算法僅在暴露任務上進行訓練和測試,其輸出結果對這個樣本最具意義。舉例來說,對於在這個樣本中缺失或罕見的動詞,它將無法提供有意義的分類。因此,其輸出不應直接推論到非暴露任務。此外,由於 Eloundou 等人的樣本已經針對暴露任務,我們預期這些任務中易於學習的比例會高於整體任務集。事實上,正如正文中所報告的,在這個樣本中,約四分之三的工資帳單加權暴露任務被歸類為易於學習。
A-4 工資和不平等計算
為了估算人工智慧對工資結果的一般均衡影響,我採用了 Acemoglu 和 Restrepo (2022)的研究方法。
表 A-1:動詞作為易於或難於人工智慧學習的手動分類
表 A-1:人工智慧學習動詞難易度的手動分類
指導 (325)
倒 (19)
監督 (275)
刮 (18)
清潔 (270)
餵食 (16)
選擇 (223)
照顧 (11)
參與 (197)
陪伴 (11)
修理 (174)
旅行 (10)
建議 (161)
指導 (10)
訓練 (156)
談話 (8)
指導 (110)
釘 (8)
研究 (105)
錘擊 (7)
驗證 (98)
懸掛 (7)
諮詢 (97)
倡導 (7)
出席 (94)
感覺 (7)
教導 (93)
監督 (57)
談判 (56)
診斷 (54)
呈現 (50)
拆解 (40)
輔導 (39)
開處方 (36)
教育 (31)
雇用 (31)
訪問 (28)
代表 (21)
作證 (20)
巡邏 (19)
---
本研究聚焦於 500 個人口統計群組,這些群組根據以下特徵定義:
五個年齡組
白人、黑人、亞裔、西語裔及其他
未完成高中、高中畢業、部分大學學歷、學士學位和研究所以上學位
本地出生或外國出生
我們採用 2018-2022 年美國社區調查五年期數據來確定工人的時薪,並依循 Acemoglu 和 Restrepo (2022) 的方法進行離群值處理。
傳播矩陣 Θ 的估算直接取自 Acemoglu 和 Restrepo (2022) 的研究,涵蓋 1980 年至 2016 年間機器人、軟體和專用機械的影響。我們採用他們基於產業勞動份額下降的任務替代估計,這些數據見於 Acemoglu 和 Restrepo (2022) 線上附錄表 A-X 的第一欄。傳播矩陣計算了 1980-2016 年間產業、職業和年齡教育群組之間的總體溢出效應。與 Acemoglu 和 Restrepo (2022) 的研究唯一不同之處在於,我們輸入的是人工智慧暴露及其對總要素生產力的影響,而非他們論文中 1980-2016 年間其他技術相關的自動化影響。
量化影響的計算採用固定點迭代演算法,解決以下一組方程式,如 Acemoglu 和 Restrepo (2022) 命題 4 所述:
d ln wg = Θg · 1d ln y + σ σ 1d ln ζ − σ 1d ln ΓAId ln ζg = Xωgi · ∂ ln si Y(p)· ln p + (σ − 1) · d ln pi, ∀gd ln pi = Xsgi · (d ln wg − d ln Γgi L AI· πgi), ∀id ln y = 1 − sK · d ln tfp + sK · d ln sK 1d ln sK = − KXsg s1 L· (d ln wg − d ln y) .
在此模型中,wg 代表 g 群組的工資,Θg 表示與 g 群組相關的傳播矩陣行,y 為整體經濟的國內生產總值(GDP),ζ 是產業佔比向量,Γg 表示 g 群組的人工智慧(AI)暴露度。ωgi 代表 g 群組在 i 產業的工資收入佔該群組總工資收入的比例,siY 是 i 產業的收入佔比,pi 為 i 產業的價格指數。sgiL 表示 g 群組在 i 產業的工資收入佔該產業總收入的比例,πgi 代表 g 群組在 i 產業執行任務的成本節省,sK 則是資本收入佔比。Acemoglu 和 Restrepo(2022)提出了一個關於總要素生產力變化(d ln tfp)的方程式,但本研究採用先前計算的 TFP 變化值。除了 y 外,所有未標注下標的變數均為 G × 1 向量。
變數 si Y、sgi 和 ωgi 直接由美國社區調查資料計算得出,並輔以美國經濟分析局(BEA)提供的49個產業層級勞動佔比資料。ΓAI 源自前述的職業層級 AI 暴露度數據,我們先將職業與其 AI 暴露度匹配,再彙總至產業與人口群組層級。在基準暴露分析中,我們將 πgi 設為 0.27,這是 Noy 和 Zhang(2023)以及 Brynjolfsson 等人(2023)研究結果的平均值。∂ ln si Y(p) ∂ ln p 的計算遵循 Acemoglu 和 Restrepo(2022)的方法,假設產業產出在 GDP 中以恆定替代彈性 η = 0.2 結合。
對於簡單和困難任務的分析,我們採用相同的程序,但針對每個人口群組分別使用簡單任務和困難任務的 AI 暴露度量。