目錄
1. 引言與概述
本文提出平均場博弈理論的一項新穎應用,用以模擬加密貨幣挖礦的競爭動態,特別針對比特幣這類表面去中心化系統中,獎勵與算力中心化的矛盾現象。核心研究問題探討驅動礦工行為的誘因、財富與權力集中的背後機制,以及初始財富分配、挖礦獎勵和成本效益(例如取得廉價電力)等因素的影響。
該模型捕捉了工作量證明挖礦的本質:礦工付出成本投入算力(雜湊率),以競爭隨機獎勵。個體策略的匯總,形成了對挖礦生態系統演進的宏觀描述。
2. 核心模型與方法論
2.1. 平均場博弈框架
該模型將挖礦競爭表述為一個最優停時或跳躍強度控制的平均場博弈。考慮一個連續統的礦工群體。每個礦工的狀態是其財富 $X_t$。他們控制其雜湊率強度 $\lambda_t$,這影響他們贏得下一個區塊的機率及其營運成本。
2.2. 礦工的最優化問題
個體礦工旨在最大化其終端財富 $X_T$ 的期望效用。財富動態由挖礦獎勵(跳躍)和努力成本驅動:
$dX_t = -c(\lambda_t)dt + R \, dN_t^{\lambda_t}$
其中 $c(\lambda)$ 是維持雜湊率 $\lambda$ 的成本函數,$R$ 是固定的區塊獎勵,而 $N_t^{\lambda}$ 是一個強度為 $\lambda_t$ 的受控泊松過程,代表成功的區塊挖礦事件。
2.3. 跳躍強度控制
關鍵的控制變數是泊松過程的強度 $\lambda_t$。選擇更高的 $\lambda$ 會增加獲得獎勵 $R$ 的機會,但也會產生更高的連續成本 $c(\lambda)dt$。平均場互動之所以產生,是因為獲勝機率也取決於所有其他礦工的總合雜湊率,從而將個體策略與群體分布連結起來。
3. 解析與數值結果
3.1. 指數效用案例(顯式解)
對於具有指數效用 $U(x) = -e^{-\gamma x}$(恆定絕對風險厭惡)的礦工,該模型允許顯式解。最優雜湊率策略 $\lambda^*$ 以回饋形式推導出來,顯示其如何依賴於當前財富、風險厭惡係數 $\gamma$、成本參數和平均場。
3.2. 冪效用案例(數值解)
對於更為現實的冪效用 $U(x) = \frac{x^{1-\eta}}{1-\eta}$(恆定相對風險厭惡),耦合了財富分布的柯爾莫哥洛夫前向方程的漢米爾頓-雅可比-貝爾曼方程被數值求解。這揭示了在遞減相對風險厭惡下的動態。
3.3. 關鍵發現與中心化驅動因素
- 財富創造財富: 異質性的初始財富分配會隨著時間導致不平等加劇(「富者愈富」)。財力更雄厚的礦工能夠維持更高的雜湊率,贏得更多獎勵。
- 獎勵規模效應: 更高的比特幣獎勵 $R$ 透過放大大型礦工的規模報酬,加速了中心化。
- 競爭的雙重角色: 雖然更多礦工會增加總合雜湊率,但模型顯示競爭僅能適度減緩——而非逆轉——中心化趨勢。
- 成本效益作為決定性優勢: 擁有較低成本函數 $c(\lambda)$(例如來自廉價電力)的礦工,在均衡狀態下貢獻了主導性的算力份額,很大程度上不受效率較低對手的競爭影響。這直接模擬了像比特大陸這類實體的崛起。
4. 技術細節與數學框架
平均場博弈的核心是偏微分方程組的耦合系統:
- HJB 方程(最優控制): $\partial_t v + H(t, x, \partial_x v, m) = 0$,終端條件為 $v(T,x)=U(x)$。漢米爾頓函數 $H$ 包含對 $\lambda$ 的極大化:$H = \sup_{\lambda \geq 0} \{ \lambda [v(t, x+R) - v(t,x)] - c(\lambda) \partial_x v \}$。
- KF 方程(分布演化): $\partial_t m + \partial_x (b^* m) = 0$,其中漂移項 $b^* = -c(\lambda^*) + \lambda^* [\delta_{x+R} - \delta_x]$ 由最優控制 $\lambda^*$ 推導而來,並包含一個跳躍項。初始條件是給定的財富分布 $m(0,x)=m_0(x)$。
均衡是一個不動點,其中來自 HJB 方程(給定分布 $m$)的最優控制 $\lambda^*$,透過 KF 方程產生一個分布演化,而該演化最終得到相同的 $m$。
5. 結果、圖表與實證背景
本文的數值結果通常會說明財富分布 $m(t,x)$ 如何從一個分散的初始狀態(例如對數常態分布)隨時間演變為高度偏斜、集中的分布。關鍵視覺化包括:
- 財富分布隨時間變化: 顯示礦工財富機率密度函數的圖表,變得更加右偏,並發展出厚尾。
- 吉尼係數軌跡: 吉尼係數(衡量不平等的指標)隨時間單調增加的圖表,量化了「富者愈富」效應。
- 雜湊率份額 vs. 初始財富/成本: 顯示均衡雜湊率份額如何隨初始財富急遽增加,或隨邊際成本下降的圖表。
- 實證連結: 該模型為實證觀察提供了理論基礎,例如 Kondor 等人 (2014) 發現比特幣累積集中在少數地址,以及具有成本優勢的礦池(如比特大陸在 2019 年控制約 33% 的雜湊率)的市場主導地位。
6. 分析框架:簡化案例研究
情境: 考慮一個簡化靜態模型中的兩種礦工類型:「大型」礦工 L,具有低邊際成本 $c_L$ 和初始財富 $W_L$;以及「小型」礦工 S,具有高成本 $c_S$ 和財富 $W_S$,其中 $W_L >> W_S$,$c_L < c_S$。
模型邏輯: 每個礦工選擇雜湊率 $\lambda_i$ 以最大化期望利潤:$\pi_i = \lambda_i \cdot R / (\lambda_L + \lambda_S) - c_i \lambda_i$,其中獎勵按雜湊率比例分配。
均衡結果: 求解一階條件得到 $\lambda_L^* / \lambda_S^* = \sqrt{c_S / c_L}$。由於 $c_S > c_L$,具有成本優勢的礦工 L 貢獻了不成比例的高算力。他的利潤率更高,允許再投資並進一步擴大差距——這是平均場博弈中心化結果的縮影。這說明了成本差異(而不僅僅是初始財富)如何驅動中心化。
7. 未來應用與研究方向
- 替代共識機制: 將平均場博弈模型應用於權益證明系統,以分析驗證者集中和「無利害關係」問題。
- 政策與協議設計: 使用該模型測試提議的協議變更(例如可變區塊獎勵、不同的費用結構)對去中心化指標的影響。
- 礦池動態: 擴展模型以包含礦池之間的策略性形成與競爭,納入礦池費用和信任因素。
- 多資產/跨鏈挖礦: 模擬礦工在多種加密貨幣之間分配算力,研究生態系統互動。
- 與實證數據整合: 使用真實世界的挖礦數據校準模型參數(成本函數、風險厭惡),以預測中心化閾值。
8. 參考文獻
- Li, Z., Reppen, A. M., & Sircar, R. (2022). A Mean Field Games Model for Cryptocurrency Mining. arXiv:1912.01952v2 [math.OC].
- Nakamoto, S. (2008). Bitcoin: A Peer-to-Peer Electronic Cash System.
- Kondor, D., Pósfai, M., Csabai, I., & Vattay, G. (2014). Do the Rich Get Richer? An Empirical Analysis of the Bitcoin Transaction Network. PLOS ONE.
- Lasry, J.-M., & Lions, P.-L. (2007). Mean field games. Japanese journal of mathematics.
- Carmona, R., & Delarue, F. (2018). Probabilistic Theory of Mean Field Games with Applications. Springer.
9. 產業分析師觀點
核心洞見: 本文給出了一個宿命論但數學上優雅的判決:工作量證明挖礦的經濟機制本質上是中心化的。去中心化不是一個穩定的均衡,而是一個會被規模經濟、成本優勢和財富複利侵蝕的過渡狀態。該模型將產業觀察者長期以來的懷疑形式化——比特幣的「去中心化」敘事與其底層博弈論日益矛盾。
邏輯流程: 論點引人注目。從理性的、利潤最大化的參與者開始。加入一個隨機但與投入資本(雜湊率)成比例的獎勵結構。引入異質性成本(電力、硬體效率)。然後,平均場博弈的機制無情地向前推進,顯示初始差異——無論是財富還是營運效率——如何被競爭放大,而非緩解。指數效用的顯式解是一個巧妙的技巧,但冪效用的數值結果才是真正的重點,直接映射到現實世界的礦工行為。
優點與缺陷: 其優點在於形式上的嚴謹性——它是一個恰當的經濟模型,而不僅僅是空談。它成功地將微觀誘因與宏觀結果(中心化)連結起來。然而,其缺陷在於抽象化。它忽略了重要的摩擦:礦池跳躍策略、ASIC 製造商(如比特大陸本身)同時作為玩家和裁判的角色、地理/政治監管風險,以及對極端中心化做出反應而進行硬分叉的可能性。與許多平均場博弈應用一樣,「平均場」假設——礦工只與總體互動——可能過度簡化了策略聯盟和礦池政治。
可操作的見解: 對於協議開發者而言,這項研究是一個嚴厲的警告。僅僅調整區塊獎勵無法解決中心化問題;它已內建於成本-獎勵的計算中。焦點必須轉向設計積極懲罰規模或獎勵分配的共識機制,或者接受監管對成本因素(例如對挖礦徵收碳稅)進行干預的角色。對於投資者而言,它強調了加密貨幣的長期價值不僅與採用率相關,還與其去中心化的可持續性相關。一個由少數具有成本優勢的實體控制的網路是一種系統性風險。本文提供了開始衡量該風險的量化框架。