根據 BlockBeats 報導,Coinbase 執行長 Brian Armstrong 於 6 月 27 日表示,在代幣用量指數增長的同時維持穩定 AI 成本的關鍵不在於限制使用,而是使用更優的預設模型與快取機制。Coinbase 透過其 LLM 閘道預設採用 GLM 5.2 與 Kimi 2.7 等開放權重模型,同時仍鼓勵工程師針對特定任務選擇合適的模型。該公司指出,91% 的員工從未觸及使用上限,因此與其調降配額,不如轉向成本更低的預設模型。
Coinbase 已實作基於快取命中率的快取感知請求處理與智慧模型路由。例如,LibreChat 在最佳化快取實作後,快取命中率從 5% 提升至 60%。透過這些做法,Coinbase 在代幣用量持續成長的同時,已將 AI 支出降低近一半。