TL;DR

  • 成本優化本身沒錯,但在產品初期就被 token 費用綁架,會限制產品能力
  • OpenClaw 的策略:不省、不切、不降級——讓用戶接入自己的訂閱服務,把算力帳單還給用戶,把注意力還給體驗
  • 智能豐足時代的三個產品轉向:Outcome over Output大力出奇蹟Disposable UI
  • 在產品證明自己值得存在之前,最大的風險不是花太多錢,而是做出一個「能用但沒人在乎」的東西

什麼是智能豐足時代?

Sam Altman 在 2024 年發表的《The Intelligence Age》裡有一個核心預測:智能將變得像電力一樣豐足且廉價。

模型的推論成本每年以數量級的速度在下降,模型商之間的價格戰只會越來越激烈。一年前覺得貴到不敢用的頂級模型,現在的價格可能只剩當時的十分之一。這個趨勢不會停。

當「智能」不再是稀缺資源,軟體的運作方式、產品的設計邏輯、甚至商業模式都會跟著改變。但大多數人(包括我自己)還沒跟上這個轉變。

做 AI 產品時,我的第一反應是省錢

在規劃一個 AI 產品的架構時,我很容易往成本考慮去想。能不能用開源模型取代 OpenAI 的 API?傳入 LLM 的 context window 能不能再切小一點?用戶這樣使用,平均每個人的成本會是多少?

一直忍不住在想:這模式有辦法規模化嗎?

但其實想想,我發現 AI 時代真正好用的產品,背後幾乎都是不計代價去使用 Token 的。例如我使用 Claude Code, 我不需要特別擔心用了多少 token, 我可以專注用它在解決問題上。當我覺得它可以幫我解決我的問題的時候,我會很甘願付費。

省 Token 不是錯,但時間點錯了

成本優化本身沒問題。任何成熟的商業產品,遲早都要面對單位經濟。

但很多創業者(包括我自己)在產品連 PMF(Product-Market Fit,產品市場契合) 都還沒找到的階段,就開始用成本思維來決定技術選型了。尤其是技術型創業者,選模型一定先看價格表,設計功能先算 token 消耗,甚至因為「太貴」而主動閹割產品能力。

這就像一間餐廳還沒確定菜單能不能讓客人回頭,就開始研究怎麼買更便宜的食材。

你今天花大量工程資源省下的那些 token 費用,六個月後可能因為一次模型的升級而徒勞無功。把創業最稀缺的時間和注意力,花在一個正在急速貶值的問題上,怎麼看都是見樹不見林。

成本思維 vs 價值思維的對比意象

OpenClaw:一個反直覺的暴力美學案例

Peter Steinberger 是 OpenClaw 的創辦人,採取了一個跟主流完全相反的策略:不省、不切、不降級。 (想要更了解 Peter 與 OpenClaw 的故事,可以參考我之前寫的這篇文章:當 AI 學會翻你的抽屜)

OpenClaw 透過 ChatGPT Codex 的 OAuth 接入,讓用戶直接使用自己的訂閱服務來驅動 Agent。這代表開發者不需要替用戶負擔 API 費用,而用戶既然已經在付月費了,也不會對每一次 Agent 運算斤斤計較。

Peter 的邏輯很直接:如果一個 Agent 能幫工程師解決一個需要花 2 小時排查的 bug,即使這一趟背後消耗了 5 到 10 美元的 token 費,怎麼看都划算。真正該問的問題從來不是「這次 API call 花了多少錢」,而是「模型夠不夠聰明,能不能把事情做完」。

他把這叫做暴力美學(Brute Force) 。聽起來粗暴,但想想看——當你不再被每一次 token 消耗牽著走,你才有餘裕去想真正重要的事:這個產品到底能幫用戶解決多大的問題?

AI 產品的成本困境:誰來買單?

這裡有一個很實際的結構性問題。

多數 AI 產品的困境不是「不想用好模型」,而是「用不起」。當你透過 API 串接模型,每一次用戶操作的成本都直接反映在你的帳單上。規模越大,壓力越大。這種結構天然會把開發者推向「省」的方向。

把算力的帳單還給用戶,把產品的注意力還給體驗。

讓使用者接入自己已經在付費的 AI 訂閱服務,開發者就不用在每一個功能設計上都先過一遍成本審查。

當然,這馬上帶出另一個問題:如果核心算力來自用戶自己的訂閱,那產品的護城河在哪裡?這題很大,改天再聊。但至少在產品的早期探索階段,這個模式能讓你從成本焦慮中鬆綁,先專注在「做出用戶真正願意用的東西」。

智能豐足(Abundant Intelligence)時代的三個產品轉向

當 token 不再稀缺,產品該怎麼做會跟現在很不一樣。

Outcome over Output

用戶要的是問題被解決,不是一個對話框。

在智能豐足的前提下,系統可以在背景自動運行數十次甚至上百次自我修正、測試、驗證,消耗大量算力,只為確保最終交付的結果是正確且可執行的。用戶不需要知道背後跑了幾輪,他只需要看到:事情做完了,而且做對了。

經濟學裡有個傑文斯悖論(Jevons Paradox):資源越便宜,總消耗量反而越大。AI 也一樣——智能越便宜,我們越會「浪費」地用它。但這種浪費,用戶其實感受到的是更好的結果。

大力出奇蹟

上一點的延伸。問題夠有價值,就該給它足夠的資源去解。

一個能幫用戶省下整個下午的 Agent,即使單次運算成本高達數百元,用戶依然會心甘情願買單。例如一個 AI 助手如果能一次讀完用戶過去十年的日記,運算出深度的個人圖譜,這種體驗和「每次對話限 20 則」之間的差距,就是產品勝負的關鍵。

不要用成本來定義產品的上限。用價值來定義。

Disposable UI

如果智能足夠強大,固定的軟體介面將變得多餘。

Agent 可以根據當下的任務需求,即時生成一個表單、一張圖表、一組按鈕——任務完成後,這些介面就可以丟棄。開發者不再需要預先設計面面俱到的操作介面,因為每一次互動的介面都是為那個特定情境量身打造的。

這不是科幻想像。當模型的推論成本低到可以忽略,「每次都重新生成 UI」就不再是浪費,而是最合理的做法。

天秤兩端:發光的智能遠重於消散的硬幣

給正在算 Token 帳單的你

如果你現在正在建 AI 產品,且發現自己花了超過 30% 的心力在想怎麼省 API 的錢,也許該退一步想想:這個階段,你最大的風險真的是花太多錢嗎?

更可能的風險是:因為省錢,你做出了一個「能用但沒人在乎」的東西。用戶試了一次就走了,體驗不夠好。而體驗不夠好,很多時候是因為你不敢讓模型放手去做。

智能豐足的時代正在到來。先讓產品證明自己值得存在,帳單的事之後再說。