算力不再稀缺?AI伺服器租賃成本走低,日本推出前沿級"編排"新模型

人工智慧基礎設施市場正在同步出現兩個新訊號:伺服器租賃成本持續下行,算力Token支出增速趨於穩定租賃。這兩個訊號共同指向AI領域一個核心命題——AI成本下降,究竟是催生更多需求,還是侵蝕現有定價能力?

日本AI實驗室Sakana推出顛覆性"編排"框架模型Fugu,以協調多個前沿模型取代暴力擴參路線,在主流基準測試中超越Claude和GPT-5.5租賃

Sakana Fugu在SWE-Bench Pro測試中得分73.7,超越Claude Opus 4.8的69.2和GPT-5.5的58.6租賃。Fugu並非單一大模型,而是一個動態排程器——透過單次API呼叫,決定將任務的不同部分路由至最適配的前沿模型並行處理,最終整合輸出優於任何單一模型的結果。

算力不再稀缺?AI伺服器租賃成本走低,日本推出前沿級

高盛1-Delta臺席負責人Rich Privorotsky將計算資源租賃價格視為追蹤AI硬體投資邏輯是否成立的核心指標:市場的核心前提是算力稀缺;若供給上升導致租賃價格持續下行,將直接挑戰稀缺性敘事租賃。目前,伺服器租賃成本已呈現明顯下行走勢。

然而Privorotsky同時指出,在Token支出格局發生根本性轉變之前,硬體板塊的交易邏輯料將延續租賃。半導體ETF上週錄得異常高的資金流入,印證了市場當前的定位偏好。

他表示,超大規模雲端計算商的價格動向將日益成為關鍵觀察點,本週的市場焦點更多將落在美光財報資料上,而非PCE租賃

Fugu租賃:編排驅動的前沿級效能

Sakana是一家總部位於東京的AI實驗室,其聯合創始人之一參與撰寫了原始Transformer論文租賃

Sakana推出的Fugu框架顛覆了當下行業主流的"暴力擴參"邏輯租賃。作為一個協調器,Fugu在接收單次API請求後,動態決策將任務的不同部分分配給不同前沿模型並行處理,最終輸出一個優於任何單一模型獨立作答的結果。

Rich Privorotsky將這一方法概括為透過"模型編排與融合"而非暴力擴參來實現前沿級效能租賃。這一方法論若得到更廣泛驗證,將對算力軍備競賽的底層邏輯構成挑戰——因為其效能增益並不依賴於更多的訓練算力投入。

展開全文

在出口管制風險日益上升的背景下,Fugu的模型池支援動態替換,賦予其額外的戰略韌性:若某一提供商因管制受限,框架可自動繞開切換,降低供應鏈單點風險租賃。這一特性使其在地緣博弈加劇的環境下具有獨特的架構優勢。

開源追趕加速租賃,Token成本壓縮深化

智譜釋出的GLM-5.2在FrontierSWE長程程式設計基準上得分74.4,與Anthropic頂級模型Opus 4.8的75.1僅差約1個百分點,同時超越GPT-5.5的72.6,成為目前評分最高的開源權重模型,定價比Opus 4.8低約72%至82%租賃

Privorotsky指出,開源與閉源模型之間的差距正持續收窄租賃。GLM-5.2採用MIT許可證,支援權重開放、模型蒸餾、量化與復現,代表能力的重大躍升,是該領域差距加速收窄的清晰訊號。

隨著能力更強的開源模型不斷湧現,Token成本壓縮排程正在加速租賃。然而,Privorotsky強調,當前的激勵機制仍指向更多資本支出而非更少。

算力不再稀缺?AI伺服器租賃成本走低,日本推出前沿級

伺服器租賃價格:算力稀缺敘事的晴雨表

在Privorotsky的分析框架中,計算資源租賃價格是觀察AI硬體投資邏輯是否成立的核心變數租賃

其邏輯鏈條清晰:若算力稀缺持續,價格應保持堅挺,從而為持續的資本支出提供正當性;反之,若供給上升導致租賃價格持續下行,將直接挑戰稀缺性敘事,且"最先承壓的是硬體"租賃

目前,伺服器租賃成本已呈下行走勢租賃。Sakana Fugu此類編排框架的出現,或許正與這一趨勢相互印證——透過更高效的資源排程而非單純堆砌算力來提升效能,從技術層面折射出供給擴張的現實。

Privorotsky表示,市場注意力將越來越多地轉向超大規模雲端計算商的價格動向,一旦後者釋放戰略調整訊號,AI投資週期的底層邏輯將面臨重新評估租賃

算力不再稀缺?AI伺服器租賃成本走低,日本推出前沿級

本站內容來自使用者投稿,如果侵犯了您的權利,請與我們聯絡刪除。聯絡郵箱:835971066@qq.com

本文連結://www.haizhilanhn.com/post/50077.html

🌐 /