允中 發自 凹非寺
量子位 | 公眾號 QbitAI
Prompt還沒退場,Loop已經開始接管AI敘事論文。
這兩週,矽谷開發者圈最熱的詞之一,是Loop Engineering論文。
它講的是一件很“Agent時代”的事:別再手動一輪輪prompt模型了,去設計一個迴圈系統,讓AI自己執行、檢查、修正、繼續跑,直到任務完成論文。
傳統模式以prompt為核心,現在開始轉向以工作流為核心,這也是它突然爆紅的原因論文。
而就在大家熱議“怎麼讓AI自己跑起來”時,另一條更硬的線也在快速升溫:Looped World Models(迴圈世界模型),簡稱LoopWM論文。
如果說Loop Engineering解決的是“AI怎麼持續幹活”論文,那LoopWM更像是在回答一個上限更高的問題:
AI在持續幹活時,能不能做到持續理解、修正、推演它所面對的世界論文。
AI在持續幹活時,能不能做到持續理解、修正、推演它所面對的世界論文。
這也是為什麼,它雖然名字裡也有“Loop”,但其展現出的技術含金量和想象空間,明顯不是一個量級論文。
它登上了Hugging Face Papers當日Top1,現已進入了AI社羣更廣泛的公共討論論文。
Loop Engineering為什麼突然火了
展開全文
Loop Engineering為什麼會火,其實很好理解論文。
因為單次對話適合問答,不適合複雜任務論文。
真要讓AI去寫程式碼、除錯、調工具、看結果、修bug、再驗證,它必須進入一個“行動—觀察—推理—繼續行動”的閉環論文。
換句話說,AI不再只是“答你一句”,而是開始“圍繞目標持續推進”論文。
這正是今天Agent熱的底層邏輯之一論文。
Google Chrome工程負責人Addy Osmani論文,引用過一個挺直白的判斷:
你不該再親自prompt agent,而該去設計那個prompt agent的loop論文。
你不該再親自prompt agent,而該去設計那個prompt agent的loop論文。
在這套敘事裡,人從“親自操作模型的人”,變成“設計自動化系統的人”論文。
這也是Loop Engineering特別像矽谷熱詞的地方:它不是一個技巧,是一次身份遷移論文。
人從提示者,變成了系統設計者論文。
但問題也隨之出現論文。會迴圈,不等於會理解。
一個Agent可以不斷調介面、讀日誌、改引數、反覆試錯,但如果它對環境狀態、動態變化、因果關係沒有更穩定的建模能力,它仍然更像一個“更勤奮的自動執行器”,而不是真正具備世界理解能力的系統論文。
也正因此,LoopWM才顯得格外關鍵和重要,它是在重寫“AI如何反覆推演世界”論文。
這件事論文,被一家中國叫臉譜心智的初創公司做了
接下來論文,讓我們深扒一下是誰做了這件事:
論文作者FaceMind Research Asia(臉譜心智),是這篇文章的通訊機構論文。
據瞭解,公司已完成數千萬元Pre-A輪融資,投資方為星連資本,老股東360超額跟投,陸奇的奇績創壇也參股了論文。
公司由95後博士陸弘遠及韋怡然創立,團隊早期從端側全模態模型切入,隨後將重心轉向更底層的世界模型研究論文。
相比只會生成內容的大模型,世界模型更強調對環境、介面與任務過程的持續理解和預測,這也被視為AI走向GUI Agent、具身智慧與機器人場景的重要基礎論文。
圍繞這一方向,臉譜心智正透過迴圈迭代、引數高效的模型架構,提升模型在長時序預測、螢幕理解和具身任務中的穩定性,並已在模擬具身環境、GUI Agent環境和真機機械臂環境中展開驗證論文。
一家年輕公司,正在試著把“理解世界”這件事,做成下一代AI基礎設施的一部分論文。
對此,星連資本合夥人李文珏表示,臉譜心智團隊最突出的特點,是兼具紮實的研究能力和複雜工程落地能力論文。
團隊核心成員長期深耕人工智慧底層技術,既能對前沿方向形成獨立判斷,也能快速將研究成果放入真實場景中驗證論文。“我們看好的是一支人才密度高、技術判斷前瞻、執行能力很強的團隊。”
在李文珏看來,陸弘遠身上兼具年輕研究者的探索欲和創業者的行動力,能夠帶領團隊持續挑戰高難度問題,並將技術判斷轉化為明確的研發方向論文。
△臉譜心智Founder陸弘遠
這種創始人特質和團隊凝聚力,是星連資本決定投資的重要原因論文。
臉譜心智的投資方360集團投前負責人向其奇表示:“陸博士是我見過最頂尖的年輕AI研究者之一論文。”
在他看來,陸弘遠關注的並非區域性最佳化,而是模型底層原理和架構創新論文。
當行業還在討論世界模型概念時,臉譜心智已經從零訓練世界模型,並在多種benchmarking上得到了行業SOTA級別成果論文。
此後,陸弘遠提出的Adam’s Law受到海外頭部模型廠商Anthropic的關注和驗證,團隊最新提出的Loop迴圈架構則進一步探索世界模型長時序訓練問題論文。
“迭代速度驚人論文。每次溝通前,我都會先去看他們最新發布的論文和技術報告。”向其奇感慨,從他們身上真正體會到了什麼叫做“一次投資,終生學習”。
關於為什麼是一家中國的初創公司能做出這樣一項工作論文,陸弘遠回答:
中國現在是一個高密度AI人才的國家,這是我們能做出一篇劃時代的世界模型工作的主要原因之一論文。
中國現在是一個高密度AI人才的國家,這是我們能做出一篇劃時代的世界模型工作的主要原因之一論文。
FaceMind未來也會被更多的國際視野所捕捉,就像他們的工作前幾周剛剛在X上被Anthropic/Facebook的投資人Accel點讚了論文。
論文到底做了什麼論文?
說得直白一點論文,LoopWM乾的事是:
不再讓模型一次前向傳播就把世界狀態“猜完”,而是讓它透過共享引數的Transformer模組,對潛在環境狀態做反覆迭代細化論文。
這背後有個很實際的矛盾論文。
要做高質量、長時程的環境模擬,計算必須足夠深;但模型一旦做深,引數量和推理成本就會一起飆升論文。
而且rollout越長,誤差越容易層層累積,最後把整個模擬拖垮論文。
論文裡的原話是論文:
faithful long-horizon simulation demands deep computation, but deeper models are expensive to deploy and prone to compounding errors論文。(高保真的長時程模擬需要深度計算,但模型越深,部署代價越高,誤差累積的風險也隨之上升。)
faithful long-horizon simulation demands deep computation, but deeper models are expensive to deploy and prone to compounding errors論文。(高保真的長時程模擬需要深度計算,但模型越深,部署代價越高,誤差累積的風險也隨之上升。)
LoopWM的思路是,把“深度”從一次性堆疊,改成迴圈式複用論文。
它不用每加深一點能力就新增一大堆引數,而是透過共享引數的transformer block,對同一個latent state(潛空間表示)反覆做refinement(細化)論文。
簡單場景少跑幾輪,複雜場景多跑幾輪,計算深度開始跟隨任務複雜度動態變化論文。
論文把這件事概括成一條新的scaling axis(擴充套件維度):iterative latent depth(迭代潛空間深度),獨立於模型規模和訓練資料之外論文。
世界模型變強,以後未必只能靠“更大”,也可以靠“更會反覆想”論文。
數字是最有說服力的部分論文。論文給出的結論包括:
引數效率最高可實現100×提升論文;
對於簡單狀態轉移論文,單步推理FLOPs可減少約25×;
在長時程rollout中,整體計算節省最高可達兩個數量級論文。
引數效率最高可實現100×提升論文;
對於簡單狀態轉移論文,單步推理FLOPs可減少約25×;
在長時程rollout中,整體計算節省最高可達兩個數量級論文。
這些都不是“說法上的最佳化”,而是直接指向部署成本、推理效率和長程穩定性的核心指標論文。
根據論文報告,在ScienceWorld基準測試上,LoopWM能在world modelling垂類任務上,比肩引數量高出兩個數量級的更大模型論文。
這意味著它不是“用更大的模型贏了”,而是用更聰明的計算方式贏了部分關鍵任務論文。
這不只是Agent升級論文,是AI認知層在換擋
AI社羣裡有一種正在變清晰的焦慮論文:
光會說話不夠,光會調工具也不夠,真正難的是在長鏈路、動態環境、複雜反饋裡,維持穩定的推演能力論文。
Loop Engineering對此給出的答案是閉環,讓AI能自己推進論文。
LoopWM走得更遠一步:給AI一套機制,讓它在推進過程中對世界狀態進行反覆、穩定、按需的計算論文。
X上關於LoopWM的討論論文,也從側面說明了這件事的分量
社羣的注意力沒有停在“100×引數效率”這個口號上論文,而是落在幾個更本質的技術詞彙:
shared transformer block(共享Transformer模組)、adaptive compute(自適應計算)、spectral stability(譜穩定性)、deferred decoding(延遲解碼)、iterative latent depth(迭代潛空間深度)……
這些詞背後指向同一個判斷:世界模型可能終於找到了一條比“繼續堆引數”更優雅的進化路徑論文。
過去一年,Agent最大的變化,是讓AI從“回答工具”變成“執行工具”論文。
LoopWM指向的變化,則更進一步,是從“執行系統”往“世界建模系統”邁一步論文。
前者解決效率問題:怎麼少點人工、多點自動化論文。
後者解決的是上限問題論文:
當AI真正進入機器人、模擬訓練、空間互動這類複雜環境,它靠什麼維持對世界的連續理解論文。
當AI真正進入機器人、模擬訓練、空間互動這類複雜環境,它靠什麼維持對世界的連續理解論文。
李飛飛談到空間智慧時說,今天的大語言模型擅長處理語言,卻缺乏對物理世界真正紮根的理解;而世界模型,正是通向這種空間與物理理解的重要基礎設施論文。
LoopWM的意義就在這條線上:它把Loop這個原本屬於Agent工作流的概念,第一次明確推進到了world model本體裡,換的是一套增長邏輯,不是修修補補論文。
矽谷先聊熱的是Loop Engineering——貼近開發者體驗,也更符合“讓AI自己跑起來”的敘事論文。
但把時間拉長,真正值得反覆看的,可能反而是Looped World Models這類工作論文。
因為它試圖回答的是,AI在自動執行中,能不能真正理解世界論文。這一點決定了系統明天能不能長大。
Prompt Engineering定義了AI如何回應人,Loop Engineering定義了AI如何持續做事,而Looped World Models定義的,可能是AI如何在做事時真正理解世界論文。
論文連結論文:
*本文系量子位獲授權刊載,觀點僅為原作者所有論文。