中國團隊拿下ICRA'26最佳論文:Agentic Coding驅動工業製造通往自主通用智慧

IMR-LLM團隊 投稿

量子位 | 公眾號 QbitAI

剛剛,在維也納落幕的機器人頂會ICRA 2026上,最佳論文獎(自動化方向)頒給了一支中國團隊論文

獲獎工作名為IMR-LLM,由深圳大學胡瑞珍教授團隊、中科院工業人工智慧研究所徐凱研究員團隊,聯合視位元機器人與卡爾頓大學共同完成,獲獎理由是提出並實現了一種新穎的工業產線多機器人任務規劃與程式生成框架論文

中國團隊拿下ICRA'26最佳論文:Agentic Coding驅動工業製造通往自主通用智慧

它乾的事,是讓大語言模型給工廠產線上的多臺機器人做任務規劃、寫執行程式論文

以前產線換一個任務,工程師就要從頭重寫一遍程式,現在,一句自然語言描述進去,排程方案和可執行程式碼自動出來論文

在覆蓋23個真實工業場景、50個製造任務的IMR-Bench測試中,IMR-LLM在任務規劃、程式生成和總體成功率三項指標上全面超過現有基線,而且任務越複雜,優勢拉得越大論文

這是怎麼做到的論文

研究背景

現代工業產線往往需要多個機器人協同完成複雜製造任務,為保證任務順利完成,大多仍依靠人工進行任務規劃並編寫執行程式論文

一旦任務或產線發生變化,需要重複進行繁重的人工操作,無法滿足對靈活性的要求論文

大語言模型在此類任務中展現出的能力為解決這一問題提供了新的思路論文。然而,現有基於大語言模型的方法大多面向簡單的家居場景,難以滿足工業產線中嚴格的時空約束和對執行正確性的要求。

展開全文

針對這一挑戰,論文提出了IMR-LLM框架,該框架充分發揮大語言模型的語義理解能力,再結合結構化工具完成約束求解和可執行性保證,實現從自然語言任務描述到高效排程和可執行程式的自動生成論文

實驗結果表明,該方法具有良好的跨任務跨產線泛化性,在所有指標上均優於現有基線方法論文

相關工作

現有方法大多面向簡單的室內家居場景,此類任務執行步驟之間相對獨立且執行程式較為簡單,因此可以直接使用大語言模型生成任務規劃和執行程式論文

然而,工業產線中工件的工序順序和加工資源使用具有嚴格限制,執行程式不僅更長,其具體步驟還會受到產線佈局、機器人配置等多種環境因素的影響論文

因此,直接依賴大模型生成規劃和程式,極易產生邏輯幻覺,生成的結果往往看似合理,卻在執行時因為資源搶佔或前置工序未完成等原因導致整個產線停滯論文

方法創新

論文所提方法分為任務規劃和程式生成兩個階段,分別解決“由哪臺機器人在什麼時間完成任務的哪一部分?”以及“具體該怎麼做?”這兩個核心問題論文

在任務規劃階段,該方法首先利用大語言模型理解自然語言任務描述,將任務分解為一系列工序,完成機器人分配,並確定同一工件工序的執行順序論文。隨後,輸出結果將自動轉化為結構化析取圖。

這樣一來,原本由自然語言描述的複雜工業任務,就被轉化為一個可以由傳統最佳化工具處理的排程問題論文。隨後,方法呼叫現有求解器,在滿足工序順序和資源約束的前提下,生成可行且高效的任務排程方案。

在程式生成階段,該方法並不直接要求大語言模型一次性生成完整的長程式,而是從少量已有程式樣例中歸納可複用的動作模式和程式結構,並據此構建工序流程樹論文

隨後,針對具體工序和環境配置,從流程樹中選擇合適的執行路徑,組合得到可執行程式碼論文。這樣一來,複雜的長程式碼生成問題被轉化為較為簡單的路徑匹配和選擇問題,極大降低了模型的推理負擔。

中國團隊拿下ICRA'26最佳論文:Agentic Coding驅動工業製造通往自主通用智慧

實驗結果資料集

為全面評估方法在不同工業產線中的適用性,論文構建了IMR-Bench資料集論文

該資料集面向船舶製造等重型裝備製造行業,包含23個真實工業場景和50個製造任務,任務按照難度劃分為三個等級,單個任務最多包含24道工序論文

定量對比

論文將IMR-LLM與現有方法進行了對比,並從任務規劃、程式生成以及總體成功率三方面進行評估論文。結果顯示該方法在所有指標上均優於現有基線,且隨著任務複雜度上升,優勢更加明顯。

定性結果

論文在模擬環境中充分證明了演算法面對製造任務變化和產線調整時的泛化能力論文

在下面的影片中,機器人需要打磨兩種型別的工件並放置在對應的托盤中,所提方法可充分利用機器和機器人資源,高效完成任務論文

當產線保持不變但任務更加複雜時,如下影片,機器人需要協作打磨並分揀三種數量不同的工件,所提方法可以把數量最多的工件(高亮為紫色)分配到兩條加工路徑上以節省加工時間論文

在下面的影片中,任務保持不變,但產線佈局和資源數量發生變化論文

機器人需要在新的產線中協作完成相同的打磨分揀任務,所提方法可以根據資源配置的變化自適應調整任務分配和加工路徑,體現出較強的泛化能力論文

真機部署

此外,論文還在多個真實工業產線中對方法進行了驗證論文。結果表明,該方法能夠適應不同產線環境和製造任務需求,進一步證明了其在實際工業場景中的應用能力。

結論

總的來說,論文提出了IMR-LLM,一個面向工業產線多機器人任務規劃與程式生成的全新框架,其核心思想是讓大語言模型負責語義理解,讓結構化工具負責約束滿足與可執行性保證論文

此外,論文基於真實工業需求構建了IMR-Bench資料集論文

最後,在模擬環境和真實產線部署中,證明了該方法顯著提升了排程效率與任務成功率論文

未來工作包括進一步探索執行反饋機制的引入,構建即時“推理-執行-糾錯”閉環系統,增強演算法在面對硬體故障或需求變化時的自適應能力,從而推動大模型在更復雜、更開放的工業具身智慧場景中紮實落地論文

論文標題論文:IMR-LLM: Industrial Multi-Robot Task Planning and Program Generation using Large Language Models

論文地址論文

專案主頁論文

本站內容來自使用者投稿,如果侵犯了您的權利,請與我們聯絡刪除。聯絡郵箱:835971066@qq.com

本文連結://www.haizhilanhn.com/post/50355.html

🌐 /