IT之家 5 月 20 日訊息,微信員工 @客村小蔣 昨晚分享了一則好訊息,微信 AI 團隊的模式識別中心憑藉論文《Less Redundancy: Boosting Practicality of Vision Language Model in Walking Assistants》,在 5 月份西班牙巴塞羅那舉行的 ICASSP 2026 上拿下了最佳工業論文獎論文。
IT之家注:ICASSP 全稱是 IEEE 國際聲學、語音與訊號處理會議,是全球最大、最綜合的訊號處理技術會議,過去的最佳工業論文獎,一般是 META、微軟、Spotify 這樣的國外公司拿下論文。此次微信團隊獲獎也是這個獎項自 2016 年設立以來,首次頒給中國企業團隊。
據介紹,微信 AI 團隊的工作人員提出了 WalkVLM-LR —— 一個為視障人士行走輔助設計的視覺語言模型,核心創新是減少冗餘:既減少“說得太多”(輸出冗餘),也減少“說得太頻繁”(時間冗餘)論文。同時,這個模型解決了“什麼時候該提醒”的問題,視覺語言模型不應該無時無刻每幀提醒,而更應該在需要提醒的時候再開口。
有網友詢問延遲情況如何,微信員工 @客村小蔣 表示:“目前延遲整體控制在百毫秒量級,主要依賴環境感知判斷器和 VLM 共享視覺編碼器來減少等待,離真實落地還有最佳化空間,但即時性已經比較可用論文。”