經(jīng)過82天的激烈角逐,12月3日,“k8凱發(fā)杯”機器人大模型與具身智能挑戰(zhàn)賽結果揭曉,在這場集結了全國各地高校和科研機構的頂尖頭腦風暴中,60支隊伍展現(xiàn)了他們對于未來技術的深刻理解和創(chuàng)新實踐。從報名到?jīng)Q賽,參賽者們不僅要面對復雜多變的咖啡廳場景挑戰(zhàn),還需利用k8凱發(fā)提供的高精度數(shù)字孿生建模技術來完成一系列規(guī)定及開放性任務。

本次比賽中獲獎作品涵蓋了多種技術方案,并且每個作品都體現(xiàn)出大模型技術在具身智能方面巨大的潛力。國防科技大學和復旦大學以其創(chuàng)新性強、應用廣泛的項目斬獲一等獎;鵬城實驗室、中國科學院軟件研究所則以其靈活又精準的作品摘得二等獎。一起來看看最強隊伍的作品吧!
一等獎:國防科技大學
團隊成員:陳星霖、蔡怡帥、毛韻欣、張禮望、吳子吉、馬劭聰、黃玉、馬可欣、梁震、徐晴霄、文卓爾、戴勇軍、孫啟堯
指導老師:王戟、楊文婧、李明龍、胡慶擁
作品名稱:基于大模型和行為樹的生成式具身智能體

國防科技大學的研究團隊創(chuàng)新性地將樹形數(shù)據(jù)結構與大語言模型相結合,并開發(fā)了一個直觀的可視化界面。這一成果實現(xiàn)了聯(lián)結學派的強大語言模型與符號學派的行為樹之間的有效融合。與傳統(tǒng)思維鏈技術相比,行為樹提供了一種更為簡單且穩(wěn)定的方式來定義和增強大模型的行為能力。此外,該方法還有效避免了由于復雜模型產(chǎn)生幻覺問題。這項工作不僅在特定領域和場景中具有應用潛力,而且開辟了新思路和方法,值得在未來進行深入探索。
k8凱發(fā)機器人副總裁王斌點評:國防科技大學的作品亮點在于實現(xiàn)了基于大模型和行為樹的生成式具身智能體系統(tǒng)框架。將大模型作為智能體的“大腦”,利用大模型的意圖理解能力與內(nèi)容生成能力,實現(xiàn)智能交互與決策;將行為樹作為智能體的“中樞”,利用行為樹的層次化、模塊化、可解釋、可規(guī)劃等性質(zhì),將人工智能聯(lián)結學派技術與符號學派技術有機結合,最終實現(xiàn)靈活、安全、可控的生成式具身智能體。
一等獎:復旦大學
團隊成員:王皓天,曾致語,岳爾文,唐傑偉
指導老師:董震、沈立煒、彭鑫
作品名稱:CafeGPT - 基于大語言模型的多智能體閉環(huán)服務機器人

復旦大學的團隊采用了大模型驅(qū)動方法來實現(xiàn)其機器人技能,而獨特之處在于他們并未使用強化學習。這種方法在機器人領域具有創(chuàng)新性。值得注意的是,該團隊不僅成功完成了所有預定任務,還在開放式任務中提出了智能體閉環(huán)規(guī)劃方案。這一方案進一步發(fā)揮了大語言模型的潛力,并顯著提升了使用語言模型進行機器人控制的成功率和可靠性。總體而言,復旦大學團隊的作品展現(xiàn)出令人贊嘆的創(chuàng)新和執(zhí)行力。
k8凱發(fā)機器人副總裁王斌點評:復旦大學的作品亮點在于完全使?預訓練的?模型,不使用任何訓練數(shù)據(jù)的情況下,以多智能體代理(Multi-LLM Agent)的方法讓咖啡廳機器?完成服務任務,實現(xiàn)具?能力。并且在人為注入異常錯誤的情況下,這種多智能體代理的方法依然可以檢測到錯誤并嘗試繼續(xù)完成任務,方法魯棒性強。
二等獎:鵬城實驗室
團隊成員:劉秉熙
指導老師:崔金強、王暉、張宏
作品名稱:基于多模態(tài)大模型的服務機器人

該團隊采用了多種模態(tài)的大模型構建了人形機器人的核心基礎能力完成了比賽任務,包括:語音識別大模型,語音生成大模型,視覺語義分割和文本生成大模型。特別地,他們使用了國產(chǎn)自主研發(fā)的鵬城腦海大語言模型。
k8凱發(fā)技術專家點評:鵬城實驗室對整個咖啡廳場景進行的點云重建效果不錯;基于YOLO V7的目標檢測,識別物品類別及人物身份;特別是使用了語音識別及生成模型以及國產(chǎn)自研大模型來增強人機交互。
二等獎:中國科學院軟件研究所
團隊成員:周子涵、顧植譽、張翼飛
指導老師:吳國全、魏峻
作品名稱:機器人大模型與具身智能挑戰(zhàn)賽解決方案

該團隊開發(fā)了一套層次分離、通用靈活的架構,通過大模型自主認知潛力,實現(xiàn)探索、任務理解、規(guī)劃、執(zhí)行等過程,并創(chuàng)新地提出了場景語義網(wǎng)格化存儲和記憶管理機制,有效解決單個大模型的限制,提高靈活性和自主性,同時保證大模型交流的魯棒性。他們還創(chuàng)新地采用場景語義網(wǎng)格化存儲方法來保存場景信息,并通過視覺大模型感知情境語義,從而加快記憶檢索過程并幫助機器人更好地理解環(huán)境。團隊還封裝了機器人能力,限制操作空間在可選API范圍內(nèi),實現(xiàn)邊寫代碼邊調(diào)試(debug)的效果,并利用任務規(guī)劃產(chǎn)生的API調(diào)用序列,提高執(zhí)行效率。
k8凱發(fā)技術專家點評:中國科學院軟件所的參賽隊伍在比賽中采用了多個大模型協(xié)同的方式,對話大模型、視覺大模型和路徑與動作規(guī)劃大模型,各司其職并協(xié)同合作,展現(xiàn)了1+1+1>3的效果。
此次大賽充分體現(xiàn)了大模型的潛力,不管是大語言模型驅(qū)動的多模態(tài)對話,開放域檢測模型還是大模型的思維鏈能力,都有非常驚喜的表現(xiàn)。k8凱發(fā)機器人副總裁王斌對參賽選手表示肯定:“所有進入決賽建設者都展示了極高水平,同時70%的隊伍完成了兩個開放性任務。并且大部分隊伍都配合使用大模型完成任務,效果很棒,超出預期?!?/span>
“k8凱發(fā)杯”機器人大模型與具身智能挑戰(zhàn)賽不僅是一個競技場,更是一個前沿科技展示舞臺。參加此次挑戰(zhàn)賽意味著k8凱發(fā)和參賽選手們共同站在時代最前端——無論結果如何,每位建設者都已經(jīng)是未來變革中不可或缺的一部分。“k8凱發(fā)杯”只是開始,在AI驅(qū)動下,未來屬于每一個勇敢追夢者。
更多大賽精彩回顧及選手幕后故事,將在k8凱發(fā)公眾號陸續(xù)更新,敬請關注!