熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
我們正在讓機器人在物理世界中變得比以往更強大。 🤖
Gemini Robotics 1.5 是一個升級的代理系統,能夠更好地推理、提前計劃、使用數位工具如 @Google Search、與人類互動等等。這是它的運作方式 🧵
我們日常活動中的許多步驟需要多次完成,對於機器人來說可能非常具有挑戰性。想像一下問: “根據我的位置,你能把這些物品分類到正確的堆肥、回收和垃圾桶嗎?” 🗑️
機器人必須在網上搜索當地指導方針,查看物品,弄清楚如何分類,然後完成任務。 ↓
為了應對這些請求,Gemini Robotics 1.5 可以通過兩個關鍵的 AI 模型協同工作來驅動新的代理應用:
🔹Gemini Robotics-ER 1.5:這作為高層次的大腦,與人互動,理解其環境,協調工具,並創建詳細的計劃以執行任務。
🔹Gemini Robotics 1.5:這負責執行,將指令轉換為機器人移動和行動所需的精確運動命令。
Gemini Robotics-ER 1.5 是首個針對具身推理優化的思考模型,並在學術和內部基準測試中達到最先進的性能。 🧠
它對現實世界的理解使其成為機器人的完美高級協調者。觀看它如何處理繁忙的桌面 ↓
傳統上,VLA 模型將指令直接轉換為機器人運動。 🦾
Gemini Robotics 1.5 現在可以在採取行動之前進行思考,使用自然語言生成內部推理序列。這使得機器人的行動更具可解釋性,並解鎖了更多有用的任務——例如按顏色整理衣物。 ↓
當你告訴機器人「為我去倫敦的旅行打包行李」時會發生什麼? 🧳 它可以查詢天氣,考慮要打包什麼,在哪裡獲取這些物品,以及如何打包它們。
在這個過程中,模型可以將長任務分解為更簡單的任務,並能夠適應環境的變化。 ↓
機器人有各種形狀和大小,具有不同的形狀、感知能力和自由度。 💡
Gemini Robotics 1.5 可以在各種實體中學習,並且可以將從一個機器人學到的知識轉移到另一個機器人,而無需專門化。
我們現在正在超越僅對單一指令作出反應的模型,創建能夠真正以一般方式解決問題的系統——朝著在物理世界中解決AGI的方向邁進。
開發者現在可以通過@GoogleAIStudio中的Gemini API使用Gemini Robotics-ER 1.5。了解更多 →

318.65K
熱門
排行
收藏