一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

我們正在讓機器人在物理世界中變得比以往更強大。 🤖 Gemini Robotics 1.5 是一個升級的代理系統，能夠更好地推理、提前計劃、使用數位工具如 @Google Search、與人類互動等等。這是它的運作方式 🧵

我們日常活動中的許多步驟需要多次完成，對於機器人來說可能非常具有挑戰性。想像一下問： “根據我的位置，你能把這些物品分類到正確的堆肥、回收和垃圾桶嗎？” 🗑️ 機器人必須在網上搜索當地指導方針，查看物品，弄清楚如何分類，然後完成任務。 ↓

為了應對這些請求，Gemini Robotics 1.5 可以通過兩個關鍵的 AI 模型協同工作來驅動新的代理應用： 🔹Gemini Robotics-ER 1.5：這作為高層次的大腦，與人互動，理解其環境，協調工具，並創建詳細的計劃以執行任務。 🔹Gemini Robotics 1.5：這負責執行，將指令轉換為機器人移動和行動所需的精確運動命令。

Gemini Robotics-ER 1.5 是首個針對具身推理優化的思考模型，並在學術和內部基準測試中達到最先進的性能。 🧠 它對現實世界的理解使其成為機器人的完美高級協調者。觀看它如何處理繁忙的桌面 ↓

傳統上，VLA 模型將指令直接轉換為機器人運動。 🦾 Gemini Robotics 1.5 現在可以在採取行動之前進行思考，使用自然語言生成內部推理序列。這使得機器人的行動更具可解釋性，並解鎖了更多有用的任務——例如按顏色整理衣物。 ↓

當你告訴機器人「為我去倫敦的旅行打包行李」時會發生什麼？ 🧳 它可以查詢天氣，考慮要打包什麼，在哪裡獲取這些物品，以及如何打包它們。在這個過程中，模型可以將長任務分解為更簡單的任務，並能夠適應環境的變化。 ↓

機器人有各種形狀和大小，具有不同的形狀、感知能力和自由度。 💡 Gemini Robotics 1.5 可以在各種實體中學習，並且可以將從一個機器人學到的知識轉移到另一個機器人，而無需專門化。

我們現在正在超越僅對單一指令作出反應的模型，創建能夠真正以一般方式解決問題的系統——朝著在物理世界中解決AGI的方向邁進。開發者現在可以通過@GoogleAIStudio中的Gemini API使用Gemini Robotics-ER 1.5。了解更多 →

318.65K