Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Estamos haciendo que los robots sean más capaces que nunca en el mundo físico. 🤖
Gemini Robotics 1.5 es un sistema agencial nivelado que puede razonar mejor, planificar con anticipación, usar herramientas digitales como @Google Search, interactuar con humanos y mucho más. Así es como funciona 🧵
Muchas de nuestras actividades diarias requieren muchos pasos para completarse y pueden ser extremadamente desafiantes para los robots. Imagínese preguntar: "Según mi ubicación, ¿puede clasificar estos objetos en los contenedores correctos de compostaje, reciclaje y basura?" 🗑️
El robot tiene que buscar en la web pautas locales, mirar los objetos, descubrir cómo ordenarlos y luego completar la tarea. ↓
Para hacer frente a estas solicitudes, Gemini Robotics 1.5 puede impulsar nuevas aplicaciones agentic con dos modelos clave de IA que trabajan juntos:
🔹Gemini Robotics-ER 1.5: Actúa como el cerebro de alto nivel, interactuando con las personas, entendiendo su entorno, orquestando herramientas y creando un plan detallado para llevar a cabo una tarea.
🔹Gemini Robotics 1.5: Es el responsable de la ejecución, traduciendo las instrucciones en comandos motores precisos necesarios para que el robot se mueva y actúe de forma general.
Gemini Robotics-ER 1.5 es el primer modelo de pensamiento optimizado para el razonamiento encarnado y logra un rendimiento de vanguardia en puntos de referencia académicos e internos. 🧠
Su comprensión del mundo real lo convierte en un orquestador de alto nivel perfecto para robots. Mira cómo aborda la organización de un escritorio ocupado ↓
Tradicionalmente, los modelos VLA traducen las instrucciones directamente en movimiento robótico. 🦾
Gemini Robotics 1.5 ahora puede pensar antes de actuar, generando una secuencia interna de razonamiento utilizando el lenguaje natural. Esto hace que las acciones del robot sean más interpretables y desbloquea tareas más útiles, como organizar la ropa por color. ↓
¿Qué sucede cuando le dices al robot que "haga una maleta para mi viaje a Londres"? 🧳 Puede buscar el clima, pensar en qué empacar, dónde conseguirlo y cómo empacarlo.
En este proceso, el modelo puede dividir las tareas largas en tareas más simples y adaptarse a los cambios en su entorno. ↓
Los robots vienen en todas las formas y tamaños, con diferentes formas, detección y grados de libertad. 💡
Gemini Robotics 1.5 puede aprender a través de varias realizaciones y puede transferir el conocimiento aprendido de un robot a otro sin necesidad de especializarse.
Ahora nos estamos moviendo más allá de los modelos que reaccionan a instrucciones únicas y creando sistemas que realmente pueden abordar problemas de manera general, en el camino hacia la resolución de AGI en el mundo físico.
Los desarrolladores ahora pueden usar Gemini Robotics-ER 1.5 a través de la API de Gemini en @GoogleAIStudio. Más información →

407.4K
Populares
Ranking
Favoritas