E se você pudesse não apenas assistir a um vídeo gerado, mas também explorá-lo? 🌐 Genie 3 é nosso modelo de mundo inovador que cria ambientes interativos e jogáveis a partir de um único prompt de texto. De paisagens fotorrealistas a reinos de fantasia, as possibilidades são infinitas. 🧵
🔘 Capacidades em tempo real O Genie 3 é o nosso primeiro modelo mundial a permitir interação ao vivo, ao mesmo tempo que melhora a consistência e o realismo em comparação com o Genie 2. Ele pode gerar mundos dinâmicos a 720p e 24 FPS, com cada quadro criado em resposta às ações do usuário.
🔘 Consistência a longo prazo Os ambientes criados permanecem em grande parte consistentes ao longo de vários minutos, com a memória visual se estendendo até 1️⃣ minuto no passado. Essa habilidade é crítica para permitir que agentes de IA aprendam sobre o mundo e proporciona aos humanos uma experiência imersiva.
🔘 Eventos mundiais acionáveis Além da navegação, os utilizadores podem inserir prompts de texto para alterar o mundo em tempo real - como mudar o clima ⛅ ou introduzir novos personagens 👤 Isto desbloqueia um novo nível de interação dinâmica.
🔘 Aceleração da pesquisa de agentes Para explorar o potencial de treinamento de agentes, colocámos o nosso agente SIMA num mundo Genie 3 com um objetivo. O agente age, e o Genie 3 simula uma resposta no mundo sem conhecer o objetivo. Isso é fundamental para construir agentes incorporados mais capazes.💡
🔘 Aplicações no mundo real O Genie 3 oferece um vislumbre de novas formas de mídia gerativa, seja para entretenimento ou educação. Imagine ver a vida através dos olhos de um dinossauro 🦖 explorando as ruas da Grécia antiga 🏛 ou aprendendo sobre como os esforços de busca e resgate são planejados. 🚁
Os modelos do mundo são um passo fundamental no caminho para a AGI, prometendo simulações ricas e ilimitadas para o treinamento de agentes de IA. O Genie 3 representa um avanço significativo para tornar isso uma realidade. Estamos a fornecer acesso antecipado a um pequeno grupo de académicos e criadores, enquanto exploramos como podemos torná-lo disponível para mais testadores de confiança no futuro. →
33,96K