
Redazione RHC:2 Novembro 2025 09:01
Em 25 de setembro, o Google DeepMind Lançado Um vídeo demonstrando Como suas plataformas humanóides lidam com tarefas diárias de várias etapas usando o raciocínio multimodal.
Em uma série de demonstrações, as máquinas executaram sequências de ações com confiança, incluindo Ordenar objetos de acordo com regras predeterminadas.
A inteligência desses sistemas é baseada no Robótica Gemini 1.5 família. Dois componentes funcionam juntos: o modelo básico traduz sinais visuais e mensagens de texto em movimentos específicos, enquanto a versão modificada do Gemini Robotics-ER 1.5 cria planos e raciocínios passo a passo sobre a situação atual, escolhendo a sequência correta de etapas.
O chamado teste de banana demonstra claramente o progresso. Anteriormente, o robô só precisava pegar uma banana e colocá-la em uma tigela: um comando, um resultado.
Agora, o sistema Separou três frutas diferentes por cor e as colocou em pratos. Jie Tang, pesquisador sênior do Google DeepMind, demonstrou o experimento; sistema de dois braços, baseado em Manipuladores Franka , completou toda a sequência sem problemas.
Apptronik ‘s Plataforma humanóide Apollo também foi testado em uma lavanderia. A máquina Separei as roupas por tonalidade em duas caixas: uma para brancos e outra para negros. Após a primeira tentativa bem-sucedida, os engenheiros trocaram as caixas para ver se o sistema detectaria a mistura e ajustaria suas ações. Apollo reconheceu o novo arranjo e concluiu com sucesso a classificação.
Robótica Gemini 1.5 Suporta aprendizagem incorporada: o robô explora seus arredores com seu corpo, sensores e câmeras e, em seguida, age com base em suas observações . ALOHA 2 foi usado na maioria das cenas, mas os mesmos cenários também podem ser tratados com Apollo e o sistema Franka de dois braços.
Funções baseadas em agente também foram adicionadas . Por exemplo, o sistema pode ser encarregado da triagem de resíduos: Ele pesquisará na Internet os regulamentos locais, avaliará visualmente cada item, atribuirá
Esse nível de consistência é alcançado através da colaboração de dois componentes: um responsável pelo caminho da percepção ao movimento , o outro para planejamento e lógica. Essa arquitetura torna a execução de tarefas do mundo real mais intuitiva e confiável.
A segurança tem recebido atenção especial. O Os robôs são treinados para avaliar proativamente os riscos, respeitar as limitações humanas e evitar situações perigosas . Com o apoio de equipes especializadas e o banco de testes ASIMOV atualizado , a Gemini Robotics-ER 1.5 alcançou uma posição de liderança em testes, o que deve facilitar a implementação precisa de sistemas semelhantes fora do laboratório.
Redação
A equipe editorial da Red Hot Cyber é composta por um grupo de indivíduos e fontes anônimas que colaboram ativamente para fornecer informações e notícias antecipadas sobre segurança cibernética e computação em geral.