Novo conceito de Musk: Optimus pode aprender a dobrar roupas assistindo a vídeos
A Tesla está atualizando o “material didático” do robô humanoide Optimus, deixando de depender de roupas de captura de movimento e controle remoto, e passando a treiná-lo por meio de vídeos.
A Tesla (TSLA.O) está adotando um roteiro já testado e comprovado para treinar seu robô humanóide. Segundo fontes próximas ao assunto, a fabricante de carros elétricos informou aos funcionários no final de junho que o projeto Optimus passará a focar mais na abordagem “puramente visual”.
Anteriormente, a Tesla utilizava trajes de captura de movimento e headsets de realidade virtual para registrar dados de operadores humanos e controlar remotamente o robô. Agora, a empresa irá treinar o robô principalmente gravando vídeos de trabalhadores executando tarefas, como ensiná-lo a pegar objetos ou dobrar camisetas.
De acordo com as fontes, a empresa afirmou que abandonar os trajes de captura de movimento e o controle remoto permitirá que a equipe amplie a coleta de dados de forma mais rápida.
Essa mudança marca um ajuste significativo na estratégia de robótica da Tesla, alinhando o Optimus com a convicção de longa data do CEO Elon Musk de que a inteligência artificial pode dominar tarefas complexas apenas com o uso de câmeras. A Tesla sempre utilizou método semelhante para treinar seu software de direção autônoma.
A mudança ocorre pouco depois da saída de Milan Kovac, chefe do projeto Optimus. Fontes revelaram que o chefe de IA, Ashok Elluswamy, assumiu o comando do projeto.
Captura de movimento e controle remoto são práticas padrão na indústria de robótica. Por exemplo, a empresa líder Boston Dynamics já utilizou controle remoto para treinar seu robô Atlas. Durante o treinamento, trabalhadores vestem trajes de captura de movimento para realizar diversas tarefas, e os dados são então inseridos no robô. Os trajes também podem ser usados para controlar o robô remotamente.
Ainda não está claro se a Tesla voltará a priorizar captura de movimento e controle remoto no futuro, ou se continuará desenvolvendo com base nos dados de vídeo e informações já coletadas.
Robert Griffin, cientista sênior do Institute for Human and Machine Cognition, afirma que grandes volumes de dados de controle remoto permitem que robôs aprendam por meio de interações físicas com o ambiente. Ele diz que confiar apenas em dados de vídeo dificulta que o robô traduza com precisão as ações do vídeo para o mundo real.
“Se você usa apenas dados de vídeo, não há interação física direta”, disse ele.
Dobrar camisetas e pegar objetos
Musk anunciou pela primeira vez em 2021 que a Tesla planejava desenvolver um robô humanóide chamado Optimus. O bilionário afirmou que o robô, no futuro, será capaz de realizar tarefas como trabalho fabril e cuidados assistenciais.
No ano passado, a empresa recrutou “operadores de coleta de dados”. Essas funções envolviam executar e registrar tarefas domésticas básicas. O anúncio de emprego indicava que os operadores precisariam usar trajes de captura de movimento e headsets de realidade virtual por longos períodos.
Até o final de junho, o projeto ainda incluía treinamento do Optimus por meio de controle remoto e trajes de captura de movimento. Fontes disseram que os trabalhadores gastavam muito tempo lidando com problemas relacionados aos trajes e ao próprio robô, o que limitava a quantidade de dados que a equipe podia coletar.
Desde a mudança na forma de treinamento, os trabalhadores passaram a usar um conjunto de cinco câmeras desenvolvidas pela própria Tesla para registrar seus movimentos. Segundo fontes, essas câmeras são instaladas em capacetes e mochilas pesadas usadas pelos trabalhadores, filmando em várias direções para fornecer dados de localização precisos ao modelo de IA.
Christian Hubicki, diretor do laboratório de robótica da Faculdade de Engenharia Conjunta da Florida A&M University e Florida State University, afirmou que essas câmeras de diferentes ângulos podem permitir que a Tesla capture detalhes mais sutis, “como a posição das articulações e dos dedos”, além de melhorar a localização do robô. Ele acrescentou que esses vídeos também podem complementar os dados coletados anteriormente via controle remoto.
Durante o treinamento, os trabalhadores recebem instruções específicas de tarefas, especialmente em relação aos movimentos das mãos, para garantir que as ações pareçam o mais humanas possível. Um funcionário relatou que eles podem passar meses repetindo a mesma tarefa simples.
Jonathan Aitken, especialista em robótica da University of Sheffield, disse que a Tesla provavelmente precisará encontrar uma maneira de fazer com que o Optimus aprenda várias tarefas por meio de movimentos generalizáveis.
“Nessa escala, eles precisam de um conjunto de movimentos universais, caso contrário, treinar todas as tarefas levaria um tempo extremamente longo”, afirmou Aitken.
Ele acrescentou que a Tesla pode adotar uma estratégia semelhante à da empresa Physical Intelligence, que ensina robôs habilidades transferíveis e flexíveis ao fornecer grandes volumes de dados de demonstração, em vez de simplesmente memorizar tarefas individuais.
“Uma abordagem muito Tesla para o desenvolvimento de robôs”
Essa nova estratégia está alinhada com a forma como a Tesla treina seu software de direção autônoma. Outras empresas de direção autônoma utilizam sensores como LiDAR e radares de ondas milimétricas para treinar seus softwares, enquanto a Tesla depende principalmente de câmeras.
A empresa coleta dados de milhões de veículos Tesla equipados com 8 a 9 câmeras. Musk afirmou que o lançamento do software de direção assistida da Tesla na China foi possível após treinar o sistema de IA com vídeos públicos de ruas asiáticas.
Em uma teleconferência de resultados em janeiro deste ano, Musk admitiu que “as necessidades de treinamento do robô humanóide Optimus podem ser pelo menos 10 vezes maiores do que as dos carros.”
“É uma abordagem muito Tesla para o desenvolvimento de robôs. Nenhuma outra empresa está tentando fazer isso nessa escala”, disse Aitken. “Eles precisam de uma quantidade de dados tão grande quanto a usada para treinar os carros.”
Alan Fern, especialista em IA e robótica da Oregon State University, afirmou que treinar o Optimus pode ser ainda mais desafiador para a Tesla do que desenvolver carros autônomos.
“Dirigir é apenas uma tarefa”, disse ele. Confiar principalmente no aprendizado por vídeo “exige que o robô compreenda o que está acontecendo no vídeo e também tenha as habilidades para executar a tarefa. Algumas coisas podem ser aprendidas por observação, mas outras precisam ser praticadas em simuladores ou no mundo real.”
Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.
Talvez também goste
Está chegando um short squeeze do Bitcoin?

AiCoin Diário (26 de agosto)
Como a queda do preço do Ethereum está impactando os principais NFTs como Pudgy Penguins
As principais coleções de NFT, incluindo Pudgy Penguins, Bored Ape Yacht Club e Doodles, registraram quedas de dois dígitos no preço mínimo, variando de 14% a 19%, em meio à correção de preço do Ethereum.

Populares
MaisPreços de criptomoedas
Mais








