De acordo com a Meta, o modelo compara "representações abstratas" de imagens em vez de pixels. Como resultado, a IA entrega "forte desempenho" em várias tarefas de visão computacional e seria muito mais eficiente computacionalmente do que outros modelos do gênero.
Por Redação, com Canaltech - de Brasília
Nesta semana, a Meta apresentou uma nova IA capaz de gerar ou completar imagens quase como um humano faria. Chamado Image Joint Embedding Predictive Architecture (ou I-JEPA), o modelo usa "geração guiada por conhecimento" para complementar figuras de forma realista.
De acordo com a Meta, o modelo compara "representações abstratas" de imagens em vez de pixels. Como resultado, a IA entrega "forte desempenho" em várias tarefas de visão computacional e seria muito mais eficiente computacionalmente do que outros modelos do gênero.
a I-JEPA é a realização da visão do cientista-chefe de IA da Meta, Yann LeCun. Em 2022, ele propôs a criação de uma máquina capaz de aprender modelos internos de "como o mundo funciona" para acelerar o treinamento, possibilitar o raciocínio para conclusão de tarefas completas e garantir flexibilidade para cenários incomuns de inteligências artificiais.
IA da Meta foca na distinção de objetos
A nova IA da Meta foi treinada com uma infinidade de imagens e textos reais, o que garantiu a ela capacidade de distinguir objetos e cenários. Essa solução pode resolver problemas comuns para inteligências artificiais geradoras de imagens, como falhas na representação de mãos e objetos fisicamente impossíveis.
"Nosso trabalho nos modelos I-JEPA é baseado no fato de que os humanos aprendem uma enorme quantidade de conhecimento básico sobre o mundo apenas o observando passivamente", pontua a empresa no post de anúncio. "Foi levantada a hipótese de que essa informação de senso comum é a chave para permitir um comportamento inteligente, como a aquisição eficiente de novos conceitos, fundamentação e planejamento", complementa.
IA gera imagens a partir de rascunhos
O conhecimento da I-JEPA permite que a IA crie imagens a partir de rascunhos, usando seu conhecimento do mundo para preencher as lacunas e gerar uma figura realista. O modelo consegue preencher cores, ajustar detalhes de iluminação e compor um plano de fundo.
Atualmente, a I-JEPA está disponível como projeto de código aberto, portanto desenvolvedores podem explorar o potencial do modelo em soluções próprias, bem como estudar seu comportamento. A IA pode ser destrinchada no diretório oficial do Facebook Research no GitHub (github.com).