Meta revoluciona a IA com seus modelos Llama 4: Scout, Maverick e Behemoth

Última atualização: 08/04/2025
autor: Isaac
  • O Llama 4 apresenta modelos multimodais capazes de entender texto e imagens.
  • Scout e Maverick já estão disponíveis e superam modelos como GPT-4o e Gemini 2.0.
  • Behemoth, com 2 trilhões de parâmetros totais, será o modelo mais poderoso do Meta.

Modelos Llama 4 IA

A Meta revolucionou mais uma vez o cenário da Inteligencia artificial com o anúncio da sua nova geração de modelos, Llama 4, composta pelas versões Scout, Maverick e Behemoth. Esses modelos não apenas consolidam a estratégia da empresa de liderar o desenvolvimento de IA aberto, mas também estabeleceu um novo padrão em termos de eficiência, capacidades multimodais e flexibilidade em aplicações do mundo real.

Com esta nova família, A Meta traz à tona a possibilidade de criar assistentes virtuais e sistemas inteligentes muito mais potentes, econômicos e versáteis., capaz de trabalhar fluidamente com texto, imagens e grandes volumes de dados graças a inovações técnicas como a arquitetura Mixture-of-Experts e uma janela de contexto extremamente ampla.

O que é Llama 4 e por que ele está causando tanto rebuliço?

Llama 4 é a quarta iteração dos modelos de linguagem do Meta, projetados do zero para Oferecer capacidades multimodais nativas, eficiência computacional superior e acesso mais aberto a desenvolvedores e empresas. Isso significa que os modelos agora não apenas entendem e geram texto, mas também podem interpretar imagens e integrá-las em suas respostas sem a necessidade de arquiteturas independentes.

Uma das suas características é a utilização de Arquitetura de mistura de especialistas (MoE), que permite que o processamento seja distribuído entre vários especialistas, ativando apenas aqueles necessários para cada tarefa. Desta maneira, o custo computacional é reduzido e o desempenho é melhorado sem ter que recorrer a modelos gigantescos e densos. Para mais informações sobre os novos desenvolvimentos do Meta, você pode verificar como Meta lançou Llama 4.

Outro grande marco nesses modelos é o janela de contexto de até 10 milhões de tokens, algo inédito no setor, que lhes permite lidar com entradas massivas, como repositórios de código inteiros ou vários documentos grandes em uma única solicitação.

Llama 4 Scout: o modelo compacto, rápido e multimodal

O Scout é o modelo mais leve da família, mas não menos potente.. com 17.000 bilhões de parâmetros ativos e 16 especialistas, foi projetado para operar em times mais modestos, como uma única GPU Nvidia H100, tornando-o ideal para aplicativos corporativos ou desenvolvedores que não têm grandes infraestruturas. Isso destaca a flexibilidade que os modelos Llama 4 oferecem para diferentes plataformas, integrando-se até mesmo em WhatsApp e outros aplicativos.

  A IBM lança o IBM z17, seu primeiro mainframe focado em IA.

Graças à sua arquitetura otimizada e ao uso da quantização INT4, o Scout alcança uma velocidade de inferência muito alta sem sacrificar a qualidade. Além disso, sua janela de contexto 10 milhões de tokens torna-o o modelo ideal para processar e resumir grandes quantidades de texto, como relatórios, bases de dados documentários ou atividades complexas do usuário.

Em termos de benchmarking, conseguiu superar rivais como Gemini 2.0 Flash-Lite, Mistral 3.1 e Gemma 3 em tarefas que combinam raciocínio, rapidez e uso eficiente de recursos, apesar de terem menos parâmetros ativos que esses modelos.

O Scout também é capaz de alinhar imagens com texto graças ao MetaCLIP, que permite interpretar visualmente as instruções e oferecer respostas conectadas com conteúdo gráfico, como demonstrado nos óculos inteligentes Ray-Ban com integração Meta AI. Para mais detalhes sobre essas integrações, confira nossa cobertura em Como usar o Meta AI no Instagram.

Llama 4 Maverick: O especialista versátil para tarefas complexas

O Llama 4 Maverick é o modelo intermediário da família e um dos mais surpreendentes em termos de desempenho. Também tem 17.000 bilhões de parâmetros ativos, mas ao contrário do Scout usa até 128 especialistas e um total de 400.000 bilhões de parâmetros. Esta estrutura permite que você especializar-se em programação, raciocínio lógico e tarefas complexas sem penalizar os tempos de resposta.

A Meta deu ênfase especial em torná-la competitiva em benchmarks como codificação, matemática, escrita criativa e tarefas difíceis. Nas avaliações do ChatBot Arena, o Maverick ficou no topo, empatando com modelos de ponta como o experimental Gemini 2.5 Pro e superando GPT-4o e Google Gêmeos 2.0 Flash em várias categorias principais. A competição entre esses modelos destaca a importância de inovações tecnológicas como as discutidas no artigo sobre Meta reconhecimento facial na Europa.

Outra de suas vantagens marcantes é que, apesar de competir em qualidade com modelos como DeepSeek 3.1, seu custo computacional é muito menor. Isso o torna uma opção muito atraente para empresas que buscam IA de alto desempenho sem desperdiçar recursos.

  O ChatGPT está nos deixando mais solitários? O verdadeiro impacto psicológico

Seu treinamento foi aprimorado por meio de Supervisão leve, aprendizagem por reforço on-line e otimização de preferência direta, alcançando um excelente equilíbrio entre velocidade, precisão e adaptação à intenção do usuário.

Llama 4 Behemoth: O Titã da Inteligência Artificial

Lhama 4 Behemoth IA

Behemoth é o gigante da nova geração. Ainda não está disponível publicamente, pois está localizado em fase de treinamento e teste, mas suas especificações já o colocam como um dos modelos mais poderosos do planeta. A sua chegada marca um marco na evolução da IA, que poderá acompanhar nas nossas notícias sobre Avanços tecnológicos e demonstrações da Meta.

falamos de 288.000 bilhões de parâmetros ativos com 16 especialistas e quase 2 trilhões de parâmetros totais. Uma verdadeira fera que Meta usou como modelo mestre ou de "ensino" para treinar Scout e Maverick de forma mais eficiente por meio de processos de co-destilação.

Em testes internos, o Behemoth conseguiu superar GPT-4.5, Claude Sonnet 3.7 e Gemini 2.0 Pro em benchmarks focados em matemática, multilinguismo e interpretação visual, como GPQA Diamond ou MATH-500.

Devido ao seu tamanho, a Meta teve que redesenhar parte de sua infraestrutura, utilizando técnicas como redes de reforço assíncronas e um novo método chamado GOAT para detectar vulnerabilidades durante testes de segurança. Tornou-se também um exemplo de como criar modelos especializados a partir de um maior, seguindo a estratégia de “destilação” usada em outras IAs, como o DeepSeek.

Compromisso com a abertura, segurança e uso responsável

Um dos pilares do Llama 4 é a abordagem da Meta para um IA mais aberta, mas também responsável. Embora alguns critiquem que não é totalmente de código aberto devido a certas licenças restritivas, é verdade que ele fornece pesos livres e documentação suficiente para que desenvolvedores e pesquisadores possam trabalhar com esses modelos. O debate sobre a abertura na IA encontra ressonância em outros projetos, como o Meta e verificação de dados profissionais.

Além disso, a Meta forneceu ao Llama 4 ferramentas para evitar usos indevidos ou problemáticos, como Guarda rápida e guarda de lhama, sistemas que filtram conteúdo inapropriado ou desinformação. O viés ideológico dos modelos também foi significativamente reduzido, segundo métricas internas, permitindo respostas mais neutras e equilibradas a questões sociais controversas.

  Nova Premier: A abordagem multimodal da Amazon para revolucionar a IA empresarial

Por outro lado, o aspecto multimodal foi gerenciado com integração desde os estágios iniciais (fusão inicial), permitindo que texto e imagem compartilhem arquitetura sem a necessidade de módulos separados. Isso melhora a consistência e facilita o treinamento conjunto com conjuntos de dados mistos.

Acesso, disponibilidade e o que vem a seguir

Tanto Scout quanto Maverick já estão disponível para download de llama.com e Hugging Face. Eles também podem ser usados ​​nativamente em plataformas como WhatsApp, Messenger, Instagram Direto e o site Meta AI. Para mais informações sobre sua integração em aplicações, você pode conferir o artigo sobre Meta AI e sua relação com o WhatsApp.

Além disso, eles foram integrados em ambientes de nuvem, como Azure, Google Cloud, Cloudflare Workers e Databricks. Essa disponibilidade os torna uma opção muito flexível tanto para desenvolvedores quanto para empresas.

A Meta anunciou a celebração do primeiro evento LlamaCon No dia 29 de abril, onde são esperadas novidades como a versão especializada Llama 4 Raciocínio e um aplicativo dedicado para seus assistentes de IA, com funções potenciais de agente, como reservas ou produção de vídeo.

Esta nova geração de modelos Llama não apenas redefine o que a IA aberta pode fazer. Também mostra que é possível atingir um IA poderosa, escalável e acessível sem sacrificar a segurança e a eficiência. Enquanto Scout e Maverick já estão estabelecendo um novo padrão em desempenho e versatilidade, Behemoth está se preparando para ser o futuro motor de uma inteligência artificial ainda mais sofisticada e especializada.

Modelo Llama 4 disponível em AWS-6
Artigo relacionado:
Meta lança Llama 4: agora disponível na AWS com grandes avanços em IA multimodal