Em uma quinta-feira qualquer de 2025, a BIA — Bradesco Inteligência Artificial — atendeu seu cliente número 1 bilhão. Foi mencionado no balanço do banco como nota de rodapé. Nenhum press release. Pra quem estava medindo, o número escondia uma transição que importa muito mais do que o marketing reconheceu: a BIA tinha deixado de ser um chatbot.
A BIA que respondia "qual o saldo da minha conta" em 2018 é a mesma marca, a mesma identidade visual, a mesma URL de acesso. Mas é uma criatura técnica diferente. A versão atual é o que se chama em 2026 de agente — não responde uma pergunta por vez, mas orquestra workflows multi-step, mantém estado entre passos, decide intermediariamente, escala humano em exceção. E isso muda fundamentalmente a equação econômica de quem opera atendimento ao cliente em escala.
Este post é uma análise do que tornou a BIA o caso mais documentado de agentic AI em produção no Brasil, e do que outros 4 casos — três bancos e um varejista — estão fazendo de forma análoga. É também um corretivo a uma confusão comum: agentic AI não é hype futurista; é uma camada técnica já em produção em pelo menos 5 grandes empresas brasileiras desde 2024-2025.
Parte 1 — A BIA antes
Os primeiros anos da BIA, entre 2018 e 2021, foram convencionais. Ela era um chatbot de regras + NLP intermediário, com integração ao core bancário pra responder consultas básicas (saldo, extrato, fatura, limite). A taxa de resolução autônoma rondava 30-40%. O resto escalava pra humano — call center, atendimento em agência, chat com gerente.
Em 2022-2023, a chegada de LLMs maduros mudou o que era possível. Não foi um anúncio. Foi uma série de mudanças incrementais, primeiro em backstage, depois aparente no produto final. O Bradesco contratou squad dedicado, fez piloto controlado em um subset de canais, mediu, expandiu. Em 2025, o número público que o banco repete é o que importa: 82% de resolução autônoma. Não 82% de tickets categorizados, não 82% de deflection no primeiro contato — 82% de jornadas concluídas sem intervenção humana.
Pra entender por que isso é diferente de chatbot, vale comparar uma jornada concreta.
Jornada típica em 2020 (chatbot)
- Cliente abre o app, vai no chat.
- Pergunta: "por que minha fatura veio mais alta esse mês?"
- Chatbot identifica intenção: consulta de fatura.
- Retorna o valor da fatura e botão pra ver detalhamento.
- Cliente lê detalhamento, não entende uma cobrança específica, pede esclarecimento.
- Chatbot não consegue continuar a conversa — escala pra humano.
- Humano abre o ticket, lê o contexto, responde.
Mesma jornada em 2026 (agente)
- Cliente abre o app.
- Pergunta: "por que minha fatura veio mais alta esse mês?"
- Agente identifica intenção, mas também consulta histórico de faturas dos últimos 6 meses, identifica que a cobrança incremental é de assinatura anual de seguro que entrou em vigor naquele mês. Já formula a resposta com contexto.
- Cliente pergunta "mas eu não pedi essa assinatura, posso cancelar?".
- Agente consulta política interna, verifica que o cancelamento é viável dentro do prazo, confirma com cliente, executa o cancelamento via API, atualiza CRM, registra ticket de auditoria, e responde com confirmação + valor que será estornado.
- Jornada termina. Nenhum humano envolvido. Tempo total: ~4 minutos.
O que mudou não foi a IA; foi o número de sistemas que o agente consegue orquestrar dentro de uma conversa. Em 2020, o chatbot fazia 1 query (saldo). Em 2026, o agente faz 6-12 (histórico, política, validação, transação, log, comunicação). Cada query é uma decisão pequena. A combinação produz o que parece uma conversa, mas é uma sequência de microdecisões orquestradas.
Parte 2 — Os 4 componentes técnicos que a BIA construiu
Conversando com gente que esteve perto do programa — engenheiros, fornecedores, ex-funcionários — emerge uma lista consistente do que foi necessário construir entre 2022 e 2025. Os 4 componentes:
1. Camada de orquestração própria
Não usaram framework de mercado puro. Construíram uma camada interna que recebe a mensagem do cliente, classifica intenção, decide quais ferramentas vai usar, monta o contexto, chama o LLM, valida a resposta, executa as ações. Por que construir: controle sobre auditoria, latência e custo. Cada conversa precisa ser rastreável pra compliance regulatório do Banco Central.
2. Tool layer com 80+ ações nomeadas
Cada coisa que o agente pode fazer — consultar saldo, cancelar assinatura, enviar 2FA, abrir ticket — é uma função nomeada com least-privilege access. O LLM não tem acesso direto ao core bancário; tem acesso ao tool layer, que valida cada chamada contra políticas de segurança e regulatórias. Por que importa: sem isso, qualquer prompt injection escala pra leitura de dado proibido.
3. Memória de cliente compartilhada
O agente lembra da última conversa, das preferências, das exceções autorizadas. Não é cache simples; é um perfil de cliente que persiste e enriquece com cada interação, com TTL e classificação de sensibilidade. Sob LGPD, isso exigiu DPIA específico e mecanismo de portabilidade.
4. Escalada humana com contexto pronto
Quando o agente decide escalar (18% das interações), ele monta um pacote pro humano: o que o cliente queria, o que tentou, qual a hipótese de causa raiz, qual ação ele recomendaria. O humano recebe não um ticket bruto, mas um briefing. Esse é o componente que mais raramente é replicado em outros bancos — e é o que faz o NPS subir, não cair, com o aumento de automação.
Parte 3 — O número que não aparece no balanço
82% de resolução autônoma é o número público. Tem outro número, esse não publicizado, que faz mais sentido: o NPS após interação com a BIA é hoje superior ao NPS após interação com humanoem parte significativa das jornadas. Não em todas — divergência forte aparece em casos emocionais ou de alta complexidade. Mas em "quero entender minha fatura", "quero cancelar uma assinatura", "quero saber se um pagamento foi processado", a IA ganha consistentemente. Tempo de espera vai a zero, a resposta é contextualizada, e o cliente não precisa repetir informações entre canais.
Isso desafia uma intuição comum em CX: a de que humano = qualidade premium e IA = qualidade econômica. Para jornadas padronizadas, a equação se inverte. O humano fica reservado pra casos onde julgamento, empatia ou exceção mandam. A combinação produz índice de satisfação mais alto, não mais baixo, do que era antes da introdução do agente.
Parte 4 — Os outros 4 casos brasileiros
Em paralelo ao Bradesco, outras 4 empresas brasileiras chegaram a estados análogos por caminhos diferentes. Os perfis e métricas reportadas:
Itaú
Reportou em 2024-2025 a marca de 400+ projetos de IA, com porção significativa em agentes verticais. O caso mais documentado é triagem de atendimento em segmentos premium — agente identifica complexidade da demanda, escala pra time especializado com contexto pronto. Métrica reportada: 60% de redução de tempo médio de atendimento em segmento alta renda. Redesenho de papel da operação: deixou de ser "quem responde" pra ser "quem decide casos limítrofes".
Magazine Luiza (Lu)
A Lu virou interface unificada de venda + suporte no WhatsApp. Diferentemente da BIA, é um caso de agente atravessando funil completo: descoberta, comparação, decisão, pós-venda. Magalu reporta uso por 30 milhões de clientes ativos, com handoff humano em casos de venda complexa ou problema escalado. Aprendizado lateral: a Lu virou também interface interna pros 30 mil funcionários da rede, pra consultar política, pedir aprovação, gerar relatório.
Banco do Brasil
Agente de atendimento integrado com produtos previdenciários e de investimento. Caso menos publicizado mas com volume relevante. Característica distintiva: o agente opera em canais regulados (telefone via voice + chat) onde a transcrição é auditada por compliance em amostra contínua. Demonstra que agentes funcionam em ambiente altamente regulado, desde que governança esteja madura.
Vivo (Telefônica Brasil)
Agente de suporte técnico que combina diagnóstico remoto (lê estado do roteador, modem, sinal de celular) com ação corretiva (reinicia equipamento via API). Casos resolvidos sem intervenção humana: ~55% em suporte técnico nível 1. Menor que bancos porque o domínio técnico tem cauda longa de exceção; mas significativo dado o custo de operação anterior.
Parte 5 — Os 3 padrões transversais
Olhando os 5 casos juntos, três padrões emergem. Quem não tem os três, não está em agentic AI — está em chatbot melhorado.
Padrão 1: orquestração própria, não framework de prateleira
Todas as 5 empresas construíram (ou customizaram fortemente) a camada de orquestração. Nenhuma usa pura plataforma. A razão é regulatória + economia: agentes em escala precisam de controle granular de custo, latência, auditoria. Plataforma resolve 60-70%; o resto é vantagem competitiva interna.
Padrão 2: redesenho do papel humano, não só automação
Em todos os 5 casos, a história não foi "automatizamos o atendimento". Foi "redesenhamos o que o humano faz quando o agente já cobre o trivial". Humano vira solucionador de exceção, designer de fluxo, validador de decisão sensível. Onde isso não foi feito, o NPS caiu. Onde foi feito, subiu.
Padrão 3: governança madura antes da escala, não depois
Em cada caso, comitê de governança formal aprovava lotes de casos novos. DPO e jurídico estavam na mesa desde o piloto. Logging completo de prompt + resposta + ação executada virou padrão. Empresas que tentaram escalar primeiro e governar depois encontraram o limite mais cedo — ou via incidente público, ou via objeção regulatória.
O que fica
Agente não é uma versão melhor de chatbot. É uma categoria diferente de software — orquestra ferramentas, mantém estado, executa ações, opera com governança. As empresas brasileiras que chegaram lá levaram 24-36 meses, em ondas, com investimento contínuo em fundação (dados, integração, governança) em paralelo aos casos de uso.
Pra quem está hoje em chatbot tradicional e quer chegar a agentic, o caminho não é trocar o motor. É redesenhar o processo primeiro, depois construir os 4 componentes técnicos. O diagnóstico Fronteira avalia onde sua empresa está em cada uma das 6 dimensões necessárias pra suportar agente em produção — mais útil que comparar tecnologias antes de saber se o terreno está pronto.