Voltar ao blog
·13 min de leitura·IA, Agentes de IA, PME, Mid-market, Brasil, Prontidão de dados

Agentes de IA para pequenas e médias empresas: por onde começar, e por que a maior parte dos pilotos emperra

Só 23% das organizações estão escalando IA agentiva, e cerca de 95% dos pilotos de GenAI não mexem o P&L. Para uma PME, o ponto de partida realista é um agente estreito rodando em cima de dado mais limpo, não uma transformação.

Gabriel Fernandes
Gabriel Fernandes
Analista de Dados Sênior
Read in English

A pesquisa State of AI da McKinsey de novembro de 2025, rodada com 1.993 executivos em 105 países, encontrou que 23% das organizações estão escalando IA agentiva em alguma parte do negócio e outros 39% ainda estão experimentando. Dentro de uma única função, não mais que cerca de 10% chegaram a escalar agentes. A cobertura da imprensa faz parecer que agentes de IA estão reescrevendo o modelo operacional de toda empresa do planeta. O dado diz que agente, hoje, é majoritariamente um slide em deck de comitê de direção.

Esse texto é para outro leitor. Uma transportadora de 50 pessoas em São Paulo com três ferramentas SaaS e um fluxo de cobrança que ainda passa por anexo de email. Uma agência de 120 pessoas onde a caixa de suporte é triada por um gerente sobrecarregado. Uma indústria de mid-market cuja equipe de contas a pagar passa quatro horas por dia digitando número de nota fiscal no ERP. Nenhuma dessas empresas precisa de transformação. Elas precisam de um agente de IA, em cima de dado mais limpo, tirando em silêncio a fricção de um fluxo. A parte difícil quase nunca é o modelo.

O que "agente de IA" significa na prática numa PME

O chatbot da homepage não é o agente de IA que vai pagar a conta. O agente que paga a conta é mais estreito, parece mais lento, e vive dentro de um fluxo só. Ele triça a caixa de suporte e roteia os 30% mais frequentes por tópico. Lê uma nota fiscal em PDF que chegou por email, extrai os campos do cabeçalho, e cria o lançamento de contas a pagar (AP) em rascunho. Pontua leads recebidos contra os últimos doze meses de negócios fechados e atribui ao representante certo. Nenhum desses é demo. É infraestrutura.

A definição importa porque o modo de falha é definido pelo escopo. Um "assistente de IA para a empresa toda", largo e ambicioso, herda toda tabela bagunçada, toda métrica sem definição, e toda exceção não documentada do negócio. Um agente de IA estreito herda a bagunça de um fluxo, que normalmente é pequena o suficiente para arrumar. É essa a razão inteira pela qual agentes de IA estreitos sobem para produção e os largos não.

Por que a maior parte dos pilotos emperra

O número mais citado de paralisia esse ano vem da iniciativa NANDA do MIT. O relatório deles de agosto de 2025, The GenAI Divide, partiu de 150 entrevistas, uma pesquisa com 350 funcionários, e análise de 300 implantações públicas. Cerca de 95% dos pilotos corporativos de GenAI não entregaram impacto mensurável em P&L (resultado). Os 5% que entregaram tinham um formato específico: 67% das implantações feitas com fornecedores especializados deram certo, contra cerca de 33% das construções internas. Vale citar o próprio framing do relatório: "o problema central não é a qualidade dos modelos de IA, mas o gap de aprendizado tanto das ferramentas quanto das organizações."

Onde vive esse gap? Outras duas pesquisas de 2025-2026 apontam para o mesmo lugar. A Cloudera e a Harvard Business Review Analytic Services, em estudo de março de 2026 com cerca de 230 membros da audiência da HBR pesquisados em outubro de 2025, encontraram que só 7% das organizações descrevem seus dados como "completamente prontos" para IA. Cinquenta e seis por cento apontaram silos e problemas de integração como o principal obstáculo. O release do Gartner de fevereiro de 2025, baseado em 248 líderes de gerenciamento de dados, diz que 63% das organizações ou não têm gestão de dados pronta para IA ou não têm certeza se têm, e prevê que até o fim de 2026 as organizações vão abandonar 60% dos projetos de IA que não tiverem dado pronto por trás.

A BCG colocou um número limpo na mesma fotografia. O AI Radar 2024 deles, com mais de mil executivos C-level em 59 países e 14 setores, atribuiu cerca de 70% dos desafios de implementação de IA a pessoas e processo, 20% a tecnologia e dado, e só 10% aos algoritmos. A maior parte dos pilotos não falha porque o modelo está errado. Eles falham porque os inputs estão errados, o fluxo em volta do modelo nunca foi redesenhado, e ninguém é dono do dado que o agente de IA lê.

Onde a implementação de IA de fato quebra

Distribuição dos desafios de implementação de IA, por origem.

  • Pessoas e processo70%
  • Tecnologia e dado20%
  • Algoritmos de IA10%
BCG Where's the Value in AI, outubro de 2024 (n=1.000+ C-suite)

A surpresa não é que pessoas e processo importam. É a proporção. Sete unidades de dificuldade vivem fora do modelo para cada uma dentro dele. Um time de operações de 30 pessoas que não consegue reconciliar o próprio relatório de aging de contas a receber (AR) dentro de uma única ferramenta de BI não vai ser resgatado por um modelo de fronteira. O modelo vai ler o que for entregue e produzir uma frase segura de si em cima do número errado.

Onde agentes de IA de fato devolvem valor numa PME

Três padrões aparecem com frequência suficiente no registro público e em projetos reais para recomendar pelo nome. Nenhum é transformação. Todos são estreitos.

1. Triagem e assistência em atendimento ao cliente

O padrão mais documentado, e o de evidência de ROI mais limpa, é um agente de IA de suporte que faz triagem de topo de funil e ajuda humanos nos tickets mais difíceis. Os compostos Forrester TEI, encomendados por fornecedores e construídos a partir de entrevistas com clientes, publicaram ROIs de três anos de 315% para o Microsoft Dynamics 365 Customer Service, 301% para o Zendesk Advanced AI, 391% para o PolyAI voice, e 210% para o Sprinklr, com payback dentro de seis meses nos casos mais fortes. São números direcionais, não auditados; Forrester TEI encomendado por fornecedor tende ao otimista, e a "organização composta" é construída a partir de clientes reais selecionados. Leia como teto, não como benchmark.

ROI declarado de agentes de IA em atendimento, lado a lado

ROI de três anos em organizações compostas em cinco estudos encomendados por fornecedores.

PolyAI391%
MS Dynamics 365 CS315%
Zendesk Advanced AI301%
Boost.ai293%
Sprinklr210%
Forrester TEI, compostos encomendados por fornecedores, 2024-2025

O agente da Klarna de fevereiro de 2024 é a celebridade dessa categoria. Em um mês, o sistema atendeu 2,3 milhões de conversas de atendimento ao cliente, dois terços do volume de chat da empresa, fez o trabalho equivalente a cerca de 700 atendentes em tempo integral, cortou o tempo médio de resolução de 11 minutos para menos de 2, e projetou cerca de US$ 40 milhões em melhoria de lucro. O recuo também faz parte da história. Entre 2024 e 2025, a Klarna suavizou publicamente a postura de "IA primeiro" e recontratou alguns atendentes humanos para os caminhos mais difíceis. A leitura correta não é "a Klarna fracassou". A leitura correta é que o teto existe, o teto é alto, e o caminho até ele é humano mais agente, não agente sozinho. A Klarna é uma ilustração útil. Não é um benchmark para PME — uma empresa de 30 pessoas nunca vai ver 2,3 milhões de conversas em um mês.

2. Contas a pagar e fluxos de back office

O segundo padrão é automação de fluxo de nota fiscal e documento: um agente de IA que lê notas fiscais em PDF recebidas por email, extrai campos de cabeçalho e itens de linha, casa contra a ordem de compra, e cria um lançamento rascunho que o analista de AP (contas a pagar) aprova. A evidência aqui é mais fraca. Posts em blog de fornecedor de AP citam "até 80%" de economia de custo sem metodologia nem amostra, e por isso esse texto não os cita. O que dá para defender é a lógica do fluxo. Um time de AP que hoje redigita 400 notas por mês com 4% de erro gasta um número mensurável de horas redigitando e um número mensurável de horas em retrabalho. Um agente de IA que acerta a primeira passada em 85% das vezes transforma a maior parte dessas horas em horas de revisão. A matemática é real mesmo onde os números do fornecedor não são.

Esse também é o padrão com o requisito mais barulhento de prontidão de dado. Se o nome do fornecedor está inconsistente no ERP, o agente de IA vai criar fornecedores duplicados. Se os itens das notas não estão amarrados a um plano de contas limpo, o agente vai chutar. A limpeza é metade do projeto. Quem te oferece deploy em quatro semanas sem pedir para ver a tabela de fornecedores está vendendo alguma coisa.

3. Roteamento de leads e extração de documento

O terceiro padrão é mais estreito ainda: um agente de IA que lê o dado do formulário de entrada mais a mensagem em texto livre, pontua contra os últimos doze meses de negócios fechados, e roteia para o representante ou o tier certo. Ou um que ingere um PDF de contrato e produz um resumo estruturado com as datas, partes e cláusulas de renovação que um paralegal teria que digitar à mão. Não existe número público segmentado por PME para ganho de roteamento de lead, então não vou inventar um. O que dá para dizer é que o padrão é curto de subir, curto de avaliar, e tende a sobreviver ao ciclo orçamentário porque a falha é barulhenta, representante errado, tier errado, e fácil de corrigir.

O recorte do Brasil

Esta é a seção que mais importa para o leitor brasileiro, porque os números internacionais acima subestimam onde o mercado local está. A TIC Empresas 2024 do CGI.br, pesquisa federal de referência com 4.453 empresas de 10 ou mais funcionários, encontrou que só 13% das empresas brasileiras estavam rodando aplicações de IA em 2024. Empresas grandes ficaram em 38%, médias em 29%, e pequenas em 10%. O caso de uso mais reportado foi automação de processo e fluxo de trabalho, em 63% das firmas que usam IA. Esse número é uma pista: quando a empresa brasileira de fato adota, ela adota exatamente onde esse texto recomenda começar.

A adoção de IA no Brasil despenca por porte

Percentual de empresas brasileiras rodando aplicações de IA, por faixa de funcionários.

Grandes38%
Médias29%
Pequenas10%
Total Brasil13%
CGI.br TIC Empresas 2024 (n=4.453, campo março a novembro de 2024)

As empresas pequenas estão mais perto do total nacional do que das médias, a população é quase toda pequena. Um estudo separado de setembro de 2025 do SEBRAE, FGV-IBRE e Google pesquisou cerca de 5.000 empresas e mediu outra coisa. Perguntou sobre familiaridade com ferramentas de IA generativa e sobre uso frequente. Familiaridade é quase universal: 99% em médias e grandes, 96% em MPEs, 87% em MEIs. O uso frequente derruba a fotografia: 35% em médias e grandes, 15% em MPEs, 18% em MEIs. As duas pesquisas discordam porque medem coisas diferentes. O CGI.br mede aplicação de IA implantada. O SEBRAE mede uso prático da ferramenta. Lendo as duas juntas, a MPE brasileira ouviu falar de ChatGPT, experimentou uma vez, e ainda não plugou em nada que rode sem alguém digitando dentro de uma caixa de chat.

A empresa brasileira conhece IA; poucas usam todo dia

Familiaridade com IA generativa versus uso frequente, por porte.

Média/grande, familiar99%
Média/grande, uso frequente35%
MPE, familiar96%
MPE, uso frequente15%
MEI, familiar87%
MEI, uso frequente18%
SEBRAE / FGV-IBRE / Google, setembro de 2025 (n≈5.000)

O gap entre familiaridade e uso frequente é largo em todos os tiers, mas é mais largo onde a empresa é menor em relação à própria vontade de usar. MPEs reportam familiaridade mais alta que MEIs e uso frequente mais baixo, a consciência chegou mais rápido que o encaixe operacional. A implicação é mais útil que a manchete. A PME brasileira não precisa ser convencida de IA. Ela precisa de ajuda para sair de "a gente já usou ChatGPT umas vezes" para um agente de IA que rode contra o dado da própria empresa sem supervisão. Isso é um problema de sequência, não de consciência.

A objeção que merece resposta de verdade

O contra-argumento mais forte para tudo acima é: se 95% dos pilotos de GenAI não mexem o P&L, por que uma empresa de 50 pessoas deveria chegar perto disso? A resposta honesta é que o mesmo achado do MIT NANDA divide a população. Projetos comprados de parceiros especializados deram certo em cerca de 67%. Construções internas deram certo em cerca de 33%. A taxa de falha não é uniforme. Ela acompanha de perto se o time tocando o projeto já fez aquilo antes, se o dado foi preparado primeiro, e se o fluxo em volta do agente de IA foi redesenhado em vez de só decorado.

Para uma PME a lição é específica. Não rode um programa de IA. Rode um projeto. Escolha um fluxo cuja dor seja mensurável em horas por semana. Contrate ou subcontrate quem já tenha entregado exatamente esse padrão antes. Gaste as duas primeiras semanas no dado que o agente de IA vai ler, não no agente. Suba a versão estreita, meça por um mês, decida se estende. Essa sequência não é a versão heroica de adoção de IA. É a versão cuja taxa de falha não quebra ninguém.

Como é "começar" com a Data Concierge

A State of AI 2025 da McKinsey rodou uma regressão sobre 25 atributos que poderiam explicar por que algumas empresas veem impacto em EBIT vindo de IA e outras não. A alavanca isolada mais forte, à frente da escolha de modelo, da escolha de fornecedor, e do tamanho do orçamento, foi redesenho de fluxo de trabalho. Apenas 21% dos usuários de gen-AI na pesquisa tinham redesenhado pelo menos algum fluxo em torno da IA. Esses 21% concentravam uma fatia desproporcional do impacto em EBIT. Os high performers, a coorte que está vendo retorno significativo, eram cerca de 6% da amostra.

A sequência da Data Concierge foi construída em cima desse achado. O trabalho se divide em quatro passos, nessa ordem, sem pular.

  1. Escolher o fluxo. Auditar dois ou três fluxos candidatos com o time. Custar cada um em horas por semana. Escolher o fluxo com mais horas e com os inputs de dado mais limpos, não o de nome mais estratégico.
  2. Limpar o dado que o agente de IA vai ler. Duas a quatro semanas, dependendo da bagunça. Reconciliar nome de fornecedor, definir a única métrica que o agente vai citar, mapear as tabelas de origem, fechar a política de acesso. É o passo chato que as falhas pulam.
  3. Subir o agente de IA estreito. Comprar de fornecedor especializado onde existir um; construir só se nenhum produto de prateleira encaixar no fluxo. Plugar no dado limpo. Manter humano no loop em toda decisão do agente no primeiro mês.
  4. Medir por um mês, depois decidir. Horas economizadas, taxa de erro, taxa de escalonamento, sinal do lado do cliente. Se o número mexe, estende. Se não mexe, tira o agente do ar e roda o próximo candidato. Não fique discutindo se "IA funciona", meça se essa IA funciona para esse fluxo.

O papel da Data Concierge nessa sequência é a ponte entre a ambição executiva ("a gente deveria estar fazendo IA") e a realidade técnica ("o nosso dado não está pronto e a gente não sabe por qual fluxo começar"). O papel não é ser o fornecedor de IA. É garantir que o agente que o fornecedor vendeu tenha algo confiável para ler, e que o fluxo em volta dele foi redesenhado, não só ligado na tomada. Escrevi sobre a mesma dinâmica em frente estratégica em empresas em transição para IA precisam de um data concierge.

Se você quer ajuda para escolher o primeiro fluxo, deixar o dado que o agente de IA vai ler em condição, e decidir entre comprar ou construir, é esse o trabalho. Uma conversa de 30 minutos para ver o ponto; um diagnóstico de uma a duas semanas se valer a pena.

Escolher o primeiro fluxo comigo

A versão silenciosa

A versão dessa história que envelhece bem não é a do board aprovando um programa de IA de US$ 2 milhões e o CEO falando em transformação no analyst day. É aquela em que, daqui a dezoito meses, três agentes de IA estão rodando em silêncio dentro de uma empresa de 100 pessoas: a caixa de suporte se triça sozinha, o time de contas a pagar aprova nota fiscal em vez de digitar, e o roteador de lead põe o representante certo no negócio certo. Ninguém ganhou promoção por subir nenhum dos três. Eles só devolveram, no agregado, quarenta horas por semana para a empresa.

É assim que IA numa PME parece quando funciona. As empresas que chegam até lá fizeram uma coisa que os 95% não fizeram: arrumaram a fundação antes de comprar o modelo.

Leituras relacionadas

Para o framing estratégico de por que a fundação vem antes do copilot, veja arrumar os dados antes de adotar IA generativa. Para o recorte específico de SaaS no mesmo boom de adoção, veja adoção de IA em times pequenos de produto SaaS. Para a visão do mercado brasileiro, veja o boom de adoção de IA no Brasil em números públicos.

Fontes

McKinsey, The State of AI, novembro de 2025 (n=1.993 executivos, 105 países, campo de junho a julho de 2025): McKinsey QuantumBlack State of AI.

MIT NANDA, The GenAI Divide, agosto de 2025 (150 entrevistas, pesquisa com 350 funcionários, 300 implantações públicas): cobertura da Fortune sobre o relatório MIT NANDA.

Cloudera e Harvard Business Review Analytic Services, estudo de prontidão de dado para IA, março de 2026 (n≈230 audiência HBR, campo em outubro de 2025): press release Cloudera / HBR.

Gartner, pesquisa sobre dado pronto para IA, fevereiro de 2025 (n=248 líderes de gerenciamento de dados, terceiro trimestre de 2024): press release do Gartner sobre dado pronto para IA.

BCG, Where's the Value in AI?, outubro de 2024 (AI Radar 2024, 1.000+ C-suite, 59 países): BCG Where's the Value in AI.

Forrester Total Economic Impact, compostos encomendados por fornecedores, 2024-2025: Microsoft Dynamics 365 Customer Service TEI; Zendesk Advanced AI TEI; Sprinklr Customer Service TEI.

Resultados do primeiro mês do assistente de IA da Klarna, fevereiro de 2024: press release da Klarna.

Goldman Sachs 10,000 Small Businesses Voices, fevereiro de 2026 (n=1.256 PMEs nos EUA): press release Goldman Sachs. Intuit QuickBooks Small Business Insights, abril de 2025 (n=2.200 empresas nos EUA com até 100 funcionários): pesquisa Intuit QuickBooks.

CGI.br, TIC Empresas 2024 (n=4.453 empresas brasileiras com 10+ funcionários, campo entre março e novembro de 2024): press release CGI.br. SEBRAE / FGV-IBRE / Google, setembro de 2025 (n≈5.000 empresas brasileiras): Blog do IBRE / FGV.

Quer conversar sobre o seu cenário?

Vamos transformar seus dados em decisões.