Agentes de IA para pequenas e médias empresas: por onde começar, e por que a maior parte dos pilotos emperra
Só 23% das organizações estão colocando IA agentiva para rodar em escala, e cerca de 95% dos pilotos de GenAI não mudam o resultado financeiro. Para uma PME, o ponto de partida realista é um agente focado rodando em cima de dado mais limpo, não uma transformação.

A pesquisa State of AI da McKinsey de novembro de 2025, feita com 1.993 executivos em 105 países, descobriu que 23% das organizações estão usando IA agentiva em escala em alguma parte do negócio e outras 39% ainda estão na fase de experimentação. Dentro de uma única área, não mais que cerca de 10% chegaram a usar agentes em escala. A cobertura da imprensa faz parecer que os agentes de IA estão reescrevendo o jeito de operar de toda empresa do planeta. O dado diz que agente, hoje, ainda é, na maioria das vezes, um slide em apresentação de comitê de direção.
Esse texto é para outro leitor. Uma transportadora de 50 pessoas em São Paulo com três ferramentas SaaS e uma cobrança que ainda passa por anexo de email. Uma agência de 120 pessoas onde a caixa de suporte é triada por um gerente sobrecarregado. Uma indústria de mid-market cuja equipe de contas a pagar passa quatro horas por dia digitando número de nota fiscal no ERP. Nenhuma dessas empresas precisa de transformação. Elas precisam de um agente de IA, em cima de dado mais limpo, tirando em silêncio o atrito de um fluxo. A parte difícil quase nunca é o modelo.
O que "agente de IA" significa na prática numa PME
O chatbot da homepage não é o agente de IA que traz retorno. O agente que traz retorno é mais focado, parece mais lento, e vive dentro de um fluxo só. Ele faz a triagem da caixa de suporte e encaminha os 30% mais frequentes por tópico. Lê uma nota fiscal em PDF que chegou por email, extrai os campos do cabeçalho, e cria o lançamento de contas a pagar (AP) em rascunho. Dá nota aos leads que chegam comparando com os últimos doze meses de negócios fechados e direciona para o vendedor certo. Nenhum desses é demonstração. É infraestrutura.
A definição importa porque o jeito como ele falha depende do escopo. Um "assistente de IA para a empresa toda", amplo e ambicioso, herda toda tabela bagunçada, toda métrica sem definição, e toda exceção que ninguém documentou no negócio. Um agente de IA focado herda a bagunça de um fluxo só, que normalmente é pequena o suficiente para arrumar. É exatamente por isso que agentes de IA focados chegam à produção e os amplos não.
Por que a maior parte dos pilotos emperra
O número mais citado de paralisia esse ano vem da iniciativa NANDA do MIT. O relatório deles de agosto de 2025, The GenAI Divide, partiu de 150 entrevistas, uma pesquisa com 350 funcionários, e a análise de 300 implantações públicas. Cerca de 95% dos pilotos corporativos de GenAI não geraram impacto mensurável no resultado financeiro (P&L). Os 5% que geraram tinham um formato específico: 67% das implantações feitas com fornecedores especializados deram certo, contra cerca de 33% das que foram construídas internamente. O próprio relatório resume bem: "o problema central não é a qualidade dos modelos de IA, mas a defasagem de aprendizado tanto das ferramentas quanto das organizações."
Onde mora essa defasagem? Outras duas pesquisas de 2025-2026 apontam para o mesmo lugar. A Cloudera e a Harvard Business Review Analytic Services, em estudo de março de 2026 com cerca de 230 leitores da HBR ouvidos em outubro de 2025, descobriram que só 7% das organizações descrevem os próprios dados como "completamente prontos" para IA. Cinquenta e seis por cento apontaram silos e problemas de integração como o principal obstáculo. O comunicado do Gartner de fevereiro de 2025, baseado em 248 líderes de gestão de dados, diz que 63% das organizações ou não têm a gestão de dados pronta para IA ou não sabem se têm, e prevê que até o fim de 2026 as organizações vão abandonar 60% dos projetos de IA que não tiverem dado pronto por trás.
A BCG botou um número claro nesse mesmo quadro. O AI Radar 2024 deles, com mais de mil executivos C-level em 59 países e 14 setores, atribuiu cerca de 70% das dificuldades de implementação de IA a pessoas e processo, 20% a tecnologia e dado, e só 10% aos algoritmos. A maior parte dos pilotos não falha porque o modelo está errado. Falham porque os dados de entrada estão errados, o fluxo em volta do modelo nunca foi repensado, e ninguém é dono do dado que o agente de IA lê.
Onde a implementação de IA de fato emperra
Distribuição das dificuldades de implementação de IA, por origem.
- Pessoas e processo70%
- Tecnologia e dado20%
- Algoritmos de IA10%
A surpresa não é que pessoas e processo importam. É a proporção. São sete unidades de dificuldade fora do modelo para cada uma dentro dele. Um time de operações de 30 pessoas que não consegue fechar o próprio relatório de aging de contas a receber (AR) dentro de uma única ferramenta de BI não vai ser salvo por um modelo de ponta. O modelo vai ler o que receber e cuspir uma frase confiante em cima do número errado.
Onde agentes de IA de fato dão retorno numa PME
Três padrões aparecem com frequência suficiente no registro público e em projetos reais para eu recomendar com nome e sobrenome. Nenhum é transformação. Todos são focados.
1. Triagem e assistência em atendimento ao cliente
O padrão mais documentado, e o de evidência de ROI mais limpa, é um agente de IA de suporte que faz triagem do topo do funil e ajuda os humanos nos chamados mais difíceis. Os compostos Forrester TEI, encomendados por fornecedores e construídos a partir de entrevistas com clientes, publicaram ROIs de três anos de 315% para o Microsoft Dynamics 365 Customer Service, 301% para o Zendesk Advanced AI, 391% para o PolyAI voice, e 210% para o Sprinklr, com payback em até seis meses nos casos mais fortes. São números que dão a direção, não auditados; Forrester TEI encomendado por fornecedor puxa para o otimista, e a "organização composta" é montada a partir de clientes reais escolhidos a dedo. Leia como teto, não como referência.
ROI declarado de agentes de IA em atendimento, lado a lado
ROI de três anos em organizações compostas em cinco estudos encomendados por fornecedores.
O agente da Klarna de fevereiro de 2024 é o caso mais famoso dessa categoria. Em um mês, o sistema atendeu 2,3 milhões de conversas de atendimento ao cliente, dois terços do volume de chat da empresa, fez o trabalho equivalente a cerca de 700 atendentes em tempo integral, derrubou o tempo médio de resolução de 11 minutos para menos de 2, e projetou cerca de US$ 40 milhões a mais de lucro. O recuo também faz parte da história. Entre 2024 e 2025, a Klarna amenizou em público o discurso de "IA primeiro" e recontratou alguns atendentes humanos para os casos mais difíceis. A leitura certa não é "a Klarna fracassou". A leitura certa é que o teto existe, o teto é alto, e o caminho até ele é humano mais agente, não agente sozinho. A Klarna serve de ilustração. Não serve de referência para PME: uma empresa de 30 pessoas nunca vai ver 2,3 milhões de conversas em um mês.
2. Contas a pagar e fluxos de back office
O segundo padrão é a automação do fluxo de nota fiscal e documento: um agente de IA que lê notas fiscais em PDF recebidas por email, extrai os campos de cabeçalho e os itens de linha, confere contra a ordem de compra, e cria um lançamento rascunho que o analista de AP (contas a pagar) aprova. Aqui a evidência é mais fraca. Blog de fornecedor de AP fala em "até 80%" de economia de custo sem método nem amostra, e por isso esse texto não cita esses números. O que dá para defender é a lógica do fluxo. Um time de AP que hoje redigita 400 notas por mês com 4% de erro gasta um número mensurável de horas redigitando e outro número mensurável em retrabalho. Um agente de IA que acerta de primeira em 85% das vezes transforma a maior parte dessas horas em horas de revisão. A conta fecha mesmo onde os números do fornecedor não fecham.
Esse também é o padrão que mais grita por dado pronto. Se o nome do fornecedor está inconsistente no ERP, o agente de IA vai criar fornecedores duplicados. Se os itens das notas não estão amarrados a um plano de contas limpo, o agente vai chutar. A limpeza é metade do projeto. Quem te promete subir em quatro semanas sem nem pedir para ver a tabela de fornecedores está te empurrando alguma coisa.
3. Roteamento de leads e extração de documento
O terceiro padrão é ainda mais focado: um agente de IA que lê o dado do formulário de entrada mais a mensagem em texto livre, dá uma nota comparando com os últimos doze meses de negócios fechados, e encaminha para o vendedor ou o nível certo. Ou um que lê um PDF de contrato e produz um resumo estruturado com as datas, partes e cláusulas de renovação que um paralegal teria que digitar à mão. Não existe número público separado por PME para o ganho de encaminhamento de lead, então não vou inventar um. O que dá para dizer é que o padrão é rápido de subir, rápido de avaliar, e costuma sobreviver ao ciclo do orçamento porque, quando erra, o erro salta aos olhos, vendedor errado, nível errado, e é fácil de corrigir.
O recorte do Brasil
Esta é a seção que mais importa para o leitor brasileiro, porque os números internacionais acima subestimam o ponto em que o mercado local está. A TIC Empresas 2024 do CGI.br, pesquisa federal de referência com 4.453 empresas de 10 ou mais funcionários, descobriu que só 13% das empresas brasileiras estavam rodando aplicações de IA em 2024. As grandes ficaram em 38%, as médias em 29%, e as pequenas em 10%. O uso mais citado foi automação de processo e de fluxo de trabalho, em 63% das empresas que usam IA. Esse número é uma pista: quando a empresa brasileira de fato adota, adota exatamente onde esse texto recomenda começar.
A adoção de IA no Brasil despenca por porte
Percentual de empresas brasileiras rodando aplicações de IA, por faixa de funcionários.
As empresas pequenas estão mais perto do total nacional do que das médias, já que a população é quase toda de pequenas. Um estudo separado de setembro de 2025 do SEBRAE, FGV-IBRE e Google ouviu cerca de 5.000 empresas e mediu outra coisa. Perguntou sobre familiaridade com ferramentas de IA generativa e sobre uso frequente. A familiaridade é quase universal: 99% em médias e grandes, 96% em MPEs, 87% em MEIs. O uso frequente muda tudo: 35% em médias e grandes, 15% em MPEs, 18% em MEIs. As duas pesquisas divergem porque medem coisas diferentes. O CGI.br mede aplicação de IA já implantada. O SEBRAE mede o uso prático da ferramenta. Lendo as duas juntas, dá para ver: a MPE brasileira ouviu falar de ChatGPT, experimentou uma vez, e ainda não conectou a IA a nada que rode sem alguém digitando dentro de uma caixa de chat.
A empresa brasileira conhece IA; poucas usam todo dia
Familiaridade com IA generativa versus uso frequente, por porte.
A distância entre familiaridade e uso frequente é grande em todos os portes, mas é maior onde a empresa é menor em relação à própria vontade de usar. As MPEs dizem conhecer mais que as MEIs e usam menos no dia a dia: a noção chegou mais rápido que o encaixe no dia a dia. A conclusão é mais útil que a manchete. A PME brasileira não precisa ser convencida de IA. Ela precisa de ajuda para sair de "a gente já usou ChatGPT umas vezes" para um agente de IA que rode em cima do dado da própria empresa sem ninguém olhando por cima. É um problema de sequência, não de consciência.
A objeção que merece resposta de verdade
O contra-argumento mais forte para tudo acima é: se 95% dos pilotos de GenAI não mudam o resultado, por que uma empresa de 50 pessoas chegaria perto disso? A resposta honesta é que esse mesmo achado do MIT NANDA separa a população em dois grupos. Os projetos comprados de parceiros especializados deram certo em cerca de 67%. Os construídos internamente deram certo em cerca de 33%. A taxa de falha não é igual para todos. Ela depende de o time que toca o projeto já ter feito aquilo antes, de o dado ter sido preparado primeiro, e de o fluxo em volta do agente de IA ter sido repensado, em vez de só maquiado.
Para uma PME a lição é específica. Não toque um programa de IA. Toque um projeto. Escolha um fluxo cuja dor dê para medir em horas por semana. Contrate ou subcontrate quem já entregou exatamente esse padrão antes. Gaste as duas primeiras semanas no dado que o agente de IA vai ler, não no agente. Suba a versão focada, meça por um mês, decida se vai em frente. Essa sequência não é a versão heroica de adoção de IA. É a versão cuja taxa de falha não derruba ninguém.
Como é "começar" com a Data Concierge
A State of AI 2025 da McKinsey rodou uma regressão sobre 25 atributos que poderiam explicar por que algumas empresas veem impacto no EBIT vindo de IA e outras não. O fator isolado mais forte, à frente da escolha de modelo, da escolha de fornecedor, e do tamanho do orçamento, foi o redesenho do fluxo de trabalho. Apenas 21% dos usuários de gen-AI na pesquisa tinham redesenhado pelo menos algum fluxo em torno da IA. Esses 21% concentravam uma fatia desproporcional do impacto no EBIT. Os de melhor desempenho, o grupo que está vendo retorno significativo, eram cerca de 6% da amostra.
A sequência da Data Concierge foi construída em cima desse achado. O trabalho se divide em quatro passos, nessa ordem, sem pular.
- Escolher o fluxo. Auditar dois ou três fluxos candidatos com o time. Calcular o custo de cada um em horas por semana. Escolher o fluxo com mais horas e com os dados de entrada mais limpos, não o de nome mais estratégico.
- Limpar o dado que o agente de IA vai ler. Duas a quatro semanas, dependendo da bagunça. Padronizar o nome do fornecedor, definir a única métrica que o agente vai citar, mapear as tabelas de origem, fechar a política de acesso. É o passo chato que os projetos que falham pulam.
- Subir o agente de IA focado. Comprar de fornecedor especializado onde existir um; construir só se nenhum produto de prateleira encaixar no fluxo. Conectar ao dado limpo. Manter uma pessoa revisando toda decisão do agente no primeiro mês.
- Medir por um mês, depois decidir. Horas economizadas, taxa de erro, taxa de escalonamento, o que o cliente sinaliza. Se o número mexe, leva adiante. Se não mexe, tira o agente do ar e parte para o próximo candidato. Não fique discutindo se "IA funciona"; meça se essa IA funciona para esse fluxo.
O papel da Data Concierge nessa sequência é a ponte entre a ambição da diretoria ("a gente precisa fazer IA") e a realidade técnica ("nosso dado não está pronto e a gente não sabe por qual fluxo começar"). O papel não é ser o fornecedor de IA. É garantir que o agente que o fornecedor vendeu tenha algo confiável para ler, e que o fluxo em volta dele foi repensado, não só ligado na tomada. Escrevi sobre a mesma dinâmica no plano estratégico em empresas em transição para IA precisam de um data concierge.
Se você quer ajuda para escolher o primeiro fluxo, deixar o dado que o agente de IA vai ler em condições, e decidir entre comprar ou construir, é esse o trabalho. Uma conversa de 30 minutos para ver se faz sentido; um diagnóstico de uma a duas semanas se valer a pena.
Escolher o primeiro fluxo comigoA versão silenciosa
A versão dessa história que envelhece bem não é a do conselho aprovando um programa de IA de US$ 2 milhões e o CEO falando em transformação no evento para analistas. É aquela em que, daqui a dezoito meses, três agentes de IA estão rodando em silêncio dentro de uma empresa de 100 pessoas: a caixa de suporte faz a própria triagem, o time de contas a pagar aprova nota fiscal em vez de digitar, e o roteador de lead coloca o vendedor certo no negócio certo. Ninguém ganhou promoção por subir nenhum dos três. Eles só devolveram, somados, quarenta horas por semana para a empresa.
É essa a cara da IA numa PME quando funciona. As empresas que chegam até lá fizeram uma coisa que os 95% não fizeram: arrumaram a base antes de comprar o modelo.
Leituras relacionadas
Para o enquadramento estratégico de por que a base vem antes do copiloto, veja arrumar os dados antes de adotar IA generativa. Para o recorte específico de SaaS no mesmo boom de adoção, veja adoção de IA em times pequenos de produto SaaS. Para a visão do mercado brasileiro, veja o boom de adoção de IA no Brasil em números públicos.
Fontes
McKinsey, The State of AI, novembro de 2025 (n=1.993 executivos, 105 países, campo de junho a julho de 2025): McKinsey QuantumBlack State of AI.
MIT NANDA, The GenAI Divide, agosto de 2025 (150 entrevistas, pesquisa com 350 funcionários, 300 implantações públicas): cobertura da Fortune sobre o relatório MIT NANDA.
Cloudera e Harvard Business Review Analytic Services, estudo de prontidão de dado para IA, março de 2026 (n≈230 audiência HBR, campo em outubro de 2025): press release Cloudera / HBR.
Gartner, pesquisa sobre dado pronto para IA, fevereiro de 2025 (n=248 líderes de gerenciamento de dados, terceiro trimestre de 2024): press release do Gartner sobre dado pronto para IA.
BCG, Where's the Value in AI?, outubro de 2024 (AI Radar 2024, 1.000+ C-suite, 59 países): BCG Where's the Value in AI.
Forrester Total Economic Impact, compostos encomendados por fornecedores, 2024-2025: Microsoft Dynamics 365 Customer Service TEI; Zendesk Advanced AI TEI; Sprinklr Customer Service TEI.
Resultados do primeiro mês do assistente de IA da Klarna, fevereiro de 2024: press release da Klarna.
Goldman Sachs 10,000 Small Businesses Voices, fevereiro de 2026 (n=1.256 PMEs nos EUA): press release Goldman Sachs. Intuit QuickBooks Small Business Insights, abril de 2025 (n=2.200 empresas nos EUA com até 100 funcionários): pesquisa Intuit QuickBooks.
CGI.br, TIC Empresas 2024 (n=4.453 empresas brasileiras com 10+ funcionários, campo entre março e novembro de 2024): press release CGI.br. SEBRAE / FGV-IBRE / Google, setembro de 2025 (n≈5.000 empresas brasileiras): Blog do IBRE / FGV.