API de CNPJ: como integrar dados de empresas brasileiras

API REST de CNPJ não é só "consulta da Receita". Veja diferenciais reais: enriquecimento (Google Places, site, decisores), normalização automática pra CRM e quando faz sentido pagar pela API em vez de raspar dados públicos.

Toda equipe técnica B2B no Brasil em algum momento bate com a mesma pergunta: "preciso buscar dados de empresas por CNPJ programaticamente — uso a API pública da Receita Federal, faço scraping, ou pago uma API de mercado?". A resposta curta é "depende do que você precisa fazer com o dado". A resposta longa é este post.

Vamos cobrir o que diferencia uma API de CNPJ comercial da consulta crua da RFB, quando faz sentido pagar, e que recursos exigir do fornecedor — sem citar nomes de concorrentes.

O que é uma API de CNPJ

Uma API de CNPJ é uma interface HTTP que devolve dados de uma empresa brasileira a partir do número do CNPJ. No mínimo, retorna razão social, situação cadastral, CNAE, endereço e capital social. Em versões mais maduras, retorna também:

  • QSA (Quadro de Sócios e Administradores) com qualificação societária traduzida, data de entrada e faixa etária dos sócios.
  • CNAEs traduzidos (descrição da atividade, não só o código).
  • Regime tributário (Simples Nacional, MEI).
  • Enriquecimento: telefones e e-mails coletados de outras fontes (website oficial, Google Places), redes sociais, decisores.
  • Busca avançada: lista CNPJs por filtros (UF, CNAE, porte, capital, etc.) — não só lookup por número.

Essa última camada é o que separa "consulta da Receita" de "plataforma de inteligência B2B".

Por que não usar a API pública da Receita Federal?

A RFB publica os dados em schedule mensal, em arquivos CSV gigantes que você precisa baixar, importar num MySQL ou PostgreSQL, e indexar. É factível para um time com infra de dados — mas o custo total inclui:

  • Storage: a base aberta tem ~25GB compactado, ~150GB descompactado.
  • Ingestão mensal: pipeline ETL que processa, valida, deduplica e atualiza ~70M linhas/mês.
  • Indexação para busca por filtros (full-text em razão social, índices em UF/CNAE/porte).
  • Mantención: cada mudança de layout da RFB quebra seu importador.
  • Enriquecimento adicional (Google Places, scraping): não vem na base oficial — você precisa construir.

Para a maioria dos times de vendas, RevOps e CRMs, isso é overhead que não paga conta. É barato só se você já tem time de dados ocioso.

O que diferencia uma boa API comercial

Existem dezenas de APIs de CNPJ no mercado. A maioria entrega a mesma coisa: dados crus da RFB em CAIXA ALTA, sem tratamento. Os diferenciais reais que você deve exigir:

1. Enriquecimento no mesmo endpoint

API que só devolve dados da RFB é pouco útil em outbound. Você precisa de telefone que funciona, e-mail que abre, decisor que existe. Uma boa API integra no mesmo endpoint:

  • Google Places (rating, horário de atendimento, website oficial, telefone verificado).
  • Scraping de website (e-mails de contato, formulários, redes sociais).
  • OSINT de decisores (LinkedIn, sites profissionais — nomes + cargos).

Sinal de alerta: fornecedor que cobra módulo por módulo (uma cobrança pra "endereço", outra pra "telefone", outra pra "Google Places") está fazendo o que se chama de "API supermercado" — você paga 5 vezes pelo que deveria vir junto.

2. Normalização automática

A Receita Federal armazena tudo em CAIXA ALTA, sem máscara, com placeholders esquisitos como (0000) 00000000 para "telefone declarado vazio" e datas no formato YYYYMMDD (sem hífen). API decente entrega isso já tratado:

  • Razão social em Title Case com acrônimos legais (LTDA, ME, EIRELI, S/A) preservados em CAPS.
  • E-mails em lowercase + validados.
  • Telefones com máscara e placeholders convertidos pra null.
  • CNPJ e CEP formatados com máscara (12.345.678/0001-90, 01310-100).
  • Datas em ISO 8601 (2024-03-15).
  • Endereço completo montado: "Avenida Paulista, 1000, Sala 100, Bela Vista, São Paulo - SP, 01310-100" — copy & paste direto pro CRM.

Se você está rodando strtolower(), preg_replace() e ucwords() no cliente da API antes de gravar no banco, está pagando por menos do que deveria.

3. Busca avançada (não só consulta por CNPJ)

Lookup individual por CNPJ é o caso fácil. O que faz diferença em outbound é buscar listas filtradas: "todas as agências de publicidade em SP com WhatsApp e capital social acima de R$ 50k". Uma boa API expõe:

  • Filtros firmográficos: UF, município, CNAE, porte, natureza jurídica, capital social (range), idade da empresa.
  • Filtros de qualidade de contato: empresas com e-mail corporativo (exclui Gmail/Hotmail), com telefone, com WhatsApp.
  • Filtros de exclusão: ignora e-mails de escritórios contábeis (que são intermediários, não decisores).
  • Paginação com cap (max 100/página) — anti-scraping mas permite varrer com loop legítimo.

4. Enriquecimento em lote (sync e async)

Quando você precisa enriquecer 500 CNPJs de uma campanha, fazer 500 requests sequenciais é frágil (timeout, rate limit, retry hell). API madura aceita lista em uma única chamada:

  • Modo síncrono pra listas pequenas (≤100 CNPJs): resposta em uma chamada só.
  • Modo assíncrono pra listas grandes (até 1.000 CNPJs): cria job, devolve job_id, você faz polling pra acompanhar status.
  • Refund automático de CNPJs não-encontrados — você não paga por dado que não existe.

5. Idempotency-Key (padrão Stripe)

Retry sem idempotency em endpoint que debita crédito é convite pra cobrança duplicada. APIs maduras implementam o padrão Idempotency-Key: se você reenvia a mesma key em até 24h, a API devolve a resposta cacheada da primeira chamada — sem re-debitar. Padrão amplamente adotado por Stripe, Shopify, GitHub.

6. Modelo de cobrança previsível

Existem dois modelos no mercado:

  1. Mensalidade fixa + por chamada: você paga R$ X de assinatura + R$ Y por consulta. Difícil prever no fim do mês.
  2. Créditos do plano: você tem N créditos/mês inclusos no plano (compartilhados entre painel e API). Sem mensalidade adicional pra ligar a API. Sobrar créditos, sobra. Faltou, faz upgrade.

O segundo modelo é mais previsível para time financeiro e mais alinhado com pequenas e médias empresas (que não querem assinar contrato anual só pra testar).

Quando vale pagar por uma API de CNPJ

Pague pela API quando você está em um dos cenários abaixo:

  • RevOps / SDR Ops: roda enrichment noturno em leads do CRM — HubSpot, Pipedrive, RD Station, Salesforce. Cada lead novo entra com setor, porte, contatos, decisor e WhatsApp.
  • Outbound em escala: precisa de lista filtrada por ICP toda semana. Busca avançada com 20 filtros economiza dias de planilha.
  • KYC / Compliance: onboarding de fornecedor consulta CNPJ, valida situação cadastral, confere QSA. Auditoria exige request_id persistente (18 meses).
  • Análise de mercado / BI: cruza amostras setoriais com bases internas. QSA + capital social + idade da empresa abastecem modelos de scoring.
  • Plataforma SaaS: produto B2B que precisa pré-popular dados quando o cliente cria conta (auto-fill de "qual é o seu CNPJ?").

Não pague quando você só precisa consultar 10 CNPJs por mês manualmente. A consulta avulsa no painel paga menos que uma API.

Como escolher seu fornecedor

Checklist objetivo para avaliar API de CNPJ antes de assinar:

  • Documentação interativa (não só PDF) — testa endpoint no navegador.
  • OpenAPI 3.0 — gera SDK na sua linguagem com 1 comando.
  • Trial sem cartão de crédito — desconfie de quem exige cartão pra liberar 1 consulta.
  • Rate limit publicado e por plano (não escondido).
  • LGPD-grade: política clara sobre Art. 7º §4º (dados manifestamente públicos) e retenção de logs.
  • Status page público ou changelog visível — sinaliza que o fornecedor leva uptime a sério.
  • Suporte responsivo: peça uma pergunta técnica antes de assinar. Como respondem?

Sobre a API LeadCNPJ

A API LeadCNPJ implementa os 6 diferenciais listados acima:

  • 67M+ empresas brasileiras da Receita Federal.
  • Enriquecimento (Google Places, scraping de site, decisores) no mesmo endpoint.
  • Normalização automática (Title Case, ISO 8601, telefones e CEP mascarados).
  • Busca avançada com 20 filtros firmográficos.
  • Enriquecimento em lote sync (≤100) e async (até 1.000) com Idempotency-Key.
  • Cobrança por créditos do plano. Acesso a partir de Growth (R$ 289,90/mês, 30 req/min). Scale 60 req/min. Enterprise ilimitado.

Documentação completa em /api/docs/. Spec OpenAPI 3.0 em /api/openapi.json. Pra ativar API na sua conta, veja a página comparativa de planos ou vá direto pra assinar o Growth.


Pronto para parar de usar 4 ferramentas?

Plataforma de dados, CRM, WhatsApp e IA — tudo numa tela só, a partir de R$ 99/mês.

Testar 7 dias grátis Sem cartão · cancele quando quiser