Projetos
Projeto Completo · Engenharia & Ciência de Dados

LH Nautical — Do caos dos dados aos insights

Projeto end-to-end para um varejista do setor náutico: 4 bases brutas, 7 problemas de qualidade, arquitetura medallion, dashboards executivos, modelos preditivos e sistema de recomendação — R$ 2,61 bilhões de receita analisada.

Ano 2025 Papel Data Analyst / Engineer Status Concluído Autor Jair Pereira da Silva Júnior
Contexto

O caos dos dados

A LH Nautical, varejista de peças e acessórios para embarcações com loja física em Florianópolis e e-commerce nacional, cresceu rápido — e os dados não acompanharam. "A diretoria quer usar IA para prever vendas, mas hoje não consegue nem consolidar o faturamento do dia."

Quatro frentes de bagunça precisavam ser organizadas antes de qualquer análise:

Estoque em planilhas manuais "sujas" · E-commerce e financeiro sem integração · Dados em múltiplos formatos (CSV, JSON) · Qualidade crítica (datas erradas, preços como texto, e-mails inválidos).

Solução

Seis frentes de entrega

Recebi quatro bases brutas (vendas, produtos, clientes, custos de importação) e organizei o projeto em camadas medallion (Bronze → Silver → Gold) que alimentam três frentes de consumo: BI executivo, previsão e recomendação.

1. EDA — mapeamento dos 7 problemas de qualidade. 2. Tratamento — limpeza, padronização e star schema. 3. Análise de Vendas — KPIs financeiros, faturamento mensal, margens e alertas. 4. Análise de Clientes — ranking, geografia, concentração de risco. 5. Previsão — projeção de faturamento. 6. Recomendação — cross-sell por market basket.

Como funciona

Arquitetura

Insights de negócio

5 achados acionáveis

1. Margem sob pressão. 30 produtos são vendidos abaixo do custo de importação; o pior tem margem de −10,54%. → Revisão urgente da tabela de preços.

2. E-commerce domina. 98% da receita vem do digital; apenas 2% da loja física. → Investir no digital tem retorno 49× maior que expandir a loja.

3. Base B2B de alta recorrência. 49 clientes fazendo ~200 pedidos cada — o perfil é de distribuidores/revendedores. Estratégia deve ser personalizada por conta.

4. Concentração saudável. Top 5 = 12,9%, Top 10 = 24,6% da receita — base bem distribuída, sem dependência crítica de um cliente. Aliada à recorrência de 100% (zero clientes one-time), o foco se desloca para expansão por conta.

5. Cross-sell identificado. 5 produtos (IDs 11, 35, 51, 103, 122) são comprados juntos por 77% dos clientes — candidatos prioritários para kits.

Resultados quantificados

Números do negócio

R$ 2,61 bi
receita líquida analisada
9.895
pedidos · 79.311 itens vendidos
7 → 0
problemas de qualidade resolvidos
Stack & decisões
Python · Pandas Power BI · DAX Streamlit Arquitetura Medallion Star Schema (Kimball) Parquet SQL Forecasting · Regressão Linear Market Basket Analysis
Sub-projetos

Aprofunde em cada frente

Cada uma das 6 frentes pode ser explorada em detalhe. Aqui as 4 que já têm página própria: