Projeto Completo
LH Nautical — Do caos dos dados aos insights
Projeto end-to-end para um varejista náutico: 4 bases brutas → arquitetura medallion → dashboards executivos, previsão e recomendação. R$ 2,61 bilhões de receita analisada, 5 insights de negócio acionáveis, 7 problemas de qualidade resolvidos.
Projetos Dashboard
BanVic Analytics — Desafio Lighthouse · V2
Versão revisada do Desafio Lighthouse 2024: pipeline ETL em PostgreSQL (schema stg_banvic), staging layer antes do Power BI e integração com IPCA para análise macroeconômica. 998 clientes · 72 mil transações · 2.000 propostas.
BanVic Dashboard Desafio Lighthouse — V1
Primeira entrega do Desafio Lighthouse 2024: análise do banco BanVic com foco em clientes, agências, contas, propostas de crédito e transações financeiras. Transformações realizadas no Power Query.
Dashboard Game Sales
Dashboard interativo focado na análise de vendas e avaliações no setor de videogames. SQL para explorar a base de dados, Power BI com DAX e Power Query para visualização, layout criado no Figma.
Dashboard Bolsas do ProUni
Análise de dados de bolsas do ProUni concedidas entre 2015 e 2019. Distribuição por tipo, localização, curso, faixa etária, sexo e evolução anual com recursos de filtros e storytelling.
Dashboard de Produção
Gestão de qualidade e produtividade industrial. Monitora peças aprovadas e rejeitadas, horas produzidas e tempos de parada. Filtros por colaborador e período para análises mês a mês.
Dashboard de Recursos Humanos
Foco em contratações, colaboradores ativos, demissões e taxa de turnover. Distribuição por cidade e gênero, estrutura hierárquica por áreas e cargos com gráfico de funil e tooltip personalizado.
Análise de RH — People Analytics
Análise de desempenho, satisfação e perfil dos colaboradores. Indicadores como salário médio, distribuição por idade e gênero, correlação entre satisfação e desempenho filtrados por departamento.
Em breve
Novo projeto de dashboard em desenvolvimento.
Em breve
Novo projeto de dashboard em desenvolvimento.
Projetos de IA Generativa
UCBvet — Assistente de IA
Assistente RAG (com Groq) para uma empresa de inseminação bovina: responde sobre vendas, visitas e protocolos em linguagem natural, cruzando banco de dados e documentos.
RAG Chatbot — Documentos
Chatbot que lê PDFs e TXT e responde perguntas sobre eles. Pipeline RAG modular com Streamlit, ChromaDB, embeddings e busca semântica.
Próximo projeto de IA
Novo projeto de IA generativa em planejamento — em breve por aqui.
Projetos de Machine Learning
Predição de Empregabilidade
Classificação binária para identificar precocemente alunos em risco de não-colocação. 4 modelos comparados sob validação cruzada (F1 ≈ 0,99).
Predição de Depressão (Adolescentes)
Modelo de triagem de saúde mental sobre base pública. Comparação de modelos com GridSearchCV, priorizando ROC-AUC (0,99) — apoio à decisão, não diagnóstico.
Sistema de Recomendação
Recomendação de produtos para cross-sell: popularidade (cold-start), produtos relacionados e market basket analysis (pares comprados juntos).
Projetos Pandas
Detecção de Fraudes em Cartão
EDA e modelo de classificação sobre 1,3 milhão de transações de cartão de crédito, num cenário de classes fortemente desbalanceadas (0,58% de fraude).
Otimização de Estoque (Curva ABC)
Priorização de estoque por curva ABC sobre 33 mil SKUs de e-commerce (Olist): ~26% dos produtos geram 80% da receita — onde concentrar controle e capital.
Análise de Retenção por Coorte
Coorte de 4.339 clientes de e-commerce: quem volta a comprar e quando. Retenção mês a mês, com a coorte fundadora retendo ~2× mais que as demais.
Projetos Python
Logística & Entrega — O Custo do Atraso
Análise de 96 mil pedidos de e-commerce (Olist): a nota do cliente despenca de 4,3 para 1,7 quando a entrega atrasa. Quantificando o impacto do atraso na satisfação.
App de Análise com Streamlit
Aplicação interativa construída com Streamlit para visualização e análise de dados em tempo real, com filtros dinâmicos e gráficos responsivos.
Web Scraping e ETL
Coleta automatizada de dados de fontes web com Python, transformação e carga em banco de dados relacional para análises posteriores.
Projetos Databricks
Pipeline Medallion — EmpregaDados
Arquitetura medallion (Bronze → Silver → Gold) no Databricks com PySpark e Delta Lake, transformando pedidos e estabelecimentos em tabelas analíticas de vendas.
Delta Lake com PySpark
Projeto de engenharia de dados com Delta Lake, aplicando versionamento, ACID transactions e otimização de queries para análises de alta performance.
Orquestração de Workflows
Criação e orquestração de workflows de dados no Databricks, com agendamento, monitoramento e tratamento de falhas em pipelines de produção.
Projetos em SQL
Análise de Vendas com SQL
Receita por categoria e concentração com SQL analítico real: CTEs e window functions (SUM OVER, RANK) sobre dados de e-commerce — sem exportar pra planilha.
Modelagem Dimensional
Projeto de star schema (Kimball) sobre dados de e-commerce: tabela-fato + 4 dimensões, grão definido, PK/FK — a fundação para análises e BI rodarem rápido.
Segmentação RFM com SQL
Segmentação de ~93 mil clientes em SQL puro: NTILE sobre Recência, Frequência e Valor + CASE para nomear segmentos (Campeões, Em risco, Hibernando…).
Kickstarter — O que faz vingar?
Sobre 370 mil projetos do Kickstarter: só 36% vingam. SQL revela o sucesso por categoria (Dance 63% × Technology 20%) e por meta. Inclui página de desenvolvimento passo a passo.