Flagship · End-to-end

Projeto Completo

Capa do projeto completo LH Nautical
Pandas Power BI Streamlit ML

LH Nautical — Do caos dos dados aos insights

Projeto end-to-end para um varejista náutico: 4 bases brutas → arquitetura medallion → dashboards executivos, previsão e recomendação. R$ 2,61 bilhões de receita analisada, 5 insights de negócio acionáveis, 7 problemas de qualidade resolvidos.

Power BI

Projetos Dashboard

Abrir dashboard Diagrama do pipeline ETL BanVic
Power BI SQL · ETL

BanVic Analytics — Desafio Lighthouse · V2

Versão revisada do Desafio Lighthouse 2024: pipeline ETL em PostgreSQL (schema stg_banvic), staging layer antes do Power BI e integração com IPCA para análise macroeconômica. 998 clientes · 72 mil transações · 2.000 propostas.

Abrir dashboard
Power BI Analytics

BanVic Dashboard Desafio Lighthouse — V1

Primeira entrega do Desafio Lighthouse 2024: análise do banco BanVic com foco em clientes, agências, contas, propostas de crédito e transações financeiras. Transformações realizadas no Power Query.

Abrir dashboard
Power BI SQL Server

Dashboard Game Sales

Dashboard interativo focado na análise de vendas e avaliações no setor de videogames. SQL para explorar a base de dados, Power BI com DAX e Power Query para visualização, layout criado no Figma.

Abrir dashboard
Power BI Python MySQL

Dashboard Bolsas do ProUni

Análise de dados de bolsas do ProUni concedidas entre 2015 e 2019. Distribuição por tipo, localização, curso, faixa etária, sexo e evolução anual com recursos de filtros e storytelling.

Dashboard de Produção

Gestão de qualidade e produtividade industrial. Monitora peças aprovadas e rejeitadas, horas produzidas e tempos de parada. Filtros por colaborador e período para análises mês a mês.

Dashboard de Recursos Humanos

Foco em contratações, colaboradores ativos, demissões e taxa de turnover. Distribuição por cidade e gênero, estrutura hierárquica por áreas e cargos com gráfico de funil e tooltip personalizado.

Análise de RH — People Analytics

Análise de desempenho, satisfação e perfil dos colaboradores. Indicadores como salário médio, distribuição por idade e gênero, correlação entre satisfação e desempenho filtrados por departamento.

Power BI

Em breve

Novo projeto de dashboard em desenvolvimento.

Power BI

Em breve

Novo projeto de dashboard em desenvolvimento.

Inteligência Artificial

Projetos de IA Generativa

Diagrama da arquitetura do assistente UCBvet
Groq RAG Flask

UCBvet — Assistente de IA

Assistente RAG (com Groq) para uma empresa de inseminação bovina: responde sobre vendas, visitas e protocolos em linguagem natural, cruzando banco de dados e documentos.

Diagrama do pipeline RAG do chatbot de documentos
ChromaDB Streamlit RAG

RAG Chatbot — Documentos

Chatbot que lê PDFs e TXT e responde perguntas sobre eles. Pipeline RAG modular com Streamlit, ChromaDB, embeddings e busca semântica.

Em breve
IA Generativa

Próximo projeto de IA

Novo projeto de IA generativa em planejamento — em breve por aqui.

Machine Learning

Projetos de Machine Learning

Pipeline de ML do projeto de empregabilidade estudantil
scikit-learn XGBoost

Predição de Empregabilidade

Classificação binária para identificar precocemente alunos em risco de não-colocação. 4 modelos comparados sob validação cruzada (F1 ≈ 0,99).

Pipeline de ML do projeto de saúde mental
scikit-learn XGBoost

Predição de Depressão (Adolescentes)

Modelo de triagem de saúde mental sobre base pública. Comparação de modelos com GridSearchCV, priorizando ROC-AUC (0,99) — apoio à decisão, não diagnóstico.

Diagrama do sistema de recomendação de produtos
Pandas Recomendação

Sistema de Recomendação

Recomendação de produtos para cross-sell: popularidade (cold-start), produtos relacionados e market basket analysis (pares comprados juntos).

Python

Projetos Pandas

Gráfico de taxa de fraude por categoria de transação
Python Pandas scikit-learn

Detecção de Fraudes em Cartão

EDA e modelo de classificação sobre 1,3 milhão de transações de cartão de crédito, num cenário de classes fortemente desbalanceadas (0,58% de fraude).

Curva ABC de produtos para otimização de estoque
Pandas ABC

Otimização de Estoque (Curva ABC)

Priorização de estoque por curva ABC sobre 33 mil SKUs de e-commerce (Olist): ~26% dos produtos geram 80% da receita — onde concentrar controle e capital.

Matriz de retenção por coorte
Python Pandas

Análise de Retenção por Coorte

Coorte de 4.339 clientes de e-commerce: quem volta a comprar e quando. Retenção mês a mês, com a coorte fundadora retendo ~2× mais que as demais.

Python

Projetos Python

Gráfico do impacto do atraso na entrega sobre a avaliação
Python Pandas

Logística & Entrega — O Custo do Atraso

Análise de 96 mil pedidos de e-commerce (Olist): a nota do cliente despenca de 4,3 para 1,7 quando a entrega atrasa. Quantificando o impacto do atraso na satisfação.

Em breve
Python Streamlit

App de Análise com Streamlit

Aplicação interativa construída com Streamlit para visualização e análise de dados em tempo real, com filtros dinâmicos e gráficos responsivos.

Em breve
Python ETL

Web Scraping e ETL

Coleta automatizada de dados de fontes web com Python, transformação e carga em banco de dados relacional para análises posteriores.

Engenharia de Dados

Projetos Databricks

Diagrama da arquitetura medallion do projeto EmpregaDados
Databricks PySpark Delta Lake

Pipeline Medallion — EmpregaDados

Arquitetura medallion (Bronze → Silver → Gold) no Databricks com PySpark e Delta Lake, transformando pedidos e estabelecimentos em tabelas analíticas de vendas.

Em breve
Databricks Delta Lake

Delta Lake com PySpark

Projeto de engenharia de dados com Delta Lake, aplicando versionamento, ACID transactions e otimização de queries para análises de alta performance.

Em breve
Databricks Workflows

Orquestração de Workflows

Criação e orquestração de workflows de dados no Databricks, com agendamento, monitoramento e tratamento de falhas em pipelines de produção.

Banco de Dados

Projetos em SQL

Receita por categoria via SQL
SQL Window Functions

Análise de Vendas com SQL

Receita por categoria e concentração com SQL analítico real: CTEs e window functions (SUM OVER, RANK) sobre dados de e-commerce — sem exportar pra planilha.

Diagrama de star schema
SQL Star Schema

Modelagem Dimensional

Projeto de star schema (Kimball) sobre dados de e-commerce: tabela-fato + 4 dimensões, grão definido, PK/FK — a fundação para análises e BI rodarem rápido.

Segmentação RFM de clientes via SQL
SQL RFM · NTILE

Segmentação RFM com SQL

Segmentação de ~93 mil clientes em SQL puro: NTILE sobre Recência, Frequência e Valor + CASE para nomear segmentos (Campeões, Em risco, Hibernando…).

Taxa de sucesso por categoria no Kickstarter
SQL + passo a passo

Kickstarter — O que faz vingar?

Sobre 370 mil projetos do Kickstarter: só 36% vingam. SQL revela o sucesso por categoria (Dance 63% × Technology 20%) e por meta. Inclui página de desenvolvimento passo a passo.