Olá, eu sou

Jair
Pereira

Transformando dados em soluções inteligentes através de Engenharia de Dados, Analytics Engineering, IA Generativa e visualização estratégica.

0+
Anos de experiência
0+
Projetos entregues
0+
Ferramentas dominadas
0+
Certificações
Stack tecnológico
Python
SQL
Power BI
Snowflake
dbt
Airbyte
Apache Spark
Pandas
BigQuery
Databricks
Docker
Azure
PostgreSQL
Streamlit
n8n
Langchain
Python
SQL
Power BI
Snowflake
dbt
Airbyte
Apache Spark
Pandas
BigQuery
Databricks
Docker
Azure
PostgreSQL
Streamlit
n8n
Langchain
Quem sou eu

Sobre mim

Jair Pereira
Disponível para projetos

Sou Jair Pereira, Engenheiro e Analista de Dados apaixonado por transformar dados brutos em decisões estratégicas. Com mais de 4 anos de experiência, construo pipelines robustos, dashboards de alto impacto e automações com IA que geram valor real para o negócio.

Minha jornada passou por análise, engenharia e agora também IA Generativa — sempre buscando entregar soluções que unem técnica com visão de negócio e storytelling de dados.

Pipelines escaláveis com Databricks, dbt e Snowflake
Dashboards estratégicos com Power BI e DAX
Automações inteligentes com LangChain e n8n
Modelagem dimensional e Data Warehouse
Análise exploratória e storytelling com Python
~/jair/profile.sh
$ cat profile.json
{
"nome"      :  "Jair Pereira"
"cargo"    :  "Engenheiro de Dados"
"local"    :  "Belo Horizonte, MG"
"exp"      :  "4+ anos"
"status"   :  true  // disponível
"foco"     :  "Dados · BI · IA Gen"
}
$ _
O que eu faço

Áreas de atuação

Engenharia de Dados

Projeto e construção de pipelines escaláveis, arquitetura medallion e integração de múltiplas fontes para analytics de alto desempenho.

dbt · Databricks Snowflake · BigQuery Airbyte · Apache Spark Delta Lake · PySpark Docker · Azure

Analytics & BI

Dashboards estratégicos, modelagem dimensional e análises orientadas a negócio que transformam dados em insights acionáveis para decisão executiva.

Power BI · DAX Power Query · SQL Metabase · Python Pandas · Matplotlib Figma · Storytelling

IA Generativa

Automações inteligentes e soluções com LLMs que aumentam produtividade, integram sistemas e entregam novos tipos de inteligência ao negócio.

LangChain · RAG n8n · OpenAI API LLMs · Agents Streamlit · FastAPI Automação · Workflows
Ferramentas e tecnologias

Stack completo

Linguagens
Python SQL DAX M (Power Query) PySpark HTML / CSS
Cloud & Big Data
Databricks Snowflake BigQuery Azure Apache Spark Delta Lake Airbyte
BI & Visualização
Power BI Metabase Streamlit Matplotlib Figma Pandas
IA & Automação
LangChain n8n OpenAI API LLMs RAG Agents
Banco de Dados
PostgreSQL MySQL SQL Server dbt
DevOps & Outros
Docker Git GitHub Jupyter VS Code
Experiência

Atuação profissional

Download CV
out/2022 — Presente
Desenvolvedor de Soluções Data & BI
Freelance
Desenvolvimento de soluções data-driven voltadas à integração, transformação e visualização de dados. Criação de pipelines ETL, dashboards analíticos e aplicações web para automação de processos e apoio à tomada de decisão.
jun/2020 — ago/2022
Analista Técnico I
Tecal Engenharia
Análise e processamento de dados técnicos e operacionais. Elaboração de relatórios e indicadores de desempenho. Suporte técnico e gestão de informações de projetos de engenharia.
Formação acadêmica

Educação

Pós-Graduação
IA Generativa e Aplicações com LLMs
PUC Minas
2025
Pós-Graduação
Engenharia de Dados
PUC Minas
2022
Graduação
Engenharia Elétrica
UNI BH
2018
Graduação
Publicidade e Propaganda
Estácio de Sá
2010
Técnico
Eletroeletrônica
UNA
2015
Técnico
Processamento de Dados
Colégio Brasileiro
2002
Certificações & Cursos

Qualificações

Indicium
Engenharia de Analytics
2025
DNC
Analista de BI
2025
Xperiun
Data Analytics
2024
CoderHouse
Data Analytics
2024
Microsoft
Azure Fundamentals – AZ-900
2022
Bootcamp
Data Engineering — AWS & Azure
2022
Portfólio

Projetos em destaque

Ver todos
Diagrama da arquitetura LH Nautical
Pandas Power BI ML

LH Nautical — Do caos dos dados aos insights

Projeto end-to-end para um varejista náutico: arquitetura medallion → dashboards executivos, previsão e recomendação. R$ 2,61 bilhões analisados.

Diagrama da arquitetura UCBvet
Groq RAG Flask

UCBvet — Assistente de IA

Assistente RAG para empresa de inseminação bovina: responde sobre vendas, visitas e protocolos em linguagem natural.

Pipeline de ML de empregabilidade
scikit-learn XGBoost

Predição de Empregabilidade

Classificação binária para identificar precocemente alunos em risco. 4 modelos comparados sob validação cruzada (F1 ≈ 0,99).

Diagrama do pipeline ETL BanVic
Power BI SQL · ETL

BanVic Analytics — Engenharia de Dados

Pipeline ETL em PostgreSQL + Power BI com integração IPCA. 998 clientes · 72 mil transações · 2.000 propostas.

Gráfico de taxa de fraude por categoria
Python Pandas scikit-learn

Detecção de Fraudes em Cartão

EDA e modelo sobre 1,3 milhão de transações num cenário de classes fortemente desbalanceadas (0,58% de fraude).

Diagrama medallion EmpregaDados
Databricks PySpark Delta Lake

Pipeline Medallion — EmpregaDados

Arquitetura medallion (Bronze → Silver → Gold) no Databricks com PySpark e Delta Lake, transformando pedidos em tabelas analíticas.

Vamos trabalhar juntos?

Transforme seus dados em
decisões inteligentes

Seja um pipeline de dados, um dashboard executivo ou uma automação com IA, estou pronto para ajudar seu negócio a crescer com dados.

Fale comigo

Contato

Vamos criar algo incrível?

Estou disponível para projetos freelance, consultoria de dados e oportunidades de trabalho. Mande uma mensagem!