IA Generativa · RAG

RAG Chatbot — Converse com seus Documentos

Envie um PDF ou TXT e pergunte em português: o sistema lê, indexa e responde com base no que está escrito no documento — um pipeline RAG modular do zero.

Ano 2024 Papel Desenvolvimento de IA Status Concluído

Ver no GitHub

Contexto

O problema

Documentos longos — contratos, manuais técnicos, relatórios — guardam respostas que custam tempo para encontrar. Ler tudo para tirar uma única dúvida é inviável no dia a dia.

A ideia foi permitir conversar com o documento: fazer uma pergunta em linguagem natural e receber a resposta ancorada exatamente no conteúdo do arquivo.

Solução

Como resolvi

Montei um pipeline RAG modular em Python. Na ingestão, o documento (PDF/TXT) é carregado, dividido em chunks e convertido em embeddings, armazenados num vector store ChromaDB.

Na consulta, a pergunta dispara uma busca semântica pelos trechos mais relevantes, que são enviados ao LLM junto da memória da conversa — gerando uma resposta fundamentada. A interface foi feita em Streamlit, com autenticação de usuário.

Como funciona

Arquitetura

Diagrama do pipeline RAG: na ingestão, o documento PDF/TXT passa por loader e chunks, vira embeddings e é guardado no ChromaDB; na consulta, a pergunta dispara busca semântica que recupera o contexto do ChromaDB e alimenta o RAGChain com o LLM e a memória de conversa, produzindo a resposta. — Dois fluxos: **ingestão** (documento → vetores) e **consulta** (pergunta → contexto → resposta), conectados pelo vector store.

Ferramentas

Stack & decisões

Python Streamlit ChromaDB RAG Embeddings · busca semântica Memória de conversa

Todos os projetos Entre em contato