RAG Chatbot — Converse com seus Documentos
Envie um PDF ou TXT e pergunte em português: o sistema lê, indexa e responde com base no que está escrito no documento — um pipeline RAG modular do zero.
O problema
Documentos longos — contratos, manuais técnicos, relatórios — guardam respostas que custam tempo para encontrar. Ler tudo para tirar uma única dúvida é inviável no dia a dia.
A ideia foi permitir conversar com o documento: fazer uma pergunta em linguagem natural e receber a resposta ancorada exatamente no conteúdo do arquivo.
Como resolvi
Montei um pipeline RAG modular em Python. Na ingestão, o documento (PDF/TXT) é carregado, dividido em chunks e convertido em embeddings, armazenados num vector store ChromaDB.
Na consulta, a pergunta dispara uma busca semântica pelos trechos mais relevantes, que são enviados ao LLM junto da memória da conversa — gerando uma resposta fundamentada. A interface foi feita em Streamlit, com autenticação de usuário.
Arquitetura