Projetos
IA Generativa · RAG

RAG Chatbot — Converse com seus Documentos

Envie um PDF ou TXT e pergunte em português: o sistema lê, indexa e responde com base no que está escrito no documento — um pipeline RAG modular do zero.

Ano 2024 Papel Desenvolvimento de IA Status Concluído
Contexto

O problema

Documentos longos — contratos, manuais técnicos, relatórios — guardam respostas que custam tempo para encontrar. Ler tudo para tirar uma única dúvida é inviável no dia a dia.

A ideia foi permitir conversar com o documento: fazer uma pergunta em linguagem natural e receber a resposta ancorada exatamente no conteúdo do arquivo.

Solução

Como resolvi

Montei um pipeline RAG modular em Python. Na ingestão, o documento (PDF/TXT) é carregado, dividido em chunks e convertido em embeddings, armazenados num vector store ChromaDB.

Na consulta, a pergunta dispara uma busca semântica pelos trechos mais relevantes, que são enviados ao LLM junto da memória da conversa — gerando uma resposta fundamentada. A interface foi feita em Streamlit, com autenticação de usuário.

Como funciona

Arquitetura

Ferramentas

Stack & decisões

Python Streamlit ChromaDB RAG Embeddings · busca semântica Memória de conversa