O que é RAG?

RAG (Retrieval-Augmented Generation) é uma técnica que aprimora as respostas de Modelos de Linguagem Grandes (LLMs) ao recuperar informações relevantes de uma base de conhecimento externa e fornecê-las como contexto para o processo de geração. Ele atua como uma ponte entre o conhecimento estático do modelo e fontes de informação dinâmicas e específicas.

Como Funciona

O RAG opera em duas fases principais:

Recuperação: Quando uma consulta é recebida, o sistema busca em uma base de conhecimento (como uma coleção de documentos de projeto ou trechos de código) as informações mais relevantes. Isso geralmente é feito usando busca semântica sobre embeddings de vetores.
Geração: As informações recuperadas são então combinadas com a consulta original e passadas para o LLM. O modelo usa esse contexto aumentado para gerar uma resposta mais precisa, detalhada e ciente do contexto.

Pense no RAG como dar à IA um exame com "livro aberto". Em vez de depender apenas de seus dados de treinamento memorizados, ela pode consultar fatos e padrões específicos da documentação do seu projeto para responder a perguntas e gerar código.

Perguntas Comuns

RAG é uma ferramenta específica? RAG é um padrão arquitetural, não uma única ferramenta. O Reasoning implementa um servidor RAG integrado, mas o conceito pode ser aplicado com vários bancos de dados vetoriais e sistemas de recuperação.
O RAG substitui o fine-tuning? Não, ele o complementa. O fine-tuning adapta o comportamento central do modelo, enquanto o RAG fornece informações específicas e atualizadas em tempo de execução. Eles podem ser usados juntos para resultados ótimos.
Como a base de conhecimento é criada? Você constrói a base de conhecimento adicionando documentos, trechos de código ou qualquer informação baseada em texto usando as ferramentas fornecidas. Esse conteúdo é então convertido em embeddings para uma busca eficiente.

RAG no AI Cockpit Reasoning

O AI Cockpit Reasoning implementa um servidor RAG integrado para:

Conectar-se a uma base de conhecimento local e persistente.
Fornecer uma interface consistente para adicionar e recuperar contexto específico do projeto.
Estender o conhecimento da IA sem a necessidade de retreinar ou fazer fine-tuning do modelo.
Permitir a geração e análise de código altamente contextualizadas sob demanda.

O RAG oferece uma maneira poderosa de tornar o assistente de IA ciente das convenções, arquitetura e requisitos únicos do seu projeto, levando a resultados significativamente melhores.

Saiba Mais Sobre RAG

Pronto para se aprofundar? Confira estes guias:

Base de Conhecimento RAG - Um guia sobre como usar e gerenciar o servidor RAG embarcado.
Guia de Testes RAG - Aprenda como testar a funcionalidade RAG no Reasoning.

Como Funciona​

Perguntas Comuns​

RAG no AI Cockpit Reasoning​

Saiba Mais Sobre RAG​

Como Funciona

Perguntas Comuns

RAG no AI Cockpit Reasoning

Saiba Mais Sobre RAG