Gera??o aumentada por recupera??o (RAG)

Technology Radar

Atualizado em : Oct 23, 2024

N?O ENTROU NA EDI??O ATUAL

Este blip n?o está na edi??o atual do Radar. Se esteve em uma das últimas edi??es, é provável que ainda seja relevante. Se o blip for mais antigo, pode n?o ser mais relevante e nossa avalia??o pode ser diferente hoje. Infelizmente, n?o conseguimos revisar continuamente todos os blips de edi??es anteriores do Radar. Saiba mais

Oct 2024

Adote

é o padr?o preferido por nossas equipes para melhorar a qualidade das respostas geradas por um modelo de linguagem de grande porte (LLM). Nós a usamos com sucesso em muitos projetos, incluindo a . Com RAG, informa??es sobre documentos relevantes e confiáveis s?o armazenadas em um banco de dados. Para um determinado prompt, o banco de dados é consultado, documentos relevantes s?o recuperados, e o prompt é aumentado com o conteúdo dos documentos, fornecendo assim um contexto mais rico ao LLM. Isso resulta em uma saída de maior qualidade e alucina??es drasticamente reduzidas. A janela de contexto — que determina o tamanho máximo da entrada do LLM — cresceu significativamente com os modelos mais recentes, mas selecionar os documentos mais relevantes ainda é uma etapa crucial. Nossa experiência indica que um contexto menor cuidadosamente construído pode produzir melhores resultados do que um contexto amplo e grande. Usar um contexto grande também é mais lento e mais caro. Costumávamos confiar apenas em embeddings armazenados em um banco de dados vetorial para identificar contexto adicional. Agora, estamos vendo reclassifica??o e busca híbrida: ferramentas de busca como Elasticsearch Relevance Engine, bem como abordagens como que utilizam grafos de conhecimento criados com a ajuda de um LLM. Uma abordagem baseada em grafos funcionou particularmente bem em nosso trabalho de compreens?o de bases de código legadas com GenAI.

Apr 2024

Adote

A é o padr?o preferido por nossas equipes para melhorar a qualidade das respostas geradas por um modelo de linguagem de grande porte (LLM). A técnica tem sido utilizada com sucesso em diversos projetos, incluindo a . Com a RAG, informa??es sobre documentos relevantes e confiáveis - em formatos como HTML e PDF - s?o armazenadas em bancos de dados que suportam um tipo de dados vetoriais ou pesquisa eficiente de documentos, como pgvector, Qdrant ou Elasticsearch Relevance Engine. Para um comando específico, o banco de dados é consultado para recuperar documentos relevantes, que s?o ent?o combinados com o prompt para fornecer um contexto mais rico para o LLM. Isso resulta em saídas de alta qualidade e numa grande redu??o de alucina??es (respostas irrelevantes). A janela de contexto - que determina o tamanho máximo da entrada do LLM - é limitada, o que significa que selecionar os documentos mais relevantes é crucial. Melhoramos a relev?ncia do conteúdo que é adicionado ao comando por meio de uma nova classifica??o. Da mesma forma, os documentos geralmente s?o grandes demais para calcular um embedding, o que significa que eles devem ser divididos em partes menores. Esse costuma ser um problema complexo, e uma abordagem é fazer com que as partes se sobreponham até certo ponto.

Sep 2023

Experimente

é uma técnica para combinar memória paramétrica e n?o paramétrica pré-treinada para gera??o de linguagem. Ela permite que você aumente o conhecimento existente de LLMs pré-treinados com conhecimento privado e contextual do seu domínio ou setor. Com RAG, você primeiro recupera um conjunto de documentos relevantes da memória n?o paramétrica (geralmente por meio de uma busca de similaridade a partir de um datastore vetorial) e, em seguida, usa a memória paramétrica dos LLMs para gerar uma saída que seja consistente com os documentos recuperados. Nós achamos que RAG é uma técnica eficaz para uma variedade de tarefas de processamento de linguagem natural (PLN) que requerem conhecimento profundo, incluindo respostas a perguntas, resumo e gera??o de histórias.

Publicado : Sep 27, 2023

Baixe o PDF

?

English?|?Espa?ol?|?笔辞谤迟耻驳耻ê蝉?|?中文

Inscreva-se para receber a newsletter do Technology Radar

Seja assinante

魅影直播

Solu??es

滨苍诲ú蝉迟谤颈补蝉

Destaques

Ferramentas e Publica??es Digitais

Todos os Insights

Baixe o PDF

?

?

?

Inscreva-se para receber a newsletter do Technology Radar

?

Visite nosso arquivo para acessar os volumes anteriores