Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Os bancos de dados vetoriais são projetados para armazenar e gerenciar incorporações vetoriais. As incorporações são representações numéricas de dados não numéricos que preservam o significado semântico. Pode vetorizar palavras, documentos, imagens, áudio e outros tipos de dados. Use embeddings para ajudar um modelo de IA a compreender o significado das entradas, permitindo que possa realizar comparações e transformações, como resumir texto, encontrar dados relacionados contextualmente ou criar imagens a partir de descrições textuais.
Por exemplo, você pode usar um banco de dados vetorial para:
- Identifique imagens, documentos e músicas semelhantes com base em seus conteúdos, temas, sentimentos e estilos.
- Identifique produtos semelhantes com base em suas características, recursos e grupos de usuários.
- Recomende conteúdos, produtos ou serviços com base nas preferências do utilizador.
- Identifique as melhores opções potenciais a partir de um grande conjunto de opções para atender a requisitos complexos.
- Identificar anomalias de dados ou atividades fraudulentas diferentes dos padrões predominantes ou normais.
Compreender a pesquisa vetorial
Os bancos de dados vetoriais fornecem recursos de pesquisa vetorial para encontrar itens semelhantes com base em suas características de dados, em vez de correspondências exatas em um campo de propriedade. A pesquisa vetorial funciona analisando as representações vetoriais dos seus dados que criou usando um modelo de embedding por IA, como os modelos de embedding Azure OpenAI. O processo de pesquisa mede a distância entre os vetores de dados e o vetor de consulta. Os vetores de dados mais próximos do vetor de consulta são os mais semelhantes semanticamente.
Alguns serviços, como o Azure Cosmos DB for MongoDB vCore , fornecem recursos nativos de pesquisa vetorial para seus dados. Outros bancos de dados podem ser aprimorados com a pesquisa vetorial indexando os dados armazenados usando um serviço como o Azure AI Search, que pode digitalizar e indexar seus dados para fornecer recursos de pesquisa vetorial.
Fluxos de trabalho de pesquisa vetorial com .NET e OpenAI
Os bancos de dados vetoriais e seus recursos de pesquisa são especialmente úteis em fluxos de trabalho de padrão RAG com o Azure OpenAI. Este padrão permite-lhe complementar o seu modelo de IA com conhecimento semanticamente rico adicional dos seus dados. Um fluxo de trabalho comum de IA que utiliza bases de dados vetoriais inclui estes passos:
- Crie incorporações para seus dados usando um modelo de incorporação OpenAI.
- Armazene e indexe as incorporações em um banco de dados vetorial ou serviço de pesquisa.
- Converta solicitações de usuário do seu aplicativo em incorporações.
- Execute uma pesquisa vetorial pelos seus dados, comparando o embedding do prompt do utilizador com os embeddings na sua base de dados.
- Use um modelo de linguagem como o GPT-4o para montar uma conclusão fácil de usar a partir dos resultados da pesquisa vetorial.
Visite o tutorial Implementar o Azure OpenAI com RAG usando pesquisa vetorial em um aplicativo .NET para obter um exemplo prático desse fluxo.
Outros benefícios do padrão RAG incluem:
- Gere respostas contextualmente relevantes e precisas às solicitações do usuário a partir de modelos de IA.
- Ultrapassar os limites dos tokens LLM — a pesquisa vetorial na base de dados realiza a maior parte do trabalho.
- Reduza os custos de frequentes ajustes finos a dados atualizados.