Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Observação
Esta funcionalidade está atualmente em pré-visualização pública. Esta pré-visualização é fornecida sem estar sujeita a um acordo de nível de serviço e não é adequada para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para mais informações, consulte Termos de Utilização Suplementares para Microsoft Azure Pré-visualizações.
As bases de dados de grafos oferecem uma forma poderosa de modelar e consultar dados ligados. Ao contrário das bases de dados relacionais tradicionais que armazenam dados em tabelas, as bases de dados de grafos representam a informação como nós (entidades) e arestas (relações), facilitando a exploração de ligações e padrões complexos de forma mais flexível. Este artigo explica os conceitos centrais das bases de dados de grafos, como funcionam as consultas de grafos e descreve quando considerar usar uma base de dados de grafos para a sua carga de trabalho. Também compara grafos no Microsoft Fabric com implementações autónomas de bases de dados de grafos.
O tipo mais comum de base de dados de grafos implementa o modelo de grafo de propriedades rotuladas (LPG): entidades (nós) e relações (arestas) podem ter rótulos e propriedades (pares chave-valor). Esse modelo flexível permite designs opcionais e controlados por esquema, além de permitir que você expresse semântica rica. Como as conexões são armazenadas explicitamente como bordas, as consultas atravessam relacionamentos seguindo bordas em vez de calcular junções caras no momento da consulta.
Importante
Este artigo utiliza exclusivamente o conjunto de dados gráfico de exemplo de redes sociais.
Conceitos principais do banco de dados gráfico
- Os nós representam entidades como pessoas, produtos ou lugares. Os nós podem ter rótulos e propriedades que descrevem seus atributos. Por exemplo, um nó Pessoa pode ter propriedades como primeiro nome, sobrenome e idade.
- As arestas representam como as entidades estão conectadas, por exemplo FRIENDS_WITH, COMPRADA ou LOCATED_IN. As bordas também podem carregar propriedades e rótulos para codificar metadados de relacionamento.
- Propriedades associam detalhes a nós e arestas (por exemplo, o nome de uma pessoa ou a data de início de uma aresta). Como as relações são armazenadas explicitamente como bordas, as consultas navegam no gráfico seguindo conexões em vez de calculá-las no momento da consulta.
Como funciona a consulta de relações
As consultas de grafos recuperam informações conectadas percorrendo de um nó inicial para os seus vizinhos, depois para os vizinhos destes e assim por diante. O esforço que uma travessia realiza está ligado ao número de bordas que toca (o bairro local), não ao tamanho total do conjunto de dados. Esta característica torna questões sobre caminhos, ligações e padrões — como amigos de amigos, caminhos mais curtos ou dependências de múltiplos saltos — naturais e eficientes de expressar.
Os bancos de dados gráficos usam linguagens de consulta baseadas em padrões, como a GQL (Graph Query Language), cada vez mais adotada, para descrever essas travessias de forma concisa. O mesmo grupo de trabalho internacional que supervisiona o SQL (ISO/IEC 39075) está a padronizar o GQL, que alinha a consulta de grafos com os padrões estabelecidos de bases de dados.
Exemplo (correspondência de padrões com GQL):
MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100
Este padrão lê-se como: começando no nó de Pessoa de Annemarie, seguir as arestas :knows até cada nó de amigo, depois seguir as arestas :likes até os nós relacionados :Comment. Devolva os 100 comentários mais recentes ordenados pela data de criação.
Modelagem e esquema
Os modelos de dados gráficos são de esquema opcional: pode trabalhar com um esquema fixo quando houver necessidade de uma sólida governança ou evoluir o modelo quando novos tipos de nós, relações ou propriedades surgirem. Essa abordagem reduz a necessidade de duplicação de dados e permite que as equipes unifiquem dados de várias fontes sem um grande redesenho inicial.
Usos comuns para bancos de dados gráficos
As bases de dados de grafos alinham-se estreitamente com domínios onde as ligações geram valor, tais como:
- Redes sociais
- Grafos de conhecimento
- Sistemas de recomendação
- Redes de fraude e risco
- Topologia de rede e TI
- Análise da dependência da cadeia de abastecimento
Nesses cenários, as perguntas são menos sobre registros únicos e mais sobre quantas entidades se relacionam e interagem ao longo de vários saltos.
Quando considerar um banco de dados gráfico
Escolha uma base de dados de grafos quando:
- As suas principais questões envolvem caminhos, bairros e padrões em dados ligados.
- O número de saltos é variável ou não é conhecido antecipadamente.
- É preciso combinar e navegar por relações entre conjuntos de dados díspares.
Se fizer regularmente este tipo de perguntas, um modelo gráfico é uma escolha natural.
Como o grafo no Microsoft Fabric se compara em relação a bases de dados de grafos autónomas
Representar os seus dados como um grafo e armazená-los numa base de dados de grafos separada e autónoma introduz frequentemente ETL (extração, transformação, carga) e sobrecarga de governação. Em contraste, o gráfico opera diretamente no OneLake, o que reduz ou elimina a necessidade de pipelines ETL separados e duplicação de dados. Considere estas compensações:
- Movimentação e duplicação de dados: Bases de dados de grafos autónomas normalmente exigem extração, transformação e carregamento de dados para um armazenamento separado, o que aumenta a complexidade e pode levar à duplicação de conjuntos de dados. O Graph funciona no OneLake, por isso podes modelar e consultar dados ligados sem os mover.
- Custos operacionais: pilhas de gráficos autónomos funcionam como clusters ou serviços separados e frequentemente acarretam custos associados à capacidade ociosa. Em gráfico, as cargas de trabalho consomem unidades de capacidade agrupadas (CUs) com redução automática e métricas centralizadas, o que simplifica as operações e pode reduzir custos.
- Escalabilidade: Alguns bancos de dados gráficos autónomos dependem de aumento de escala ou clustering específico do fornecedor. O Graph foi concebido para grafos de grande escala e utiliza sharding escalonável entre múltiplos trabalhadores para gerir cargas de trabalho de big data de forma eficiente.
- Ferramentas e competências: Sistemas de grafos específicos de fornecedores podem exigir linguagens especializadas e frameworks analíticos separados. O Graph oferece uma modelação unificada, consultas baseadas em normas (GQL), algoritmos incorporados de análise de grafos, integração com BI e IA, e ferramentas exploratórias de baixo/não-código. Estas capacidades permitem que um conjunto mais vasto de utilizadores trabalhe com dados ligados.
- Governação e segurança: Implementações separadas de grafos precisam de configurações independentes de governação e segurança. Graph utiliza a governação, linhagem e controlo de acesso baseado em funções (RBAC) do OneLake, para que conformidade, auditoria e permissões se mantenham consistentes com o resto do seu ambiente Fabric.