Partilhar via


O que é espelhamento em malha?

O espelhamento na malha é uma solução de baixo custo e baixa latência para reunir dados de vários sistemas em uma única plataforma de análise. Pode replicar continuamente o seu património de dados existente diretamente no OneLake da Fabric a partir de várias bases de dados Azure e fontes de dados externas.

Com os dados mais recentes em um formato consultável no OneLake, pode agora usar todos os diferentes serviços no Fabric, como realizar análises com o Spark, executar cadernos, engenharia de dados, visualização através de relatórios do Power BI e muito mais.

O espelhamento no Fabric permite que os usuários desfrutem de um produto altamente integrado, completo e fácil de usar, projetado para simplificar suas necessidades de análise. Criado para abertura e colaboração entre a Microsoft e soluções tecnológicas que podem ler o formato de tabela Delta Lake de código aberto, o Mirroring é uma solução turnkey de baixo custo e baixa latência que permite criar uma réplica de seus dados no OneLake que pode ser usada para todas as suas necessidades analíticas.

As tabelas Delta podem ser usadas em qualquer lugar no Fabric, permitindo que os utilizadores acelerem a sua jornada no Fabric.

O espelhamento é habilitado criando uma conexão segura com sua fonte de dados operacionais. Escolhe se replica uma base de dados inteira ou tabelas individuais e o espelhamento manterá automaticamente os seus dados sincronizados. Uma vez configurados, os dados irão replicar-se continuamente no OneLake para consumo analítico.

Por que usar o espelhamento na malha?

Hoje, muitas organizações têm dados operacionais ou analíticos de missão crítica em silos.

Acessar e trabalhar com esses dados hoje requer pipelines complexos de ETL (Extract Transform Load), processos de negócios e silos de decisão, criando:

  • Acesso restrito e limitado a dados importantes e em constante mudança
  • Atrito entre pessoas, processos e tecnologia
  • Longos tempos de espera para criar pipelines e processos para dados criticamente importantes
  • Não há liberdade para usar as ferramentas que você precisa para analisar e compartilhar insights confortavelmente
  • Falta de uma base adequada para as pessoas compartilharem e colaborarem em dados
  • Não há formatos de dados abertos comuns para todos os cenários analíticos - BI, IA, integração, engenharia e até mesmo aplicativos

O espelhamento no Fabric oferece uma experiência fácil para acelerar o tempo para gerar valor a partir de insights e decisões e para quebrar o isolamento de dados entre soluções tecnológicas.

  • Replicação quase em tempo real de dados e metadados em um data lake SaaS, com análise integrada para BI e IA

A plataforma Microsoft Fabric assenta numa base de Software como Serviço (SaaS), que eleva a simplicidade e a integração a um novo patamar. Para saber mais sobre Microsoft Fabric, veja O que é Microsoft Fabric?

A seguir estão os princípios fundamentais do espelhamento:

  • Habilitar o espelhamento na malha é simples e intuitivo, sem a necessidade de criar pipelines de ETL complexos, alocar outros recursos de computação e gerenciar a movimentação de dados.

  • O espelhamento no Fabric é um serviço totalmente gerenciado, portanto, você não precisa se preocupar com hospedagem, manutenção ou gerenciamento da replicação da conexão espelhada.

Espelhar objetos

O espelhamento cria estes itens no espaço de trabalho do Fabric:

  • O espelhamento gerencia a replicação de dados e metadados no OneLake e a conversão para o Parquet, em um formato pronto para análise. Isso permite cenários downstream, como engenharia de dados, ciência de dados e muito mais.
  • Um endpoint de análise SQL

Para além do editor de consultas SQL, existe um vasto ecossistema de ferramentas, incluindo SQL Server Management Studio (SSMS), a extensão MSSQL para Visual Studio Code e até GitHub Copilot.

O compartilhamento permite facilitar o controle e o gerenciamento de acesso, para garantir que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões seguras e democratizadas em toda a sua organização.

Tipos de espelhamento

O Fabric oferece três abordagens diferentes para trazer dados para o OneLake por meio do espelhamento.

  • Espelhamento de bases de dados – O espelhamento de bases de dados em Microsoft Fabric permite a replicação de bases de dados e tabelas inteiras, permitindo reunir dados de vários sistemas numa única plataforma analítica.
  • Espelhamento de metadados – O espelhamento de metadados na malha sincroniza metadados (como nomes de catálogo, esquemas e tabelas) em vez de mover fisicamente os dados. Essa abordagem aproveita os atalhos, garantindo que os dados permaneçam em sua origem enquanto ainda são facilmente acessíveis no Fabric.
  • Espelhamento aberto – O espelhamento aberto no Fabric foi projetado para estender o espelhamento com base no formato de tabela aberta Delta Lake. Esta capacidade permite a qualquer programador escrever os dados de alteração da sua aplicação diretamente num item de base de dados espelhado no Microsoft Fabric, com base na abordagem de espelhamento aberto e APIs públicas.

Atualmente, estão disponíveis as seguintes bases de dados externas:

Platform Replicação quase em tempo real Tipo de espelhamento Tutorial de ponta a ponta
Microsoft Fabric bases de dados espelhadas a partir de Azure Cosmos DB Yes Espelhamento de banco de dados Tutorial: Azure Cosmos DB
Base de dados espelhada do Microsoft Fabric a partir do Azure Databricks Yes Espelhamento de metadados Tutorial: Azure Databricks
Bases de dados espelhadas do Microsoft Fabric no Azure Database para PostgreSQL servidor flexível Yes Espelhamento de banco de dados Tutorial: Azure Database for PostgreSQL servidor flexível
Microsoft Fabric bases de dados espelhadas do Azure SQL Database Yes Espelhamento de banco de dados Tutorial: Azure SQL Database
Microsoft Fabric bases de dados espelhadas a partir de Azure SQL Managed Instance Yes Espelhamento de banco de dados Tutorial: Azure SQL Managed Instance
Microsoft Fabric bases de dados espelhadas do Google BigQuery (pré-visualização) Yes Espelhamento de banco de dados Tutorial: Google BigQuery
Microsoft Fabric bases de dados espelhadas da Oracle (pré-visualização) Yes Espelhamento de banco de dados Tutorial: Oracle
Bases de dados espelhadas do Microsoft Fabric a partir do SAP Yes Espelhamento de banco de dados Tutorial: SAP
Bases de dados espelhadas do Microsoft Fabric do Snowflake Yes Espelhamento de banco de dados Tutorial: Floco de neve
Microsoft Fabric bases de dados espelhadas a partir de SQL Server Yes Espelhamento de banco de dados Tutorial: SQL Server
Abrir bancos de dados espelhados Yes Ativar espelhamento Tutorial: Abrir espelhamento
Microsoft Fabric bases de dados espelhadas a partir da base de dados SQL Fabric Yes Espelhamento de banco de dados Configurado automaticamente

Replicação quase em tempo real

O tempo quase real pode depender de vários fatores, incluindo:

  • Localização/região de origem
  • Localização/região de destino
  • Volume das alterações
  • Frequência das alterações
  • Largura de banda da rede e latência em relação à fonte
  • Recursos computacionais alocados ao gateway de dados local

Como funciona o espelhamento de bases de dados?

Os ficheiros Delta chegam incrementalmente no Fabric a partir da fonte de dados. O método de identificação dos dados alterados incrementalmente varia em cada fonte de dados. No SQL Server 2025, por exemplo, o SQL Database Engine analisa o registo de transações da base de dados de origem com alta frequência. O SQL Server publica alterações para cada tabela em ficheiros correspondentes na zona de aterragem do Fabric.

Dentro do Fabric, um motor replicador está sempre a correr e a analisar ficheiros recém-publicados com alta frequência. O Fabric integra imediatamente as alterações recebidas na tabela delta de destino. As alterações podem ser publicadas tão rapidamente quanto a cada 15 segundos.

A lógica de backoff para detetar baixa atividade evita sobrecarga excessiva nos motores de origem de dados fora do Fabric e reduz a latência ao responder à frequência das mudanças nos dados recebidos.

Diagrama do funcionamento do Espelhamento da Base de Dados Fabric.

Como funciona o espelhamento de metadados?

O espelhamento não só permite a replicação de dados, mas também pode ser alcançado por meio de atalhos ou espelhamento de metadados em vez da replicação completa de dados, permitindo que os dados estejam disponíveis sem movê-los fisicamente ou duplicá-los. O espelhamento, nesse contexto, refere-se à replicação apenas de metadados, como nomes de catálogo, esquemas e tabelas, em vez dos dados reais em si. Essa abordagem permite que o Fabric torne os dados de diferentes fontes acessíveis sem duplicá-los, simplificando o gerenciamento de dados e minimizando as necessidades de armazenamento.

Por exemplo, ao aceder a dados registados no Catálogo Unity, o Fabric espelha apenas a estrutura do catálogo do Azure Databricks, permitindo que se aceda aos dados subjacentes através de atalhos. Esse método garante que todas as alterações nos dados de origem sejam refletidas instantaneamente no Fabric sem exigir a movimentação de dados, mantendo a sincronização em tempo real e melhorando a eficiência ao aceder a informações atualizadas.

Como funciona o espelhamento aberto?

Além de espelhamento, que permite a replicação de dados por meio da criação de uma conexão segura com a sua fonte de dados, você também pode selecionar um provedor de dados existente ou desenvolver seu próprio aplicativo para transferir dados para o banco de dados espelhado. Depois de criar um banco de dados espelhado aberto via API pública ou por meio do portal Fabric, você poderá obter uma URL de zona de aterrissagem no OneLake, onde poderá depositar dados de alteração conforme a especificação de espelhamento aberto.

Quando os dados estiverem na zona de aterrissagem com o formato adequado, a replicação começará a ser executada e gerenciará a complexidade de mesclar as alterações com atualizações, inserir e excluir para serem refletidas em tabelas delta. Esse método garante que todos os dados gravados na zona de pouso serão imediatamente e manterão os dados no Fabric up-to-date.

Partilha

O compartilhamento facilita o controle e o gerenciamento de acesso, enquanto os controles de segurança, como RLS (segurança em nível de linha) e OLS (segurança em nível de objeto), entre outros, garantem que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões seguras e democratizadas em toda a sua organização.

Ao compartilhar, os usuários concedem a outros usuários ou a um grupo de usuários acesso a um banco de dados espelhado sem dar acesso ao espaço de trabalho e ao restante de seus itens. Quando alguém compartilha um banco de dados espelhado, também fornece acesso ao endpoint de análises SQL.

Para obter mais informações, consulte Compartilhar seu banco de dados espelhado e gerenciar permissões.

Consultas entre bancos de dados

Com os dados do teu banco de dados espelhado armazenados no OneLake, podes escrever consultas entre bancos de dados, juntando dados de bancos de dados espelhados, armazéns e endpoints de análise SQL dos Lakehouses numa única consulta T-SQL. Para obter mais informações, consulte Escrever uma consulta entre bancos de dados.

Por exemplo, pode-se referenciar a tabela a partir de bancos de dados espelhados e armazéns de dados usando uma nomenclatura de três partes. No exemplo a seguir, use o nome de três partes para referenciar ContosoSalesTable no depósito ContosoWarehouse. De outros bancos de dados ou depósitos, a primeira parte da convenção de nomenclatura SQL padrão de três partes é o nome do banco de dados espelhado.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Custo do espelhamento

Para espelhamento de banco de dados e espelhamento aberto, a computação do Fabric e o armazenamento OneLake são gratuitos até um limite predeterminado baseado em capacidade.

  • O armazenamento para réplicas é gratuito até um limite baseado na capacidade. O espelhamento oferece um terabyte gratuito de armazenamento de espelhamento para cada unidade de capacidade (UC) adquirida. Por exemplo, se você comprar uma capacidade F64, obterá 64 terabytes gratuitos de armazenamento, usados exclusivamente para espelhamento. O armazenamento do OneLake é cobrado se o limite de armazenamento de espelhamento gratuito for excedido ou quando a capacidade for pausada. Para mais informações, consulte Microsoft Fabric Preços.
  • A computação de malha em segundo plano usada para replicar seus dados no Fabric OneLake é gratuita e não consome capacidade. Solicitações diretamente ao OneLake para dados espelhados consomem capacidade como o consumo normal de computação do OneLake. O cálculo para consultar dados usando SQL, Power BI ou Spark é cobrado a taxas normais.
  • Uma capacidade de Fabric em execução é necessária apenas para a configuração inicial do espelhamento.

Engenharia de dados com seus dados de banco de dados espelhados

A Microsoft Fabric oferece várias capacidades de engenharia de dados para garantir que os seus dados são facilmente acessíveis, bem organizados e de alta qualidade. No Fabric Data Engineering, você pode:

  • Crie e gerencie seus dados como Spark usando uma lakehouse
  • Projete pipelines para copiar dados para sua casa no lago
  • Usar definições de trabalho do Spark para submeter trabalhos em lote e streaming para o cluster Spark
  • Usar blocos de anotações para escrever código para ingestão, preparação e transformação de dados

Ciência de dados com seus dados de banco de dados espelhados

A Microsoft Fabric oferece a Ciência de Dados Fabric para capacitar os utilizadores a completar fluxos de trabalho completos de ciência de dados, com o objetivo de enriquecimento de dados e insights empresariais. Você pode concluir uma ampla gama de atividades em todo o processo de ciência de dados, desde a exploração, preparação e limpeza de dados até a experimentação, modelagem, pontuação de modelos e fornecimento de insights preditivos para relatórios de BI.

Os utilizadores do Microsoft Fabric podem aceder às cargas de trabalho de Data Science. A partir daí, eles podem descobrir e acessar vários recursos relevantes. Por exemplo, eles podem criar experimentos, modelos e notebooks de aprendizado de máquina. Eles também podem importar Blocos de Anotações existentes na página inicial de Ciência de Dados.

Direct Lake com os seus dados de base de dados espelhados

O modo Direct Lake pode ser usado com bases de dados espelhadas em Microsoft Fabric para permitir consultas de alto desempenho sobre dados espelhados sem necessidade de movimentação ou duplicação de dados. Quando um banco de dados espelhado é criado, seus dados são armazenados no formato Delta Lake no OneLake. Este formato nativo permite que o Power BI e outras ferramentas de análise se conectem via modo Direct Lake, oferecendo insights quase em tempo real ao aceder diretamente aos ficheiros subjacentes. Essa integração combina a simplicidade do espelhamento com a velocidade e a escalabilidade do Direct Lake, permitindo relatórios rápidos e atualizados sobre dados operacionais.

Retenção para dados espelhados

O espelhamento no Fabric replica continuamente a sua infraestrutura de dados existente no OneLake em formato de tabela do Delta Lake. Para manter os dados espelhados armazenados de forma eficiente e sempre prontos para análise, o espelhamento executa automaticamente o vácuo para remover arquivos antigos que não são mais referenciados por um log Delta.

Você pode personalizar a configuração de retenção de acordo com suas necessidades. Por exemplo, pode optar por um período de retenção mais curto para não consumir tanto armazenamento de espelhamento ou alargar o período de retenção para explorar as capacidades de viagem no tempo do sistema Delta para análises.

Para bancos de dados espelhados criados a partir do portal Fabric após meados de junho de 2025, a retenção padrão é de um dia. Para bancos de dados espelhados antigos, o padrão é sete dias. Para verificar ou atualizar a definição de retenção, no portal Fabric, navegue até à sua base de dados espelhada ->Definições ->separador de gestão de tabelas Delta , e especifique o limiar de retenção. Você também pode configurá-lo via API pública especificando a retentionInDays propriedade.

Banco de dados SQL no Fabric

Também pode criar e gerir diretamente uma base de dados SQL em Microsoft Fabric dentro do portal Fabric. Com base no Azure SQL Database, a base de dados SQL no Fabric é automaticamente espelhada para fins de análise e permite-lhe criar facilmente a sua base de dados operacional no Fabric. O banco de dados SQL é a página inicial do Fabric para cargas de trabalho OLTP e pode se integrar à integração de controle de origem do Fabric.