Compartilhar via


O que é Espelhamento no Fabric?

O espelhamento no Fabric é uma solução de baixo custo e baixa latência para reunir dados de vários sistemas em uma única plataforma de análise. Você pode replicar continuamente seu conjunto de dados existente diretamente no OneLake da plataforma Fabric a partir de uma variedade de bancos de dados do Azure e de fontes de dados externas.

Com os dados mais atualizados em um formato consultável no OneLake, agora você pode usar todos os diferentes serviços no Fabric, como executar análises com Spark, executar notebooks, executar engenharia de dados, visualizar por meio de relatórios do Power BI e muito mais.

O espelhamento no Fabric permite que os usuários desfrutem de um produto altamente integrado, de ponta a ponta e fácil de usar projetado para simplificar suas necessidades de análise. Criado para promover a abertura e a colaboração entre a Microsoft e soluções de tecnologia que podem ler o formato de tabela do Delta Lake de software livre, o Espelhamento é uma solução pronta para uso, de baixo custo e baixa latência, que permite criar uma réplica dos seus dados no OneLake, que pode ser utilizada para todas as suas necessidades analíticas.

As tabelas Delta podem ser usadas em toda a Fabric, permitindo que os usuários acelerem sua jornada na Fabric.

O espelhamento é habilitado criando uma conexão segura com sua fonte de dados operacional. Você escolhe se deseja replicar um banco de dados inteiro ou tabelas individuais e o Espelhamento manterá seus dados sincronizados automaticamente. Depois de configurados, os dados serão replicados continuamente no OneLake para consumo de análise.

Por que usar o espelhamento no ambiente Fabric?

Hoje, muitas organizações têm dados operacionais ou analíticos críticos em silos.

Acessar e trabalhar com esses dados hoje requer pipelines complexos de ETL (Extrair, Transformar, Carregar), processos de negócios e silos de decisão, criando:

  • Acesso restrito e limitado a dados importantes, sempre em constante alteração
  • Atrito entre pessoas, processo e tecnologia
  • Longos tempos de espera para criar pipelines e processos para dados extremamente importantes
  • Sem liberdade para usar as ferramentas necessárias para analisar e compartilhar insights confortavelmente
  • Falta de uma base adequada para as pessoas compartilharem e colaborarem em dados
  • Não há formatos de dados abertos comuns para todos os cenários analíticos – BI, IA, Integração, Engenharia e até aplicativos

O espelhamento no Fabric fornece uma experiência fácil para acelerar o tempo para obter valor em insights e decisões, e eliminar silos de dados entre soluções de tecnologia.

  • Replicação quase em tempo real de dados e metadados em um data lake do SaaS, com análises embutidas para BI e IA

A plataforma Microsoft Fabric baseia-se em uma base de SaaS (Software como Serviço), que leva a simplicidade e a integração a um nível totalmente novo. Para saber mais sobre Microsoft Fabric, consulte O que é Microsoft Fabric?

Veja a seguir os princípios principais do espelhamento:

  • Habilitar o Espelhamento no Fabric é simples e intuitivo, sem precisar criar pipelines de ETL complexos, alocar outros recursos de computação e gerenciar a movimentação de dados.

  • O espelhamento no Fabric é um serviço totalmente gerenciado, portanto, você não precisa se preocupar em hospedar, manter ou gerenciar a replicação da conexão espelhada.

Espelhamento de objetos

O espelhamento cria estes itens no workspace do Fabric:

  • O espelhamento gerencia a replicação de dados e metadados no OneLake e sua conversão em Parquet, em um formato pronto para análise. Isso permite cenários downstream, como engenharia de dados, ciência de dados e muito mais.
  • Um endpoint de análise SQL

Além do editor de consultas SQL há um amplo ecossistema de ferramentas, incluindo SQL Server Management Studio (SSMS), a extensão MSSQL para Visual Studio Code e até GitHub Copilot.

O compartilhamento permite a facilidade de controle de acesso e gerenciamento, para garantir que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões segura e democratizada em toda a sua organização.

Tipos de espelhamento

O Fabric oferece três abordagens diferentes para trazer dados para o OneLake por meio do espelhamento.

  • Database mirroring – o espelhamento de banco de dados em Microsoft Fabric permite a replicação de bancos de dados e tabelas inteiros, permitindo que você reúna dados de vários sistemas em uma única plataforma de análise.
  • Espelhamento de metadados – o espelhamento de metadados no Fabric sincroniza metadados (como nomes de catálogo, esquemas e tabelas) em vez de mover fisicamente os dados. Essa abordagem aproveita os atalhos, garantindo que os dados permaneçam em sua fonte enquanto ainda estão facilmente acessíveis no Fabric.
  • Espelhamento aberto – O espelhamento aberto no Fabric foi projetado para estender o espelhamento com base no formato de tabela Delta Lake aberto. Essa funcionalidade permite que qualquer desenvolvedor escreva os dados de alteração do aplicativo diretamente em um item de banco de dados espelhado em Microsoft Fabric, com base na abordagem de espelhamento aberto e nas APIs públicas.

Atualmente, os seguintes bancos de dados externos estão disponíveis:

Platform Replicação quase em tempo real Tipo de espelhamento Tutorial completo
Microsoft Fabric bancos de dados espelhados de Azure Cosmos DB Yes Espelhamento de banco de dados Tutorial: Azure Cosmos DB
Bancos de dados espelhados do Microsoft Fabric no Azure Databricks Yes Espelhamento de metadados Tutorial: Azure Databricks
Microsoft Fabric bancos de dados espelhados de Azure Database for PostgreSQL servidor flexível Yes Espelhamento de banco de dados Tutorial: Azure Database for PostgreSQL Servidor Flexível
Microsoft Fabric bancos de dados espelhados do Azure SQL Database Yes Espelhamento de banco de dados Tutorial: Azure SQL Database
Bancos de dados espelhados do Microsoft Fabric do Azure SQL Managed Instance Yes Espelhamento de banco de dados Tutorial: Azure SQL Managed Instance
Bancos de dados do Microsoft Fabric espelhados do Google BigQuery (versão prévia) Yes Espelhamento de banco de dados Tutorial: Google BigQuery
Microsoft Fabric bancos de dados espelhados do Oracle (versão prévia) Yes Espelhamento de banco de dados Tutorial: Oracle
Microsoft Fabric bancos de dados espelhados do SAP Yes Espelhamento de banco de dados Tutorial: SAP
Microsoft Fabric bancos de dados replicados do Snowflake Yes Espelhamento de banco de dados Tutorial: Floco de Neve
Bancos de dados espelhados do SQL Server no Microsoft Fabric Yes Espelhamento de banco de dados Tutorial: SQL Server
Abrir bancos de dados espelhados Yes Abrir espelhamento Tutorial: Abrir espelhamento
Banco de dados espelhados do Microsoft Fabric a partir do Banco de Dados SQL do Fabric Yes Espelhamento de banco de dados Configurado automaticamente

Replicação quase em tempo real

Quase em tempo real pode depender de uma variedade de fatores, incluindo:

  • Local/região da origem
  • Localização/região do destino
  • Volume de alterações
  • Frequência de alterações
  • Largura de banda de rede e latência da origem
  • Recursos de computação alocados para o gateway de dados local

Como funciona o espelhamento de banco de dados?

Os arquivos Delta chegam incrementalmente ao Fabric por meio da fonte de dados. O método de identificar os dados alterados incrementalmente varia em cada fonte de dados. No SQL Server 2025, por exemplo, o SQL Database Engine verifica o log de transações do banco de dados de origem em alta frequência. SQL Server publica alterações para cada tabela em arquivos correspondentes na zona de destino do Fabric.

Dentro do Fabric, um mecanismo de replicador está sempre em execução e verificando arquivos recém-publicados em alta frequência. O Fabric mescla imediatamente as alterações recebidas na tabela delta de destino. As alterações podem ser publicadas tão rápido quanto a cada 15 segundos.

A lógica de recuo para detectar a baixa atividade evita sobrecarga excessiva em mecanismos de fonte de dados fora do ambiente Fabric e reduz a latência ao responder à frequência das alterações nos dados recebidos.

Diagrama de como funciona o Espelhamento de Banco de Dados do Fabric.

Como funciona o espelhamento de metadados?

O espelhamento não só habilita a replicação de dados, mas também pode ser obtido por meio de atalhos ou espelhamento de metadados em vez de replicação completa de dados, permitindo que os dados fiquem disponíveis sem movê-los fisicamente ou duplicá-los. O espelhamento nesse contexto refere-se à replicação de apenas metadados, como nomes de catálogo, esquemas e tabelas, em vez dos próprios dados reais. Essa abordagem permite que o Fabric torne os dados de diferentes fontes acessíveis sem duplicá-los, simplificando o gerenciamento de dados e minimizando as necessidades de armazenamento.

Por exemplo, ao acessar dados registrados no Catálogo do Unity, o Fabric espelha apenas a estrutura do catálogo do Azure Databricks, permitindo que os dados subjacentes sejam acessados por meio de atalhos. Esse método garante que todas as alterações nos dados de origem sejam refletidas instantaneamente no Fabric sem a necessidade de movimentação de dados, mantendo a sincronização em tempo real e aumentando a eficiência no acesso a informações atualizadas.

Como funciona o espelhamento aberto?

Além de espelhar a habilitação da replicação de dados criando uma conexão segura com sua fonte de dados, você também pode selecionar um provedor de dados existente ou gravar seu próprio aplicativo para inserir dados no banco de dados espelhado. Depois de criar um banco de dados espelhado aberto por meio da API pública ou por meio do portal do Fabric, você poderá obter uma URL de zona de destino no OneLake, onde poderá obter dados de alteração por especificação de espelhamento aberto.

Depois que os dados estiverem na zona de destino com o formato adequado, a replicação começará a ser executada e gerenciará a complexidade de mesclar as alterações com atualizações, inserir e excluir a serem refletidas em tabelas delta. Esse método garante que todos os dados gravados na zona de aterrissagem serão imediatamente atualizados e manterão os dados no Fabric atualizados.

Compartilhamento

O compartilhamento permite facilidade no controle de acesso e gerenciamento, enquanto controles de segurança como segurança em nível de linha (RLS) e segurança em nível de objeto (OLS), entre outros, garantem que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões segura e democratizada em toda a sua organização.

Ao compartilhar, os usuários concedem a outros usuários ou a um grupo de usuários acesso a um banco de dados espelhado sem dar acesso ao workspace e ao restante de seus itens. Quando alguém compartilha um banco de dados espelhado, também concede acesso ao endpoint de análise do SQL.

Para obter mais informações, consulte Compartilhar seu banco de dados espelhado e gerenciar permissões.

Consultas entre bancos de dados

Com os dados do banco de dados espelhado armazenados no OneLake, você pode escrever consultas transacionais entre bancos de dados, unindo dados de bancos de dados espelhados, de armazéns de dados e dos pontos de extremidade de análise SQL dos Lakehouses em uma única consulta T-SQL. Para obter mais informações, consulte Gravar uma consulta entre bancos de dados.

Por exemplo, você pode referenciar a tabela de bancos de dados espelhados e armazéns usando nomenclatura de três partes. No exemplo a seguir, use o nome em três partes para fazer referência ao ContosoSalesTable no armazém ContosoWarehouse. Em outros bancos de dados ou armazenamentos, a primeira parte da convenção de nomenclatura de três partes do SQL padrão é o nome do banco de dados espelhado.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Custo do espelhamento

Para espelhamento de banco de dados e espelhamento aberto, a computação do Fabric e o armazenamento do OneLake são gratuitos até um limite baseado em capacidade.

  • O armazenamento para réplicas é gratuito até um limite com base no tamanho da capacidade. O espelhamento oferece um terabyte gratuito de armazenamento em modo espelho para cada unidade de capacidade (CU) que você comprou. Por exemplo, se você adquirir uma capacidade F64, receberá 64 terabytes de armazenamento gratuito, usados exclusivamente para espelhamento. O armazenamento OneLake será cobrado se o limite gratuito de armazenamento de espelhamento for excedido ou se a capacidade for suspensa. Para obter mais informações, consulte Microsoft Fabric Pricing.
  • A computação do Background Fabric usada para replicar seus dados no Fabric OneLake é gratuita e não consome capacidade. Solicitações diretamente ao OneLake para dados espelhados consomem capacidade como é o caso do consumo normal de computação do OneLake. A computação para consultar dados usando SQL, Power BI ou Spark é cobrada a taxas regulares.
  • Uma capacidade do Fabric em execução é necessária apenas para a configuração inicial do Espelhamento.

Engenharia de dados com seus dados de banco de dados espelhados

Microsoft Fabric fornece vários recursos de engenharia de dados para garantir que seus dados sejam facilmente acessíveis, bem organizados e de alta qualidade. Na Engenharia de Dados do Fabric, é possível:

  • Crie e gerencie seus dados no Spark usando um lakehouse
  • Projetar pipelines para copiar dados em seu Lakehouse
  • Usar definições de trabalho do Spark para enviar tarefas em lote/streaming para o cluster Spark
  • Usar notebooks para escrever código para ingestão, preparação e transformação de dados

Ciência de Dados com seus dados de banco de dados espelhados

Microsoft Fabric oferece o Fabric Data Science para capacitar os usuários a concluir fluxos de trabalho de ciência de dados de ponta a ponta para fins de enriquecimento de dados e insights de negócios. Você pode concluir uma ampla gama de atividades em todo o processo de ciência de dados, desde exploração, preparação e limpeza de dados até experimentação, modelagem, pontuação de modelo e fornecimento de insights preditivos para relatórios de BI.

Usuários do Microsoft Fabric podem acessar cargas de trabalho de Ciência de Dados. A partir daí, eles podem descobrir e acessar vários recursos relevantes. Por exemplo, eles podem criar experimentos, modelos e blocos de anotações de machine learning. Eles também podem importar blocos de anotações existentes na home page da Ciência de Dados.

Direct Lake com seus dados de banco de dados espelhados

Direct Lake modo pode ser usado com bancos de dados espelhados em Microsoft Fabric para habilitar a consulta de alto desempenho em dados espelhados sem a necessidade de movimentação ou duplicação de dados. Quando um banco de dados espelhado é criado, seus dados são armazenados no formato Delta Lake no OneLake. Esse formato nativo permite que Power BI e outras ferramentas de análise se conectem por meio do modo Direct Lake, oferecendo insights quase em tempo real acessando diretamente os arquivos subjacentes. Essa integração combina a simplicidade do espelhamento com a velocidade e a escalabilidade do Direct Lake, permitindo relatórios rápidos e atualizados sobre dados operacionais.

Retenção para dados espelhados

O espelhamento no Fabric replica continuamente seu patrimônio de dados existente para o OneLake no formato de tabela Delta Lake. Para manter os dados espelhados armazenados com eficiência e sempre prontos para análise, o espelhamento executa automaticamente o vácuo para remover arquivos antigos não mais referenciados por um log Delta.

Você pode personalizar a configuração de retenção de acordo com seus requisitos. Por exemplo, você pode escolher um período de retenção mais curto para reduzir o consumo de armazenamento de espelhamento ou estender o período de retenção para utilizar as capacidades de viagem no tempo da Delta para análises.

Para bancos de dados espelhados criados no portal do Fabric após meados de junho de 2025, a retenção padrão é um dia. Para bancos de dados espelhados antigos, o padrão é sete dias. Para verificar ou atualizar a configuração de retenção, no portal do Fabric, navegue até a guia de > do banco de dados espelhado -> -Delta e especifique o limite de retenção. Você também pode configurá-la por meio da API pública especificando a retentionInDays propriedade.

Banco de dados SQL no Fabric

Você também pode criar e gerenciar diretamente um banco de dados SQL no Microsoft Fabric no portal do Fabric. Com base em Azure SQL Database, o banco de dados SQL no Fabric é automaticamente espelhado para fins de análise e permite que você crie facilmente seu banco de dados operacional no Fabric. O banco de dados SQL é a base das cargas de trabalho de OLTP no Fabric e pode se integrar à integração com controle de versão do Fabric.