Condividi tramite


Specchio di Snowflake in Microsoft Fabric

Mirroring in Fabric offre un'esperienza semplice per evitare complessi ETL (Extract Transform Load) e integrare i dati esistenti del data warehouse Snowflake con il resto dei dati in Microsoft Fabric. È possibile replicare continuamente i dati Snowflake esistenti direttamente in OneLake di Fabric. All'interno di Fabric è possibile sbloccare potenti scenari di business intelligence, intelligenza artificiale, ingegneria dei dati, data science e condivisione dei dati.

Per una guida sulla configurazione del database Snowflake per il mirroring in Fabric, consulta Tutorial: Configurare i database con mirroring Microsoft Fabric da Snowflake.

Perché usare il mirroring in Fabric?

Con il Mirroring in Fabric, non è necessario unire servizi diversi da più fornitori. Al contrario, è possibile usufruire di un prodotto end-to-end altamente integrato e facile da usare, progettato per semplificare le tue esigenze di analisi e sviluppato per garantire apertura e collaborazione tra Microsoft, Snowflake e le migliaia di soluzioni tecnologiche in grado di leggere il formato di tabella open-source Delta Lake.

Quali esperienze di analisi sono integrate?

I database con mirroring sono un elemento nel Fabric Data Warehousing distinto dal Warehouse e dall'endpoint di analisi SQL.

Diagramma del mirroring del database di Fabric per Snowflake.

Il mirroring crea questi elementi nell'area di lavoro Fabric.

  • Elemento del database mirato. Ciò consente scenari downstream come ingegneria dei dati, data science e altro ancora. Il mirroring gestisce:
    • La replicazione dei metadati della tabella Iceberg in OneLake attraverso collegamenti rapidi alla risorsa di archiviazione che contiene le tabelle Iceberg. OneLake converte automaticamente queste tabelle Iceberg in tabelle formattate Delta Lake per l'uso tra carichi di lavoro di Fabric.
    • Replica dei dati della tabella gestita in OneLake e conversione in Parquet, in un formato pronto per l'analisi.
  • Un endpoint di analisi SQL

Ogni database con mirroring ha un endpoint di analisi SQL generato automaticamente che offre un'esperienza analitica avanzata sulle tabelle Delta create dal processo di mirroring. Gli utenti hanno accesso a comandi T-SQL familiari che possono definire ed eseguire query su oggetti dati, ma non modificare i dati dall'endpoint di analisi SQL, perché si tratta di una copia di sola lettura. È possibile eseguire le azioni seguenti nell'endpoint di analisi SQL:

  • Esplora le tabelle che fanno riferimento ai dati nelle tue tabelle Delta Lake da Snowflake.
  • Crea query e viste senza codice ed esplora i dati visivamente senza scrivere una riga di codice.
  • Sviluppare viste SQL, funzioni in linea con valori di tabella (FVF) e stored procedure per incapsulare la semantica e la logica di business in T-SQL.
  • Gestire le autorizzazioni per gli oggetti.
  • Eseguire query sui dati in altri warehouse e lakehouse nella stessa area di lavoro.

Oltre all'editor di query SQL, esiste un ampio ecosistema di strumenti in grado di eseguire query sull'endpoint di analisi SQL, tra cui SQL Server Management Studio (SSMS), l'estensione MSSQL per Visual Studio Code e anche GitHub Copilot.

Considerazioni sulla sicurezza

Per abilitare il mirroring di Fabric, sono necessarie autorizzazioni utente per il database Snowflake che concede le seguenti autorizzazioni:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Per altre informazioni, vedere la documentazione di Snowflake su Access Control Privilegi per le tabelle di streaming e Required Permissions for Streams.

Importante

Qualsiasi sicurezza granulare stabilita nel warehouse Snowflake di origine deve essere riconfigurata nel database con mirroring in Microsoft Fabric. Per ulteriori informazioni, vedere autorizzazioni granulari SQL in Microsoft Fabric.

Mirroring Snowflake dietro al firewall

Controllare i requisiti di rete per accedere all'origine dati Snowflake. Se l'origine dati Snowflake non è accessibile pubblicamente e si trova all'interno di una rete privata, creare un gateway dati di rete virtuale o installare un gateway dati locale per eseguire il mirroring dei dati. La Azure Virtual Network o la rete del computer gateway deve connettersi all'istanza Snowflake tramite un endpoint privato o essere consentite dalla regola del firewall. Per iniziare, vedere Tutorial: Configurare i database con mirroring abilitato in Microsoft Fabric da Snowflake.

Considerazioni sul costo di Snowflake con mirroring

Il calcolo di Fabric usato per replicare i dati in Fabric OneLake è gratuito. Il costo di archiviazione del mirroring è gratuito fino a un limite in base alla capacità. Per altre informazioni, vedere Costo del mirroring e Microsoft Fabric Prezzi. Il calcolo per l'esecuzione di query sui dati tramite SQL, Power BI o Spark viene addebitato a tariffe regolari.

Fabric non addebita costi per l'ingresso dei dati di rete in OneLake per il mirroring.

Sono previsti costi di calcolo e query cloud di Snowflake quando i dati vengono sottoposti a mirroring: calcolo del magazzino virtuale e calcolo dei servizi cloud.

  • Costi di calcolo del warehouse virtuale Snowflake:
    • I costi di calcolo verranno addebitati sul lato Snowflake se sono presenti modifiche ai dati che vengono lette in Snowflake e a loro volta vengono sottoposti a mirroring in Fabric.
    • Tutte le query di metadati eseguite in background per controllare eventuali modifiche ai dati non comportano costi di calcolo Snowflake; tuttavia, le query che generano dati, come ad esempio SELECT *, risvegliano il warehouse Snowflake e comportano spese per le risorse di calcolo.
  • Costi di calcolo dei servizi Snowflake:
    • Anche se non sono previsti costi di calcolo per le attività in background, ad esempio creazione, query di metadati, controllo di accesso, visualizzazione delle modifiche dei dati e anche query DDL, sono previsti costi cloud associati a queste query.
    • A seconda del tipo di edizione Snowflake di cui si dispone, verranno addebitati i crediti corrispondenti per i costi dei servizi cloud.

Nello screenshot seguente è possibile visualizzare i costi di calcolo del warehouse virtuale e dei servizi cloud per il database Snowflake associato di cui viene eseguito il mirroring in Fabric. In questo scenario, la maggior parte dei costi di calcolo dei servizi cloud (in giallo) proviene da query di modifica dei dati in base ai punti indicati in precedenza. I costi di calcolo del warehouse virtuale (in blu) derivano esclusivamente dalle modifiche ai dati, che vengono letti da Snowflake e sottoposti a mirroring in Fabric.

Screenshot del grafico dei costi di Snowflake.

Per altre informazioni sui costi di query cloud specifici di Snowflake, vedere la documentazione Snowflake: Comprendere i costi complessivi.

Passo successivo