Freigeben über


Azure Databricks

Hinweis

Dieser Connector gehört und wird von Databricks bereitgestellt.

Zusammenfassung

Gegenstand BESCHREIBUNG
Freigabezustand Allgemeine Verfügbarkeit
Produkte Power BI (Semantikmodelle)
Power BI (Datenflüsse)
Fabric (Dataflow Gen2)
Unterstützte Authentifizierungstypen Azure Active Directory
Persönliches Zugriffstoken
Benutzername und Kennwort

Hinweis

Der Azure Databricks Connector für Power BI unterstützt jetzt den Treiber Arrow Database Connectivity (ADBC). Diese Funktion ist in der Vorschau verfügbar. Hiererhalten Sie weitere Informationen.

Netzwerkvoraussetzungen

Für private Netzwerke müssen Sie die folgenden Netzwerkeinstellungen implementieren:

  • *.blob.core.windows.net* und *.store.core.windows.net müssen in Ihrer Netzwerkumgebung geöffnet sein.
  • Diese Liste der Zertifikatdownloads und Sperrungen muss auch zu Ihrer Zulassungsliste hinzugefügt werden.
  • Wenn die Firewallunterstützung für Ihr Databricks-Arbeitsbereichsspeicherkonto aktiviert ist, müssen Sie entweder ein Virtuelles Netzwerkdatengateway oder ein lokales Datengateway konfigurieren, um privaten Zugriff auf das Speicherkonto zu ermöglichen. Dadurch wird sichergestellt, dass der Fabric Power BI-Dienst weiterhin auf das Speicherkonto des Arbeitsbereichs zugreifen kann und CloudFetch weiterhin ordnungsgemäß funktioniert. Alternativ können Sie CloudFetch mit der Konfiguration EnableQueryResultDownload=0deaktivieren.

Unterstützte Funktionen

  • Importieren
  • DirectQuery (Power BI Semantikmodelle)

Herstellen einer Verbindung mit Databricks (AWS, Azure oder GCP) über Power Query Desktop

Führen Sie die folgenden Schritte aus, um eine Verbindung mit Databricks von Power Query Desktop herzustellen:

  1. Suchen Sie in der Get Data-Erfahrung nach Databricks, um den Azure Databricks-Connector auszuwählen. Verwenden Sie den Connector Azure Databricks für alle Databricks SQL Warehouse-Daten, es sei denn, Sie wurden anderweitig von Ihrem Databricks-Mitarbeiter angewiesen.

    Daten abrufen von Databricks Cloud.

  2. Geben Sie den Serverhostnamen und HTTP-Pfad für Ihr Databricks SQL Warehouse an. Unter Konfigurieren der ODBC- und JDBC-Treiber von Databricks finden Sie Anleitungen zur Suche nach „Serverhostname“ und „HTTP-Pfad“. Geben Sie diese Informationen entsprechend ein. Sie können optional einen Standardkatalog und/oder eine Datenbank unter Erweiterte Optionen bereitstellen. Wählen Sie OK aus, um fortzufahren.

    Geben Sie Ihr Databricks SQL Warehouse an.

  3. Geben Sie Ihre Anmeldeinformationen an, um sich bei Ihrem Databricks SQL Warehouse zu authentifizieren. Es gibt drei Optionen für Anmeldeinformationen:

    • Databricks-Clientanmeldeinformationen. Anweisungen zum Generieren von Databricks OAuth M2M Client-Anmeldeinformationen finden Sie unter Databricks OAuth M2M.

    • Persönliches Zugriffstoken (verwendbar für AWS, Azure oder GCP). Anweisungen zum Generieren eines Persönlichen Zugriffstokens (PAT) finden Sie unter Persönliche Zugriffstoken.

    • Azure Active Directory (nur für Azure verwendbar). Melden Sie sich mit dem Browser-Popup bei Ihrem Organisationskonto an.

      Geben Sie ein entsprechendes Token an.

    Hinweis

    Nachdem Sie Ihre Anmeldeinformationen für ein bestimmtes Databricks SQL Warehouse eingegeben haben, werden diese Anmeldeinformationen von Power BI Desktop zwischengespeichert und in nachfolgenden Verbindungsversuchen wiederverwendet. Sie können diese Anmeldeinformationen unter Datei > Optionen und Einstellungen > Datenquelleneinstellungen ändern. Weitere Informationen: Ändern Sie die Authentifizierungsmethode

  4. Nachdem Sie erfolgreich eine Verbindung hergestellt haben, zeigt der Navigator die Daten an, die Ihnen im Cluster verfügbar sind. Sie können entweder Transform Data auswählen, um die Daten mithilfe von Power Query oder Load zu transformieren, um die Daten in Power Query Desktop zu laden.

    Das Bild zeigt, wie der Power Query Navigator Databricks Cloud-Daten in die Desktop-App lädt.

Verbindung mit Databricks-Daten aus Power Query Online herstellen

Führen Sie die folgenden Schritte aus, um eine Verbindung mit Databricks von Power Query Online herzustellen:

  1. Wählen Sie die Option Azure Databricks in der Benutzeroberfläche zum Abrufen von Daten aus. Verschiedene Apps haben unterschiedliche Möglichkeiten, um auf die Power Query Online-Datenabruf-Funktion zuzugreifen. Weitere Informationen dazu, wie Sie in der Power Query Online die Datenerfassungserfahrung aus Ihrer App starten können, finden Sie unter Wo Sie Daten abrufen können.

    Verwenden Sie das Suchfeld, um die verfügbaren Databricks-Konnektoren einzugrenzen. Verwenden Sie den Connector Azure Databricks für alle Databricks SQL Warehouse-Daten, es sei denn, Sie wurden anderweitig von Ihrem Databricks-Mitarbeiter angewiesen.

    Screenshot der Databricks-Connectoroptionen in Power Query.

  2. Geben Sie den Server-Hostnamen und HTTP-Pfad für Ihr Databricks SQL Warehouse ein. Unter Konfigurieren der ODBC- und JDBC-Treiber von Databricks finden Sie Anleitungen zur Suche nach „Serverhostname“ und „HTTP-Pfad“. Sie können optional einen Standardkatalog und/oder eine Datenbank unter Erweiterte Optionen bereitstellen.

    Screenshot der Verbindungseinstellungen und Anmeldeinformationen für Azure Databricks.

  3. Geben Sie Ihre Anmeldeinformationen an, um sich bei Ihrem Databricks SQL Warehouse zu authentifizieren. Es gibt drei Optionen für Anmeldeinformationen:

    • Benutzername/Kennwort (verwendbar für AWS oder GCP). Diese Option ist nicht verfügbar, wenn Ihre Organisation/Ihr Konto 2FA/MFA verwendet.
    • Account Key (verwendbar für AWS, Azure oder GCP). Anweisungen zum Generieren eines Persönlichen Zugriffstokens (PAT) finden Sie unter Persönliche Zugriffstoken.
    • Azure Active Directory (nur für Azure verwendbar). Melden Sie sich mit dem Browser-Popup bei Ihrem Organisationskonto an.
  4. Nachdem Sie erfolgreich eine Verbindung hergestellt haben, erscheint der Navigator und zeigt die auf dem Server verfügbaren Daten an. Wählen Sie Ihre Daten im Navigator aus. Wählen Sie dann Next aus, um die Daten in Power Query zu transformieren.

    Screenshot des Power Query Navigators, der Databricks Cloud-Daten in die Online-App lädt.

Connectorimplementierung des Arrow Database Connectivity-Treibers (Vorschau)

Sie können den Arrow Database Connectivity (ADBC) Treiber für den Azure Databricks Connector in Power BI verwenden. Da wir diesen Connector weiterhin verbessern und neue Funktionen hinzufügen, empfehlen wir Ihnen, ein Upgrade auf die neueste Version durchzuführen, um es auszuprobieren und Produktfeedback zu übermitteln.

So wechseln Sie zum ADBC-Treiber:

  1. Öffnen Sie Ihr gewünschtes Dashboard in Power BI.
  2. Wählen Sie Daten transformieren aus.
  3. Wählen Sie Advanced Editor im Optionsabschnitt Query aus.
  4. Geben Sie für ADBC an Implementation="2.0" .
    let
        Source = Databricks.Catalogs("adb-<workspace-id>.<random-number>.azuredatabricks.net", "/sql/1.0/warehouses/<sql-warehouse-id>",
            [Catalog=null, Database=null, EnableAutomaticProxyDiscovery=null, Implementation="2.0"]),
        powerbi_Database = Source{[Name="powerbi",Kind="Database"]}[Data],
        default_Schema = powerbi_Database{[Name="default",Kind="Schema"]}[Data],
        dashboard_data_Table = default_Schema{[Name="dashboard_data",Kind="Table"]}[Data]
    in
        dashboard_data_Table
    

Einschränkungen und Überlegungen

  • Der Azure Databricks Connector unterstützt webproxy. Automatische Proxyeinstellungen, die in PAC-Dateien definiert sind, werden jedoch nicht unterstützt.
  • Im Azure Databricks Connector wird die Databricks.Query-Datenquelle in Kombination mit dem DirectQuery-Modus Power BI Semantikmodells nicht unterstützt.