Freigeben über


Transformieren von Daten durch Ausführen eines Notebooks

Verwenden Sie die Notizbuchaktivität, um Notizbücher auszuführen, die Sie in Microsoft Fabric als Teil Ihrer Data Factory-Pipelines erstellen. Mit Notizbüchern können Sie Apache Spark-Aufträge ausführen, um Ihre Daten als Teil Ihrer Datenworkflows einzubringen, zu bereinigen oder zu transformieren. Es ist einfach, Ihren Pipelines in Fabric eine Notizbuchaktivität hinzuzufügen, und dieser Leitfaden führt Sie durch jeden Schritt.

Voraussetzungen

Um zu beginnen, müssen die folgenden Voraussetzungen erfüllt sein:

Erstellen einer Notizbuchaktivität

  1. Erstellen Sie eine neue Pipeline in Ihrem Arbeitsbereich.

  2. Suchen Sie im Bereich der Pipelineaktivitäten nach „Notebook“ und fügen Sie es der Pipeline-Canvas hinzu.

    Screenshot: Fabric-Benutzeroberfläche mit Aktivitätenbereich und hervorgehobener Notebook-Aktivität.

  3. Wählen Sie die neue Notebook-Aktivität im Canvas aus, wenn sie noch nicht ausgewählt ist.

    Screenshot: Registerkarte „Allgemeine Einstellungen“ der Notebook-Aktivität.

    Weitere Informationen zur Konfiguration der Registerkarte Allgemein finden Sie in der Anleitung zu den Allgemeinen Einstellungen.

Konfigurieren von Notizbucheinstellungen

Wählen Sie die Registerkarte Einstellungen aus.

Wählen Sie unter "Verbindung" die Authentifizierungsmethode für die Ausführung des Notizbuchs aus, und geben Sie die erforderlichen Anmeldeinformationen an.

Wählen Sie ein vorhandenes Notizbuch aus der Dropdownliste " Notizbuch " aus, und geben Sie optional alle Parameter an, die an das Notizbuch übergeben werden sollen.

Screenshot: Hervorgehobene Registerkarte „Notebook-Einstellungen“, auf der ein Notebook ausgewählt werden kann und Parameter festgelegt werden können.

Sitzungstag festlegen

Um den Zeitaufwand für die Ausführung Ihres Notebookauftrags zu minimieren, können Sie optional ein Sitzungstag festlegen. Durch Festlegen des Sitzungstags wird Spark angewiesen, vorhandene Spark-Sitzungen wiederzuverwenden, wodurch die Startzeit minimiert wird. Jeder beliebige Zeichenfolgenwert kann für den Sitzungs-Tag verwendet werden. Wenn keine Sitzung vorhanden ist, wird mithilfe des Tagwerts ein neues erstellt.

Screenshot der Registerkarte „Notebookeinstellungen“, die hervorgehoben ist, um den Bereich zu zeigen, in dem der Sitzungs-Tag hinzugefügt wird.

Hinweis

Um den Session-Tag verwenden zu können, muss der Modus „Hohe Parallelität“ für die Pipeline, die das Ausführen mehrerer Notebooks ermöglicht, aktiviert sein. Diese Option finden Sie unter dem Modus „Hohe Parallelität“ für Spark-Einstellungen unter den Arbeitsbereichseinstellungen

Screenshot der Registerkarte „Arbeitsbereichseinstellungen“ mit Hervorhebung der Registerkarte, auf welcher der Modus für hohe Parallelität für Pipelines mit mehreren Notebooks aktiviert werden soll.

Speichern, Ausführen oder Planen der Pipeline

Wechseln Sie oben im Pipeline-Editor zur Registerkarte " Start ", und wählen Sie die Schaltfläche "Speichern" aus, um Ihre Pipeline zu speichern. Wählen Sie "Ausführen" aus, um sie direkt auszuführen, oder planen Sie die Ausführung zu bestimmten Zeiten oder Intervallen. Weitere Informationen zu Pipelineausführungen finden Sie unter: Pipelineausführungen planen.

Screenshot, das die Registerkarte „Start“ im Pipeline-Editor zeigt, mit hervorgehobenen Schaltflächen für Speichern, Ausführen und Planen sowie den Namen der Registerkarte.

Nach dem Ausführen können Sie die Ausführung der Pipeline überwachen und den Ausführungsverlauf über die Registerkarte Ausgabe unterhalb des Zeichenbereichs anzeigen.

Bekannte Probleme

  • Die WI-Option in den Verbindungseinstellungen wird in einigen Fällen nicht angezeigt. An einem Fix für diesen Fehler wird derzeit gearbeitet.
  • Die Verwendung des Dienstprinzipals zum Ausführen eines Notizbuchs, das semantischen Link-Code enthält, weist funktionale Einschränkungen auf und unterstützt nur eine Teilmenge von semantischen Link-Features. Ausführliche Informationen finden Sie in den unterstützten Funktionen für semantische Verknüpfungen . Um andere Funktionen zu verwenden, empfiehlt es sich, die semantische Verknüpfung mit einem Dienstprinzipal manuell zu authentifizieren.
  • Einige Kunden sehen möglicherweise die Dropdownliste "Workspace Identity (WI)" nicht, oder sie wird angezeigt, aber sie können keine Verbindung erstellen. Dieses Verhalten ist auf ein bekanntes Problem in einer unserer zugrunde liegenden Plattformkomponenten zurückzuführen. Die Korrektur wird derzeit bearbeitet.