Delen via


Aangepaste Spark-pools maken in Microsoft Fabric

Gebruik aangepaste Spark-pools om de rekenkracht voor uw workloads in Fabric aan te passen. U kunt de grootte van het knooppunt kiezen, automatisch schalen configureren en dynamische toewijzing van uitvoerders inschakelen.

Met aangepaste pools kunt u de prestaties en kosten in balans houden door schaallimieten in te stellen die overeenkomen met de vraag naar workloads.

Als u al startersgroepen gebruikt, zijn aangepaste pools een aanvullende optie wanneer u meer controle nodig hebt over het formaat en schaalgedrag voor specifieke workloads. Gebruik starterspools voor snel opstarten en standaardinstellingen en ga naar aangepaste pools wanneer u workloadspecifieke rekenkracht moet afstemmen. Zie Starterspools configureren in Fabric voor meer informatie over startersgroepen.

Vereiste voorwaarden

Een aangepaste Spark-pool maken:

  • U hebt de beheerdersrol in de werkruimte nodig.
  • Een capaciteitsbeheerder moet aangepaste werkruimtegroepeninschakelen in Spark Compute-instellingen voor de capaciteit.

Zie voor meer informatie Data Engineering en Data Science-instellingen configureren en beheren voor Fabric-capaciteiten.

Aangepaste Spark-pools maken

De Spark-pool maken of beheren die is gekoppeld aan uw werkruimte:

  1. Ga naar uw werkruimte en selecteer Werkruimte-instellingen.

    Schermopname die laat zien waar u Data Engineering kunt selecteren in de Werkruimte-instellingenmenu.

  2. Selecteer de optie Data Engineering/Science om het menu uit te vouwen en selecteer vervolgens Spark-instellingen.

    Schermopname van de detailweergave van Spark-instellingen.

  3. Selecteer Nieuwe pool in de vervolgkeuzelijst Standaardgroep voor werkruimte om een nieuwe aangepaste Spark-pool te maken. U kunt meerdere aangepaste pools maken en deze selecteren als de standaardgroep voor uw werkruimte.

  4. Voer op de pagina Nieuwe pool maken een poolnaam in. Selecteer een knooppuntfamilie (zoals geoptimaliseerd voor geheugen) en knooppuntgrootte op basis van de workloadvereisten. Zie de sectie Opties voor knooppuntgrootten hieronder voor meer informatie over knooppuntgrootten.

    Aanbeveling

    De grootte van het knooppunt wordt bepaald door capaciteitseenheden (CU), die de rekencapaciteit vertegenwoordigt die aan elk knooppunt is toegewezen.

    Schermopname met opties voor het maken van aangepaste pools.

  5. Configureer in de bewerkingsweergave automatische schaalaanpassing en wijs uitvoerders dynamisch toe.

    Schermopname met opties voor het maken van aangepaste pools voor automatisch schalen en dynamische toewijzing.

    Gebruik de schuifregelaars om elke instelling te verhogen of te verlagen op basis van uw workloadbehoeften.

    • Als automatische schaalaanpassing is ingeschakeld, wordt de pool geschaald tussen de geconfigureerde minimum- en maximumknooppuntwaarden op basis van activiteit.

    • Als uitvoerders dynamisch worden toegewezen, past Fabric de uitvoerderstoewijzing aan op basis van de werklastvraag binnen de geconfigureerde grenzen.

  6. Klik op Creëren.

Aangepaste pools hebben een standaard autopauze duur van 2 minuten na inactiviteit. Wanneer de automatische pauze is bereikt, verloopt de sessie en wordt het cluster gedealloceerd. Facturering is alleen van toepassing wanneer de berekening actief wordt gebruikt. Aangepaste Spark-pools in Microsoft Fabric momenteel een maximale knooppuntlimiet van 200 ondersteunen, dus zorg ervoor dat uw minimum- en maximumwaarden voor automatische schaalaanpassing binnen deze limiet blijven.

Opties voor knooppuntgrootte

Wanneer u een aangepaste Spark-pool instelt, kiest u uit de volgende knooppuntgrootten:

Grootte van knooppunt virtuele cores Geheugen (Gigabyte) Beschrijving
Klein 4 32 Voor lichtgewicht ontwikkel- en testtaken.
Gemiddeld 8 64 Voor algemene workloads en typische operaties.
Groot 16 128 Voor geheugenintensieve taken of grote gegevensverwerkingstaken.
X-groot 32 256 Voor de meest veeleisende Spark-workloads die belangrijke resources nodig hebben.
XX-Groot 64 512 Voor de grootste Spark-workloads waarvoor het hoogste reken- en geheugen per knooppunt is vereist.