Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Den här artikeln är en översikt över dina alternativ för att skapa och hantera arbetsytor.
Vad är en arbetsyta?
En arbetsyta är en Azure Databricks-distribution på ett molntjänstkonto. Det ger en enhetlig miljö för att arbeta med Azure Databricks-tillgångar för en angiven uppsättning användare.
Det finns två typer av Databricks-arbetsytor:
- Serverlösa arbetsytor: En arbetsytedistribution i ditt Azure Databricks-konto som är förkonfigurerat med serverlös beräkning och standardlagring för att ge en helt serverlös upplevelse. Du kan fortfarande ansluta till din molnlagring från serverlösa arbetsytor.
- Hybridarbetsytor: Den här arbetsytedistributionen kallas även för en klassisk arbetsyta och etablerar lagrings- och beräkningsresurser i ditt befintliga Azure-konto. Serverlös beräkning är fortfarande tillgänglig i hybridarbetsytor.
Kravspecifikation
Innan du skapar en Azure Databricks-arbetsyta måste du ha en Azure-prenumeration som inte är en kostnadsfri utvärderingsprenumeration.
Om du har ett kostnadsfritt konto utför du följande steg:
- Gå till din profil och ändra din prenumeration till betala per användning. Se Kostnadsfritt Azure-konto.
- Ta bort utgiftsgränsen.
- Begär en kvotökning för vCPU:er i din region.
Nödvändiga Azure-behörigheter
Om du vill skapa en Azure Databricks-arbetsyta måste du vara något av följande:
- En användare med Azure-rollen Deltagare eller Ägare på prenumerationsnivå.
- En användare med en anpassad rolldefinition som har följande lista med behörigheter:
Microsoft.Databricks/workspaces/*Microsoft.Resources/subscriptions/resourceGroups/readMicrosoft.Resources/subscriptions/resourceGroups/writeMicrosoft.Databricks/accessConnectors/*Microsoft.Compute/register/actionMicrosoft.ManagedIdentity/register/actionMicrosoft.Storage/register/actionMicrosoft.Network/register/actionMicrosoft.Resources/deployments/validate/actionMicrosoft.Resources/deployments/writeMicrosoft.Resources/deployments/read
Anmärkning
Behörigheterna Microsoft.Compute/register/action, Microsoft.ManagedIdentity/register/action, Microsoft.Storage/register/action, Microsoft.Network/register/action krävs inte om dessa leverantörer redan är registrerade i prenumerationen. Se Registrera resursleverantör.
Välja en arbetsytetyp
I följande avsnitt beskrivs vilken arbetsytetyp som är bäst för vanliga användningsfall. Använd de här rekommendationerna för att bestämma om du vill distribuera en serverlös eller klassisk arbetsyta.
När du ska välja serverlösa arbetsytor
Serverlösa arbetsytor är det bästa valet för de flesta användningsfall och det enklaste sättet att komma igång med användningsfall för användare och drift, till exempel Lakebase, Genie och Databricks Apps.
Serverlösa arbetsytor är det bästa valet för följande användningsfall:
- Ge företagsanvändare åtkomst till Databricks One
- Skapa AI/BI-instrumentpaneler
- Skapa Databricks-appar
- Utföra undersökande analys med hjälp av notebook-filer eller SQL-lager
- Ansluta till SaaS-leverantörer via Lakehouse Federation (men inte Lakeflow Connect)
- Använda Genie Spaces för affärsanvändningsfall
- Använda AI-funktioner som vektorsökning, modellhantering, AI-funktioner och agentstenar
- Skapa serverlösa Lakeflow deklarativa Spark-pipelines
När du ska välja klassiska arbetsytor
Klassiska arbetsytor är det bästa valet för följande användningsfall:
- Portera befintlig äldre Spark-kod som använder Spark RDD
- Använda Scala eller R som primärt kodningsspråk
- Strömmande data som kräver tidsbaserade utlösarintervall
- Ansluta till lokala system eller privata databaser direkt via Lakeflow Connect
Alternativ för att skapa arbetsyta
Det finns flera sätt att distribuera en Azure Databricks-arbetsyta. Standarddistributionsmetoden sker via Azure-portalen eller Terraform.
Dessutom kan du skapa arbetsytor med hjälp av följande verktyg: