Del via


Brug Python i Power Query Editor

Du kan bruge Python, et programmeringssprog, der er bredt anvendt af statistikere, dataforskere og dataanalytikere, i Power BI Desktop Power Query Editor. Denne integration af Python i Power Query Editor giver dig mulighed for at udføre datarensning med Python og udføre avanceret dataformning og analyse i datasæt, herunder udfyldning af manglende data, forudsigelser og klyngedannelse, for blot at nævne nogle få. Python er et kraftfuldt sprog og kan bruges i Power Query Editor til at forberede din datamodel og oprette rapporter.

Forudsætninger

Du skal installere Python og pandas, før du går i gang.

  • Installer Python - For at bruge Python i Power BI Desktops Power Query Editor skal du installere Python på din lokale maskine. Du kan downloade og installere Python gratis fra mange steder, herunder den officielle Python-downloadside og Anacondaen.

  • Installer pandas - For at bruge Python med Power Query Editor skal du også installere pandas. Pandas bruges til at flytte data mellem Power BI og Python-miljøet.

Brug Python med Power Query Editor

For at vise, hvordan man bruger Python i Power Query Editor, tag dette eksempel fra et aktiemarkedsdatasæt, baseret på en CSV-fil, som du kan downloade herfra og følge med. Trinene for dette eksempel er følgende procedure:

  1. Først skal du indlæse dine data i Power BI Desktop. I dette eksempel indlæser duEuStockMarkets_NA.csv-filen og vælger Get data>Text/CSV fra Home-båndet i Power BI Desktop.

    Skærmbillede af Get Data-båndet i Power BI Desktop, der viser CSV-valget.

  2. Vælg filen og vælg Åbn, og CSV-filen vises i CSV-filens dialog.

    Skærmbillede af CSV-filens dialog, der viser den valgte CSV.

  3. Når dataene er indlæst, ser du dem i feltpanelet i Power BI Desktop.

    Skærmbillede af feltpanelet, der viser de indlæste data.

  4. Åbn Power Query Editor ved at vælge Transformér data fra fanen Hjem i Power BI Desktop.

    Skærmbillede af Power Query-editoren i Power BI Desktop, der viser valget af Transform-data.

  5. I fanen Transform vælger du Kør Python Script , og Kør Python Script-editoren vises som vist i næste trin. Rækkerne 15 og 20 mangler data, ligesom andre rækker, du ikke kan se på billedet nedenfor. Følgende trin viser, hvordan Python udfylder disse rækker for dig.

    Skærmbillede af fanen Transformer, der viser rækker af data.

  6. For dette eksempel indtaster du følgende scriptkode:

    import pandas as pd
    completedData = dataset.fillna(method='backfill', inplace=False)
    dataset["completedValues"] =  completedData["SMI missing values"]
    

    Bemærkning

    Du skal have pandas-biblioteket installeret i dit Python-miljø for at den tidligere scriptkode kan fungere korrekt. For at installere pandas, kør følgende kommando i din Python-installation: pip install pandas

    Når den sættes i dialogen Run Python Script , ser koden ud som følgende eksempel:

    Skærmbillede af dialogen Run Python Script, der viser scriptkoden.

  7. Efter du har valgt OK, viser Power Query Editor en advarsel om databeskyttelse.

    Skærmbillede af Power Query Editor-panelet, der viser advarslen om databeskyttelse.

  8. For at Python-scripts skal fungere korrekt i Power BI-tjenesten, skal alle datakilder sættes til offentligt. For mere information om privatlivsindstillinger og deres konsekvenser, se Privatlivsniveauer.

    Skærmbillede af dialogen Privatlivsniveauer, der viser, at Offentlig er sat.

    Bemærk en ny kolonne i feltpanelet kaldet completedValues. Bemærk, at der mangler nogle få dataelementer, såsom på række 15 og 18. Tag et kig på, hvordan Python håndterer det i næste afsnit.

Med blot tre linjer Python-script udfyldte Power Query Editor de manglende værdier med en forudsigende model.

Opret visuals ud fra Python-scriptdata

Nu kan vi lave en visuel fremstilling for at se, hvordan Python-scriptkoden ved brug af pandas-biblioteket har udfyldt de manglende værdier, som vist i følgende billede:

Skærmbillede af billedet, der viser originale data og færdige manglende værdier i pandas-biblioteket.

Når den visualisering er færdig, og alle andre visualiseringer, du måske vil lave med Power BI Desktop, kan du gemme Power BI Desktop-filen . Power BI Desktop-filer gemmes med filendelsen .pbix . Brug derefter datamodellen, inklusive de Python-scripts, der er en del af den, i Power BI-tjenesten.

Bemærkning

Vil du se en færdig .pbix-fil med disse trin udført? Du er heldig. Du kan downloade den færdige Power BI Desktop-fil , der bruges i disse eksempler, lige her.

Når du uploader .pbix-filen til Power BI-tjenesten, er der brug for et par ekstra trin for at få data til at opdatere i tjenesten og for at opdatere visualiseringer i tjenesten. Dataene skal have adgang til Python for at opdatere visualiseringer. De øvrige trin er følgende:

  • Aktivér planlagt opdatering for datasættet. For at aktivere planlagt opdatering for arbejdsbogen, der indeholder dit datasæt med Python-scripts, se Konfiguration af planlagt opdatering, som også indeholder information om Personal Gateway.
  • Installer den personlige gateway. Du skal have en personlig gateway installeret på den maskine, hvor filen er placeret, og hvor Python er installeret. Power BI-tjenesten skal tilgå den arbejdsbog og gengive eventuelle opdaterede visualiseringer. For mere information, se installer og konfigurér Personal Gateway.

Overvejelser og begrænsninger

Der er nogle begrænsninger for forespørgsler, der inkluderer Python-scripts oprettet i Power Query Editor:

  • Alle Python-datakildeindstillinger skal sættes til Offentlig, og alle andre trin i en forespørgsel oprettet i Power Query Editor skal også være offentlige. For at komme til datakildeindstillinger, vælg i Power BI DesktopFilindstillinger > og indstillinger > Datakildeindstillinger.

    Skærmbillede af filmenuen i Power BI Desktop, der viser valg af datakildeindstillinger.

    Fra dialogen Data Source Settings vælger du datakilderne og derefter Rediger Tilladelser... og sikrer, at privatlivsniveauet er sat til Offentligt.

    Skærmbillede af dialogen for datakildeindstillinger, der viser, at privatlivsniveauet er sat til Offentligt.

  • For at aktivere planlagt opdatering af dine Python-visualiseringer eller datasæt skal du aktivere planlagt opdatering og have en personlig gateway installeret på computeren, der huser arbejdsbogen og Python-installationen. For mere information om begge, se det forrige afsnit i denne artikel, som giver links til at lære mere om hver af dem.

  • Indlejrede tabeller, som er tabeller af tabeller, understøttes i øjeblikket ikke.

Der er alle mulige ting, du kan gøre med Python og brugerdefinerede forespørgsler, så udforsk og form dine data præcis, som du ønsker, de skal se ud.