Compartilhar via


Usar o Python no Editor do Power Query

Você pode usar o Python, uma linguagem de programação amplamente usada por estatísticos, cientistas de dados e analistas de dados, no Editor do Power Query do Power BI Desktop. Essa integração do Python ao Editor do Power Query permite que você execute a limpeza de dados usando o Python e execute a modelagem e análise de dados avançadas em conjuntos de dados, incluindo a conclusão de dados ausentes, previsões e clustering, apenas para citar alguns. O Python é uma linguagem poderosa e pode ser usado no Editor do Power Query para preparar seu modelo de dados e criar relatórios.

Pré-requisitos

Você precisará instalar o Python e o Pandas antes de começar.

  • Instalar Python – Para usar Python no Editor do Power Query do Power BI Desktop, você precisa instalar o Python no seu computador local. Você pode baixar e instalar o Python gratuitamente em muitos locais, incluindo a página de download oficial do Python e o Anaconda.

  • Instalar o Pandas – Para usar o Python com o Editor do Power Query, você também precisará instalar o Pandas. O Pandas é usado para mover dados entre o Power BI e o ambiente do Python.

Usar o Python com o Editor do Power Query

Para mostrar como usar o Python no Editor do Power Query, use este exemplo de um conjunto de dados do mercado de ações, com base em um arquivo CSV que você pode baixar daqui e acompanhar. As etapas para este exemplo são o seguinte procedimento:

  1. Primeiro, carregue seus dados no Power BI Desktop. Neste exemplo, carregue o arquivo EuStockMarkets_NA.csv e selecione Obter dados>Texto/CSV na faixa de opções Início no Power BI Desktop.

    Captura de tela da faixa de opções Obter Dados no Power BI Desktop, mostrando a seleção CSV.

  2. Selecione o arquivo e selecione Abrir e o CSV é exibido na caixa de diálogo do arquivo CSV .

    Captura de tela da caixa de diálogo de arquivo CSV mostrando o CSV selecionado.

  3. Depois que os dados forem carregados, você os verá no painel Campos no Power BI Desktop.

    Captura de tela do painel Campos mostrando os dados carregados.

  4. Abra o Editor do Power Query selecionando Transformar dados na guia Página Inicial no Power BI Desktop.

    Captura de tela do Editor do Power Query no Power BI Desktop, mostrando a seleção transformar dados.

  5. Na guia Transformar , selecione Executar Script Python e o editor Executar Script Python será exibido conforme mostrado na próxima etapa. As linhas 15 e 20 sofrem de dados ausentes, assim como outras linhas que você não pode ver na imagem a seguir. As etapas a seguir mostram como o Python conclui essas linhas para você.

    Captura de tela da guia Transformar, mostrando linhas de dados.

  6. Para este exemplo, insira o seguinte código de script:

    import pandas as pd
    completedData = dataset.fillna(method='backfill', inplace=False)
    dataset["completedValues"] =  completedData["SMI missing values"]
    

    Observação

    Você precisa ter a biblioteca pandas instalada em seu ambiente python para que o código de script anterior funcione corretamente. Para instalar o Pandas, execute o seguinte comando na instalação do Python: pip install pandas

    Quando colocado na caixa de diálogo Executar Script python , o código se parece com o seguinte exemplo:

    Captura de tela da caixa de diálogo Executar Script Python, mostrando o código do script.

  7. Depois de selecionar OK, o Editor do Power Query exibirá um aviso sobre privacidade de dados.

    Captura de tela do painel Editor do Power Query mostrando o aviso sobre privacidade de dados.

  8. Para que os scripts do Python funcionem corretamente no serviço do Power BI, todas as fontes de dados precisam ser definidas como públicas. Para obter mais informações sobre as configurações de privacidade e suas implicações, consulte Níveis de Privacidade.

    Captura de tela da caixa de diálogo Níveis de privacidade, mostrando que Público está como definido.

    Observe uma nova coluna no painel Campos chamada completedValues. Observe que há alguns elementos de dados ausentes, como nas linhas 15 e 18. Dê uma olhada em como o Python lida com isso na próxima seção.

Com apenas três linhas de script Python, o Editor do Power Query preencheu os valores ausentes com um modelo preditivo.

Criar visuais com base em dados de script do Python

Agora podemos criar um visual para ver como o código de script Python usando a biblioteca pandas concluiu os valores ausentes, conforme mostrado na imagem a seguir:

Captura de tela da visualização, mostrando dados originais e valores ausentes preenchidos da biblioteca pandas.

Depois que esse visual for concluído e qualquer outro visual que você queira criar usando o Power BI Desktop, você poderá salvar o arquivo do Power BI Desktop . Arquivos do Power BI Desktop salvos com a extensão de nome de arquivo .pbix . Em seguida, use o modelo de dados, incluindo os scripts python que fazem parte dele, no serviço do Power BI.

Observação

Deseja ver um arquivo .pbix concluído com estas etapas concluídas? Você está com sorte. Você pode baixar o arquivo completo do Power BI Desktop usado nestes exemplos aqui.

Depois de carregar o arquivo .pbix no serviço do Power BI, mais algumas etapas serão necessárias para permitir que os dados sejam atualizados no serviço e permitir que os visuais sejam atualizados no serviço. Os dados precisam de acesso ao Python para que os visuais sejam atualizados. As outras etapas são as seguintes etapas:

  • Habilite a atualização agendada para o conjunto de dados. Para habilitar a atualização agendada para a pasta de trabalho que contém seu conjunto de dados com scripts Python, consulte Configurar a atualização agendada, que também inclui informações sobre o Gateway Pessoal.
  • Instale o Gateway Pessoal. Você precisa de um Gateway Pessoal instalado no computador onde o arquivo está localizado e onde o Python está instalado. O serviço do Power BI deve acessar essa pasta de trabalho e renderizar novamente todos os visuais atualizados. Para obter mais informações, consulte instalar e configurar o Gateway Pessoal.

Considerações e limitações

Há algumas limitações para consultas que incluem scripts Python criados no Editor do Power Query:

  • Todas as configurações de fonte de dados do Python devem ser definidas como Pública e todas as outras etapas em uma consulta criada no Editor do Power Query também devem ser públicas. Para acessar as configurações de fonte de dados, no Power BI Desktop , selecione Opções de Arquivo > e configurações > de fonte de dados.

    Captura de tela do menu Arquivo no Power BI Desktop, mostrando a seleção de configurações da fonte de dados.

    Na caixa de diálogo Configurações da Fonte de Dados , selecione as fontes de dados e, em seguida, selecione Editar Permissões... e verifique se o Nível de Privacidade está definido como Público.

    Captura de tela da caixa de diálogo Configurações da fonte de dados mostrando que o Nível de Privacidade está definido como Público.

  • Para habilitar a atualização agendada de seus visuais ou conjuntos de dados do Python, você precisa habilitar a atualização agendada e ter um Gateway Pessoal instalado no computador que abriga a pasta de trabalho e a instalação do Python. Para obter mais informações sobre ambos, consulte a seção anterior neste artigo, que fornece links para saber mais sobre cada um.

  • Atualmente, não há suporte para tabelas aninhadas, que são tabelas dentro de tabelas.

Há todos os tipos de coisas que você pode fazer com Python e consultas personalizadas, portanto, explore e modele seus dados da maneira que você deseja que eles apareçam.