Partilhar via


Funções agregadas no mapeamento de fluxos de dados

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory em Microsoft Fabric, uma solução de análise tudo-em-um para empresas. Microsoft Fabric cobre tudo, desde movimentação de dados a ciência de dados, análise em tempo real, inteligência de negócios e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Os fluxos de dados estão disponíveis tanto na Azure Data Factory pipelines como na Azure Synapse Analytics pipelines. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando fluxos de dados de mapeamento.

Este artigo fornece detalhes sobre funções agregadas suportadas pelo Azure Data Factory e Azure Synapse Analytics no mapeamento de fluxos de dados.

Lista de funções agregadas

As seguintes funções estão disponíveis apenas em transformações agregadas, pivot, despivot e de janelas.

Função de agregação Tarefa
approxDistinctCount Obtém a contagem agregada aproximada de valores distintos para uma coluna. O segundo parâmetro opcional é controlar o erro de estimativa.
Preço médio Obtém a média dos valores de uma coluna.
avgIf Obtém a média dos valores de uma coluna, com base nos critérios.
Recolha Coleta todos os valores da expressão no grupo agregado em uma matriz. Durante este processo, pode recolher e transformar estruturas em estruturas alternativas. O número de itens é igual ao número de linhas desse grupo e pode conter valores nulos. O número de itens recolhidos deve ser pequeno.
collectUnique Coleta todos os valores da expressão no grupo agregado em uma matriz exclusiva. Durante este processo, pode recolher e transformar estruturas em estruturas alternativas. O número de itens é menor ou igual ao número de linhas desse grupo e pode conter valores nulos. O número de itens recolhidos deve ser pequeno.
count Obtém a contagem agregada de valores. Se as colunas opcionais forem especificadas, ignora os valores NULL na contagem.
contarTodos Obtém a contagem agregada de valores, incluindo o valor NULL.
countDistinct Obtém a contagem agregada de valores distintos de um conjunto de colunas.
contarAllDistinct Obtém a contagem agregada de valores distintos de um conjunto de colunas, incluindo NULL valores.
countIf Obtém a contagem agregada de valores, com base nos critérios. Se a coluna opcional for especificada, ignora os valores NULL na contagem.
covariância População Obtém a covariância populacional entre duas colunas.
covariancePopulationIf Obtém a covariância populacional de duas colunas, com base em critérios.
covariância Amostra Obtém a covariância de amostra de duas colunas.
covariânciaAmostraSe Obtém a covariância amostral de duas colunas, com base em critérios.
primeiro Obtém o primeiro valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, assume-se falso.
isDistinct Localiza se uma coluna ou conjunto de colunas é distinto. Não conta nulo como um valor distinto.
Curtose Obtém a curtose de uma coluna.
kurtosisIf Obtém a curtose de uma coluna com base em determinados critérios.
último Obtém o último valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, assume-se falso.
máx. Obtém o valor máximo de uma coluna.
maxIf Obtém o valor máximo de uma coluna, com base nos critérios.
média Obtém a média dos valores de uma coluna. O mesmo que AVG.
meanIf Obtém a média dos valores de uma coluna, com base em critérios. O mesmo que avgIf.
min Obtém o valor mínimo de uma coluna.
minIf Obtém o valor mínimo de uma coluna, com base nos critérios.
assimetria Obtém a assimetria de uma coluna.
assimetriaSe Obtém a inclinação de uma coluna, com base nos critérios.
Stddev Obtém o desvio padrão de uma coluna.
stddevIf Obtém o desvio padrão de uma coluna, com base nos critérios.
stddevPopulation Obtém o desvio padrão da população de uma coluna.
stddevPopulationIf Obtém o desvio padrão populacional de uma coluna, com base nos critérios.
stddevSample Obtém o desvio padrão de amostra de uma coluna.
stddevSampleIf Obtém o desvio padrão de exemplo de uma coluna, com base em critérios.
soma Obtém a soma agregada de uma coluna numérica.
somaDistinto Obtém a soma agregada de valores distintos de uma coluna numérica.
sumDistinctIf Obtém a soma agregada de uma coluna numérica, com base nos critérios. A condição pode ser baseada em qualquer coluna.
somaSe Obtém a soma agregada de uma coluna numérica, com base nos critérios. A condição pode ser baseada em qualquer coluna.
topN Obtém os melhores valores N desta coluna.
variância Obtém a variância de uma coluna.
varianceIf Obtém a variância de uma coluna, com base nos critérios.
variânciaPopulação Obtém a variação populacional de uma coluna.
variânciaPopulaçãoSe Obtém a variância populacional de uma coluna, com base em critérios.
variância da amostra Obtém a variância imparcial de uma coluna.
VariânciaAmostraSe Obtém a variância imparcial de uma coluna, com base nos critérios.