array_sort

Samlingsfunktion: Sorterar indatamatrisen i stigande ordning. Elementen i indatamatrisen måste vara ordnade. Null-element placeras i slutet av den returnerade matrisen. Stöder Spark Connect.

För motsvarande Databricks SQL-funktion, se array_sort funktion.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.array_sort(col=<col>, comparator=<comparator>)

Parameterar

Parameter	Typ	Description
`col`	`pyspark.sql.Column` eller `str`	Namn på kolumn eller uttryck.
`comparator`	`callable`valfri	En binär funktion som returnerar ett negativt heltal, 0 eller ett positivt heltal eftersom det första elementet är mindre än, lika med eller större än det andra elementet. Om jämförelsefunktionen returnerar null misslyckas funktionen och ett fel uppstår.

Retur

pyspark.sql.Column: sorterad matris.

Examples

Exempel 1: Sortera en matris i stigande standardordning

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([([2, 1, None, 3],),([1],),([],)], ['data'])
df.select(dbf.array_sort(df.data).alias('r')).collect()

[Row(r=[1, 2, 3, None]), Row(r=[1]), Row(r=[])]

Exempel 2: Sortera en matris med en anpassad jämförelse

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(["foo", "foobar", None, "bar"],),(["foo"],),([],)], ['data'])
df.select(dbf.array_sort(
    "data",
    lambda x, y: dbf.when(x.isNull() | y.isNull(), dbf.lit(0)).otherwise(dbf.length(y) - dbf.length(x))
).alias("r")).collect()

[Row(r=['foobar', 'foo', None, 'bar']), Row(r=['foo']), Row(r=[])]

Feedback

Var den här sidan till hjälp?

Last updated on 2026-02-01