Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Samlingsfunktion: Sorterar indatamatrisen i stigande ordning. Elementen i indatamatrisen måste vara ordnade. Null-element placeras i slutet av den returnerade matrisen. Stöder Spark Connect.
För motsvarande Databricks SQL-funktion, se array_sort funktion.
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.array_sort(col=<col>, comparator=<comparator>)
Parameterar
| Parameter | Typ | Description |
|---|---|---|
col |
pyspark.sql.Column eller str |
Namn på kolumn eller uttryck. |
comparator |
callablevalfri |
En binär funktion som returnerar ett negativt heltal, 0 eller ett positivt heltal eftersom det första elementet är mindre än, lika med eller större än det andra elementet. Om jämförelsefunktionen returnerar null misslyckas funktionen och ett fel uppstår. |
Retur
pyspark.sql.Column: sorterad matris.
Examples
Exempel 1: Sortera en matris i stigande standardordning
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([([2, 1, None, 3],),([1],),([],)], ['data'])
df.select(dbf.array_sort(df.data).alias('r')).collect()
[Row(r=[1, 2, 3, None]), Row(r=[1]), Row(r=[])]
Exempel 2: Sortera en matris med en anpassad jämförelse
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(["foo", "foobar", None, "bar"],),(["foo"],),([],)], ['data'])
df.select(dbf.array_sort(
"data",
lambda x, y: dbf.when(x.isNull() | y.isNull(), dbf.lit(0)).otherwise(dbf.length(y) - dbf.length(x))
).alias("r")).collect()
[Row(r=['foobar', 'foo', None, 'bar']), Row(r=['foo']), Row(r=[])]