Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Returnerar det första värdet col för för en grupp rader. Det returnerar det första värdet som inte är null som visas när ignoreNulls värdet är inställt på true. Om alla värden är null returneras null.
Syntax
from pyspark.sql import functions as sf
sf.first_value(col, ignoreNulls=None)
Parameterar
| Parameter | Typ | Description |
|---|---|---|
col |
pyspark.sql.Column eller str |
Målkolumn att arbeta med. |
ignoreNulls |
pyspark.sql.Column eller bool, valfritt |
Om det första värdet är null letar du efter det första värdet som inte är null. |
Retur
pyspark.sql.Column: ett värde col för för en grupp rader.
Examples
Exempel 1: Hämta det första värdet utan att ignorera nullvärden
from pyspark.sql import functions as sf
spark.createDataFrame(
[(None, 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["a", "b"]
).select(sf.first_value('a'), sf.first_value('b')).show()
+--------------+--------------+
|first_value(a)|first_value(b)|
+--------------+--------------+
| NULL| 1|
+--------------+--------------+
Exempel 2: Hämta det första värdet och ignorera null-värden
from pyspark.sql import functions as sf
spark.createDataFrame(
[(None, 1), ("a", 2), ("a", 3), ("b", 8), ("b", 2)], ["a", "b"]
).select(sf.first_value('a', True), sf.first_value('b', True)).show()
+--------------+--------------+
|first_value(a)|first_value(b)|
+--------------+--------------+
| a| 1|
+--------------+--------------+