Dela via


Radklass

En rad i DataFrame. Fälten i den kan nås:

  • som attribut (row.key)
  • som ordlistevärden (row[key])

key in row söker igenom radnycklar.

Rad kan användas för att skapa ett radobjekt med hjälp av namngivna argument. Det är inte tillåtet att utelämna ett namngivet argument för att representera att värdet är Ingen eller saknas. Detta bör uttryckligen anges till Ingen i det här fallet.

Ändrat i Databricks Runtime 7.4: Rader som skapats från namngivna argument har inte längre fältnamn sorterade alfabetiskt och sorteras i den position som anges.

Syntax

from pyspark.sql import Row

Row(tuple)

Parameters

Parameter Type Beskrivning
tuple tupel Radelementen

Methods

Metod Beskrivning
asDict(recursive) Returnerar raden som Dict[str, Any].

Exempel

Använda namngivna argument

from pyspark.sql import Row
row = Row(name="Alice", age=11)
row
# Row(name='Alice', age=11)
row['name'], row['age']
# ('Alice', 11)
row.name, row.age
# ('Alice', 11)
'name' in row
# True
'wrong_key' in row
# False

Skapa radklasser

Rad kan också användas för att skapa en annan Radliknande klass, och sedan kan den användas för att skapa radobjekt:

Person = Row("name", "age")
Person
# <Row('name', 'age')>
'name' in Person
# True
'wrong_key' in Person
# False
Person("Alice", 11)
# Row(name='Alice', age=11)

Det här formuläret kan också användas för att skapa rader som tuppelns värden, med namnlösa fält:

row1 = Row("Alice", 11)
row2 = Row(name="Alice", age=11)
row1 == row2
# True