Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Skapar en ny rad för en json-kolumn enligt de angivna fältnamnen.
Syntax
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Parameterar
| Parameter | Typ | Description |
|---|---|---|
col |
pyspark.sql.Column eller str |
Strängkolumn i json-format. |
fields |
str | Ett fält eller fält som ska extraheras. |
Retur
pyspark.sql.Column: en ny rad för varje angivet fältvärde från json-objektet
Examples
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]