Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Cria uma nova linha para uma coluna json de acordo com os nomes dos campos dados.
Sintaxe
from pyspark.sql import functions as sf
sf.json_tuple(col, *fields)
Parâmetros
| Parâmetro | Tipo | Description |
|---|---|---|
col |
pyspark.sql.Column ou str |
Coluna string em formato json. |
fields |
str | Um campo ou campos para extrair. |
Devoluções
pyspark.sql.Column: uma nova linha para cada valor de campo dado do objeto json
Examples
from pyspark.sql import functions as sf
data = [("1", '''{"f1": "value1", "f2": "value2"}'''), ("2", '''{"f1": "value12"}''')]
df = spark.createDataFrame(data, ("key", "jstring"))
df.select(df.key, sf.json_tuple(df.jstring, 'f1', 'f2')).collect()
[Row(key='1', c0='value1', c1='value2'), Row(key='2', c0='value12', c1=None)]