Compartir a través de


map_from_entries

Transforma una matriz de entradas del par clave-valor (estructuras con dos campos) en un mapa. El primer campo de cada entrada se usa como clave y el segundo campo como valor de la columna de mapa resultante.

Syntax

from pyspark.sql import functions as sf

sf.map_from_entries(col)

Parámetros

Parámetro Tipo Description
col pyspark.sql.Column o str Nombre de columna o expresión

Devoluciones

pyspark.sql.Column: un mapa creado a partir de la matriz de entradas especificada.

Examples

Ejemplo 1: Uso básico de map_from_entries

from pyspark.sql import functions as sf
df = spark.sql("SELECT array(struct(1, 'a'), struct(2, 'b')) as data")
df.select(sf.map_from_entries(df.data)).show()
+----------------------+
|map_from_entries(data)|
+----------------------+
|      {1 -> a, 2 -> b}|
+----------------------+

Ejemplo 2: map_from_entries con valores NULL

from pyspark.sql import functions as sf
df = spark.sql("SELECT array(struct(1, null), struct(2, 'b')) as data")
df.select(sf.map_from_entries(df.data)).show()
+----------------------+
|map_from_entries(data)|
+----------------------+
|   {1 -> NULL, 2 -> b}|
+----------------------+

Ejemplo 3: map_from_entries con un dataframe

from pyspark.sql import Row, functions as sf
df = spark.createDataFrame([([Row(1, "a"), Row(2, "b")],), ([Row(3, "c")],)], ['data'])
df.select(sf.map_from_entries(df.data)).show()
+----------------------+
|map_from_entries(data)|
+----------------------+
|      {1 -> a, 2 -> b}|
|              {3 -> c}|
+----------------------+

Ejemplo 4: map_from_entries con matriz vacía

from pyspark.sql import functions as sf
from pyspark.sql.types import ArrayType, StringType, IntegerType, StructType, StructField
schema = StructType([
  StructField("data", ArrayType(
    StructType([
      StructField("key", IntegerType()),
      StructField("value", StringType())
    ])
  ), True)
])
df = spark.createDataFrame([([],)], schema=schema)
df.select(sf.map_from_entries(df.data)).show()
+----------------------+
|map_from_entries(data)|
+----------------------+
|                    {}|
+----------------------+