Compartir a través de


input_file_name

Crea una columna de cadena para el nombre de archivo de la tarea de Spark actual.

Syntax

from pyspark.sql import functions as sf

sf.input_file_name()

Devoluciones

pyspark.sql.Column: nombres de archivo.

Examples

Ejemplo 1: Obtener el nombre del archivo de entrada

import os
from pyspark.sql import functions as sf
path = os.path.abspath(__file__)
df = spark.read.text(path)
df.select(sf.input_file_name()).first()
Row(input_file_name()='file:/...')