Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Calcula la hora del evento desde una columna de ventana. Los valores de la ventana de columna se generan mediante operadores de agregación de ventanas y son de tipo STRUCT<start: TIMESTAMP, end: TIMESTAMP> donde start es inclusivo y end es exclusivo. La hora de evento de los registros generados por operadores de agregación de ventanas se puede calcular tal y como window_time(window) son window.end - lit(1).alias("microsecond") (ya que microsegundos es la precisión mínima de tiempo de evento admitida). La columna de ventana debe ser una generada por un operador de agregación de ventanas.
Para obtener la función SQL de Databricks correspondiente, consulte window_time function.
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.window_time(windowColumn=<windowColumn>)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
windowColumn |
pyspark.sql.Column o str |
Columna de ventana de registros agregados de ventana. |
Devoluciones
pyspark.sql.Column: la columna para los resultados calculados.
Examples
import datetime
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(datetime.datetime(2016, 3, 11, 9, 0, 7), 1)], ['dt', 'v'])
df2 = df.groupBy(dbf.window('dt', '5 seconds')).agg(dbf.sum('v'))