Compartir a través de


randn

Genera una columna aleatoria con muestras independientes y distribuidas de forma idéntica (i.i.d.) a partir de la distribución normal estándar. Soporta Spark Connect.

Para obtener la función SQL de Databricks correspondiente, consulte randn function.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.randn(seed=<seed>)

Parámetros

Parámetro Tipo Description
seed int (default: None) Valor de inicialización para el generador aleatorio.

Devoluciones

pyspark.sql.Column: una columna de valores aleatorios.

Examples

from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.randn()).show() # doctest: +SKIP
+---+--------------------------+
| id|randn(3968742514375399317)|
+---+--------------------------+
|  0|      -0.47968645355788...|
|  1|       -0.4950952457305...|
+---+--------------------------+

from pyspark.databricks.sql import functions as dbf
spark.range(0, 2, 1, 1).select("*", dbf.randn(seed=42)).show() # doctest: +SKIP
+---+------------------+
| id|         randn(42)|
+---+------------------+
|  0| 2.384479054241...|
|  1|0.1920934041293...|
+---+------------------+