Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Divide una cadena en matrices de oraciones, donde cada oración es una matriz de palabras.
Los language argumentos y country son opcionales. Cuando se omiten:
- Si se omiten,
Locale.ROOT - locale(language='', country='')se usa . seLocale.ROOTconsidera la configuración regional base de todas las configuraciones regionales y se usa como idioma o configuración regional neutral del país para las operaciones sensibles a la configuración regional. -
countrySi se omite ,locale(language, country='')se usa .
Cuando son NULL:
- Si son ambos
null,Locale.US - locale(language='en', country='US')se usa . - Si es
languagenull ycountryno es null,Locale.US - locale(language='en', country='US')se usa . - Si no
languagees null ycountryes null,locale(language)se usa . - Si ninguno de ellos es
null,locale(language, country)se usa .
Para obtener la función SQL de Databricks correspondiente, consulte sentences function.
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.sentences(string=<string>, language=<language>, country=<country>)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
string |
pyspark.sql.Column o str |
una cadena que se va a dividir |
language |
pyspark.sql.Column o str, optional |
un idioma de la configuración regional |
country |
pyspark.sql.Column o str, optional |
un país de la configuración regional |
Devoluciones
pyspark.sql.Column: matrices de oraciones divididas.
Examples
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("This is an example sentence.", )], ["s"])
df.select("*", dbf.sentences(df.s, dbf.lit("en"), dbf.lit("US"))).show(truncate=False)
df.select("*", dbf.sentences(df.s, dbf.lit("en"))).show(truncate=False)
df.select("*", dbf.sentences(df.s)).show(truncate=False)