Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Um wrapper para registro de fonte de dados.
Essa instância pode ser acessada por meio de spark.dataSource. Use-a para registrar uma subclasse personalizada DataSource para que ela possa ser referenciada pelo nome e spark.read.format()df.write.format().
Sintaxe
spark.dataSource.register(MyDataSource)
Methods
| Método | Descrição |
|---|---|
register(dataSource) |
Registra uma fonte de dados definida pelo usuário do Python.
dataSource deve ser uma subclasse de DataSource. |
Exemplos
Registre uma fonte de dados personalizada e leia-a:
from pyspark.sql.datasource import DataSource, DataSourceReader
class MyDataSource(DataSource):
@classmethod
def name(cls):
return "my_data_source"
def schema(self):
return "id INT, value STRING"
def reader(self, schema):
return MyDataSourceReader(schema)
class MyDataSourceReader(DataSourceReader):
def read(self, partition):
yield (1, "hello")
yield (2, "world")
spark.dataSource.register(MyDataSource)
df = spark.read.format("my_data_source").load()
df.show()