Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Analyse une colonne contenant des données binaires (blob) et retourne un VariantType. Lève une exception si l’objet blob d’entrée n’est pas valide.
Syntaxe
from pyspark.databricks.sql import functions as dbf
dbf.ai_parse_document(col=<col>, options=<options>)
Paramètres
| Paramètre | Type | Descriptif |
|---|---|---|
col |
pyspark.sql.Column ou données binaires |
Nom de colonne ou de colonne contenant les objets blob binaires à analyser. |
options |
dictoptionnel |
Dictionnaire d’options permettant de contrôler le comportement d’analyse. |
Retours
pyspark.sql.Column: nouvelle colonne de VariantType contenant le résultat de l’analyse du document. Le résultat inclut un document objet avec pages et elements des tableaux, ainsi que error_status et metadata. Chaque élément représente une unité discrète de contenu dans le document analysé, tel qu’un paragraphe de texte, un tableau, une figure ou un marqueur de disposition. Pour obtenir le schéma de sortie complet et des détails sur les éléments, consultez ai_parse_document.