Partager via


ai_parse_document

Analyse une colonne contenant des données binaires (blob) et retourne un VariantType. Lève une exception si l’objet blob d’entrée n’est pas valide.

Syntaxe

from pyspark.databricks.sql import functions as dbf

dbf.ai_parse_document(col=<col>, options=<options>)

Paramètres

Paramètre Type Descriptif
col pyspark.sql.Column ou données binaires Nom de colonne ou de colonne contenant les objets blob binaires à analyser.
options dictoptionnel Dictionnaire d’options permettant de contrôler le comportement d’analyse.

Retours

pyspark.sql.Column: nouvelle colonne de VariantType contenant le résultat de l’analyse du document. Le résultat inclut un document objet avec pages et elements des tableaux, ainsi que error_status et metadata. Chaque élément représente une unité discrète de contenu dans le document analysé, tel qu’un paragraphe de texte, un tableau, une figure ou un marqueur de disposition. Pour obtenir le schéma de sortie complet et des détails sur les éléments, consultez ai_parse_document.