Compartir a través de


SplitSkill interface

Aptitud para dividir una cadena en fragmentos de texto.

Extends

Propiedades

azureOpenAITokenizerParameters

Solo se aplica si la unidad está establecida en azureOpenAITokens. Si se especifica, splitSkill usará estos parámetros al realizar la tokenización. Los parámetros son una propiedad "encoderModelName" válida y una propiedad opcional "allowedSpecialTokens".

defaultLanguageCode

Valor que indica qué código de lenguaje se va a usar. El valor predeterminado es en.

maximumPagesToTake

Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, SplitSkill dejará de dividirse después de procesar las primeras páginas "maximumPagesToTake", con el fin de mejorar el rendimiento cuando solo se necesitan algunas páginas iniciales de cada documento.

maxPageLength

Longitud máxima de página deseada. El valor predeterminado es 10000.

odatatype

Discriminador polimórfico, que especifica los distintos tipos que puede ser este objeto.

pageOverlapLength

Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, el fragmento n+1 comenzará con este número de caracteres o tokens desde el final del nº fragmento.

textSplitMode

Valor que indica qué modo de división se va a realizar.

unit

Solo se aplica si textSplitMode está establecido en páginas. Hay dos valores posibles. La elección de los valores decidirá la medida de longitud (maximumPageLength y pageOverlapLength). El valor predeterminado es "caracteres", lo que significa que la longitud se medirá por carácter.

Propiedades heredadas

context

Representa el nivel en el que tienen lugar las operaciones, como la raíz del documento o el contenido del documento (por ejemplo, /document o /document/content). El valor predeterminado es /document.

description

Descripción de la aptitud que describe las entradas, salidas y uso de la aptitud.

inputs

Las entradas de las aptitudes podrían ser una columna del conjunto de datos de origen o la salida de una aptitud ascendente.

name

Nombre de la aptitud que la identifica de forma única dentro del conjunto de aptitudes. A una aptitud sin nombre definido se le asignará un nombre predeterminado de su índice basado en 1 en la matriz de aptitudes, con el prefijo "#".

outputs

La salida de una aptitud es un campo en un índice de búsqueda o un valor que otra aptitud puede consumir como entrada.

Detalles de las propiedades

azureOpenAITokenizerParameters

Solo se aplica si la unidad está establecida en azureOpenAITokens. Si se especifica, splitSkill usará estos parámetros al realizar la tokenización. Los parámetros son una propiedad "encoderModelName" válida y una propiedad opcional "allowedSpecialTokens".

azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters

Valor de propiedad

defaultLanguageCode

Valor que indica qué código de lenguaje se va a usar. El valor predeterminado es en.

defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

Valor de propiedad

"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

maximumPagesToTake

Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, SplitSkill dejará de dividirse después de procesar las primeras páginas "maximumPagesToTake", con el fin de mejorar el rendimiento cuando solo se necesitan algunas páginas iniciales de cada documento.

maximumPagesToTake?: number

Valor de propiedad

number

maxPageLength

Longitud máxima de página deseada. El valor predeterminado es 10000.

maxPageLength?: number

Valor de propiedad

number

odatatype

Discriminador polimórfico, que especifica los distintos tipos que puede ser este objeto.

odatatype: "#Microsoft.Skills.Text.SplitSkill"

Valor de propiedad

"#Microsoft.Skills.Text.SplitSkill"

pageOverlapLength

Solo se aplica cuando textSplitMode está establecido en "pages". Si se especifica, el fragmento n+1 comenzará con este número de caracteres o tokens desde el final del nº fragmento.

pageOverlapLength?: number

Valor de propiedad

number

textSplitMode

Valor que indica qué modo de división se va a realizar.

textSplitMode?: "pages" | "sentences"

Valor de propiedad

"pages" | "sentences"

unit

Solo se aplica si textSplitMode está establecido en páginas. Hay dos valores posibles. La elección de los valores decidirá la medida de longitud (maximumPageLength y pageOverlapLength). El valor predeterminado es "caracteres", lo que significa que la longitud se medirá por carácter.

unit?: string

Valor de propiedad

string

Detalles de las propiedades heredadas

context

Representa el nivel en el que tienen lugar las operaciones, como la raíz del documento o el contenido del documento (por ejemplo, /document o /document/content). El valor predeterminado es /document.

context?: string

Valor de propiedad

string

Heredado deSearchIndexerSkill.context

description

Descripción de la aptitud que describe las entradas, salidas y uso de la aptitud.

description?: string

Valor de propiedad

string

Heredado deSearchIndexerSkill.description

inputs

Las entradas de las aptitudes podrían ser una columna del conjunto de datos de origen o la salida de una aptitud ascendente.

inputs: InputFieldMappingEntry[]

Valor de propiedad

Heredado deSearchIndexerSkill.inputs

name

Nombre de la aptitud que la identifica de forma única dentro del conjunto de aptitudes. A una aptitud sin nombre definido se le asignará un nombre predeterminado de su índice basado en 1 en la matriz de aptitudes, con el prefijo "#".

name?: string

Valor de propiedad

string

Heredado deSearchIndexerSkill.name

outputs

La salida de una aptitud es un campo en un índice de búsqueda o un valor que otra aptitud puede consumir como entrada.

outputs: OutputFieldMappingEntry[]

Valor de propiedad

Heredado deSearchIndexerSkill.outputs