Compartir a través de


ai_similarityFunción

Se aplica a:casilla marcada como Sí Databricks SQL casilla marcada como Sí Databricks Runtime

Importante

Esta funcionalidad está en versión preliminar pública y compatible con HIPAA.

Durante la versión preliminar:

La función ai_similarity() invoca un modelo de IA generativo de última generación de las API de Foundation Model de Databricks para comparar dos cadenas y calcula la puntuación de similitud semántica mediante SQL.

Requisitos

Importante

Los modelos subyacentes que se pueden usar en este momento tienen licencia en virtud de la licencia de Apache 2.0, Copyright © The Apache Software Foundation o el LLAMA 3.3 Community License Copyright © Meta Platforms, Inc. Todos los derechos reservados. Los clientes son responsables de garantizar el cumplimiento de las licencias de modelo aplicables.

Databricks recomienda revisar estas licencias para garantizar el cumplimiento de los términos aplicables. Si los modelos surgen en el futuro que funcionan mejor según las pruebas comparativas internas de Databricks, Databricks podría cambiar el modelo (y la lista de licencias aplicables proporcionadas en esta página).

  • Esta función solo está disponible en áreas de trabajo de regiones que admiten funciones de IA optimizadas para la inferencia por lotes.
  • Esta función no está disponible en Azure Databricks SQL Classic.
  • Consulte la página de precios de Databricks SQL.
  • En Databricks Runtime 15.1 y versiones posteriores, esta función se admite en cuadernos de Databricks, incluidos los cuadernos que se ejecutan como una tarea en un flujo de trabajo de Databricks.
  • Las cargas de trabajo de inferencia por lotes requieren Databricks Runtime 15.4 ML LTS para mejorar el rendimiento.

Sintaxis

ai_similarity(expr1, expr2)

Argumentos

  • expr1: una expresión STRING.
  • expr2: una expresión STRING.

Devoluciones

Valor FLOAT que representa la similitud semántica entre las dos cadenas de entrada. La puntuación de salida es relativa y solo se debe usar para la clasificación. La puntuación de 1 significa que los dos texto son iguales.

Ejemplos

> SELECT ai_similarity('Apache Spark', 'Apache Spark');
  1.0

> SELECT
   company_name
  FROM
   customers
  ORDER BY ai_similarity(company_name, 'Databricks') DESC
  LIMIT 10;

  Databricks Inc.