Compartir a través de


Guía rápida de provisión de SQL

Para ofrecer análisis rápidos y confiables desde la plataforma Lakehouse, es esencial configurar y operar almacenes de SQL para lograr un rendimiento óptimo de BI. Los almacenes de SQL en Azure Databricks están diseñados específicamente para servir cargas de trabajo de inteligencia empresarial, lo que permite el escalado dinámico, el procesamiento de consultas eficaz y una administración sólida de recursos.

En esta página se describen los procedimientos recomendados para el aprovisionamiento, la administración y la supervisión de almacenes de SQL para garantizar paneles con capacidad de respuesta, el uso rentable de los recursos y la integración sin problemas con las herramientas de BI empresarial.

Este contenido está diseñado para ingenieros de datos, desarrolladores de BI y administradores de áreas de trabajo responsables de configurar, optimizar y mantener almacenes de SQL para el rendimiento de análisis y paneles. Muchas tareas requieren permisos avanzados de área de trabajo que le permiten crear o administrar almacenes de SQL.

Servicio de SQL

Procedimiento recomendado Impacto Docs Elementos de acción
Uso de cómputo sin servidor para iniciar, detener y escalar recursos automáticamente Reduce los costos al detener los recursos inactivos. Habilitar auto-parada para almacenes de desarrollo
Uso de almacenes de SQL para cualquier carga de trabajo de BI (se recomienda usar sin servidor) Los almacenes de SQL están optimizados para cargas de trabajo de BI. Configuración de SQL Warehouse para cargas de trabajo de BI
Tamaño adecuado del almacén Equilibra el rendimiento y el costo de la carga de trabajo. Comience con el tamaño M, supervise el rendimiento y ajuste si es necesario.
Uso de un tamaño de clúster superior para conjuntos de datos más grandes Cuanto mayor sea el clúster (M, L, XL, etc.), más rápido se ejecutan las consultas complejas. Si solo tienes consultas sencillas y de ejecución corta, no aumentes el tamaño (podría ser más lento debido a la reorganización de datos). Evaluación de la complejidad de las consultas y el tamaño del conjunto de datos
Uso del escalado de SQL Warehouse Un almacén de SQL se expande para manejar el aumento de la carga de trabajo. Cuando el almacén alcanza sus límites, las consultas se ponen en cola, no se rechazan. Activar el escalado en cargas de trabajo en producción
Si se esperan muchas consultas simultáneas, aumente el número mínimo de clústeres. Impide que las consultas se ponen en cola mientras se espera el escalado horizontal. Configuración de clústeres mínimos en función de la carga de trabajo esperada
Uso de almacenes SQL independientes para diferentes cargas de trabajo o unidades de negocio Ajusta el tamaño de los almacenes SQL para mejorar el aislamiento y la atribución de costos. Creación de almacenes dedicados por carga de trabajo
Supervisión del rendimiento de las consultas Identifica los cuellos de botella de rendimiento y los problemas mediante el historial de consultas. Las tablas del sistema permiten supervisar el rendimiento mediante programación. Configuración de paneles de supervisión

Para obtener instrucciones detalladas sobre el análisis de los requisitos de carga de trabajo de BI y la configuración de almacenes de SQL para diferentes patrones de acceso (DirectQuery frente a Import/Extract), consulte Configuración de SQL Warehouse para cargas de trabajo de BI.