Compartir a través de


Guía rápida de creación de cálculo

Este artículo tiene como objetivo proporcionar instrucciones claras y fundamentadas para la creación de recursos de cómputo. Mediante el uso de los tipos de proceso adecuados para el flujo de trabajo, puede mejorar el rendimiento y ahorrar costos.

Práctica recomendada Impacto Documentación
Si no está familiarizado con Azure Databricks, empiece por usar tipos de instancias de uso general. Al seleccionar el tipo de instancia adecuado para la carga de trabajo, se obtiene una mayor eficacia.
Utilice el modo de acceso estándar, a menos que la característica necesaria no esté admitida. El proceso de computación con el modo de acceso estándar puede ser utilizado por varios usuarios con aislamiento de datos entre usuarios.
Use los tipos de instancia de última generación si hay suficiente disponibilidad La última generación de tipos de instancia proporciona el mejor rendimiento y las características más recientes.
Establezca el equilibrio de instancias a demanda y puntuales dependiendo de la rapidez con la que necesite que se ejecute la carga de trabajo. Las instancias spot ahorran en costos, pero pueden afectar al tiempo de ejecución general de una operación si las instancias spot son recuperadas.
Elija el tamaño de los nodos y el número de trabajadores en función de los tipos de operaciones que realiza su carga de trabajo. Por ejemplo, si espera una gran cantidad de mezclas, puede ser más eficaz usar un único nodo grande, en lugar de varios nodos más pequeños.
Ejecute el vaciado en un clúster con el escalado automático establecido para 1-4 trabajadores, donde cada trabajador tiene 8 núcleos.
Seleccione un controlador con entre 8 y 32 núcleos. Aumente el tamaño del controlador si recibe errores de memoria insuficiente (OOM).
Las instrucciones de vacuum se dividen en dos fases, la segunda de las cuales es impulsada por drivers. Si no usa el clúster de tamaño correcto, la operación podría provocar una ralentización y podría no realizarse correctamente.
Evaluar si el flujo de trabajo por lotes se beneficiaría de Photon Photon proporciona consultas más rápidas y reduce el costo total por carga de trabajo.