Compartir a través de


ANALYZE TABLE … MÉTRICAS DE ALMACENAMIENTO DE PROCESO

Se aplica a:marcado como sí Databricks Runtime 18.0 y versiones posteriores

El ANALYZE TABLE … COMPUTE STORAGE METRICS comando calcula las métricas de tamaño de almacenamiento total de una tabla. Proporciona un desglose detallado del almacenamiento para el análisis y la optimización de costos. Para optimizar el rendimiento de las consultas en su lugar, consulte ANALYZE TABLE ... ESTADÍSTICAS DE PROCESO.

Sintaxis

ANALYZE TABLE table_name COMPUTE STORAGE METRICS

Parámetros

Description

Calcula las métricas de tamaño de almacenamiento total para una tabla específica. Este comando devuelve información de almacenamiento completa, incluidos bytes totales, bytes activos, bytes vacíos y bytes de desplazamiento de tiempo, junto con el número asociado de archivos para cada categoría.

Use este comando para identificar tablas grandes o sin usar, optimizar los costos de almacenamiento y comprender por qué el tamaño total de almacenamiento difiere del tamaño de tabla activo. Esto es especialmente útil para los administradores de plataformas que necesitan analizar patrones de almacenamiento en varias tablas o realizar un seguimiento de los cambios de almacenamiento a lo largo del tiempo.

Métricas de salida

El comando devuelve las siguientes métricas en una sola fila:

Campo Descripción
total_bytes Tamaño total de almacenamiento de la tabla. Esto equivale al tamaño del registro de transacciones + bytes activos + bytes aspirables + bytes de viaje en el tiempo.
num_total_files Número total de archivos, incluidos archivos de registro delta, archivos activos, archivos limpiables y archivos de viaje en el tiempo.
active_bytes Tamaño de los archivos de datos a los que hace referencia activamente la tabla (igual que sizeInBytes).
num_active_files Número total de archivos a los que hace referencia activamente la tabla.
vacuumable_bytes Tamaño de los datos que se pueden quitar mediante la ejecución de VACUUM o habilitando la optimización predictiva.
num_vacuumable_files Número de archivos aspirables.
time_travel_bytes El tamaño de los datos históricos usados para reversiones y operaciones de viaje en el tiempo. También conocido como bytes de lápida o bytes a prueba de fallos.
num_time_travel_files Número de archivos usados para el viaje en el tiempo.

Detalles

  • El comando usa un enfoque de lista recursiva para calcular la información de almacenamiento. El tiempo de ejecución suele estar en cuestión de minutos, pero puede tardar hasta varias horas en tablas muy grandes.
  • Este comando funciona tanto para tablas gestionadas por el catálogo de Unity como para tablas externas.
  • Las métricas de almacenamiento se calculan en el momento en que se ejecuta el comando y no se almacenan en el catálogo de Unity ni se devuelven mediante DESCRIBE EXTENDED.
  • Para realizar un seguimiento de los cambios de almacenamiento a lo largo del tiempo, ejecute este comando periódicamente y almacene los resultados en una tabla. Ejecute este comando en un bucle entre varias tablas para analizar los patrones de almacenamiento en todo el patrimonio de datos.

Consideraciones sobre el tipo de tabla

Para las vistas materializadas y las tablas de streaming, total_bytes incluye el tamaño de la tabla y los metadatos asociados. La active_bytes métrica excluye las partes que se pueden recorrer en vacío y en el tiempo de la tabla.

Examples

> ANALYZE TABLE main.my_schema.my_table COMPUTE STORAGE METRICS;
total_bytes  total_num_files  active_bytes  num_active_files  vacuumable_bytes  num_vacuumable_files  time_travel_bytes  num_time_travel_files
-----------  ---------------  ------------  ----------------  ----------------  --------------------  -----------------  ---------------------
 5368709120             1250    4294967296              1000        805306368                   150         268435456                    100

La salida muestra:

  • Almacenamiento total: 5,37 GB en 1250 archivos
  • Datos activos: 4,29 GB en 1000 archivos (versión de tabla actual)
  • Datos liberables: 805 MB en 150 archivos (se pueden reclamar con VACUUM)
  • Datos de viaje en tiempo: 268 MB en 100 archivos (para consultas históricas)