Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En esta referencia se describe cómo la configuración de red de las máquinas virtuales cliente y los sistemas de archivos de Azure Managed Lustre (AMLFS) afectan al rendimiento general.
El rendimiento de red y la latencia entre AMLFS y los clientes afectan directamente a los tiempos de finalización del trabajo. Para obtener un rendimiento predecible y alto, siga estos principios de diseño:
- Use redes aceleradas en todas las máquinas virtuales cliente.
- Coloque AMLFS y máquinas virtuales cliente en la misma zona de disponibilidad en regiones que admiten zonas de disponibilidad.
- Mantenga el enrutamiento de red entre clientes y AMLFS lo más directo posible, con saltos adicionales mínimos o sin saltos adicionales en la ruta de acceso de datos.
Suposiciones de entorno
Estas recomendaciones asumen el siguiente entorno:
- Un sistema de archivos de Lustre administrado de Azure implementado en una red virtual (VNet).
- Una o varias máquinas virtuales cliente Linux que cumplen los requisitos previos de AMLFS.
- El cliente lustre instalado y montado, como se describe en Instalación del cliente lustre y Conexión del cliente al sistema de archivos.
Requisitos de redes aceleradas
Las redes aceleradas usan la virtualización de E/S raíz única (SR-IOV) para ofrecer un mayor rendimiento, una menor latencia y una vibración reducida en comparación con los adaptadores de red básicos. Para cargas de trabajo de AMLFS intensivas de E/S, Microsoft recomienda encarecidamente habilitar redes aceleradas en todas las máquinas virtuales cliente. Para más información, consulte Introducción a las redes aceleradas de Azure.
Planee máquinas virtuales cliente para AMLFS de la siguiente manera:
- Priorice los tamaños de máquina virtual que admiten redes aceleradas. Esto incluye todos los tamaños de máquina virtual de Azure HPC e IA.
- Habilite las redes aceleradas al crear la interfaz de red o actualice la interfaz con redes aceleradas habilitadas si el tamaño de la máquina virtual lo admite. Para obtener opciones paso a paso en el portal, la CLI de Azure y PowerShell, consulte Administración de redes aceleradas para Azure Virtual Machines.
- Al implementar máquinas virtuales cliente mediante la CLI de Azure, Bicep, Terraform o plantillas de ARM, configure las interfaces de red para que las redes aceleradas se habiliten de forma predeterminada.
- Al aprovisionar grupos de clientes a través de orquestadores como Azure CycleCloud, Azure Batch o Azure Kubernetes Service (AKS), asegúrese de que el grupo de nodos o las definiciones de máquina virtual especifiquen tamaños de máquina virtual y configuración de NIC que admitan y habiliten redes aceleradas.
Puede validar que las redes aceleradas están habilitadas en una máquina virtual cliente mediante:
- En Azure Portal, abra el recurso de interfaz de red y confirme que las redes aceleradas están establecidas en Habilitado.
- En la máquina virtual, compruebe que la interfaz de red usa el controlador de red acelerado según la documentación de distribución.
Para obtener más opciones para confirmar la configuración desde scripts o herramientas de línea de comandos, consulte Confirmar que las redes aceleradas están habilitadas.
La habilitación de redes aceleradas en todos los clientes AMLFS ayuda a maximizar el rendimiento por nodo y reduce la sobrecarga de CPU para el procesamiento de red, lo que es importante para cargas de trabajo de Lustre altamente paralelas.
Consideraciones sobre la zona de disponibilidad
En las regiones que admiten zonas de disponibilidad, AMLFS siempre se implementa en una zona de disponibilidad específica. Alinee la ubicación de la máquina virtual cliente con la zona AMLFS para minimizar la latencia y evitar el tráfico entre zonas. Para obtener información general sobre las zonas de disponibilidad en Azure, consulte Introducción a las zonas de disponibilidad.
Siga estas instrucciones:
- Al implementar máquinas virtuales cliente, colóquelas en la misma zona de disponibilidad que el sistema de archivos AMLFS.
- Evite diseños en los que los clientes de una zona accedan principalmente a AMLFS en otra zona, ya que el tráfico entre zonas puede agregar latencia.
- Para clústeres grandes, agrupe los clientes por carga de trabajo o tipo de trabajo y mantenga cada grupo en la misma zona que la instancia de AMLFS que usan.
Si debe abarcar varias zonas por motivos operativos o de resistencia y la latencia entre zonas degrada el rendimiento, tenga en cuenta lo siguiente:
- Mantener trabajos intensivos de ancho de banda o sensibles a la latencia en la misma zona que AMLFS.
- Uso de instancias de AMLFS adicionales en otras zonas para localizar el acceso a datos para cargas de trabajo independientes.
Para comprobar qué tamaños de máquina virtual están disponibles en cada zona de disponibilidad para una región determinada, use la GUÍA de la CLI de Azure o PowerShell en Comprobación de la disponibilidad de la SKU de máquina virtual.
Consideraciones sobre la topología de red
Cada salto de red adicional entre las máquinas virtuales cliente y AMLFS puede agregar latencia, reducir el rendimiento e introducir vibración. Para obtener el mejor rendimiento, implemente AMLFS y máquinas virtuales cliente en la misma red virtual y use el enrutamiento directo entre subredes, sin aplicaciones virtuales de red adicionales ni saltos intermedios en la ruta de acceso de datos. Si usa rutas definidas por el usuario (UDR) en la red virtual, asegúrese de que no invalidan las rutas del sistema entre subredes de cliente y la subred AMLFS para que el tráfico de Lustre permanezca en la ruta de acceso directa.
Pasos siguientes
En este artículo, ha aprendido a optimizar el rendimiento de AMLFS mediante la optimización de la configuración de red, la selección de ubicación de zona de disponibilidad y el enrutamiento.
Para optimizar aún más la implementación, consulte: