Delen via


Betrouwbaarheid in Azure NetApp Files

Azure NetApp Files is een systeemeigen, hoogwaardige oplossing voor bestandsopslag die naadloos in Azure integreert en het delen van bestanden via NFS-protocollen (Network File System) en Server Message Block (SMB) mogelijk maakt. Azure NetApp Files is ontworpen voor hoge prestaties en biedt schaalbare en veilige bestandsopslag die wordt beheerd als een service.

Wanneer u Azure gebruikt, is betrouwbaarheid een gedeelde verantwoordelijkheid. Microsoft biedt een scala aan mogelijkheden ter ondersteuning van tolerantie en herstel. U bent verantwoordelijk voor het begrijpen van de werking van deze mogelijkheden binnen alle services die u gebruikt en het selecteren van de mogelijkheden die u nodig hebt om te voldoen aan uw bedrijfsdoelstellingen en beschikbaarheidsdoelen.

In dit artikel wordt beschreven hoe u NetApp Files bestand maakt tegen verschillende mogelijke storingen en problemen, waaronder tijdelijke fouten, storingen in de beschikbaarheidszone en regio-storingen. Er wordt ook beschreven hoe u back-ups kunt gebruiken om te herstellen van verschillende soorten problemen, en belangrijke informatie over de Azure NetApp Files service level agreement (SLA) wordt benadrukt.

Aanbevelingen voor productie-implementatie

Zie Architecture best practices voor Azure NetApp Files in het Azure Well-Architected Framework voor meer informatie over het implementeren van Azure NetApp Files ter ondersteuning van de betrouwbaarheidsvereisten van uw oplossing en hoe betrouwbaarheid van invloed is op andere aspecten van uw architectuur.

Overzicht van betrouwbaarheidsarchitectuur

Als u Azure NetApp Files wilt gebruiken, moet u een NetApp-account configureren die capaciteitspools bevat en die volumes hosten. U kunt capaciteit en doorvoer onafhankelijk configureren en opties voor gegevensbeveiliging beheren die aan verschillende behoeften voldoen. U kunt replicatie tussen volumes inschakelen, zelfs als ze zich op verschillende locaties bevinden.

Tolerantie voor tijdelijke fouten

Tijdelijke fouten zijn korte, onregelmatige fouten in onderdelen. Ze vinden vaak plaats in een gedistribueerde omgeving, zoals de cloud, en ze zijn een normaal onderdeel van de bewerkingen. Tijdelijke fouten corrigeren zichzelf na een korte periode. Het is belangrijk dat uw toepassingen tijdelijke fouten kunnen afhandelen, meestal door de betreffende aanvragen opnieuw uit te voeren.

Alle cloudtoepassingen moeten de Azure richtlijnen voor tijdelijke foutafhandeling volgen wanneer ze communiceren met api's, databases en andere onderdelen die in de cloud worden gehost. Zie Aanbevelingen voor het afhandelen van tijdelijke foutenvoor meer informatie.

Naast tijdelijke fouttypen die van invloed kunnen zijn op elke cloudoplossing, kan incidenteel gepland onderhoud, zoals platformupdates, service-updates en software-upgrades, ook van invloed zijn op Azure NetApp Files.

Vanuit het perspectief van een bestandsprotocol zoals NFS en SMB, zijn tijdelijke fouten niet storend als de toepassing de invoer/uitvoer (I/O) pauzes kan verwerken die zich tijdens deze storingen kunnen voordoen. De I/O-pauzes zijn doorgaans kort, variërend van een paar seconden tot 30 seconden. Voor sommige toepassingen is mogelijk afstemming vereist om de I/O-pauzes af te handelen.

Het NFS-protocol is robuust en bestandsbewerkingen op de clientserver blijven over het algemeen normaal. Voor sommige toepassingen is het afstemmen mogelijk vereist voor het afhandelen van I/O-pauzes gedurende 30 tot 45 seconden. Wees ervoor dat u op de hoogte bent van de instellingen voor veerkracht van de toepassing om om te gaan met de onderhoudsevenementen van de opslagdienst.

Voor menselijke interactieve toepassingen die gebruikmaken van het SMB-protocol zijn de standaardprotocolinstellingen meestal voldoende. Azure NetApp Files biedt ook ondersteuning voor SMB-continue beschikbaarheid, waardoor transparante SMB-failover mogelijk is. SMB Transparent Failover elimineert onderbrekingen die serviceonderhoudsevenementen veroorzaken. Het verbetert ook de betrouwbaarheid en gebruikerservaring.

Continue SMB-beschikbaarheid is alleen beschikbaar voor specifieke toepassingen.

Voor meer aanbevelingen zie Veelgestelde vragen over veerkracht voor Azure NetApp Files.

Tolerantie voor fouten in beschikbaarheidszones

Beschikbaarheidszones zijn fysiek afzonderlijke groepen datacenters binnen een Azure regio. Wanneer één zone uitvalt, kunnen services een failover uitvoeren naar een van de resterende zones.

Azure NetApp Files ondersteunt zonal implementaties van volumes. Gebruik de functie beschikbaarheidszone voor volumeplaatsing in Azure NetApp Files om elk volume in één beschikbaarheidszone van uw keuze te implementeren. U kunt deze functie alleen gebruiken als Azure NetApp Files aanwezig is in die beschikbaarheidszone en voldoende capaciteit heeft. Als u latentiegevoelige toepassingen hebt, kunt u een volume implementeren in dezelfde beschikbaarheidszone als uw Azure rekenresources en andere services.

In het volgende diagram geven oranje pijlen met volle pijlpunten aan hoe alle virtuele machines (VM's) in de regio met gekoppelde virtuele netwerken toegang hebben tot alle Azure NetApp Files bronnen. Groene pijlen geven aan hoe VM's die toegang hebben tot Azure NetApp Files volumes in dezelfde zone, het foutdomein van de beschikbaarheidszone delen. Er is geen replicatie tussen de verschillende volumes op platformniveau.

Diagram dat de plaatsing van volumes in beschikbaarheidszones voor Azure NetApp Files toont.

In het diagram ziet u drie beschikbaarheidszones in een Azure regio. Oranje pijlen met massieve pijlpunten verbinden pictogrammen die VM's vertegenwoordigen en Azure NetApp Files bronnen in beschikbaarheidszones. Groene pijlen verbinden VM's en Azure NetApp Files volumes in dezelfde beschikbaarheidszone.

Een implementatie met één zone is niet voldoende om te voldoen aan hoge betrouwbaarheidsvereisten. Als u gegevens asynchroon wilt repliceren tussen volumes in verschillende beschikbaarheidszones, kunt u replicatie tussen meerdere zones gebruiken. U moet replicatie tussen zones afzonderlijk configureren van de plaatsing van het volume van de beschikbaarheidszone.

Als een beschikbaarheidszone mislukt, bent u verantwoordelijk voor het detecteren van de fout en het overschakelen naar een alternatief volume in een andere zone.

Requirements

  • Region-ondersteuning: Replicatie tussen zones is beschikbaar in alle regio's met beschikbaarheidszone die ondersteuning bieden voor Azure NetApp Files.

  • Volumeplaatsing in de beschikbaarheidszone in Azure NetApp Files zorgt voor zonegebonden volumeplaatsing. U ziet een lage latentie wanneer u verbinding maakt met VM's binnen dezelfde beschikbaarheidszone. De plaatsing van het volume in de beschikbaarheidszone biedt echter geen nabijheidsplaatsing met VM's of andere resources en het volume bevindt zich mogelijk in een ander fysiek deel van het datacenter.

  • Replicatie is alleen toegestaan tussen verschillende Azure abonnementen als deze zich binnen dezelfde Microsoft Entra tenant bevinden.

  • Voor meer overwegingen over beschikbaarheidszones in Azure NetApp Files, zie Requirements and considerations for using cross-zone replication en Manage availability zone volume placement.

Kosten

Er worden geen extra kosten in rekening gebracht om de plaatsing van het volume in de beschikbaarheidszone in Azure NetApp Files in te schakelen. U betaalt alleen voor de capaciteitspools en resources die u in deze zones implementeert.

Gerepliceerde volumes worden gehost in een capaciteitspool. De kosten voor replicatie tussen zones zijn gebaseerd op de ingerichte capaciteitspoolgrootte en -laag. Er zijn geen extra kosten verbonden aan gegevensreplicatie.

Ondersteuning voor beschikbaarheidszones configureren

U moet de plaatsing van volumes en replicatie tussen zones afzonderlijk configureren.

  • Volumeplaatsing:

    • Maak een nieuw volume of configureer een bestaand volume met ondersteuning voor beschikbaarheidszones. Als u beschikbaarheidszones voor volumes in Azure NetApp Files wilt configureren, raadpleegt u Plaatsing van beschikbaarheidszone voor Azure NetApp Files.

      Als u door Terraform beheerde volumes met beschikbaarheidszones implementeert, zijn andere configuraties vereist. Voor meer informatie, zie Beschikbaarheidszone invullen voor door Terraform beheerde volumes.

      Als u op rollen gebaseerd toegangsbeheer gebruikt, moet u ervoor zorgen dat u de juiste machtigingen configureert.

    • Een volume migreren tussen beschikbaarheidszones. Nadat u een volume hebt geconfigureerd om het in een beschikbaarheidszone te plaatsen, kan de opgegeven beschikbaarheidszone niet worden gewijzigd. U kunt volumes niet verplaatsen tussen beschikbaarheidszones.

    • Schakel ondersteuning voor beschikbaarheidszones voor een volume uit. Nadat u een volume hebt geconfigureerd om het in een beschikbaarheidszone te plaatsen, kunt u de ondersteuning voor de beschikbaarheidszone niet uitschakelen.

  • Replicatie tussen zones:

    • Schakel replicatie tussen zones in. Configureer replicatie tussen zones voor een ander volume om de tolerantie van uw oplossing te verbeteren.

    • Schakel replicatie tussen zones uit. U kunt replicatie tussen zones uitschakelen door de replicatiekoppeling te verbreken. Zie Herstel na noodgeval met behulp van Azure NetApp Files voor meer informatie.

Gedrag wanneer alle zones in orde zijn

In deze sectie wordt beschreven wat u kunt verwachten wanneer meerdere Azure NetApp Files volumes worden geïmplementeerd in afzonderlijke beschikbaarheidszones, replicatie tussen zones is ingeschakeld en alle beschikbaarheidszones operationeel zijn.

  • Verkeersroutering tussen zones: Binnenkomende aanvragen worden doorgestuurd naar het specifieke volume, dat zich in de beschikbaarheidszone bevindt die u selecteert.

  • Data-replicatie tussen zones: Azure NetApp Files replicatie tussen zones betekent dat alle wijzigingen in het bronvolume asynchroon worden gerepliceerd naar doelvolumes. U kunt bepalen hoe vaak de replicatie plaatsvindt. Replicatie tussen zones ondersteunt drie replicatieschema's: elke 10 minuten, elk uur en dagelijks.

    Belangrijk

    Het replicatieschema van 10 minuten wordt niet ondersteund voor grote volumes die gebruikmaken van replicatie tussen zones.

Gedrag tijdens een zonefout

In deze sectie wordt beschreven wat u kunt verwachten wanneer meerdere Azure NetApp Files volumes worden geïmplementeerd in afzonderlijke beschikbaarheidszones, replicatie tussen zones is ingeschakeld en er een storing in de beschikbaarheidszone is.

  • Detectie en reactie: U bent verantwoordelijk voor het detecteren van het verlies van een beschikbaarheidszone en het initiëren van een failover.

    Failover is een handmatig proces. Wanneer u het doelvolume moet activeren, bijvoorbeeld wanneer u een failover wilt uitvoeren naar de beschikbaarheidszone van de bestemming, moet u de replicatiepeering verbreken en vervolgens het doelvolume koppelen. Zie failover naar het doelvolumevoor meer informatie.

  • Notification: Als u de status van uw Azure NetApp Files volume wilt bewaken, kunt u Azure Monitor metrische gegevens gebruiken. Azure Monitor detecteert afwijkingen die wijzen op een zone-down scenario via realtime metrische gegevens, zoals invoer-/uitvoerbewerkingen per seconde (IOPS), latentie en capaciteitsgebruik. U kunt waarschuwingen en meldingen configureren om naar beheerders te verzenden, zodat ze onmiddellijk kunnen reageren door bestandsshares opnieuw te verdelen of failovers of andere protocollen voor herstel na noodgevallen te starten.

  • Actieve aanvragen: Tijdens een zone-downgebeurtenis kunnen actieve aanvragen onderbrekingen of verhoogde latenties ervaren.

  • Verwachte gegevensverlies: De hoeveelheid gegevensverlies of RPO (Recovery Point Objective), die u tijdens een zonefailover kunt verwachten, is afhankelijk van het replicatieschema voor meerdere zones dat u configureert.

    Replicatieschema Typische RPO
    Elke 10 minuten 20 minuten
    Per uur Twee uur
    Dagelijks Minder dan 48 uur
  • Verwachte downtime: Failover naar een andere zone vereist dat u de peeringrelatie onderbreekt om het doelvolume te activeren en lees- en schrijftoegang tot gegevens op de tweede site te bieden. Nadat u de peering hebt geactiveerd om te breken, kunt u verwachten dat de failover binnen één minuut wordt voltooid.

    De totale hoeveelheid downtime of de beoogde hersteltijd (RTO) die u tijdens een zonefailover kunt verwachten, is echter afhankelijk van meerdere factoren, waaronder hoe lang het duurt voordat uw systemen of processen het verlies van de zone detecteren en failoverprocessen initiëren. Het is ook belangrijk om te bepalen of u uw antwoord wilt automatiseren of handmatige stappen moet uitvoeren. Voor goed voorbereide configuraties vereist het algehele proces doorgaans een paar minuten tot een uur om te voltooien.

  • Verkeer omleiden: U bent verantwoordelijk voor het omleiden van uw toepassingsverkeer om verbinding te maken met het zojuist actieve doelvolume. Zie failover naar het doelvolumevoor meer informatie.

Zoneherstel

Failback is een handmatig proces waarvoor u een hersynchronisatiebewerking moet uitvoeren, de replicatie opnieuw moet herstellen en het bronvolume opnieuw moet koppelen voor toegang tot de client. Zie Herstel na noodgeval met behulp van Azure NetApp Files voor meer informatie.

Testen op zonefouten

U kunt de replicatieconfiguratie tussen zones veilig testen met behulp van momentopnamen van uw volume. Zie Test disaster recovery for Azure NetApp Files voor meer informatie over een benadering op hoog niveau voor het testen van de replicatieconfiguratie tussen zones.

Tolerantie voor storingen in de hele regio

Standaard is Azure NetApp Files een service met één regio. Als de regio niet meer beschikbaar is, zijn volumes die zijn opgeslagen in die regio ook niet meer beschikbaar. Om de tolerantie te verbeteren als er een regionale storing optreedt, ondersteunt Azure NetApp Files replicatie tussen regio's. U kunt gegevens asynchroon repliceren van een Azure NetApp Files volume (de bron) in de ene regio naar een andere Azure NetApp Files volume (de bestemming) in een andere regio die door Microsoft vooraf wordt selectief gemaakt. Met deze mogelijkheid kunt u een failover uitvoeren voor uw kritieke toepassing als er een storing of noodgeval in de hele regio optreedt.

Opmerking

U kunt ook één volume repliceren naar een andere beschikbaarheidszone en naar een andere regio. Zie Onderstand Azure NetApp Files replication voor meer informatie.

Requirements

Regioondersteuning: De secundaire regio waarnaar u uw volumes kunt repliceren, is afhankelijk van de primaire regio. Zie ondersteunde regioparen voor meer informatie.

Overwegingen

Replicatie is alleen toegestaan tussen verschillende Azure abonnementen als deze zich binnen dezelfde Microsoft Entra tenant bevinden.

Zie Verwachtingen en overwegingen voor het gebruik van replicatie tussen regio's voor andere overwegingen met betrekking tot replicatie tussen regio's in Azure NetApp Files.

Kosten

Replicatiekosten tussen regio's zijn gebaseerd op de hoeveelheid gegevens die u repliceert. Zie Kostenmodel voor replicatie tussen regio's voor meer informatie en enkele voorbeeldscenario's.

Ondersteuning voor meerdere regio's configureren

  • Replicatie tussen regio's inschakelen:Configureer replicatie tussen regio's om de tolerantie van uw oplossing te verbeteren.

  • Replicatie tussen regio's uitschakelen: U kunt replicatie tussen regio's uitschakelen door de replicatiekoppeling te verbreken. Zie Herstel na noodgeval met behulp van Azure NetApp Files voor meer informatie.

Gedrag wanneer alle regio's in orde zijn

In deze sectie wordt beschreven wat u kunt verwachten wanneer Azure NetApp Files volumes zijn geconfigureerd voor het gebruik van replicatie tussen regio's en beide regio's operationeel zijn.

  • Verkeersroutering tussen regio's: Binnenkomende aanvragen worden doorgestuurd naar het specifieke volume, dat zich in de primaire regio bevindt.

  • Gegevensreplicatie tussen regio's: Azure NetApp Files replicatie tussen regio's betekent dat alle wijzigingen in het bronvolume asynchroon worden gerepliceerd naar doelvolumes. U kunt bepalen hoe vaak de replicatie plaatsvindt. Replicatie tussen regio's ondersteunt drie replicatieschema's: elke 10 minuten, elk uur en dagelijks.

    Belangrijk

    Het replicatieschema van 10 minuten wordt niet ondersteund voor grote volumes die gebruikmaken van replicatie tussen regio's.

  • Replicatiestatus bewaken: U kunt de status van de peeringrelatie controleren en u kunt waarschuwingen configureren om u op de hoogte te stellen als de replicatievertraging hoger is dan de verwachte drempelwaarde. Zie De status van de replicatierelatie weergeven en controleren voor meer informatie.

Gedrag tijdens een regiofout

In deze sectie wordt beschreven wat u kunt verwachten wanneer Azure NetApp Files volumes zijn geconfigureerd voor het gebruik van replicatie tussen regio's en er een storing is in de primaire regio.

  • Detectie en reactie: U bent verantwoordelijk voor het detecteren van het verlies van een regio en het initiëren van een failover. Failover is een handmatig proces. Wanneer u het doelvolume moet activeren, bijvoorbeeld wanneer u een failover naar de doelregio wilt uitvoeren, moet u de replicatiepeering verbreken en vervolgens het doelvolume koppelen. Zie failover naar het doelvolumevoor meer informatie.

  • Notification: Als u de status van uw Azure NetApp Files volume wilt bewaken, kunt u Azure Monitor metrische gegevens gebruiken. Azure Monitor detecteert afwijkingen die wijzen op een regio-down scenario via realtime metrische gegevens, zoals IOPS, latentie en capaciteitsgebruik. U kunt waarschuwingen en meldingen configureren om naar beheerders te verzenden, zodat ze onmiddellijk kunnen reageren door bestandsshares opnieuw te verdelen of failovers of andere protocollen voor herstel na noodgevallen te starten.

  • Actieve aanvragen: Tijdens een regio-downgebeurtenis kunnen actieve aanvragen onderbrekingen of verhoogde latenties ervaren.

  • Verwachte gegevensverlies: De hoeveelheid gegevensverlies of RPO die u tijdens een regiofailover kunt verwachten, is afhankelijk van het replicatieschema voor meerdere regio's dat u configureert.

    Replicatieschema Typische RPO
    Elke 10 minuten Minder dan 20 minuten
    Per uur Minder dan twee uur
    Dagelijks Minder dan 48 uur
  • Verwachte downtime: Voor failover naar een andere regio moet u de peeringrelatie verbreken om het doelvolume te activeren en lees- en schrijfgegevenstoegang te bieden op de tweede site. Nadat u de peering hebt geactiveerd om te breken, kunt u verwachten dat de failover binnen één minuut wordt voltooid.

    De totale hoeveelheid downtime of RTO die u tijdens een zonefailover kunt verwachten, is echter afhankelijk van meerdere factoren, waaronder hoe lang het duurt voordat uw systemen of processen het verlies van de zone detecteren en failoverprocessen initiëren. Het is ook belangrijk om te bepalen of u uw antwoord wilt automatiseren of handmatige stappen moet uitvoeren. Voor goed voorbereide configuraties vereist het algehele proces doorgaans een paar minuten tot een uur om te voltooien.

  • Verkeer omleiden: U bent verantwoordelijk voor het omleiden van uw toepassingsverkeer om verbinding te maken met het zojuist actieve doelvolume. Zie failover naar het doelvolumevoor meer informatie.

Herstel van de regio

U bent verantwoordelijk voor failback nadat de primaire regio is hersteld. Failback is een handmatig proces waarvoor u een hersynchronisatiebewerking moet uitvoeren, de replicatie opnieuw moet herstellen en het bronvolume opnieuw moet koppelen voor toegang tot de client. Zie Herstel na noodgeval met behulp van Azure NetApp Files voor meer informatie.

Test voor regiofouten

U kunt uw replicatieconfiguratie tussen regio's veilig testen met behulp van momentopnamen van uw volume. Zie Test disaster recovery for Azure NetApp Files voor meer informatie over een benadering op hoog niveau voor het testen van uw replicatieconfiguratie tussen regio's.

Backups en herstel

Azure NetApp Files back-up breidt de mogelijkheden voor gegevensbeveiliging van Azure NetApp Files uit door een volledig beheerde back-upoplossing te bieden voor langetermijnherstel, archief en naleving. Backups die door de service worden gemaakt, worden opgeslagen in Azure Storage, onafhankelijk van volumemomentopnamen die beschikbaar zijn voor snel herstel of klonen. Back-ups die door de service worden gemaakt, kunnen worden hersteld naar nieuwe Azure NetApp Files volumes binnen de regio. Azure NetApp Files back-up ondersteunt zowel op beleid gebaseerde (geplande) back-ups als handmatige (on-demand) back-ups.

Voor verdere beveiliging voegt Azure NetApp Files snapshots stabiliteit, schaalbaarheid en snelle herstelbaarheid toe zonder dat dit van invloed is op de prestaties. Ze bieden de basis voor andere redundantieoplossingen, waaronder back-up, replicatie tussen regio's en replicatie tussen zones.

Voor de meeste oplossingen hoeft u niet uitsluitend te vertrouwen op back-ups. Gebruik in plaats daarvan de andere mogelijkheden die in deze handleiding worden beschreven om uw tolerantievereisten te ondersteunen. Back-ups beschermen echter tegen enkele risico's die andere benaderingen niet opleveren. Zie Wat zijn redundantie, replicatie en back-up? voor meer informatie.

Diensteniveauovereenkomst

De SLA (Service Level Agreement) voor Azure services beschrijft de verwachte beschikbaarheid van elke service en de voorwaarden waaraan uw oplossing moet voldoen om die beschikbaarheidsverwachting te bereiken. Zie SLAs voor onlineservices voor meer informatie.