Afbeeldingsverwerking met batchmodelimplementaties

VAN TOEPASSING OP:Azure CLI ml extension v2 (current)Python SDK azure-ai-ml v2 (current)

U kunt batchmodelimplementaties gebruiken voor het verwerken van tabelgegevens, maar ook voor andere bestandstypen, zoals afbeeldingen. Deze implementaties worden ondersteund in zowel MLflow- als aangepaste modellen. In dit artikel leert u hoe u een model implementeert dat afbeeldingen classificeert op basis van de ImageNet-taxonomie.

Vereisten

Een Azure-abonnement. Als u geen Azure-abonnement hebt, maakt u een gratis account.
Een Azure Machine Learning-werkruimte. Zie Azure Machine Learning-werkruimten beheren om een werkruimte te maken.
De volgende machtigingen in de Azure Machine Learning-werkruimte:
- Voor het maken of beheren van batch-eindpunten en -implementaties: gebruik een eigenaar, inzender of aangepaste rol met de Microsoft.MachineLearningServices/workspaces/batchEndpoints/* machtigingen.
- Voor het maken van Azure Resource Manager-implementaties in de werkruimteresourcegroep: Gebruik een eigenaar, inzender of aangepaste rol met de Microsoft.Resources/deployments/write machtiging in de resourcegroep waarin de werkruimte wordt geïmplementeerd.
De Azure Machine Learning CLI of de Azure Machine Learning SDK voor Python:
- Azure-CLI
- Python
Voer de volgende opdracht uit om de Azure CLI en de mlextensie voor Azure Machine Learning te installeren:
```
az extension add -n ml
```
Implementaties van pijplijnonderdelen voor batcheindpunten vereisen versie 2.7 of hoger van de ml extensie voor de Azure CLI (huidige versie: 2.37.0). Gebruik de az extension update --name ml opdracht om de nieuwste versie op te halen.
Voer de volgende opdracht uit om de Azure Machine Learning SDK voor Python te installeren:
```
pip install azure-ai-ml
```
Voor de ModelBatchDeployment en PipelineComponentBatchDeployment klassen is versie 1.7.0 of hoger van de SDK vereist (huidige versie: 1.31.0). Gebruik de pip install -U azure-ai-ml opdracht om de nieuwste versie op te halen.

Verbinding maken met uw werkruimte

De werkruimte is de resource op het hoogste niveau voor Azure Machine Learning. Het biedt een gecentraliseerde plek om te werken met alle artefacten die u maakt wanneer u Azure Machine Learning gebruikt. In deze sectie maakt u verbinding met de werkruimte waar u uw implementatietaken uitvoert.

Azure-CLI
Python

Voer in de volgende opdracht uw abonnements-id, werkruimtenaam, resourcegroepnaam en locatie in:

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

Importeer de vereiste bibliotheken:

from azure.ai.ml import MLClient, Input, load_component
from azure.ai.ml.entities import BatchEndpoint, ModelBatchDeployment, ModelBatchDeploymentSettings, PipelineComponentBatchDeployment, Model, AmlCompute, Data, BatchRetrySettings, CodeConfiguration, Environment, Data
from azure.ai.ml.constants import AssetTypes, BatchDeploymentOutputAction
from azure.ai.ml.dsl import pipeline
from azure.identity import DefaultAzureCredential

Configureer de details van de werkruimte en haal een ingang op voor de werkruimte:

Voer in de volgende opdracht uw abonnements-id, resourcegroepnaam en werkruimtenaam in:

subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

Over dit voorbeeld

In dit artikel wordt een model gebruikt dat is gebouwd met behulp van TensorFlow, samen met de RestNet-architectuur. Zie Identiteitstoewijzingen in Deep Residual Networks voor meer informatie. U kunt het https://azuremlexampledata.blob.core.windows.net/data/imagenet/model.zip downloaden. Het model heeft de volgende beperkingen:

Het werkt met afbeeldingen van grootte 244x244 (tensors van (224, 224, 3)).
Hiervoor moeten invoerwaarden worden geschaald naar het bereik [0,1].

De informatie in dit artikel is gebaseerd op codevoorbeelden in de opslagplaats azureml-examples . Als u de opdrachten lokaal wilt uitvoeren zonder YAML en andere bestanden te hoeven kopiëren/plakken, kloont u de opslagplaats. Wijzig mappen in cli/endpoints/batch/deploy-models/imagenet-classifier als u de Azure CLI of sdk/python/endpoints/batch/deploy-models/imagenet-classifier gebruikt als u de SDK voor Python gebruikt.

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli/endpoints/batch/deploy-models/imagenet-classifier

Volg mee met Jupyter Notebooks

U kunt dit voorbeeld volgen in een Jupyter Notebook. Open in de gekloonde opslagplaats het notebook: imagenet-classifier-batch.ipynb.

Afbeeldingsclassificatie met batch-implementaties

In dit voorbeeld leert u hoe u een Deep Learning-model implementeert dat een bepaalde afbeelding kan classificeren op basis van de taxonomie van ImageNet.

Het eindpunt maken

Maak het eindpunt dat als host fungeert voor het model:

Azure-CLI
Python

Geef de naam van het eindpunt op.

ENDPOINT_NAME="imagenet-classifier-batch"

Maak het volgende YAML-bestand om het batch-eindpunt met de naam endpoint.yml te definiëren:

$schema: https://azuremlschemas.azureedge.net/latest/batchEndpoint.schema.json
name: imagenet-classifier-batch
description: A batch endpoint for performing image classification using a TFHub model ImageNet model.
auth_mode: aad_token

Voer de volgende code uit om het eindpunt te maken:

az ml batch-endpoint create --file endpoint.yml  --name $ENDPOINT_NAME

Geef de naam van het eindpunt op.

endpoint_name="imagenet-classifier-batch"

Configureer het eindpunt.

endpoint = BatchEndpoint(
    name=endpoint_name,
    description="An batch service to perform ImageNet image classification",
)

Voer de volgende code uit om het eindpunt te maken:

ml_client.batch_endpoints.begin_create_or_update(endpoint)

Het model registreren

Modelimplementaties kunnen alleen geregistreerde modellen implementeren. U moet het model registreren. U kunt deze stap overslaan als het model dat u probeert te implementeren al is geregistreerd.

Download een kopie van het model.

Azure-CLI
Python

wget "${IMAGENET_SAMPLE_URI_BASE}/model.zip"
unzip model.zip -d .

import os
import urllib.request
from zipfile import ZipFile

response = urllib.request.urlretrieve('https://azuremlexampledata.blob.core.windows.net/data/imagenet/model.zip', 'model.zip')

os.mkdirs("imagenet-classifier", exits_ok=True)
with ZipFile(response[0], 'r') as zip:
  model_path = zip.extractall(path="imagenet-classifier")

Registreer het model.

Azure-CLI
Python

MODEL_NAME='imagenet-classifier'
az ml model create --name $MODEL_NAME --path "model"

model_name = 'imagenet-classifier'
model = ml_client.models.create_or_update(
    Model(name=model_name, path=model_path, type=AssetTypes.CUSTOM_MODEL)
)

Een scorescript maken

Maak een scorescript dat de afbeeldingen van de batchimplementatie kan uitlezen en de scores van het model kan terugsturen.

De init methode laadt het model met behulp van de keras module in tensorflow.
De run methode wordt uitgevoerd voor elke minibatch die de batchimplementatie biedt.
De run methode leest één afbeelding van het bestand tegelijk.
De run methode past de grootte van de afbeeldingen aan naar de gewenste maten voor het model.
De run methode schaalt de afbeeldingen opnieuw naar het bereik [0,1] domein, wat het model verwacht.
Het script retourneert de klassen en de waarschijnlijkheden die zijn gekoppeld aan de voorspellingen.

Deze code is de code/score-by-file/batch_driver.py bestand:

import os
import numpy as np
import pandas as pd
import tensorflow as tf
from os.path import basename
from PIL import Image
from tensorflow.keras.models import load_model


def init():
    global model
    global input_width
    global input_height

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    model_path = os.path.join(os.environ["AZUREML_MODEL_DIR"], "model")

    # load the model
    model = load_model(model_path)
    input_width = 244
    input_height = 244


def run(mini_batch):
    results = []

    for image in mini_batch:
        data = Image.open(image).resize(
            (input_width, input_height)
        )  # Read and resize the image
        data = np.array(data) / 255.0  # Normalize
        data_batch = tf.expand_dims(
            data, axis=0
        )  # create a batch of size (1, 244, 244, 3)

        # perform inference
        pred = model.predict(data_batch)

        # Compute probabilities, classes and labels
        pred_prob = tf.math.reduce_max(tf.math.softmax(pred, axis=-1)).numpy()
        pred_class = tf.math.argmax(pred, axis=-1).numpy()

        results.append([basename(image), pred_class[0], pred_prob])

    return pd.DataFrame(results)

Aanbeveling

Hoewel afbeeldingen in minibatches worden geleverd door het systeem, verwerkt dit scoringsscript één afbeelding tegelijk. Dit is een veelvoorkomend patroon omdat het laden van de hele batch en het tegelijkertijd naar het model verzendt, kan leiden tot hoge geheugenbelasting op de batchuitvoering (OOM-uitzonderingen).

Er zijn bepaalde gevallen waarin dit een hoge verwerkingssnelheid in het scoringsproces mogelijk maakt. Dit is het geval voor batchimplementaties via GPU-hardware waarbij u een hoog GPU-gebruik wilt bereiken. Zie Implementaties met hoge doorvoer voor een scorescript dat gebruikmaakt van deze methode.

Notitie

Als u een generatief model wilt implementeren, waarmee bestanden worden gegenereerd, leert u hoe u een scorescript maakt: Uitvoer in batchimplementaties aanpassen.

De implementatie maken

Nadat u het scorescript hebt gemaakt, maakt u er een batchimplementatie voor. Gebruik de volgende procedure:

Zorg ervoor dat u een rekencluster hebt gemaakt waar u de implementatie kunt maken. In dit voorbeeld gebruikt u een rekencluster met de naam gpu-cluster. Hoewel dit niet vereist is, versnelt het gebruik van GPU's de verwerking.
Geef aan over welke omgeving de implementatie moet worden uitgevoerd. In dit voorbeeld wordt het model uitgevoerd op TensorFlow. Azure Machine Learning heeft al een omgeving waarop de vereiste software is geïnstalleerd, zodat u deze omgeving opnieuw kunt gebruiken. U moet een aantal afhankelijkheden toevoegen aan een conda.yml bestand.
- Azure-CLI
- Python
De omgevingsdefinitie is opgenomen in het implementatiebestand.
```
compute: azureml:gpu-cluster
environment:
  name: tensorflow212-cuda11-gpu
  image: mcr.microsoft.com/azureml/curated/tensorflow-2.12-cuda11:latest
```
Haal een verwijzing naar de omgeving op.
```
environment = Environment(
    name="tensorflow27-cuda11-gpu",
    conda_file="environment/conda.yml",
    image="mcr.microsoft.com/azureml/curated/tensorflow-2.7-ubuntu20.04-py38-cuda11-gpu:latest",
)
```

Maak de implementatie.

Azure-CLI
Python

Als u een nieuwe implementatie wilt maken onder het gemaakte eindpunt, maakt u een YAML configuratie zoals in het volgende voorbeeld. Zie voor andere eigenschappen het volledige YAML-schema van het batch-eindpunt.

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
endpoint_name: imagenet-classifier-batch
name: imagenet-classifier-resnetv2
description: A ResNetV2 model architecture for performing ImageNet classification in batch
type: model
model: azureml:imagenet-classifier@latest
compute: azureml:gpu-cluster
environment:
  name: tensorflow212-cuda11-gpu
  image: mcr.microsoft.com/azureml/curated/tensorflow-2.12-cuda11:latest
  conda_file: environment/conda.yaml
code_configuration:
  code: code/score-by-file
  scoring_script: batch_driver.py
resources:
  instance_count: 2
settings:
  max_concurrency_per_instance: 1
  mini_batch_size: 5
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 300
  error_threshold: -1
  logging_level: info

Maak de implementatie met de volgende opdracht:

az ml batch-deployment create --file deployment-by-file.yml --endpoint-name $ENDPOINT_NAME --set-default

Gebruik de volgende code om een nieuwe implementatie te maken met de aangegeven omgeving en het scorescript:

deployment = BatchDeployment(
    name="imagenet-classifier-resnetv2",
    description="A ResNetV2 model architecture for performing ImageNet classification in batch",
    endpoint_name=endpoint.name,
    model=model,
    environment=environment,
    code_configuration=CodeConfiguration(
        code="code/score-by-file",
        scoring_script="batch_driver.py",
    ),
    compute=compute_name,
    instance_count=2,
    max_concurrency_per_instance=1,
    mini_batch_size=10,
    output_action=BatchDeploymentOutputAction.APPEND_ROW,
    output_file_name="predictions.csv",
    retry_settings=BatchRetrySettings(max_retries=3, timeout=300),
    logging_level="info",
)

Maak de implementatie met de volgende opdracht:

ml_client.batch_deployments.begin_create_or_update(deployment)

Hoewel u een specifieke implementatie binnen een eindpunt kunt aanroepen, wilt u meestal het eindpunt zelf aanroepen en het eindpunt laten bepalen welke implementatie moet worden gebruikt. Deze implementatie wordt de standaardimplementatie genoemd.

Met deze methode kunt u de standaardimplementatie wijzigen en het model voor de implementatie wijzigen zonder het contract te wijzigen met de gebruiker die het eindpunt aanroept. Gebruik de volgende code om de standaardimplementatie bij te werken:
- Azure Machine Learning CLI
- Azure Machine Learning SDK voor Python
```
az ml batch-endpoint update --name $ENDPOINT_NAME --set defaults.deployment_name=$DEPLOYMENT_NAME
```
```
endpoint.defaults.deployment_name = deployment.name
ml_client.batch_endpoints.begin_create_or_update(endpoint)
```

Uw batch-eindpunt is klaar om te worden gebruikt.

De implementatie testen

Gebruik een voorbeeld van 1000 afbeeldingen uit de oorspronkelijke ImageNet-gegevensset om het eindpunt te testen. Batch-eindpunten kunnen alleen gegevens verwerken die zich in de cloud bevinden en die toegankelijk zijn vanuit de Azure Machine Learning-werkruimte. Upload het naar een Azure Machine Learning-gegevensarchief. Maak een gegevensasset die kan worden gebruikt om het eindpunt aan te roepen voor scoren.

Notitie

Batch-eindpunten accepteren gegevens die kunnen worden geplaatst in meerdere typen locaties.

Download de bijbehorende voorbeeldgegevens.

Azure-CLI
Python

wget "${IMAGENET_SAMPLE_URI_BASE}/imagenet-1000.zip"
unzip imagenet-1000.zip -d data

Notitie

Als u de applicatie niet lokaal hebt geïnstalleerd, installeert u deze of gebruikt u een browser om het bestand .zip te downloaden.

!wget https://azuremlexampledata.blob.core.windows.net/data/imagenet-1000.zip
!unzip imagenet-1000.zip -d data

Maak de gegevensasset op basis van de gedownloade gegevens.

Azure-CLI
Python

Maak een definitie van een gegevensasset in een YAML bestand met de naam imagenet-sample-unlabeled.yml:

$schema: https://azuremlschemas.azureedge.net/latest/data.schema.json
name: imagenet-sample-unlabeled
description: A sample of 1000 images from the original ImageNet dataset. Download content from https://azuremlexampledata.blob.core.windows.net/data/imagenet-1000.zip.
type: uri_folder
path: data

Maak het gegevensobject aan.

az ml data create -f imagenet-sample-unlabeled.yml

Geef deze waarden op:

data_path = "data"
dataset_name = "imagenet-sample-unlabeled"

imagenet_sample = Data(
    path=data_path,
    type=AssetTypes.URI_FOLDER,
    description="A sample of 1000 images from the original ImageNet dataset",
    name=dataset_name,
)

Maak de data-eenheid aan.

ml_client.data.create_or_update(imagenet_sample)

Gebruik deze code om de net gemaakte gegevensbron op te halen:

imagenet_sample = ml_client.data.get(dataset_name, label="latest")

Wanneer de gegevens zijn geüpload en klaar zijn om te worden gebruikt, roept u het eindpunt aan.
- Azure-CLI
- Python
```
JOB_NAME=$(az ml batch-endpoint invoke --name $ENDPOINT_NAME --input azureml:imagenet-sample-unlabeled@latest --query name -o tsv)
```
Notitie

Als het hulpprogramma jq niet is geïnstalleerd, raadpleegt u jq downloaden.
Aanbeveling

Wat is het verschil tussen de inputs en input parameter wanneer u een eindpunt aanroept?

Over het algemeen kunt u een woordenlijstparameter inputs = {} gebruiken met de invoke methode om een willekeurig aantal vereiste invoer op te geven aan een batch-eindpunt dat een modelimplementatie of een pijplijnimplementatie bevat.

Voor een modelimplementatie kunt u de input parameter gebruiken als een kortere manier om de locatie van de invoergegevens voor de implementatie op te geven. Deze aanpak werkt omdat bij een modelimplementatie altijd slechts één gegevensinvoer nodig is.
```
input = Input(type=AssetTypes.URI_FOLDER, path=imagenet_sample.id)
job = ml_client.batch_endpoints.invoke(
   endpoint_name=endpoint.name,
   input=input,
)
```

Aanbeveling

U geeft de implementatienaam in de aanroepbewerking niet aan. Dat komt doordat het eindpunt de taak automatisch doorstuurt naar de standaardimplementatie. Omdat het eindpunt slechts één implementatie heeft, is dat de standaardinstelling. U kunt een specifieke implementatie instellen door het argument/de parameter deployment_nameaan te geven.

Een batchtaak wordt gestart zodra het commando terugkeert. U kunt de status van de taak controleren totdat deze is voltooid.
- Azure-CLI
- Python
```
az ml job show -n $JOB_NAME --web
```
```
ml_client.jobs.get(job.name)
```

Nadat de implementatie is voltooid, downloadt u de voorspellingen.

Azure-CLI
Python

Gebruik de volgende opdracht om de voorspellingen te downloaden:

az ml job download --name $JOB_NAME --output-name score --download-path ./

ml_client.jobs.download(name=job.name, output_name='score', download_path='./')

De voorspellingen lijken op de volgende uitvoer. De voorspellingen worden gecombineerd met de labels voor het gemak van de lezer. Zie het bijbehorende notebook voor meer informatie over hoe u dit effect kunt bereiken.

import pandas as pd
score = pd.read_csv("named-outputs/score/predictions.csv", header=None,  names=['file', 'class', 'probabilities'], sep=' ')
score['label'] = score['class'].apply(lambda pred: imagenet_labels[pred])
score

bestand	klasse	Waarschijnlijkheid	etiket
n02088094_Afghan_hound. JPEG	161	0.994745	Afghaanse windhond
n02088238_basset	162	0.999397	Basset
n02088364_beagle. JPEG	165	0.366914	bluetick
n02088466_bloodhound. JPEG	164	0.926464	bloedhond
...	...	...	...

Implementaties met hoge doorvoer

Zoals eerder vermeld verwerkt de implementatie één afbeelding tegelijk, zelfs wanneer de batchimplementatie een batch daarvan levert. In de meeste gevallen is deze aanpak het beste. Het vereenvoudigt hoe de modellen worden uitgevoerd en voorkomt mogelijke problemen met onvoldoende geheugen. Echter, in bepaalde andere gevallen wilt u de onderliggende hardware zo veel mogelijk maximaal benutten. Dit is bijvoorbeeld het geval met GPU's.

In deze gevallen wilt u mogelijk deductie uitvoeren voor de volledige batch met gegevens. Deze benadering impliceert dat de hele set afbeeldingen in het geheugen wordt geladen en deze rechtstreeks naar het model wordt verzonden. In het volgende voorbeeld wordt gebruikgemaakt van TensorFlow om een batch afbeeldingen te lezen en ze allemaal tegelijk te beoordelen. Het maakt ook gebruik TensorFlow van ops om gegevens vooraf te verwerken. De hele pijplijn vindt plaats op hetzelfde apparaat dat wordt gebruikt (CPU/GPU).

Waarschuwing

Sommige modellen hebben een niet-lineaire relatie met de grootte van de invoer in termen van het geheugenverbruik. Om onvoldoende geheugenuitzondering te voorkomen, batcht u opnieuw (zoals in dit voorbeeld is gedaan) of verkleint u de grootte van de batches die door de batchimplementatie zijn gemaakt.

Maak het script voor het scoren code/score-by-batch/batch_driver.py:

import os
import numpy as np
import pandas as pd
import tensorflow as tf
from tensorflow.keras.models import load_model


def init():
    global model
    global input_width
    global input_height

    # AZUREML_MODEL_DIR is an environment variable created during deployment
    model_path = os.path.join(os.environ["AZUREML_MODEL_DIR"], "model")

    # load the model
    model = load_model(model_path)
    input_width = 244
    input_height = 244


def decode_img(file_path):
    file = tf.io.read_file(file_path)
    img = tf.io.decode_jpeg(file, channels=3)
    img = tf.image.resize(img, [input_width, input_height])
    return img / 255.0


def run(mini_batch):
    images_ds = tf.data.Dataset.from_tensor_slices(mini_batch)
    images_ds = images_ds.map(decode_img).batch(64)

    # perform inference
    pred = model.predict(images_ds)

    # Compute probabilities, classes and labels
    pred_prob = tf.math.reduce_max(tf.math.softmax(pred, axis=-1)).numpy()
    pred_class = tf.math.argmax(pred, axis=-1).numpy()

    return pd.DataFrame(
        [mini_batch, pred_prob, pred_class], columns=["file", "probability", "class"]
    )

Met dit script wordt een tensorgegevensset samengesteld uit de minibatch die door de batch-implementatie wordt verzonden. Deze gegevensset wordt vooraf verwerkt om de verwachte tensors voor het model te verkrijgen met behulp van de map bewerking met de functie decode_img.
De gegevensset wordt opnieuw gebatcheerd (16) om de gegevens naar het model te verzenden. Gebruik deze parameter om te bepalen hoeveel informatie u in het geheugen kunt laden en tegelijk naar het model kunt verzenden. Als u een GPU gebruikt, moet u deze parameter zorgvuldig afstemmen om het maximale gebruik van de GPU te bereiken net voordat u een geheugenfout krijgt.
Nadat voorspellingen zijn berekend, worden de tensors geconverteerd naar numpy.ndarray.

Maak de implementatie.

Azure-CLI
Python

Als u een nieuwe implementatie wilt maken onder het gemaakte eindpunt, maakt u een YAML configuratie zoals in het volgende voorbeeld. Zie voor andere eigenschappen het volledige YAML-schema van het batch-eindpunt.

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
endpoint_name: imagenet-classifier-batch
name: imagenet-classifier-resnetv2
description: A ResNetV2 model architecture for performing ImageNet classification in batch
type: model
model: azureml:imagenet-classifier@latest
compute: azureml:gpu-cluster
environment:
  name: tensorflow212-cuda11-gpu
  image: mcr.microsoft.com/azureml/curated/tensorflow-2.12-cuda11:latest
  conda_file: environment/conda.yaml
code_configuration:
  code: code/score-by-batch
  scoring_script: batch_driver.py
resources:
  instance_count: 2
tags:
  device_acceleration: CUDA
  device_batching: 16
settings:
  max_concurrency_per_instance: 1
  mini_batch_size: 5
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 300
  error_threshold: -1
  logging_level: info

Maak de implementatie met de volgende opdracht:

az ml batch-deployment create --file deployment-by-batch.yml --endpoint-name $ENDPOINT_NAME --set-default

Gebruik de volgende code om een nieuwe implementatie te maken met de aangegeven omgeving en het scorescript:

deployment = BatchDeployment(
    name="imagenet-classifier-resnetv2",
    description="A ResNetV2 model architecture for performing ImageNet classification in batch",
    endpoint_name=endpoint.name,
    model=model,
    environment=environment,
    code_configuration=CodeConfiguration(
        code="code/score-by-batch",
        scoring_script="batch_driver.py",
    ),
    compute=compute_name,
    instance_count=2,
    tags={ "device_acceleration": "CUDA", "device_batching": "16" }
    max_concurrency_per_instance=1,
    mini_batch_size=10,
    output_action=BatchDeploymentOutputAction.APPEND_ROW,
    output_file_name="predictions.csv",
    retry_settings=BatchRetrySettings(max_retries=3, timeout=300),
    logging_level="info",
)

Maak de implementatie met de volgende opdracht:

ml_client.batch_deployments.begin_create_or_update(deployment)

U kunt deze nieuwe implementatie gebruiken met de voorbeeldgegevens die eerder worden weergegeven. Als u deze implementatie wilt aanroepen, geeft u de naam van de implementatie aan in de aanroepmethode of stelt u deze in als de standaardinstelling.

Overwegingen voor MLflow-modellen die afbeeldingen verwerken

MLflow-modellen in Batch-eindpunten ondersteunen het lezen van afbeeldingen als invoergegevens. Aangezien MLflow-implementaties geen scorescript vereisen, moet u rekening houden met de volgende overwegingen bij het gebruik ervan:

Ondersteunde afbeeldingsbestanden zijn: .png, .jpg, .jpeg, .tiff, .bmp en .gif.
MLflow-modellen verwachten een np.ndarray als invoer te ontvangen die overeenkomt met de afmetingen van de invoerafbeelding. Om meerdere afbeeldingsgrootten in elke batch te ondersteunen, roept de batchuitvoering het MLflow-model eenmaal per afbeeldingsbestand aan.
MLflow-modellen worden sterk aangemoedigd om een handtekening op te nemen. Als dat het gebeurt, moet het van het type TensorSpeczijn. Invoer worden aangepast om overeen te komen met de vorm van de tensor, indien beschikbaar. Als er geen handtekening beschikbaar is, worden de tensors van het type np.uint8 afgeleid.
Voor modellen die een handtekening bevatten en naar verwachting variabele grootte van afbeeldingen moeten verwerken, moet u een handtekening opnemen die deze kan garanderen. In het volgende voorbeeld van een handtekening zijn bijvoorbeeld batches van drie gekanaalde afbeeldingen toegestaan.

import numpy as np
import mlflow
from mlflow.models.signature import ModelSignature
from mlflow.types.schema import Schema, TensorSpec

input_schema = Schema([
  TensorSpec(np.dtype(np.uint8), (-1, -1, -1, 3)),
])
signature = ModelSignature(inputs=input_schema)

(...)

mlflow.<flavor>.log_model(..., signature=signature)

U vindt een werkend voorbeeld in de Jupyter notebook imagenet-classifier-mlflow.ipynb. Zie MLflow-modellen gebruiken in batchimplementaties voor meer informatie over het gebruik van MLflow-modellen in batchimplementaties.

Volgende stappen

Feedback

Is deze pagina nuttig?

Last updated on 2026-03-13

Delen via

Afbeeldingsverwerking met batchmodelimplementaties

Vereisten

Verbinding maken met uw werkruimte

Over dit voorbeeld

Volg mee met Jupyter Notebooks

Afbeeldingsclassificatie met batch-implementaties

Het eindpunt maken

Het model registreren

Een scorescript maken

De implementatie maken

De implementatie testen

Implementaties met hoge doorvoer

Overwegingen voor MLflow-modellen die afbeeldingen verwerken

Volgende stappen

Feedback

Aanvullende resources