Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Dans cet article, vous allez apprendre à développer une application IA générative en commençant par GitHub Modèles, puis à mettre à niveau votre expérience en déployant une ressource Foundry Tools avec Microsoft Foundry Models.
GitHub Models sont utiles lorsque vous souhaitez rechercher et expérimenter des modèles IA gratuitement lorsque vous développez une application IA générative. Lorsque vous êtes prêt à mettre votre application en production, mettez à niveau votre expérience en déployant une ressource Foundry Tools dans un abonnement Azure et en commençant à utiliser des modèles Foundry. Vous n’avez pas besoin de modifier quoi que ce soit d’autre dans votre code.
L'utilisation du terrain de jeu et de l'API gratuite pour les modèles GitHub est soumise à des limites de débit : requêtes par minute, requêtes par jour, jetons par requête et requêtes simultanées. En cas de limitation du débit, vous devrez attendre la réinitialisation de la limite de débit atteinte avant de pouvoir effectuer d’autres requêtes.
Prerequisites
Tu as besoin de:
- Un compte GitHub avec access à GitHub Models.
- Un abonnement Azure avec un mode de paiement valide. Si vous n'avez pas d'abonnement Azure, créez un compte payé Azure à commencer. Vous pouvez également attendre que vous soyez prêt à déployer votre modèle en production, à quel moment vous serez invité à créer ou à mettre à jour votre compte Azure sur un compte standard.
- Les modèles Foundry des partenaires et de la communauté exigent un accès à Azure Marketplace. Vérifiez que vous disposez des autorisations requises pour vous abonner aux offres de modèle. Foundry Models vendus directement par Azure n'ont pas cette exigence.
Mise à niveau vers des modèles Foundry
Les limites de débit pour le terrain de jeu et l’utilisation gratuite de l’API vous aident à expérimenter des modèles et à développer votre application IA. Lorsque vous êtes prêt à mettre votre application en production, utilisez une clé et un point de terminaison à partir d'un compte de Azure payant. Vous n’avez pas besoin de modifier quoi que ce soit d’autre dans votre code.
Note
GitHub Modèles sont gratuits avec des limites de taux. Après la mise à niveau vers les modèles Foundry, l’utilisation est facturée à votre abonnement Azure en fonction du type deployment vous choisissez.
Pour obtenir la clé et le point de terminaison :
Accédez à GitHub Models et sélectionnez un modèle pour atterrir sur son terrain de jeux. Cet article utilise Mistral Medium 3 (25.05).
Tapez certaines invites ou utilisez certaines invites suggérées pour interagir avec le modèle dans le terrain de jeu.
Sélectionnez Utiliser ce modèle dans le terrain de jeu. Cette action ouvre une fenêtre pour « Commencer avec les modèles dans votre base de code ».
Dans l’étape « Configurer l’authentification », sélectionnez Get Clé Microsoft Foundry dans la section « Azure AI ».
Si vous êtes déjà connecté à votre compte Azure, ignorez cette étape. Toutefois, si vous n'avez pas de compte Azure ou si vous n'êtes pas connecté à votre compte, procédez comme suit :
Si vous n'avez pas de compte Azure, sélectionnez Creater mon compte et suivez les étapes pour en créer un.
Sinon, si vous disposez d’un compte Azure, sélectionnez Signez-vous dans. Si votre compte existant est un compte gratuit, vous devez d’abord effectuer une mise à niveau vers un plan standard.
Revenez au terrain de jeu du modèle et sélectionnez à nouveau Obtenir la clé Microsoft Foundry .
Connectez-vous à votre compte Azure.
Vous êtes redirigé vers Foundry > GitHub et atterrissez sur la page d'accueil dans un project Foundry.
Conseil / Astuce
Si vous arrivez dans l’expérience Foundry (classique), activez le bouton New Foundry situé dans le coin supérieur droit de la barre de navigation pour passer à la nouvelle expérience Foundry.
Suivez les étapes décrites dans Déployer un modèle pour déployer le modèle de votre choix, le tester dans l’aire de jeu et inférencer le modèle déployé avec du code.
Vérifiez que le déploiement fonctionne en envoyant une invite de test dans l'environnement de test. Si vous recevez une réponse, votre modèle est prêt à être utilisé à partir du code.
Important
Contrairement à GitHub Modèles où tous les modèles sont déjà configurés, la ressource Foundry Tools vous permet de contrôler les modèles disponibles dans votre point de terminaison et sous quelle configuration. Ajoutez autant de modèles que vous envisagez d’utiliser avant de les indiquer dans le paramètre model. Découvrez comment ajouter d’autres modèles à votre ressource.
Explorer des fonctionnalités supplémentaires
Les modèles Foundry prennent en charge les fonctionnalités qui ne sont pas disponibles dans GitHub Modèles :
- Model catalog — Parcourir, comparer et évaluer des modèles à partir de Azure, de partenaires et de la communauté open source.
- Authentification sans clé : utilisez Microsoft Entra ID pour l’authentification basée sur des jetons sans gérer les clés API.
- Filtrage de contenu : configurez des filtres de sécurité de contenu pour vos déploiements.
- Limitation de débit : définissez des limites de débit personnalisées pour des modèles spécifiques dans votre ressource.
- Types de déploiement : choisissez parmi plusieurs références SKU de déploiement telles que le paiement par jeton, le provisionné et le traitement par lot.
Résoudre des problèmes courants
| Problème | Résolution |
|---|---|
| Modèle non disponible dans votre région | Vérifiez la disponibilité de la région du modèle sur sa page de catalogue model et choisissez une région prise en charge. |
| Erreur d’authentification après échange de clé | Vérifiez que vous avez copié la clé correcte à partir du portail Foundry. Sélectionnez Paramètres du projet>Clés et points de terminaison pour afficher vos clés. |
| Erreurs de limite de débit après la mise à niveau | Les limites de taux pour les modèles Foundry dépendent de votre type de déploiement. Effectuez un scale-up ou choisissez un déploiement à débit plus élevé. |
