Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cette page présente le code Genie pour la science des données. Conçu spécifiquement pour les notebooks Databricks et l’éditeur SQL, Le code Genie en mode Agent peut explorer les données, générer et exécuter du code, et corriger les erreurs, à partir d’une seule invite.
Qu’est-ce que Genie Code pour la science des données ?
Le mode Agent de Genie Code peut automatiser des flux de travail de science des données en plusieurs étapes entières dans les notebooks Databricks et l’éditeur SQL.
Par rapport au mode Conversation de code Genie, le mode Agent a développé des fonctionnalités : planification d’une solution, récupération des ressources pertinentes, exécution de code, utilisation de sorties de cellule pour améliorer les résultats, correction automatique des erreurs, etc.
Genie Code peut planifier et générer du code à exécuter dans des notebooks ou des requêtes à exécuter dans l’éditeur SQL. Genie Code fonctionne avec vous pour approuver ses plans et confirmer ses prochaines étapes avant de continuer. Avec votre approbation, Genie Code peut utiliser des outils pour effectuer des tâches telles que la recherche de tables, la modification d’un bloc-notes, l’exécution de cellules et la lecture des sorties de cellule.
L’accès et les actions de Genie Code sont régies par les autorisations de l’utilisateur. Il peut uniquement accéder aux données auxquelles vous avez accès et effectuer des opérations pour lesquelles vous disposez d’autorisations.
Spécifications
Pour utiliser les fonctionnalités de science des données agentiques de Genie Code, votre espace de travail a besoin des éléments suivants :
- Les fonctionnalités d'IA propulsées par des partenaires sont activées pour le compte et l'espace de travail. Consultez les fonctionnalités d’IA optimisées par les partenaires.
- Préversion du mode Agent de code Genie activée. Consultez Gérer les préversions d’Azure Databricks.
Utiliser le code Genie pour la science des données
Pour utiliser Génie Code pour les tâches de science des données :
À partir d’un notebook Databricks ou de l’éditeur SQL, ouvrez le panneau latéral Génie Code.
Dans le coin inférieur droit, sélectionnez Agent. Cela active le mode Agent de Genie Code, vous permettant d’interagir avec ses capacités de science des données agentique.
Entrez une invite de code Genie. Par exemple, « Analyser
@sales_transactionsà partir d’samples.bakehouse pour identifier le produit le plus vendu ».Conseil / Astuce
Référencer des tables spécifiques à l’aide de
@table_name. L’agent utilisera cette table et toutes les métadonnées associées pour organiser sa réponse. L’agent respecte les autorisations du catalogue Unity de l’utilisateur. Il peut donc accéder uniquement aux données auxquelles vous avez accès.À mesure que Genie Code génère sa réponse, il s’interrompt souvent pour obtenir votre entrée :
Pour des tâches plus complexes, Genie Code peut créer un plan pas à pas et poser des questions de clarification. Répondez à ses questions de clarification pour l’aider à affiner son plan.
Lorsque Genie Code doit exécuter du code, il demande votre approbation avant de continuer. Autoriser ou refuser sa demande. Vous pouvez également sélectionner Autoriser dans ce thread (faisant référence au thread de conversation Genie Code) ou Toujours autoriser.
Important
Genie Code peut générer et exécuter du code dans votre notebook. Bien qu’il ait des garde-fous pour empêcher les actions dangereuses, il y a encore des risques. Vous devez uniquement l’utiliser avec du code et des données que vous approuvez
À mesure que Genie Code poursuit son travail, vous pouvez être invité à sélectionner Continuer ou Rejeter. Passez en revue le travail existant de Genie Code, puis sélectionnez Continuer à l’autoriser à passer à ses étapes suivantes ou Rejeter pour lui indiquer d’essayer autre chose.
Pour arrêter le code Genie pendant qu’il fonctionne, cliquez sur
Genie Code peut créer des cellules de bloc-notes (ou des requêtes), générer du texte et du code, exécuter les cellules du bloc-notes et accéder à la sortie de la cellule pour interpréter les résultats.
Note
Pour que Genie Code poursuive son travail et effectuez les étapes suivantes, vous devez rester sur l’onglet actuel dans lequel il fonctionne.
Conseil / Astuce
Vous pouvez ajouter des instructions pour Génie Code en mode Agent à utiliser dans la plupart des réponses. Par exemple, si vous avez des conventions de code ou des bibliothèques préférées à utiliser, vous pouvez ajouter ces instructions aux instructions pour Génie Code. Vous pouvez également créer des compétences pour étendre Genie Code avec des fonctionnalités spécialisées pour vos tâches spécifiques au domaine. Pour plus d’informations et d’autres conseils, consultez Conseils pour améliorer les réponses au code Génie.
Cas d’utilisation
En mode Agent, Genie Code a développé des fonctionnalités, telles que la recherche de données, l’interprétation des sorties et l’exécution d’actions de cellule.
Genie Code peut vous aider à effectuer des tâches complexes de science des données, notamment l’analyse exploratoire des données, la prévision et le Machine Learning. Vous pouvez même utiliser la création d’un bloc-notes d’analyse des données à partir de zéro avec Genie Code. Pour obtenir de meilleurs résultats, fournissez à l’agent un contexte en référençant des tables, des pipelines, des notebooks, des requêtes et des fichiers avec @<resource_name>. Vous pouvez également cliquer sur Ajoutez un contexte pour sélectionner manuellement le contexte à fournir. Chaque ressource de référence persiste dans le contexte de conversation.
Essayez les suggestions suivantes pour commencer :
-
Découverte des données :
- « Quelle table contient des données de transaction de la boulangerie ? »
- « Je veux voir les données météorologiques de la date 2025-01-01 dans la ville de Los Angeles, CA. »
- « Recherchez une table qui contient les données des taxis de New York et affichez-moi les 10 premières lignes. »
-
Analyse exploratoire des données :
- « Aidez-moi à analyser la chaîne JSON dans la colonne A. »
- « Créer une visualisation des données à partir de cette table ».
- « Interpréter ce graphique à barres ».
- « Décrire le
@sales_transactionsjeu de données. Effectuez un certain EDA pour m’aider à comprendre les statistiques de colonne et à visualiser la distribution des valeurs. Pensez comme un scientifique des données. - « Analysez
@workload_insightspour trouver les 5 premiers clients pour les charges de travail Databricks SQL la semaine dernière par chiffre d’affaires. Tracez ensuite le nombre d’utilisateurs que ces clients avaient pour Databricks SQL par semaine pour les 6 dernières semaines. »
-
Prévision :
- « À l’aide du
@incidentsjeu de données, créez une prévision du nombre quotidien d’incidents pour les 2 prochaines semaines. Lorsque vous avez terminé, donnez-moi une table de données et un graphique interactif pour afficher les résultats. - « À l’aide du
@website_trafficjeu de données, prédire le nombre quotidien de visiteurs pour le mois à venir. Mettez en évidence tous les modèles saisonniers. - « Générer une prévision de la demande de produit pour les 6 prochains mois à partir du
@inventoryjeu de données, y compris les intervalles de confiance. »
- « À l’aide du
-
Machine Learning :
- « Effectuez une préparation des données et une ingénierie des fonctionnalités pour préparer ce jeu de données pour l’entraînement du modèle. »
- « Entraîner un modèle de classification sur le
@customer_datajeu de données pour prédire l’activité. Évaluez le modèle en utilisant la précision et les métriques AUC. - « Effectuer le réglage des hyperparamètres sur un modèle de régression à l’aide du
@housing_pricesjeu de données pour améliorer l’erreur de prédiction . » - « Créez un modèle de clustering sur le
@sales_leadsjeu de données pour identifier les segments de clients et fournissez un résumé des caractéristiques de chaque cluster. »
-
Organisation du bloc-notes :
- « Créez une cellule qui récapitule les résultats de ce bloc-notes . »
- « Donnez à ce bloc-notes un nom pertinent. »
Analyse exploratoire des données
Utilisez Genie Code pour effectuer une analyse exploratoire des données sur un jeu de données. Par exemple, essayez de lui demander de vous aider à créer un bloc-notes qui analyse le samples.bakehouse.sales_transactions jeu de données.
Dans un onglet bloc-notes vide, ouvrez le panneau Code Genie, sélectionnez le mode Agent , puis entrez l’invite suivante : « Décrire le jeu de données, @sales_transactions à partir de samples.bakehouse. Je veux faire un certain nombre d’EDA pour comprendre les statistiques de colonne et visualiser la distribution des valeurs. Pensez comme un scientifique des données.
L’agent crée un plan pour répondre à votre invite et peut poser des questions de clarification. Avec votre approbation, il génère de nouvelles cellules de bloc-notes qui incluent du code pour explorer les données et le texte qui explique son processus et ses résultats.