Delen via


Concepten van Fabric-gegevensagenten (preview)

De Data agent in Microsoft Fabric is een nieuwe Microsoft Fabric functie die u in staat stelt om uw eigen gespreks-Q&A-systemen te maken met behulp van generatieve AI. Een Fabric-gegevensagent maakt gegevensinzichten toegankelijker en geschikter voor iedereen in uw organisatie. Met behulp van een Fabric-gegevensagent kan uw team gesprekken voeren, met gewone vragen in het Engels, over de gegevens die uw organisatie heeft opgeslagen in Fabric OneLake en vervolgens relevante antwoorden ontvangen. Op deze manier kunnen zelfs mensen zonder technische expertise in AI of een grondige kennis van de gegevensstructuur nauwkeurige en contextrijke antwoorden krijgen.

U kunt ook organisatiespecifieke instructies, voorbeelden en richtlijnen toevoegen om de Fabric-gegevensagent af te stemmen. Deze aanpak zorgt ervoor dat antwoorden aansluiten op de behoeften en doelstellingen van uw organisatie, zodat iedereen effectiever kan communiceren met gegevens. Fabric-gegevensagent bevordert een cultuur van gegevensgestuurde besluitvorming, omdat het obstakels voor inzicht in toegankelijkheid verlaagt, samenwerking vergemakkelijkt en uw organisatie meer waarde uit de gegevens helpt halen.

Belangrijk

Deze functie is beschikbaar als preview-versie.

Vereiste voorwaarden

Hoe de Fabric-gegevensagent werkt

De Fabric-gegevensagent maakt gebruik van grote taalmodellen (LLM's) om gebruikers op natuurlijke wijze te helpen met hun gegevens te communiceren. De Fabric-gegevensagent past Azure OpenAI Assistant-API's toe en gedraagt zich als een agent. Het verwerkt gebruikersvragen, bepaalt de meest relevante gegevensbron (Lakehouse, Warehouse, Power BI gegevensset, KQL-databases, ontologie) en roept het juiste hulpprogramma aan om query's te genereren, valideren en uitvoeren. Gebruikers kunnen vervolgens vragen stellen in gewone taal en gestructureerde, door mensen leesbare antwoorden ontvangen. Deze aanpak elimineert de noodzaak om complexe query's te schrijven en zorgt voor nauwkeurige en veilige gegevenstoegang.

Dit werkt als volgt in detail:

Vraag parseren en valideren: De Fabric-gegevensagent past Azure Api's van OpenAI Assistant toe als de onderliggende agent om vragen van gebruikers te verwerken. Deze aanpak zorgt ervoor dat de vraag voldoet aan beveiligingsprotocollen, verantwoordelijk AI-beleid (RAI) en gebruikersmachtigingen. De Fabric-gegevensagent dwingt leesbaarheid strikt af en onderhoudt uitsluitend leesbare gegevensverbindingen met alle gegevensbronnen.

Gegevensbronidentificatie: de Fabric-gegevensagent gebruikt de referenties van de gebruiker om toegang te krijgen tot het schema van de gegevensbron. Deze aanpak zorgt ervoor dat het systeem gegevensstructuurgegevens ophaalt die de gebruiker heeft gemachtigd om te bekijken. De agent evalueert vervolgens de vraag van de gebruiker op basis van alle beschikbare gegevensbronnen, waaronder relationele databases (Lakehouse en Warehouse), Power BI gegevenssets (Semantische modellen), KQL-databases en ontologieën. Het kan ook verwijzen naar instructies van de door de gebruiker verstrekte gegevensagent om de meest relevante gegevensbron te bepalen.

Aanroepen van hulpprogramma's en het genereren van query's: zodra de juiste gegevensbron of bronnen zijn geïdentificeerd, herformuleert de Fabric-gegevensagent de vraag voor duidelijkheid en structuur en roept vervolgens het bijbehorende hulpprogramma aan om een gestructureerde query te genereren:

  • Natuurlijke taal voor SQL (NL2SQL) voor relationele databases (Lakehouse/Warehouse).
  • Natuurlijke taal voor DAX (NL2DAX) voor Power BI gegevenssets (Semantische modellen).
  • Natuurlijke taal naar KQL (NL2KQL) voor KQL-databases.

Met het geselecteerde hulpprogramma wordt een query gegenereerd op basis van het opgegeven schema, de metagegevens en de context die de onderliggende agent van de Fabric-gegevensagent doorgeeft.

Queryvalidatie: Het hulpprogramma voert validatie uit om ervoor te zorgen dat de query correct is gevormd en voldoet aan zijn eigen beveiligingsprotocollen en RAI-beleid.

Query-uitvoering en -reactie: na validatie voert de Fabric-gegevensagent de query uit op de gekozen gegevensbron. De resultaten worden opgemaakt in een door mensen leesbare reactie, waaronder gestructureerde gegevens, zoals tabellen, samenvattingen of belangrijke inzichten.

Door deze methode te gebruiken, kunnen gebruikers met hun gegevens communiceren met behulp van natuurlijke taal. De Fabric-gegevensagent verwerkt de complexiteit van het genereren, valideren en uitvoeren van query's. Gebruikers hoeven zelf geen SQL, DAX of KQL te schrijven.

Configuratie van fabricgegevensagent

Het configureren van een Fabric-gegevensagent is vergelijkbaar met het bouwen van een Power BI rapport. U begint met het ontwerpen en verfijnen om ervoor te zorgen dat deze aan uw behoeften voldoet en deze vervolgens publiceert en deelt met collega's, zodat ze met de gegevens kunnen communiceren. Het instellen van een Fabric-gegevensagent omvat:

Selecteren van gegevensbronnen: Een Fabric-gegevensagent ondersteunt maximaal vijf gegevensbronnen in elke combinatie, waaronder lakehouses, magazijnen, KQL-databases, Power BI semantische modellen en ontologieën. Een geconfigureerde Fabric-gegevensagent kan bijvoorbeeld vijf Power BI semantische modellen bevatten. Het kan bestaan uit een combinatie van twee Power BI semantische modellen, één lakehouse en één KQL-database. U hebt veel beschikbare opties.

Relevante tabellen kiezen: nadat u de gegevensbronnen hebt geselecteerd, voegt u ze één voor één toe en definieert u de specifieke tabellen uit elke bron die de Fabric-gegevensagent gebruikt. Deze stap zorgt ervoor dat de Fabric-gegevensagent nauwkeurige resultaten ophaalt door alleen te focussen op relevante gegevens. Voor lakehouses betekent deze stap het selecteren van lakehouse-tabellen (niet afzonderlijke lakehouse-bestanden). Als uw gegevens worden gestart als bestanden (bijvoorbeeld CSV of JSON), maakt u deze beschikbaar voor de agent door deze op te nemen in tabellen of op een andere manier weer te geven via tabellen.

Context toevoegen: Als u de nauwkeurigheid van de Fabric-gegevensagent wilt verbeteren, geeft u meer context via instructies en voorbeeldquery's voor de Fabric-gegevensagent. Als de onderliggende agent voor de Fabric-gegevensagent helpt de context de Azure OpenAI Assistant-API beter geïnformeerde beslissingen te nemen over het verwerken van gebruikersvragen en bepalen welke gegevensbron het meest geschikt is om deze te beantwoorden.

  • Instructies voor gegevensagent: voeg instructies toe om de agent te begeleiden die ten grondslag aan de Fabric-gegevensagent is gekoppeld, bij het bepalen van de beste gegevensbron om specifieke typen vragen te beantwoorden. U kunt ook aangepaste regels of definities opgeven die de terminologie van de organisatie of specifieke vereisten verduidelijken. Deze instructies kunnen meer context of voorkeuren bieden die van invloed zijn op de wijze waarop de agent gegevensbronnen selecteert en opvraagt. Stel directe vragen over financiële metrische gegevens aan een Power BI-semantisch model, ken query's met betrekking tot exploratie van ruwe gegevens toe aan het lakehouse, en routeer vragen waarvoor loganalyse nodig is naar de KQL-database.

  • Voorbeeldquery's: Voeg voorbeeldparen van vragen en query's toe om te illustreren hoe de Fabric-gegevensagent moet reageren op algemene query's. Deze voorbeelden dienen als richtlijn voor de agent, waarmee het inzicht krijgt in het interpreteren van vergelijkbare vragen en het genereren van nauwkeurige antwoorden.

Notitie

Het toevoegen van voorbeeldquery-/vraagparen wordt momenteel niet ondersteund voor Power BI semantische modelgegevensbronnen.

Door duidelijke AI-instructies en relevante voorbeeldquery's te combineren, kunt u de Fabric-gegevensagent beter afstemmen op de gegevensbehoeften van uw organisatie, zodat u nauwkeurigere en contextbewuste reacties kunt uitvoeren.

Verschil tussen een Fabric-gegevensagent en een copilot

Hoewel zowel Fabric-gegevensagents als Fabric-copilots gebruikmaken van generatieve AI om gegevens te verwerken en te redeneren, bestaan er belangrijke verschillen in hun functionaliteit en gebruiksvoorbeelden:

Configuratieflexubiliteit: U kunt Fabric-gegevensagents sterk configureren. U kunt aangepaste instructies en voorbeelden opgeven om hun gedrag aan te passen aan specifieke scenario's. Fabric-copilots zijn daarentegen vooraf geconfigureerd en bieden dit aanpassingsniveau niet aan.

Scope en Use Case: Fabric-copilots helpen bij taken binnen Microsoft Fabric, zoals het genereren van notebookcode of magazijnquery’s. Fabric-gegevensagents zijn daarentegen zelfstandige artefacten. Om Fabric-gegevensagents veelzijdiger te maken voor bredere gebruiksvoorbeelden, kunnen ze worden geïntegreerd met externe systemen zoals Microsoft Copilot Studio, Microsoft Foundry, Microsoft Teams of andere hulpprogramma's buiten Fabric.

Evaluatie van de Fabric-gegevensagent

Het productteam heeft de kwaliteit en veiligheid van de reacties van de Fabric-gegevensagent grondig geëvalueerd:

Benchmark Testing: Het productteam testte Fabric-gegevensagenten in een reeks openbare en privé gegevenssets om hoogwaardige en nauwkeurige antwoorden te garanderen.

Verbeterde risicobeperking: het productteam heeft beveiligingsmaatregelen geïmplementeerd om ervoor te zorgen dat de uitvoer van de Fabric-gegevensagent gericht blijft op de context van geselecteerde gegevensbronnen, waardoor het risico op irrelevante of misleidende antwoorden wordt verminderd.

Beperkingen

De Fabric-gegevensagent is momenteel beschikbaar als openbare preview en heeft beperkingen. Updates verbeteren de Fabric-gegevensagent in de loop van de tijd.

  • De Fabric-gegevensagent genereert alleen SQL-, DAX- en KQL-leesquery's. Er worden geen SQL-, DAX- of KQL-query's gegenereerd waarmee gegevens worden gemaakt, bijgewerkt of verwijderd.
  • De Fabric-gegevensagent biedt geen ondersteuning voor ongestructureerde gegevens, zoals .pdf, .docxof .txt bestanden. U kunt de Fabric-gegevensagent niet gebruiken voor toegang tot ongestructureerde gegevensresources.
  • Voor Lakehouse-gegevensbronnen beantwoordt de Fabric-gegevensagent vragen met behulp van de lakehouse-tabellen die u selecteert. Zelfstandige Lakehouse-bestanden (bijvoorbeeld CSV- of JSON-bestanden) worden niet rechtstreeks gelezen, tenzij ze worden opgenomen of weergegeven als tabellen.
  • De Fabric-gegevensagent biedt momenteel geen ondersteuning voor niet-Engelse talen. Voor optimale prestaties geeft u vragen, instructies en voorbeeldquery's in het Engels.
  • U kunt de LLM die door de Fabric-gegevensagent wordt gebruikt, niet wijzigen.
  • Gespreksgeschiedenis in de Fabric-gegevensagent blijft mogelijk niet altijd bestaan. In bepaalde gevallen, zoals wijzigingen in de back-endinfrastructuur, service-updates of modelupgrades, kan de geschiedenis van het vorige gesprek opnieuw worden ingesteld of verloren gaan.
  • De Fabric-gegevensagent kan geen query's uitvoeren wanneer de werkruimtecapaciteit van de gegevensbron zich in een andere regio bevindt dan de werkruimtecapaciteit van de gegevensagent. Een lakehouse met capaciteit in Noord-Europa faalt bijvoorbeeld als de capaciteit van de data-agent zich in Frankrijk Centraal bevindt.
  • Gebruikers kunnen maximaal 100 voorbeeldquery's per gegevensbron opgeven in hun gegevensagent.
  • Fabric Data Agents zijn momenteel ontworpen voor conversationele inzichten in plaats van voor het retourneren van volledige gegevenssets. Om beknopte en efficiënte antwoorden te garanderen, worden de geretourneerde gegevens automatisch beperkt en/of samengevat. Op dit moment worden antwoorden beperkt tot maximaal 25 rijen en 25 kolommen. Houd er rekening mee dat eerdere chatgeschiedenis invloed kan hebben op volgende antwoorden. Als u bijvoorbeeld vraagt om alle rijen voor dit jaar weer te geven, retourneert de agent nog steeds maximaal 25 rijen. Vervolgvragen kunnen vervolgens worden beantwoord op basis van deze al beperkte context, wat van invloed kan zijn op het resultaat. In dergelijke gevallen wordt het starten van een nieuwe chatsessie aanbevolen.