Del via


Konsepter for stoffdataagent (forhåndsversjon)

Data agent i Microsoft Fabric er en ny Microsoft Fabric-funksjon som gjør det mulig å lage din egen samtalebaserte Q& Et system ved å bruke generativ AI. En fabric-dataagent gjør datainnsikter mer tilgjengelige og gjennomførbare for alle i organisasjonen. Ved å bruke en Fabric-dataagent kan teamet ditt ha samtaler, med enkle spørsmål på engelsk, om dataene organisasjonen din lagret i Fabric OneLake og deretter motta relevante svar. På denne måten kan selv personer uten teknisk ekspertise innen kunstig intelligens eller en dyp forståelse av datastrukturen, få presise og kontekstrike svar.

Du kan også legge til organisasjonsspesifikke instruksjoner, eksempler og veiledning for å finjustere Fabric-dataagenten. Denne tilnærmingen sikrer at svarene samsvarer med organisasjonens behov og mål, slik at alle kan engasjere seg mer effektivt med data. Fabric Data Agent fremmer en kultur for datadrevet beslutningstaking fordi det senker barrierer for innsiktstilgjengelighet, legger til rette for samarbeid og hjelper organisasjonen din med å hente mer verdi ut av dataene sine.

Important

Denne funksjonen er i forhåndsvisning.

Prerequisites

Slik fungerer fabric-dataagenten

Fabric-dataagenten bruker store språkmodeller (LLM-er) for å hjelpe brukere med å samhandle naturlig med dataene sine. Fabric-dataagenten bruker Azure OpenAI Assistant-API-er og oppfører seg som en agent. Den behandler brukerspørsmål, bestemmer den mest relevante datakilden (Lakehouse, Warehouse, Power BI-datasett, KQL-databaser, ontologi), og aktiverer det riktige verktøyet for å generere, validere og utføre spørringer. Brukerne kan deretter stille spørsmål på enkelt språk og motta strukturerte, menneskelesbare svar. Denne tilnærmingen eliminerer behovet for å skrive komplekse spørringer og sikrer nøyaktig og sikker tilgang til data.

Slik fungerer det i detalj:

Spørsmålsanalyse og validering: Fabric-dataagenten bruker Azure OpenAI Assistant API-er som underliggende agent for å behandle brukerspørsmål. Denne fremgangsmåten sikrer at spørsmålet overholder sikkerhetsprotokoller, ansvarlige AI-policyer (RAI) og brukertillatelser. Fabric-dataagenten håndhever skrivebeskyttet tilgang, og opprettholder skrivebeskyttede datatilkoblinger til alle datakilder.

Datakildeidentifikasjon: Fabric-dataagenten bruker brukerens legitimasjon for å få tilgang til skjemaet til datakilden. Denne tilnærmingen sikrer at systemet henter datastrukturinformasjon som brukeren har tillatelse til å se. Agenten vurderer deretter brukerens spørsmål mot alle tilgjengelige datakilder, inkludert relasjonsdatabaser (Lakehouse og Warehouse), Power BI-datasett (Semantic Models), KQL-databaser og ontologier. Det kan også referere til brukerangitte dataagentinstruksjoner for å finne den mest relevante datakilden.

Verktøykalling og generering av spørringer: Når riktig datakilde eller kilder er identifisert, omformulerer Fabric-dataagenten spørsmålet for klarhet og struktur, og påkaller deretter det tilsvarende verktøyet for å generere en strukturert spørring:

  • Naturlig språk til SQL (NL2SQL) for relasjonsdatabaser (Lakehouse/Warehouse).
  • Naturlig språk til DAX (NL2DAX) for Power BI-datasett (semantiske modeller).
  • Naturlig språk til KQL (NL2KQL) for KQL-databaser.

Det valgte verktøyet genererer en spørring basert på det angitte skjemaet, metadataene og konteksten som agenten underliggende Fabric-dataagenten deretter sender.

Spørringsvalidering: Verktøyet utfører validering for å sikre at spørringen er korrekt utformet og følger sine egne sikkerhetsprotokoller og RAI-policyer.

Spørringsutførelse og svar: Når den er validert, utfører Fabric-dataagenten spørringen mot den valgte datakilden. Resultatene er formatert i et menneskelig lesbart svar, som kan omfatte strukturerte data, for eksempel tabeller, sammendrag eller viktig innsikt.

Ved å bruke denne tilnærmingen kan brukere samhandle med dataene sine ved hjelp av naturlig språk. Fabric-dataagenten håndterer kompleksiteten ved generering, validering og kjøring av spørringer. Brukere trenger ikke å skrive SQL, DAX eller KQL selv.

Konfigurasjon av stoffdataagent

Å konfigurere en Fabric-dataagent ligner på å bygge en Power BI-rapport—du starter med å designe og forbedre den for å sikre at den møter dine behov, deretter publiserer og deler du den med kolleger slik at de kan samhandle med dataene. Konfigurasjon av en fabric-dataagent innebærer:

Valg av datakilder: En Fabric-dataagent støtter opptil fem datakilder i enhver kombinasjon, inkludert innsjøhus, lagerbygninger, KQL-databaser, Power BI semantiske modeller og ontologier. For eksempel kan en konfigurert Fabric-dataagent inkludere fem Power BI-semantiske modeller. Den kan inkludere en blanding av to Power BI-semantiske modeller, ett lakehouse og én KQL-database. Du har mange tilgjengelige alternativer.

Velge relevante tabeller: Etter at du har valgt datakildene, legg dem til én om gangen, og definer de spesifikke tabellene fra hver kilde som Fabric-dataagenten bruker. Dette trinnet sikrer at Fabric-dataagenten henter nøyaktige resultater ved å fokusere bare på relevante data. For lakehouses innebærer dette steget å velge lakehouse-tabeller (ikke individuelle lakehouse-filer). Hvis dataene dine starter som filer (for eksempel CSV eller JSON), gjør dem tilgjengelige for agenten ved å legge dem inn i tabeller eller på annen måte eksponere dem gjennom tabeller.

Legge til kontekst: For å forbedre nøyaktigheten til Fabric-dataagenten, gi mer kontekst gjennom instruksjoner og eksempelforespørsler. Som den underliggende agenten for Fabric-dataagenten hjelper konteksten Azure OpenAI Assistant API-et med å ta mer informerte beslutninger om hvordan brukerspørsmål skal behandles, og avgjøre hvilken datakilde som er best egnet til å svare på dem.

  • Instruksjoner for dataagent: Legg til instruksjoner for å veilede agenten som ligger til grunn for Fabric-dataagenten, i å finne den beste datakilden for å besvare spesifikke typer spørsmål. Du kan også angi egendefinerte regler eller definisjoner som klargjør organisasjonsterminologi eller spesifikke krav. Disse instruksjonene kan gi mer kontekst eller preferanser som påvirker hvordan agenten velger og spør datakilder. For eksempel, å rette spørsmål om finansielle målinger til en Power BI semantisk modell, tildele spørringer som involverer rå datautforskning til lakehouse, og rute spørsmål som krever loganalyse til KQL-databasen.

  • Eksempelforespørsler: Legg til eksempler på spørsmål-spørringspar for å illustrere hvordan Fabric-dataagenten bør svare på vanlige forespørsler. Disse eksemplene fungerer som en veiledning for agenten, som hjelper den med å forstå hvordan man tolker lignende spørsmål og genererer nøyaktige svar.

Note

Å legge til eksempler på spørrings-/spørsmålspar støttes for øyeblikket ikke for Power BI semantiske modelldatakilder.

Ved å kombinere klare ai-instruksjoner og relevante eksempelspørringer kan du bedre justere Fabric-dataagenten med organisasjonens databehov, noe som sikrer mer nøyaktige og kontekstavhengige svar.

Forskjellen mellom en fabric-dataagent og en copilot

Selv om både Fabric-dataagenter og Fabric-copiloter bruker generativ AI for å behandle og resonnere over data, finnes det viktige forskjeller i funksjonalitet og bruksområder:

Konfigurasjonsfleksibilitet: Du kan konfigurere Fabric-dataagenter på en høy måte. Du kan gi egendefinerte instruksjoner og eksempler for å skreddersy virkemåten deres til bestemte scenarier. Fabric copilots, derimot, er forhåndskonfigurert og tilbyr ikke dette nivået av tilpasning.

Scope and Use Case: Fabric-copiloter hjelper til med oppgaver innenfor Microsoft Fabric, som å generere notatbokkode eller lagerforespørsler. Stoffdataagenter er derimot frittstående artefakter. For å gjøre Fabric-dataagenter mer allsidige for bredere bruksområder, kan de integreres med eksterne systemer som Microsoft Copilot Studio, Microsoft Foundry, Microsoft Teams eller andre verktøy utenfor Fabric.

Evaluering av fabric-dataagenten

Produktteamet evaluerte grundig kvaliteten og sikkerheten til svar fra Fabric-dataagenter:

Benchmark-testing: Produktteamet testet Fabric-dataagenter på tvers av en rekke offentlige og private datasett for å sikre høy kvalitet og nøyaktige svar.

Forbedrede skadebegrensninger: Produktteamet implementerte sikkerhetstiltak for å sikre at Fabric-dataagentens resultater forblir fokusert på konteksten til utvalgte datakilder, noe som reduserer risikoen for irrelevante eller misvisende svar.

Limitations

Fabric-dataagenten er for øyeblikket i offentlig forhåndsvisning og har begrensninger. Oppdateringer vil forbedre fabric-dataagenten over tid.

  • Fabric-dataagenten genererer kun SQL-, DAX- og KQL-«lese»-spørringer. Den genererer ikke SQL-, DAX- eller KQL-spørringer som oppretter, oppdaterer eller sletter data.
  • Fabric-dataagenten støtter ikke ustrukturerte data, som .pdf, .docxeller .txt filer. Du kan ikke bruke dataagenten Fabric til å få tilgang til ustrukturerte dataressurser.
  • For lakehouse-datakilder svarer Fabric-dataagenten på spørsmål ved hjelp av lakehouse-tabellene du velger. Den leser ikke direkte frittstående Lakehouse-filer (for eksempel CSV- eller JSON-filer) med mindre de er importert eller eksponert som tabeller.
  • Fabric-dataagenten støtter for øyeblikket ikke ikke-engelske språk. For optimal ytelse, gi spørsmål, instruksjoner og eksempelforespørsler på engelsk.
  • Du kan ikke endre LLM som Fabric-dataagenten bruker.
  • Samtalehistorikken i Fabric-dataagenten vedvarer kanskje ikke alltid. I visse tilfeller, som endringer i backend-infrastruktur, tjenesteoppdateringer eller modelloppgraderinger, kan tidligere samtalehistorikk bli tilbakestilt eller mistet.
  • Fabric-dataagenten kan ikke utføre spørringer når datakildens arbeidsområdekapasitet er i en annen region enn dataagentens arbeidsområdekapasitet. For eksempel feiler et innsjøhus med kapasitet i Nord-Europa hvis dataagentens kapasitet er i France Central.
  • Brukere kan gi opptil 100 eksempelspørringer per datakilde i sin Data Agent.
  • Fabric Data Agents er for øyeblikket designet for samtalebaserte innsikter snarere enn for å returnere komplette datasett. For å sikre konsise og effektive svar, begrenser og/eller oppsummerer chat-utdataene automatisk dataene som returneres. For øyeblikket er svarene begrenset til maksimalt 25 rader og 25 kolonner. Vennligst merk at tidligere chathistorikk kan påvirke påfølgende svar. For eksempel, hvis du ber om å «vise alle rader for i år», vil agenten likevel returnere maksimalt 25 rader. Oppfølgingsspørsmål kan deretter besvares basert på denne allerede begrensede konteksten, noe som kan påvirke resultatet. I slike tilfeller anbefales det å starte en ny chat-økt.