Del via


Kjør tester og se resultater

[Denne artikkelen inneholder dokumentasjon for forhåndsversjonen og kan bli endret.]

Kjør evalueringer og analyser resultatene for å optimalisere agentens atferd og validere at agenten oppfyller dine forretnings- og kvalitetskrav. Du kan også kjøre et testsett flere ganger for å se endringer over tid etter hvert som du forbedrer agenten din.

Testresultater er tilgjengelige i Copilot Studio i 89 dager. For å lagre testresultatene dine over lengre tid, eksporter resultatene til en CSV-fil.

Kjør en test med et testsett

Etter at du har laget et testsett, kjør en test ved å bruke det settet. Eller kjør tester på nytt ved å bruke det samme settet for å sammenligne resultater over tid og iterasjoner. En test kan ta opptil noen minutter å gjennomføre. Du kan bare kjøre én test om gangen.

Viktig!

Agentevalueringer som bruker brukergodkjenning, krever tilgang via Microsoft Copilot Studio-koblingen. Hvis administratoren din slår av denne tilkoblingen, kan du ikke kjøre tester ved å bruke evalueringsverktøyet. Hvis du vil ha mer informasjon, kan du se Copilot Studio-koblinger og datagrupper.

  1. Gå til agentens evalueringsside .

Skjermbilde som viser hvordan man velger Evalueringsfanen når fanevalget komprimeres på grunn av skjermstørrelse.

  1. Kjør en test ved å utføre en av følgende handlinger:

    • Når du har laget eller redigert et testsett, velg Evaluer.
    • I delen for nylige resultater kan du kjøre en test på nytt ved å gjøre ett av følgende steg:
      • Hold musepekeren over testresultatet du vil evaluere, velg de tre prikkene (...) og velg deretter Evaluer testsett igjen.
      • Velg testresultatet for å åpne det, velg deretter de tre prikkene (...) i Evalueringsoppsummeringspanelet , og velg deretter Evaluere testsett igjen.

    Hvis brukerprofilen for testsettet har brutte forbindelser, eller testsettet ikke har en brukerprofil, vises dialogen Administrer forbindelser . Du trenger ikke bruke en brukerprofil for testing. Men hvis du bruker en profil, må alle tilkoblingene fungere. For informasjon om hvordan du fikser tilkoblinger, se Administrer brukerprofiler og tilkoblinger.

En evaluering kan ta noen minutter å gjennomføre. Et varsel vises i Copilot Studio når testresultatene er klare til å vises.

Dykk ned i testresultatene

Hver gang du kjører en evaluering med et testsett, Copilot Studio:

  1. Bruker den tilkoblede brukerkontoen til å simulere samtaler med agenten, og sender hvert spørsmål i testsaken til agenten.

  2. Samler inn agentens svar.

  3. Måler og analyserer suksessen til hvert svar. Hvert testtilfelle mottar en Bestått, Ikke bestått, Ugyldig eller Feil basert på kriteriene i testtilfellet.

  4. Tilordner en passsatspoengsum basert på bestått/feilfrekvens for testsettet.

Du kan se beståttprosenten for hvert testsett som kjøres på agentens evalueringsside , under Nylige resultater. Hvis du vil se flere testsettkjøringer, velger du Se alle.

Skjermbilde som viser en liste over tidligere evalueringer.

Se og vurder en detaljert analyse for et testtilfelle

Når du åpner et testresultat, ser du detaljene fra testkjøringen, en liste over spørringene som ble brukt i testen, hvordan agenten svarte, og bestått - eller strykpoengsummen .

Velg et testtilfelle i listen for å se en detaljert vurdering av hvert svar. Velg Alle, Bestått, eller Ikke bestått for å filtrere saker etter resultat.

Skjermbilde som viser en liste over testtilfeller i en fullført evaluering, med filtrene markert.

Vurderingen inkluderer forventede og faktiske svar, begrunnelsen bak testresultatet, samt kunnskapen, temaene og verktøyene agenten brukte for å svare.

Skjermbilde som viser det detaljerte resultatet og evalueringen av en testsak.

  1. Evalueringsresultatene. Dette eksempelet viser resultatene av en kvalitetsevaluering.

  2. Velg Vis aktivitetskart for å se agentens sekvens av input, beslutninger og output i en testsak. Finn ut mer i Vis samtale i en aktivitet.

  3. Transkripsjonen av testspørsmålet og agentens svar.

  4. Ressursene agenten brukte i testen. Velg en for å åpne den.

Du kan gi tilbakemelding til Microsoft om hvor godt evalueringen fungerte for hvert testtilfelle. Denne tilbakemeldingen handler spesifikt om hvor effektivt den valgte evalueringsmetoden vurderte responsen, ikke om selve responsen var korrekt. Tilbakemeldingene dine bidrar til å forbedre kvaliteten og nøyaktigheten i evalueringene over tid.

For å vurdere en evaluering, velg tommel opp-skjermbildet som viser et tommel opp-ikon for å sende inn positiv tilbakemelding på en testcase-evaluering. eller tommel ned skjermbilde som viser et tommel ned-ikon for å sende inn negativ tilbakemelding på en testcase-evaluering. ikonet i panelet for detaljer i testtilfellet. Når tilbakemeldingsskjemaet åpnes, oppgi flere detaljer om vurderingen din, og velg deretter Send inn.

Sammenlign testresultater

Du vil teste én versjon av agenten din og se endringer i ytelsen før og etter at du gjør endringer. Du kan sammenligne to kjøringer av samme testsett ved å bruke verktøyet Sammenligning med .

For å se en sammenligning må du kjøre det samme testsettet minst to ganger.

  1. På agentens evalueringsside , under Nylige testresultater, åpner du testkjøringen du ønsker å bruke som base for sammenligningen.

  2. Velg nedtrekksmenyen Sammenlign med , og velg deretter tid og dato for testkjøringen du vil sammenligne med de nåværende åpne testresultatene.

Skjermbilde som viser rullegardinmenyen Sammenlign med.

I listen over Test cases viser piler hvilke testcase-resultater som forbedret seg ved å endre fra å feile til å bestå , eller hvilke som ble forverret ved å endre fra å bestå til å feile .

Velg et testtilfelle for å se flere detaljer. I panelet for evalueringssammendrag kan du se en direkte sammenligning av testresultater, med resultatet av den nåværende testkjøringen øverst.

Skjermbilde som viser de sammenlignede resultatene fra to testsett.

Eksporttestresultater

Du kan eksportere testresultater til en CSV-fil. Filen lister opp spørsmålet, forventet svar (hvis aktuelt), testmetode, bestått poengsum (hvis aktuelt), agentens svar, testresultat og analyse for hvert testtilfelle.

  1. Gå til agentens evalueringsside .
  2. I delen for nylige resultater eksporterer du et testresultat ved å gjøre ett av følgende steg:
    • Hold musepekeren over testtilfellet du vil eksportere, velg de tre prikkene (...) og velg deretter Eksporter testresultater.
    • Velg testtilfellet for å åpne det, de tre prikkene (...) i Evalueringsoppsummeringspanelet , og velg deretter Eksporter testresultater.

Testresultatene lastes ned som navnet på testsettet ditt.csv.