Delen via


Spraak-naar-tekst in Azure Batch

Audio nauwkeurig transcriberen naar tekst in meer dan 100 talen en varianten. Als onderdeel van de Azure AI Speech-service kunt u met Batch Transcriptie een grote hoeveelheid audio in opslag transcriberen. U kunt met een SAS-URI (Shared Access Signature) naar audiobestanden verwijzen en de transcriptieresultaten asynchroon ontvangen.

Deze connector is beschikbaar in de volgende producten en regio's:

Dienst Class Regions
Copilot Studio Standaard Alle Power Automate-regio's , met uitzondering van het volgende:
     - China Cloud beheerd door 21Vianet
Logic-apps Standaard Alle Logic Apps-regio's , met uitzondering van het volgende:
     - Azure China-regio's
Power Apps Standaard Alle Power Apps-regio's , met uitzondering van het volgende:
     - China Cloud beheerd door 21Vianet
Power Automate Standaard Alle Power Automate-regio's , met uitzondering van het volgende:
     - China Cloud beheerd door 21Vianet
Contactpersoon
Naam Speech Service Power Platform-team
URL https://docs.microsoft.com/azure/cognitive-services/speech-service/support
E-mailen speechpowerplatform@microsoft.com
Connectormetagegevens
Uitgever Microsoft
Webpagina https://docs.microsoft.com/azure/cognitive-services/speech-service/
Privacybeleid https://privacy.microsoft.com
Categorieën AI; Website

De Speech Services batchtranscriptie-API is een cloudservice die asynchrone verwerking van batchspraakherkenning biedt via opgegeven audio-inhoud. Deze connector maakt deze functies beschikbaar als bewerkingen in Microsoft Power Automate en Power Apps.

Pre-requisites

U hebt het volgende nodig om door te gaan:

Een verbinding maken

De connector ondersteunt de volgende verificatietypen:

Api-sleutel API-sleutel Alle regio's Deelbaar
Geïntegreerde Microsoft Entra ID Gebruik Microsoft Entra ID voor toegang tot uw spraakservice. Alle regio's behalve Azure Government en Department of Defense (DoD) in Azure Government en de Amerikaanse overheid (GCC-High) Niet deelbaar
Geïntegreerde Microsoft Entra-id (Azure Government) Gebruik Microsoft Entra ID voor toegang tot uw spraakservice. Alleen Azure Government en Department of Defense (DoD) in Azure Government en us Government (GCC-High) Niet deelbaar
Standaard [AFGESCHAFT] Deze optie is alleen bedoeld voor oudere verbindingen zonder expliciet verificatietype en is alleen beschikbaar voor compatibiliteit met eerdere versies. Alle regio's Niet deelbaar

Api-sleutel

Verificatie-id: keyBasedAuth

Van toepassing: Alle regio's

API-sleutel

Dit is deelbare verbinding. Als de power-app wordt gedeeld met een andere gebruiker, wordt de verbinding ook gedeeld. Zie het overzicht van connectors voor canvas-apps - Power Apps | Microsoft Docs

Naam Typologie Description Verplicht
Accountsleutel beveiligde string Spraakservicesleutel Klopt
Regio touw Speech-serviceregio (voorbeeld: eastus) Klopt

Microsoft Entra id geïntegreerd

Verificatie-id: tokenBasedAuth

Van toepassing: Alle regio's behalve Azure Government en Department of Defense (DoD) in Azure Government en us Government (GCC-High)

Gebruik Microsoft Entra ID voor toegang tot uw spraakservice.

Dit is geen deelbare verbinding. Als de power-app wordt gedeeld met een andere gebruiker, wordt een andere gebruiker gevraagd om expliciet een nieuwe verbinding te maken.

Naam Typologie Description Verplicht
Aangepast subdomein touw Eindpunt-URL van aangepast subdomein (voorbeeld: contoso) Klopt

Geïntegreerde Microsoft Entra-id (Azure Government)

Verificatie-id: tokenBasedAuth

Van toepassing: Alleen Azure Government en Department of Defense (DoD) in Azure Government en us Government (GCC-High)

Gebruik Microsoft Entra ID voor toegang tot uw spraakservice.

Dit is geen deelbare verbinding. Als de power-app wordt gedeeld met een andere gebruiker, wordt een andere gebruiker gevraagd om expliciet een nieuwe verbinding te maken.

Naam Typologie Description Verplicht
Aangepast subdomein touw Eindpunt-URL van aangepast subdomein (voorbeeld: contoso) Klopt

Standaard [AFGESCHAFT]

Van toepassing: Alle regio's

Deze optie is alleen bedoeld voor oudere verbindingen zonder expliciet verificatietype en is alleen beschikbaar voor compatibiliteit met eerdere versies.

Dit is geen deelbare verbinding. Als de power-app wordt gedeeld met een andere gebruiker, wordt een andere gebruiker gevraagd om expliciet een nieuwe verbinding te maken.

Naam Typologie Description Verplicht
Accountsleutel beveiligde string Azure Cognitive Services voor Batch Speech-to-Text-accountsleutel Klopt
Regio touw Speech-serviceregio (voorbeeld: eastus) Klopt

Beperkingslimieten

Name Aanroepen Verlengingsperiode
API-aanroepen per verbinding 100 60 seconden

Acties

Ondersteunde landinstellingen ophalen (V3.1)

Hiermee haalt u een lijst op met ondersteunde landinstellingen voor offlinetranscripties.

Transcriptie bijwerken (V3.1)

Hiermee worden de veranderlijke details bijgewerkt van de transcriptie die is geïdentificeerd door de id.

Transcriptie maken (V3.1)

Hiermee maakt u een nieuwe transcriptie.

Transcriptie verwijderen (V3.1)

Hiermee verwijdert u de opgegeven transcriptietaak.

Transcriptiebestand ophalen (V3.1)

Hiermee haalt u één specifiek bestand (geïdentificeerd met fileId) op uit een transcriptie (geïdentificeerd met id).

Transcripties ophalen (V3.1)

Hiermee haalt u de transcriptie op die is geïdentificeerd door de opgegeven id.

Transcriptieslijst ophalen (V3.1)

Hiermee haalt u een lijst met transcripties op voor het geverifieerde abonnement.

Transcriptieslijstbestanden ophalen (V3.1)

Haalt de bestanden op van de transcriptie die is geïdentificeerd door de opgegeven id.

Ondersteunde landinstellingen ophalen (V3.1)

Hiermee haalt u een lijst op met ondersteunde landinstellingen voor offlinetranscripties.

Retouren

Name Pad Type Description
array of string

Transcriptie bijwerken (V3.1)

Hiermee worden de veranderlijke details bijgewerkt van de transcriptie die is geïdentificeerd door de id.

Parameters

Name Sleutel Vereist Type Description
Identiteitsbewijs
id True uuid

De id van de transcriptie.

zelf
self True uri

De locatie van de entiteit waarnaar wordt verwezen.

displayName
displayName string

De naam van het object.

beschrijving
description string

De beschrijving van het object.

customProperties
customProperties object

De aangepaste eigenschappen van deze entiteit. De maximaal toegestane sleutellengte is 64 tekens, de maximaal toegestane waardelengte is 256 tekens en het aantal toegestane vermeldingen is 10.

Retouren

Transcriptie maken (V3.1)

Hiermee maakt u een nieuwe transcriptie.

Parameters

Name Sleutel Vereist Type Description
contentUrls
contentUrls array of uri

U kunt een lijst met inhouds-URL's opgeven om audiobestanden te transcriberen. Maximaal 1000 URL's zijn toegestaan. Deze eigenschap wordt niet geretourneerd in een antwoord.

contentContainerUrl
contentContainerUrl uri

U kunt ook een URL opgeven voor een Azure Blob-container die de audiobestanden bevat. Een container mag maximaal 5 GB en maximaal 10000 blobs hebben. De maximale grootte voor een blob is 2,5 GB. Container-SAS moet machtigingen 'r' (lezen) en 'l' (lijst) bevatten. Deze eigenschap wordt niet geretourneerd in een antwoord.

locatie
locale True string

De landinstelling van de ingesloten gegevens. Als taalidentificatie wordt gebruikt, wordt deze landinstelling gebruikt om spraak te transcriberen waarvoor geen taal kan worden gedetecteerd.

displayName
displayName True string

De weergavenaam van het object.

model
self uri

De locatie van de entiteit waarnaar wordt verwezen.

diarizationEnabled
diarizationEnabled boolean

Een waarde die aangeeft of diarisatie (sprekeridentificatie) wordt aangevraagd. De standaardwaarde. false Als alleen dit veld is ingesteld op true en het verbeterde diarisatiesysteem niet wordt ingeschakeld door op te gevenDiarizationProperties, maakt een eenvoudig diarisatiesysteem onderscheid tussen maximaal twee luidsprekers. In dit geval worden noextra-kosten toegepast. Het verbeterde diarisatiesysteem biedt diarisatie voor een configureerbaar bereik van luidsprekers. Deze kan worden geconfigureerd in het DiarizationProperties veld. AFGESCHAFT: Het standaard diarisatiesysteem is afgeschaft en wordt samen met dediarizationEnabled instelling in de volgende primaire versie van de API verwijderd.

wordLevelTimestampsEnabled
wordLevelTimestampsEnabled boolean

Een waarde die aangeeft of tijdstempels op woordniveau worden aangevraagd. De standaardwaarde isfalse.

displayFormWordLevelTimestampsEnabled
displayFormWordLevelTimestampsEnabled boolean

Een waarde die aangeeft of tijdstempels op woordniveau voor het weergaveformulier worden aangevraagd. De standaardwaarde is false.

Kanalen
channels array of integer

Een verzameling van de aangevraagde kanaalnummers. In het standaardscenario worden de kanalen 0 en 1 overwogen.

destinationContainerUrl
destinationContainerUrl uri

De aangevraagde doelcontainer.### Opmerkingen ###When een doelcontainer wordt gebruikt in combinatie met een timeToLive, worden de metagegevens van atranscriptie normaal verwijderd, maar de gegevens die zijn opgeslagen in de doelcontainer, inclusief resultaten van transcriptie, blijven ongewijzigd, omdat er geen verwijdermachtigingen vereist zijn voor dezecontainer.
Ter ondersteuning van automatisch opschonen configureert u de levensduur van de blob in de container of gebruikt u 'Bring Your Own Storage (BYOS)' in plaats van destinationContainerUrl, waar blobs kunnen worden opgeschoond.

interpunctiemodus
punctuationMode string

De modus die wordt gebruikt voor interpunctie.

profanityFilterMode
profanityFilterMode string

Modus van grof filteren.

timeToLive
timeToLive string

Hoe lang de transcriptie in het systeem wordt bewaard nadat deze is voltooid. Zodra de time to live is bereikt na voltooiing (geslaagd of mislukt), wordt deze automatisch verwijderd. Als u deze waarde niet instelt of op 0 instelt, wordt automatisch verwijderen uitgeschakeld. De langste ondersteunde duur is 31 dagen. De duur wordt gecodeerd als ISO 8601-duur ('PnYnMnDTnHnMnS', zie https://en.wikipedia.org/wiki/ISO_8601#Durations).

minCount
minCount integer

Een hint voor het minimale aantal sprekers voor diarisatie. Moet kleiner zijn dan of gelijk zijn aan de eigenschap maxSpeakers.

maxCount
maxCount integer

Het maximum aantal sprekers voor diarisatie. Moet kleiner zijn dan 36 en groter dan of gelijk aan de minSpeakers-eigenschap.

candidateLocales
candidateLocales True array of string

De landinstellingen van de kandidaat voor taalidentificatie (bijvoorbeeld ["en-US", "de-DE", "es-ES"]). Minimaal 2 en maximaal 10 kandidaatlandinstellingen, inclusief de belangrijkste landinstelling voor de transcriptie, worden ondersteund.

speechModelMapping
speechModelMapping object

Een optionele toewijzing van landinstellingen aan spraakmodelentiteiten. Als er geen model wordt gegeven voor een landinstelling, wordt het standaardbasismodel gebruikt. Sleutels moeten landinstellingen zijn die zijn opgenomen in de kandidaat-landinstellingen. Waarden zijn entiteiten voor modellen van de respectieve landinstellingen.

e-mailadres
email string

Het e-mailadres waarnaar e-mailmeldingen moeten worden verzonden voor het geval de bewerking is voltooid. De waarde wordt verwijderd nadat het e-mailbericht is verzonden.

Retouren

Transcriptie verwijderen (V3.1)

Hiermee verwijdert u de opgegeven transcriptietaak.

Parameters

Name Sleutel Vereist Type Description
Identiteitsbewijs
id True uuid

De id van de transcriptie.

Transcriptiebestand ophalen (V3.1)

Hiermee haalt u één specifiek bestand (geïdentificeerd met fileId) op uit een transcriptie (geïdentificeerd met id).

Parameters

Name Sleutel Vereist Type Description
Identiteitsbewijs
id True uuid

De id van de transcriptie.

Bestands-id
fileId True uuid

De id van het bestand.

Sas-geldigheid in seconden
sasValidityInSeconds integer

De duur in seconden dat een SAS-URL geldig moet zijn. De standaardduur is 12 uur. Wanneer u BYOS (https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-encryption-of-data-at-rest#bring-your-own-storage-byos-for-customization-and-logging): Een waarde van 0 betekent dat een gewone blob-URI zonder SAS-token wordt gegenereerd.

Retouren

Body
File

Transcripties ophalen (V3.1)

Hiermee haalt u de transcriptie op die is geïdentificeerd door de opgegeven id.

Parameters

Name Sleutel Vereist Type Description
Identiteitsbewijs
id True uuid

De id van de transcriptie.

Retouren

Transcriptieslijst ophalen (V3.1)

Hiermee haalt u een lijst met transcripties op voor het geverifieerde abonnement.

Parameters

Name Sleutel Vereist Type Description
Overslaan
skip integer

Aantal gegevenssets dat wordt overgeslagen.

Boven
top integer

Het aantal gegevenssets dat wordt opgenomen na het overslaan.

Filter
filter string

Een filterexpressie voor het selecteren van een subset van de beschikbare transcripties.

  • Ondersteunde eigenschappen: displayName, description, createdDateTime, lastActionDateTime, status, landinstelling.
  • Exploitanten:
    - eq, ne worden ondersteund voor alle eigenschappen.
    - gt, ge, lt, le worden ondersteund voor createdDateTime en lastActionDateTime.
    - en, of, worden niet ondersteund.
  • Voorbeeld:filter=createdDateTime gt 2022-02-01T11:00:00Z

Retouren

Transcriptieslijstbestanden ophalen (V3.1)

Haalt de bestanden op van de transcriptie die is geïdentificeerd door de opgegeven id.

Parameters

Name Sleutel Vereist Type Description
Identiteitsbewijs
id True uuid

De id van de transcriptie.

Sas-geldigheid in seconden
sasValidityInSeconds integer

De duur in seconden dat een SAS-URL geldig moet zijn. De standaardduur is 12 uur. Wanneer u BYOS (https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-encryption-of-data-at-rest#bring-your-own-storage-byos-for-customization-and-logging): Een waarde van 0 betekent dat een gewone blob-URI zonder SAS-token wordt gegenereerd.

Overslaan
skip integer

Aantal gegevenssets dat wordt overgeslagen.

Boven
top integer

Het aantal gegevenssets dat wordt opgenomen na het overslaan.

Filter
filter string

Een filterexpressie voor het selecteren van een subset van de beschikbare bestanden.

  • Ondersteunde eigenschappen: naam, createdDateTime, soort.
  • Exploitanten:
    - eq, ne worden ondersteund voor alle eigenschappen.
    - gt, ge, lt, le worden ondersteund voor createdDateTime.
    - en, of, worden niet ondersteund.
  • Voorbeeld:filter=name eq 'myaudio.wav.json' and kind eq 'Transcription'

Retouren

Definities

DiarizationProperties

Name Pad Type Description
luidsprekers
speakers DiarizationSpeakersProperties

DiarizationSpeakersProperties

Name Pad Type Description
minCount
minCount integer

Een hint voor het minimale aantal sprekers voor diarisatie. Moet kleiner zijn dan of gelijk zijn aan de eigenschap maxSpeakers.

maxCount
maxCount integer

Het maximum aantal sprekers voor diarisatie. Moet kleiner zijn dan 36 en groter dan of gelijk aan de minSpeakers-eigenschap.

Bestand

Name Pad Type Description
vriendelijk
kind FileKind

Type gegevens.

koppelingen
links FileLinks
aanmaakDatumTijd
createdDateTime date-time

De aanmaaktijd van dit bestand. De tijdstempel wordt gecodeerd als ISO 8601-datum- en tijdnotatie (zie https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations).

properties
properties FileProperties
naam
name string

De naam van dit bestand.

FileKind

Type gegevens.

Type gegevens.

Name Pad Type Description
contentUrl
contentUrl uri

De URL voor het ophalen van de inhoud van dit bestand.

FileProperties

Name Pad Type Description
size
size integer

De grootte van de gegevens in bytes.

duration
duration string

De duur voor het geval dit bestand een audiobestand is. De duur wordt gecodeerd als ISO 8601duration ("PnYnMnDTnHnMnS", zie https://en.wikipedia.org/wiki/ISO_8601#Durations).

LanguageIdentificationProperties

Name Pad Type Description
candidateLocales
candidateLocales array of string

De landinstellingen van de kandidaat voor taalidentificatie (bijvoorbeeld ["en-US", "de-DE", "es-ES"]). Minimaal 2 en maximaal 10 kandidaatlandinstellingen, inclusief de belangrijkste landinstelling voor de transcriptie, worden ondersteund.

speechModelMapping
speechModelMapping object

Een optionele toewijzing van landinstellingen aan spraakmodelentiteiten. Als er geen model wordt gegeven voor een landinstelling, wordt het standaardbasismodel gebruikt. Sleutels moeten landinstellingen zijn die zijn opgenomen in de kandidaat-landinstellingen. Waarden zijn entiteiten voor modellen van de respectieve landinstellingen.

PaginatedFiles

Name Pad Type Description
values
values array of File

Een lijst met entiteiten die worden beperkt door de doorgegeven queryparameters 'skip' en 'top' of de bijbehorende standaardwaarden. Wanneer u een lijst doorloopt met behulp van paginering en het parallel verwijderen van entiteiten, worden sommige entiteiten overgeslagen in de resultaten. Het is raadzaam om een lijst op de client te maken en te verwijderen na het ophalen van de volledige lijst.

@nextLink
@nextLink uri

Een koppeling naar de volgende set gepagineerde resultaten als er meer entiteiten beschikbaar zijn; anders null.

GepagineerdeTranscriptions

Name Pad Type Description
values
values array of Transcription

Een lijst met entiteiten die worden beperkt door de doorgegeven queryparameters 'skip' en 'top' of de bijbehorende standaardwaarden. Wanneer u een lijst doorloopt met behulp van paginering en het parallel verwijderen van entiteiten, worden sommige entiteiten overgeslagen in de resultaten. Het is raadzaam om een lijst op de client te maken en te verwijderen na het ophalen van de volledige lijst.

@nextLink
@nextLink uri

Een koppeling naar de volgende set gepagineerde resultaten als er meer entiteiten beschikbaar zijn; anders null.

ProfanityFilterMode

Modus van grof filteren.

Modus van grof filteren.

Interpunctiemodus

De modus die wordt gebruikt voor interpunctie.

De modus die wordt gebruikt voor interpunctie.

Transcriptie

Name Pad Type Description
contentUrls
contentUrls array of uri

U kunt een lijst met inhouds-URL's opgeven om audiobestanden te transcriberen. Maximaal 1000 URL's zijn toegestaan. Deze eigenschap wordt niet geretourneerd in een antwoord.

contentContainerUrl
contentContainerUrl uri

U kunt ook een URL opgeven voor een Azure Blob-container die de audiobestanden bevat. Een container mag maximaal 5 GB en maximaal 10000 blobs hebben. De maximale grootte voor een blob is 2,5 GB. Container-SAS moet machtigingen 'r' (lezen) en 'l' (lijst) bevatten. Deze eigenschap wordt niet geretourneerd in een antwoord.

locatie
locale string

De landinstelling van de ingesloten gegevens. Als taalidentificatie wordt gebruikt, wordt deze landinstelling gebruikt om spraak te transcriberen waarvoor geen taal kan worden gedetecteerd.

displayName
displayName string

De weergavenaam van het object.

model
model.self uri

De locatie van de entiteit waarnaar wordt verwezen.

properties
properties TranscriptionProperties

TranscriptieProperties

Name Pad Type Description
diarizationEnabled
diarizationEnabled boolean

Een waarde die aangeeft of diarisatie (sprekeridentificatie) wordt aangevraagd. De standaardwaarde. false Als alleen dit veld is ingesteld op true en het verbeterde diarisatiesysteem niet wordt ingeschakeld door op te gevenDiarizationProperties, maakt een eenvoudig diarisatiesysteem onderscheid tussen maximaal twee luidsprekers. In dit geval worden noextra-kosten toegepast. Het verbeterde diarisatiesysteem biedt diarisatie voor een configureerbaar bereik van luidsprekers. Deze kan worden geconfigureerd in het DiarizationProperties veld. AFGESCHAFT: Het standaard diarisatiesysteem is afgeschaft en wordt samen met dediarizationEnabled instelling in de volgende primaire versie van de API verwijderd.

wordLevelTimestampsEnabled
wordLevelTimestampsEnabled boolean

Een waarde die aangeeft of tijdstempels op woordniveau worden aangevraagd. De standaardwaarde isfalse.

displayFormWordLevelTimestampsEnabled
displayFormWordLevelTimestampsEnabled boolean

Een waarde die aangeeft of tijdstempels op woordniveau voor het weergaveformulier worden aangevraagd. De standaardwaarde is false.

Kanalen
channels array of integer

Een verzameling van de aangevraagde kanaalnummers. In het standaardscenario worden de kanalen 0 en 1 overwogen.

destinationContainerUrl
destinationContainerUrl uri

De aangevraagde doelcontainer.### Opmerkingen ###When een doelcontainer wordt gebruikt in combinatie met een timeToLive, worden de metagegevens van atranscriptie normaal verwijderd, maar de gegevens die zijn opgeslagen in de doelcontainer, inclusief resultaten van transcriptie, blijven ongewijzigd, omdat er geen verwijdermachtigingen vereist zijn voor dezecontainer.
Ter ondersteuning van automatisch opschonen configureert u de levensduur van de blob in de container of gebruikt u 'Bring Your Own Storage (BYOS)' in plaats van destinationContainerUrl, waar blobs kunnen worden opgeschoond.

interpunctiemodus
punctuationMode PunctuationMode

De modus die wordt gebruikt voor interpunctie.

profanityFilterMode
profanityFilterMode ProfanityFilterMode

Modus van grof filteren.

timeToLive
timeToLive string

Hoe lang de transcriptie in het systeem wordt bewaard nadat deze is voltooid. Zodra de time to live is bereikt na voltooiing (geslaagd of mislukt), wordt deze automatisch verwijderd. Als u deze waarde niet instelt of op 0 instelt, wordt automatisch verwijderen uitgeschakeld. De langste ondersteunde duur is 31 dagen. De duur wordt gecodeerd als ISO 8601-duur ('PnYnMnDTnHnMnS', zie https://en.wikipedia.org/wiki/ISO_8601#Durations).

diarisatie
diarization DiarizationProperties
Taalidentificatie -
languageIdentification LanguageIdentificationProperties
e-mailadres
email string

Het e-mailadres waarnaar e-mailmeldingen moeten worden verzonden voor het geval de bewerking is voltooid. De waarde wordt verwijderd nadat het e-mailbericht is verzonden.