Spraak-naar-tekst in Azure Batch
Audio nauwkeurig transcriberen naar tekst in meer dan 100 talen en varianten. Als onderdeel van de Azure AI Speech-service kunt u met Batch Transcriptie een grote hoeveelheid audio in opslag transcriberen. U kunt met een SAS-URI (Shared Access Signature) naar audiobestanden verwijzen en de transcriptieresultaten asynchroon ontvangen.
Deze connector is beschikbaar in de volgende producten en regio's:
| Dienst | Class | Regions |
|---|---|---|
| Copilot Studio | Standaard | Alle Power Automate-regio's , met uitzondering van het volgende: - China Cloud beheerd door 21Vianet |
| Logic-apps | Standaard | Alle Logic Apps-regio's , met uitzondering van het volgende: - Azure China-regio's |
| Power Apps | Standaard | Alle Power Apps-regio's , met uitzondering van het volgende: - China Cloud beheerd door 21Vianet |
| Power Automate | Standaard | Alle Power Automate-regio's , met uitzondering van het volgende: - China Cloud beheerd door 21Vianet |
| Contactpersoon | |
|---|---|
| Naam | Speech Service Power Platform-team |
| URL | https://docs.microsoft.com/azure/cognitive-services/speech-service/support |
| E-mailen | speechpowerplatform@microsoft.com |
| Connectormetagegevens | |
|---|---|
| Uitgever | Microsoft |
| Webpagina | https://docs.microsoft.com/azure/cognitive-services/speech-service/ |
| Privacybeleid | https://privacy.microsoft.com |
| Categorieën | AI; Website |
De Speech Services batchtranscriptie-API is een cloudservice die asynchrone verwerking van batchspraakherkenning biedt via opgegeven audio-inhoud. Deze connector maakt deze functies beschikbaar als bewerkingen in Microsoft Power Automate en Power Apps.
Pre-requisites
U hebt het volgende nodig om door te gaan:
- Azure-abonnement: Krijg een gratis abonnement
- Maak een spraakresource in Azure Portal.
- Haal de spraakresourcesleutel en -regio op. Nadat uw Spraak-resource is geïmplementeerd, selecteert u Ga naar de resource om sleutels weer te geven en te beheren. Zie De sleutels voor uw resource ophalen voor meer informatie over Cognitive Services-resources.
- Upload uw eigen gegevens of gebruik bestaande audiobestanden via openbare URI of SAS-URI (Shared Access Signature). Meer informatie hier
Een verbinding maken
De connector ondersteunt de volgende verificatietypen:
| Api-sleutel | API-sleutel | Alle regio's | Deelbaar |
| Geïntegreerde Microsoft Entra ID | Gebruik Microsoft Entra ID voor toegang tot uw spraakservice. | Alle regio's behalve Azure Government en Department of Defense (DoD) in Azure Government en de Amerikaanse overheid (GCC-High) | Niet deelbaar |
| Geïntegreerde Microsoft Entra-id (Azure Government) | Gebruik Microsoft Entra ID voor toegang tot uw spraakservice. | Alleen Azure Government en Department of Defense (DoD) in Azure Government en us Government (GCC-High) | Niet deelbaar |
| Standaard [AFGESCHAFT] | Deze optie is alleen bedoeld voor oudere verbindingen zonder expliciet verificatietype en is alleen beschikbaar voor compatibiliteit met eerdere versies. | Alle regio's | Niet deelbaar |
Api-sleutel
Verificatie-id: keyBasedAuth
Van toepassing: Alle regio's
API-sleutel
Dit is deelbare verbinding. Als de power-app wordt gedeeld met een andere gebruiker, wordt de verbinding ook gedeeld. Zie het overzicht van connectors voor canvas-apps - Power Apps | Microsoft Docs
| Naam | Typologie | Description | Verplicht |
|---|---|---|---|
| Accountsleutel | beveiligde string | Spraakservicesleutel | Klopt |
| Regio | touw | Speech-serviceregio (voorbeeld: eastus) | Klopt |
Microsoft Entra id geïntegreerd
Verificatie-id: tokenBasedAuth
Van toepassing: Alle regio's behalve Azure Government en Department of Defense (DoD) in Azure Government en us Government (GCC-High)
Gebruik Microsoft Entra ID voor toegang tot uw spraakservice.
Dit is geen deelbare verbinding. Als de power-app wordt gedeeld met een andere gebruiker, wordt een andere gebruiker gevraagd om expliciet een nieuwe verbinding te maken.
| Naam | Typologie | Description | Verplicht |
|---|---|---|---|
| Aangepast subdomein | touw | Eindpunt-URL van aangepast subdomein (voorbeeld: contoso) | Klopt |
Geïntegreerde Microsoft Entra-id (Azure Government)
Verificatie-id: tokenBasedAuth
Van toepassing: Alleen Azure Government en Department of Defense (DoD) in Azure Government en us Government (GCC-High)
Gebruik Microsoft Entra ID voor toegang tot uw spraakservice.
Dit is geen deelbare verbinding. Als de power-app wordt gedeeld met een andere gebruiker, wordt een andere gebruiker gevraagd om expliciet een nieuwe verbinding te maken.
| Naam | Typologie | Description | Verplicht |
|---|---|---|---|
| Aangepast subdomein | touw | Eindpunt-URL van aangepast subdomein (voorbeeld: contoso) | Klopt |
Standaard [AFGESCHAFT]
Van toepassing: Alle regio's
Deze optie is alleen bedoeld voor oudere verbindingen zonder expliciet verificatietype en is alleen beschikbaar voor compatibiliteit met eerdere versies.
Dit is geen deelbare verbinding. Als de power-app wordt gedeeld met een andere gebruiker, wordt een andere gebruiker gevraagd om expliciet een nieuwe verbinding te maken.
| Naam | Typologie | Description | Verplicht |
|---|---|---|---|
| Accountsleutel | beveiligde string | Azure Cognitive Services voor Batch Speech-to-Text-accountsleutel | Klopt |
| Regio | touw | Speech-serviceregio (voorbeeld: eastus) | Klopt |
Beperkingslimieten
| Name | Aanroepen | Verlengingsperiode |
|---|---|---|
| API-aanroepen per verbinding | 100 | 60 seconden |
Acties
| Ondersteunde landinstellingen ophalen (V3.1) |
Hiermee haalt u een lijst op met ondersteunde landinstellingen voor offlinetranscripties. |
| Transcriptie bijwerken (V3.1) |
Hiermee worden de veranderlijke details bijgewerkt van de transcriptie die is geïdentificeerd door de id. |
| Transcriptie maken (V3.1) |
Hiermee maakt u een nieuwe transcriptie. |
| Transcriptie verwijderen (V3.1) |
Hiermee verwijdert u de opgegeven transcriptietaak. |
| Transcriptiebestand ophalen (V3.1) |
Hiermee haalt u één specifiek bestand (geïdentificeerd met fileId) op uit een transcriptie (geïdentificeerd met id). |
| Transcripties ophalen (V3.1) |
Hiermee haalt u de transcriptie op die is geïdentificeerd door de opgegeven id. |
| Transcriptieslijst ophalen (V3.1) |
Hiermee haalt u een lijst met transcripties op voor het geverifieerde abonnement. |
| Transcriptieslijstbestanden ophalen (V3.1) |
Haalt de bestanden op van de transcriptie die is geïdentificeerd door de opgegeven id. |
Ondersteunde landinstellingen ophalen (V3.1)
Hiermee haalt u een lijst op met ondersteunde landinstellingen voor offlinetranscripties.
Retouren
| Name | Pad | Type | Description |
|---|---|---|---|
|
|
array of string |
Transcriptie bijwerken (V3.1)
Hiermee worden de veranderlijke details bijgewerkt van de transcriptie die is geïdentificeerd door de id.
Parameters
| Name | Sleutel | Vereist | Type | Description |
|---|---|---|---|---|
|
Identiteitsbewijs
|
id | True | uuid |
De id van de transcriptie. |
|
zelf
|
self | True | uri |
De locatie van de entiteit waarnaar wordt verwezen. |
|
displayName
|
displayName | string |
De naam van het object. |
|
|
beschrijving
|
description | string |
De beschrijving van het object. |
|
|
customProperties
|
customProperties | object |
De aangepaste eigenschappen van deze entiteit. De maximaal toegestane sleutellengte is 64 tekens, de maximaal toegestane waardelengte is 256 tekens en het aantal toegestane vermeldingen is 10. |
Retouren
- Body
- Transcription
Transcriptie maken (V3.1)
Hiermee maakt u een nieuwe transcriptie.
Parameters
| Name | Sleutel | Vereist | Type | Description |
|---|---|---|---|---|
|
contentUrls
|
contentUrls | array of uri |
U kunt een lijst met inhouds-URL's opgeven om audiobestanden te transcriberen. Maximaal 1000 URL's zijn toegestaan. Deze eigenschap wordt niet geretourneerd in een antwoord. |
|
|
contentContainerUrl
|
contentContainerUrl | uri |
U kunt ook een URL opgeven voor een Azure Blob-container die de audiobestanden bevat. Een container mag maximaal 5 GB en maximaal 10000 blobs hebben. De maximale grootte voor een blob is 2,5 GB. Container-SAS moet machtigingen 'r' (lezen) en 'l' (lijst) bevatten. Deze eigenschap wordt niet geretourneerd in een antwoord. |
|
|
locatie
|
locale | True | string |
De landinstelling van de ingesloten gegevens. Als taalidentificatie wordt gebruikt, wordt deze landinstelling gebruikt om spraak te transcriberen waarvoor geen taal kan worden gedetecteerd. |
|
displayName
|
displayName | True | string |
De weergavenaam van het object. |
|
model
|
self | uri |
De locatie van de entiteit waarnaar wordt verwezen. |
|
|
diarizationEnabled
|
diarizationEnabled | boolean |
Een waarde die aangeeft of diarisatie (sprekeridentificatie) wordt aangevraagd. De standaardwaarde. |
|
|
wordLevelTimestampsEnabled
|
wordLevelTimestampsEnabled | boolean |
Een waarde die aangeeft of tijdstempels op woordniveau worden aangevraagd. De standaardwaarde is |
|
|
displayFormWordLevelTimestampsEnabled
|
displayFormWordLevelTimestampsEnabled | boolean |
Een waarde die aangeeft of tijdstempels op woordniveau voor het weergaveformulier worden aangevraagd. De standaardwaarde is |
|
|
Kanalen
|
channels | array of integer |
Een verzameling van de aangevraagde kanaalnummers. In het standaardscenario worden de kanalen 0 en 1 overwogen. |
|
|
destinationContainerUrl
|
destinationContainerUrl | uri |
De aangevraagde doelcontainer.### Opmerkingen ###When een doelcontainer wordt gebruikt in combinatie met een |
|
|
interpunctiemodus
|
punctuationMode | string |
De modus die wordt gebruikt voor interpunctie. |
|
|
profanityFilterMode
|
profanityFilterMode | string |
Modus van grof filteren. |
|
|
timeToLive
|
timeToLive | string |
Hoe lang de transcriptie in het systeem wordt bewaard nadat deze is voltooid. Zodra de time to live is bereikt na voltooiing (geslaagd of mislukt), wordt deze automatisch verwijderd. Als u deze waarde niet instelt of op 0 instelt, wordt automatisch verwijderen uitgeschakeld. De langste ondersteunde duur is 31 dagen. De duur wordt gecodeerd als ISO 8601-duur ('PnYnMnDTnHnMnS', zie https://en.wikipedia.org/wiki/ISO_8601#Durations). |
|
|
minCount
|
minCount | integer |
Een hint voor het minimale aantal sprekers voor diarisatie. Moet kleiner zijn dan of gelijk zijn aan de eigenschap maxSpeakers. |
|
|
maxCount
|
maxCount | integer |
Het maximum aantal sprekers voor diarisatie. Moet kleiner zijn dan 36 en groter dan of gelijk aan de minSpeakers-eigenschap. |
|
|
candidateLocales
|
candidateLocales | True | array of string |
De landinstellingen van de kandidaat voor taalidentificatie (bijvoorbeeld ["en-US", "de-DE", "es-ES"]). Minimaal 2 en maximaal 10 kandidaatlandinstellingen, inclusief de belangrijkste landinstelling voor de transcriptie, worden ondersteund. |
|
speechModelMapping
|
speechModelMapping | object |
Een optionele toewijzing van landinstellingen aan spraakmodelentiteiten. Als er geen model wordt gegeven voor een landinstelling, wordt het standaardbasismodel gebruikt. Sleutels moeten landinstellingen zijn die zijn opgenomen in de kandidaat-landinstellingen. Waarden zijn entiteiten voor modellen van de respectieve landinstellingen. |
|
|
e-mailadres
|
string |
Het e-mailadres waarnaar e-mailmeldingen moeten worden verzonden voor het geval de bewerking is voltooid. De waarde wordt verwijderd nadat het e-mailbericht is verzonden. |
Retouren
- Body
- Transcription
Transcriptie verwijderen (V3.1)
Hiermee verwijdert u de opgegeven transcriptietaak.
Parameters
| Name | Sleutel | Vereist | Type | Description |
|---|---|---|---|---|
|
Identiteitsbewijs
|
id | True | uuid |
De id van de transcriptie. |
Transcriptiebestand ophalen (V3.1)
Hiermee haalt u één specifiek bestand (geïdentificeerd met fileId) op uit een transcriptie (geïdentificeerd met id).
Parameters
| Name | Sleutel | Vereist | Type | Description |
|---|---|---|---|---|
|
Identiteitsbewijs
|
id | True | uuid |
De id van de transcriptie. |
|
Bestands-id
|
fileId | True | uuid |
De id van het bestand. |
|
Sas-geldigheid in seconden
|
sasValidityInSeconds | integer |
De duur in seconden dat een SAS-URL geldig moet zijn. De standaardduur is 12 uur. Wanneer u BYOS (https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-encryption-of-data-at-rest#bring-your-own-storage-byos-for-customization-and-logging): Een waarde van 0 betekent dat een gewone blob-URI zonder SAS-token wordt gegenereerd. |
Retouren
- Body
- File
Transcripties ophalen (V3.1)
Hiermee haalt u de transcriptie op die is geïdentificeerd door de opgegeven id.
Parameters
| Name | Sleutel | Vereist | Type | Description |
|---|---|---|---|---|
|
Identiteitsbewijs
|
id | True | uuid |
De id van de transcriptie. |
Retouren
- Body
- Transcription
Transcriptieslijst ophalen (V3.1)
Hiermee haalt u een lijst met transcripties op voor het geverifieerde abonnement.
Parameters
| Name | Sleutel | Vereist | Type | Description |
|---|---|---|---|---|
|
Overslaan
|
skip | integer |
Aantal gegevenssets dat wordt overgeslagen. |
|
|
Boven
|
top | integer |
Het aantal gegevenssets dat wordt opgenomen na het overslaan. |
|
|
Filter
|
filter | string |
Een filterexpressie voor het selecteren van een subset van de beschikbare transcripties.
|
Retouren
Transcriptieslijstbestanden ophalen (V3.1)
Haalt de bestanden op van de transcriptie die is geïdentificeerd door de opgegeven id.
Parameters
| Name | Sleutel | Vereist | Type | Description |
|---|---|---|---|---|
|
Identiteitsbewijs
|
id | True | uuid |
De id van de transcriptie. |
|
Sas-geldigheid in seconden
|
sasValidityInSeconds | integer |
De duur in seconden dat een SAS-URL geldig moet zijn. De standaardduur is 12 uur. Wanneer u BYOS (https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-encryption-of-data-at-rest#bring-your-own-storage-byos-for-customization-and-logging): Een waarde van 0 betekent dat een gewone blob-URI zonder SAS-token wordt gegenereerd. |
|
|
Overslaan
|
skip | integer |
Aantal gegevenssets dat wordt overgeslagen. |
|
|
Boven
|
top | integer |
Het aantal gegevenssets dat wordt opgenomen na het overslaan. |
|
|
Filter
|
filter | string |
Een filterexpressie voor het selecteren van een subset van de beschikbare bestanden.
|
Retouren
- Body
- PaginatedFiles
Definities
DiarizationProperties
| Name | Pad | Type | Description |
|---|---|---|---|
|
luidsprekers
|
speakers | DiarizationSpeakersProperties |
DiarizationSpeakersProperties
| Name | Pad | Type | Description |
|---|---|---|---|
|
minCount
|
minCount | integer |
Een hint voor het minimale aantal sprekers voor diarisatie. Moet kleiner zijn dan of gelijk zijn aan de eigenschap maxSpeakers. |
|
maxCount
|
maxCount | integer |
Het maximum aantal sprekers voor diarisatie. Moet kleiner zijn dan 36 en groter dan of gelijk aan de minSpeakers-eigenschap. |
Bestand
| Name | Pad | Type | Description |
|---|---|---|---|
|
vriendelijk
|
kind | FileKind |
Type gegevens. |
|
koppelingen
|
links | FileLinks | |
|
aanmaakDatumTijd
|
createdDateTime | date-time |
De aanmaaktijd van dit bestand. De tijdstempel wordt gecodeerd als ISO 8601-datum- en tijdnotatie (zie https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations). |
|
properties
|
properties | FileProperties | |
|
naam
|
name | string |
De naam van dit bestand. |
FileKind
FileLinks
| Name | Pad | Type | Description |
|---|---|---|---|
|
contentUrl
|
contentUrl | uri |
De URL voor het ophalen van de inhoud van dit bestand. |
FileProperties
| Name | Pad | Type | Description |
|---|---|---|---|
|
size
|
size | integer |
De grootte van de gegevens in bytes. |
|
duration
|
duration | string |
De duur voor het geval dit bestand een audiobestand is. De duur wordt gecodeerd als ISO 8601duration ("PnYnMnDTnHnMnS", zie https://en.wikipedia.org/wiki/ISO_8601#Durations). |
LanguageIdentificationProperties
| Name | Pad | Type | Description |
|---|---|---|---|
|
candidateLocales
|
candidateLocales | array of string |
De landinstellingen van de kandidaat voor taalidentificatie (bijvoorbeeld ["en-US", "de-DE", "es-ES"]). Minimaal 2 en maximaal 10 kandidaatlandinstellingen, inclusief de belangrijkste landinstelling voor de transcriptie, worden ondersteund. |
|
speechModelMapping
|
speechModelMapping | object |
Een optionele toewijzing van landinstellingen aan spraakmodelentiteiten. Als er geen model wordt gegeven voor een landinstelling, wordt het standaardbasismodel gebruikt. Sleutels moeten landinstellingen zijn die zijn opgenomen in de kandidaat-landinstellingen. Waarden zijn entiteiten voor modellen van de respectieve landinstellingen. |
PaginatedFiles
| Name | Pad | Type | Description |
|---|---|---|---|
|
values
|
values | array of File |
Een lijst met entiteiten die worden beperkt door de doorgegeven queryparameters 'skip' en 'top' of de bijbehorende standaardwaarden. Wanneer u een lijst doorloopt met behulp van paginering en het parallel verwijderen van entiteiten, worden sommige entiteiten overgeslagen in de resultaten. Het is raadzaam om een lijst op de client te maken en te verwijderen na het ophalen van de volledige lijst. |
|
@nextLink
|
@nextLink | uri |
Een koppeling naar de volgende set gepagineerde resultaten als er meer entiteiten beschikbaar zijn; anders null. |
GepagineerdeTranscriptions
| Name | Pad | Type | Description |
|---|---|---|---|
|
values
|
values | array of Transcription |
Een lijst met entiteiten die worden beperkt door de doorgegeven queryparameters 'skip' en 'top' of de bijbehorende standaardwaarden. Wanneer u een lijst doorloopt met behulp van paginering en het parallel verwijderen van entiteiten, worden sommige entiteiten overgeslagen in de resultaten. Het is raadzaam om een lijst op de client te maken en te verwijderen na het ophalen van de volledige lijst. |
|
@nextLink
|
@nextLink | uri |
Een koppeling naar de volgende set gepagineerde resultaten als er meer entiteiten beschikbaar zijn; anders null. |
ProfanityFilterMode
Interpunctiemodus
De modus die wordt gebruikt voor interpunctie.
De modus die wordt gebruikt voor interpunctie.
Transcriptie
| Name | Pad | Type | Description |
|---|---|---|---|
|
contentUrls
|
contentUrls | array of uri |
U kunt een lijst met inhouds-URL's opgeven om audiobestanden te transcriberen. Maximaal 1000 URL's zijn toegestaan. Deze eigenschap wordt niet geretourneerd in een antwoord. |
|
contentContainerUrl
|
contentContainerUrl | uri |
U kunt ook een URL opgeven voor een Azure Blob-container die de audiobestanden bevat. Een container mag maximaal 5 GB en maximaal 10000 blobs hebben. De maximale grootte voor een blob is 2,5 GB. Container-SAS moet machtigingen 'r' (lezen) en 'l' (lijst) bevatten. Deze eigenschap wordt niet geretourneerd in een antwoord. |
|
locatie
|
locale | string |
De landinstelling van de ingesloten gegevens. Als taalidentificatie wordt gebruikt, wordt deze landinstelling gebruikt om spraak te transcriberen waarvoor geen taal kan worden gedetecteerd. |
|
displayName
|
displayName | string |
De weergavenaam van het object. |
|
model
|
model.self | uri |
De locatie van de entiteit waarnaar wordt verwezen. |
|
properties
|
properties | TranscriptionProperties |
TranscriptieProperties
| Name | Pad | Type | Description |
|---|---|---|---|
|
diarizationEnabled
|
diarizationEnabled | boolean |
Een waarde die aangeeft of diarisatie (sprekeridentificatie) wordt aangevraagd. De standaardwaarde. |
|
wordLevelTimestampsEnabled
|
wordLevelTimestampsEnabled | boolean |
Een waarde die aangeeft of tijdstempels op woordniveau worden aangevraagd. De standaardwaarde is |
|
displayFormWordLevelTimestampsEnabled
|
displayFormWordLevelTimestampsEnabled | boolean |
Een waarde die aangeeft of tijdstempels op woordniveau voor het weergaveformulier worden aangevraagd. De standaardwaarde is |
|
Kanalen
|
channels | array of integer |
Een verzameling van de aangevraagde kanaalnummers. In het standaardscenario worden de kanalen 0 en 1 overwogen. |
|
destinationContainerUrl
|
destinationContainerUrl | uri |
De aangevraagde doelcontainer.### Opmerkingen ###When een doelcontainer wordt gebruikt in combinatie met een |
|
interpunctiemodus
|
punctuationMode | PunctuationMode |
De modus die wordt gebruikt voor interpunctie. |
|
profanityFilterMode
|
profanityFilterMode | ProfanityFilterMode |
Modus van grof filteren. |
|
timeToLive
|
timeToLive | string |
Hoe lang de transcriptie in het systeem wordt bewaard nadat deze is voltooid. Zodra de time to live is bereikt na voltooiing (geslaagd of mislukt), wordt deze automatisch verwijderd. Als u deze waarde niet instelt of op 0 instelt, wordt automatisch verwijderen uitgeschakeld. De langste ondersteunde duur is 31 dagen. De duur wordt gecodeerd als ISO 8601-duur ('PnYnMnDTnHnMnS', zie https://en.wikipedia.org/wiki/ISO_8601#Durations). |
|
diarisatie
|
diarization | DiarizationProperties | |
|
Taalidentificatie -
|
languageIdentification | LanguageIdentificationProperties | |
|
e-mailadres
|
string |
Het e-mailadres waarnaar e-mailmeldingen moeten worden verzonden voor het geval de bewerking is voltooid. De waarde wordt verwijderd nadat het e-mailbericht is verzonden. |