Freigeben über


Sherpa Digital (Vorschau)

Sherpa Digital Connector ermöglicht die automatische Audio-zu-Text-Transkription innerhalb der Workflowautomatisierung und app-Erstellung. Es beseitigt manuelle Transkription und hilft Benutzern, KI schneller zu nutzen, z. B. während Schulungen. Weitere Connectors werden in Kürze verfügbar sein.

Dieser Connector ist in den folgenden Produkten und Regionen verfügbar:

Dienstleistung Class Regions
Copilot Studio Premium Alle Power Automate Regionen mit Ausnahme der folgenden:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Logik-Apps Norm Alle Logik-Apps-Regionen mit Ausnahme der folgenden Bereiche:
     - Azure Government Regionen
     - Azure China-Regionen
     - US Department of Defense (DoD)
Power Apps Premium Alle Power Apps Regionen mit Ausnahme der folgenden:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Power Automate Premium Alle Power Automate Regionen mit Ausnahme der folgenden:
     - US Government (GCC)
     - US Government (GCC High)
     - China Cloud betrieben von 21Vianet
     - US Department of Defense (DoD)
Kontakt
Name Unterstützung der digitalen Sherpa-API
URL https://api.sherpaplatform.eu
Email thierry.hubar@sherpadigital.nl
Connectormetadaten
Herausgeber Sherpa Digital
Webseite https://sherpadigital.nl
Datenschutzrichtlinie https://api.sherpaplatform.eu/privacy
Kategorien Künstliche Intelligenz; Produktivität

Sherpa Digital Connector

Überblick

Mit dem Sherpa Digital Connector können Sie Audiodateien mithilfe erweiterter Sprach-zu-Text-Technologie in Text transkribieren. Laden Sie Ihre Audiodateien hoch und empfangen Sie genaue Transkriptionen in Niederländisch, ideal für Besprechungsnotizen, Sprachaufzeichnungen und Audioinhaltsverarbeitung.

Features

  • High-Quality Transkription: Konvertieren von Audiodateien in genaue Texttranskriptionen
  • Mehrere Audioformate: Unterstützt MP3-, WAV-, M4A-, MP4-, FLAC-, OGG- und WebM-Formate
  • Asynchrone Verarbeitung: Automatisches Abrufen des Transkriptionsabschlusses (bis zu 10 Minuten)
  • Unterstützung für große Dateien: Behandeln von Audiodateien mit bis zu 500 MB
  • Niederländische Sprachunterstützung: Optimiert für Niederländisch (nl-NL) Transkription
  • Organisierter Speicher: Optionales Ordnerpräfix zum Organisieren von Transkriptionen

Erste Schritte

Voraussetzungen

Um den Sherpa Digital Connector zu verwenden, benötigen Sie Folgendes:

  1. Ein API-Schlüssel von Sherpa Digital
  2. Eine Audiodatei in einem unterstützten Format (MP3, WAV, M4A, MP4, FLAC, OGG oder WebM)

Abrufen des API-Schlüssels

  1. Wenden Sie sich an Sherpa Digital, um einen API-Schlüssel anzufordern.
  2. E-Mail: ruben.lanjouw@sherpadigital.nl
  3. Besuch: https://sherpaplatform.eu

Sobald Sie ihren API-Schlüssel haben, können Sie ihn in den Connectoreinstellungen konfigurieren.

Authentifizierung

Der Sherpa Digital Connector verwendet die API-Schlüsselauthentifizierung. Beim Konfigurieren des Connectors:

  1. Geben Sie Ihren API-Schlüssel in die Verbindungseinstellungen ein.
  2. Der API-Schlüssel wird sicher gespeichert und für alle API-Anforderungen verwendet.
  3. Einschließen des API-Schlüssels in den X-API-Key Header für alle Anforderungen

Hinweis: Dieser Connector verwendet keine OAuth-Authentifizierung. Sie müssen ihren API-Schlüssel nur während der Verbindungseinrichtung bereitstellen.

Usage

Audiodatei transkribieren

Die Hauptaktion ermöglicht es Ihnen, eine Audiodatei hochzuladen und die Transkription zu empfangen.

Anforderungsformat:

  • Verwenden des JSON-Textformats mit base64-codiertem Audio, um optimale Kompatibilität mit Power Automate
  • Audiodatei muss base64-codiert im contentBytes Feld sein
  • Fügen Sie den Dateinamen mit der Erweiterung in das Feld ein.name

Anforderungstext:

{
  "audio": {
    "name": "meeting_recording.mp3",
    "contentBytes": "UklGRiQAAABXQVZFZm10..."
  },
  "prefix": "meetings/2024"
}

Antwort:

{
  "transcription": "Dit is de getranscribeerde tekst uit het audio bestand.",
  "transcription_filename": "transcription_meeting_recording.txt",
  "status": "completed"
}

Die Parameter

  • Audio (erforderlich): Audiodateiobjekt mit:
    • Name (erforderlich): Name der Audiodatei mit Erweiterung (z. B. "meeting_recording.mp3")
    • contentBytes (erforderlich): Base64-codierte Audiodateiinhalte
  • Präfix (optional): Ordnerpräfix für die Organisation von Transkriptionen (z. B. "Besprechungen/2024")

Antwortfelder

  • Transkription: Der transkribierte Text aus der Audiodatei
  • transcription_filename: Name der Transkriptionsdatei
  • status: Verarbeitungsstatus ("abgeschlossen" oder "Verarbeitung")

Unterstützte Audioformate

  • MP3 (.mp3)
  • WAV (.wav)
  • M4A (.m4a)
  • MP4 (.mp4)
  • FLAC (.flac)
  • OGG (.ogg)
  • WebM (.webm)

Einschränkungen

  • Dateigröße: Maximal 500 MB pro Audiodatei
  • Sprache: Unterstützt derzeit nur Niederländisch (nl-NL)
  • Verarbeitungszeit: Maximale Wartezeit von 10 Minuten für den Abschluss der Transkription
  • Timeout: Wenn die Transkription länger als 10 Minuten dauert, erhalten Sie eine Timeoutantwort und können später wieder einchecken.

Fehlerbehandlung

Der Connector gibt die entsprechenden HTTP-Statuscodes zurück:

  • 200: Transkription erfolgreich abgeschlossen
  • 400: Ungültige Anforderung – fehlende Datei oder ungültiger Dateityp
  • 401: Nicht autorisiert – ungültiger oder fehlender API-Schlüssel
  • 408: Anforderungstimeout - Transkription wird noch verarbeitet
  • 500: Interner Serverfehler

Support

Bei Fragen, Problemen oder zum Anfordern eines API-Schlüssels:

Anwendungsfälle

  • Besprechungstranskription: Automatisches Transkribieren von Besprechungsaufzeichnungen
  • Sprachnotizen: Konvertieren von Sprachnotizen in Text zur einfachen Suche und Freigabe
  • Inhaltsverarbeitung: Extrahieren von Text aus Audioinhalten zur Analyse
  • Barrierefreiheit: Erstellen von Textversionen von Audioinhalten für Barrierefreiheit

Bewährte Methoden

  1. Dateivorbereitung: Sicherstellen, dass die Audioqualität für optimale Transkriptionsgenauigkeit klar ist
  2. Dateigröße: Speichern von Dateien unter 400 MB zur optimalen Verarbeitung
  3. Formatauswahl: Optimale Kompatibilität mit MP3,M4A- oder WAV-Formaten
  4. Organisation: Verwenden des Präfixparameters zum Organisieren von Transkriptionen nach Projekt, Datum oder Kategorie

Unterstützte Vorgänge

  • Transkription

Bekannte Einschränkungen

N/A

Eine Verbindung wird erstellt

Der Connector unterstützt die folgenden Authentifizierungstypen:

Vorgabe Parameter zum Erstellen einer Verbindung. Alle Regionen Nicht teilbar

Vorgabe

Anwendbar: Alle Regionen

Parameter zum Erstellen einer Verbindung.

Dies ist keine freigabefähige Verbindung. Wenn die Power-App für einen anderen Benutzer freigegeben wird, wird ein anderer Benutzer aufgefordert, eine neue Verbindung explizit zu erstellen.

Name Typ Description Erforderlich
API-Schlüssel securestring Der API-Schlüssel für diese API Richtig

Drosselungsgrenzwerte

Name Aufrufe Verlängerungszeitraum
API-Aufrufe pro Verbindung 100 60 Sekunden

Aktionen

Transkribieren einer Audiodatei in Text

Lädt eine Audiodatei hoch und transkribiert sie mithilfe von Spracherkennung in Texttechnologie. Der Endpunkt akzeptiert Audiodateien in mehreren Formaten (MP3, WAV, M4A, MP4, FLAC, OGG, WebM).

  • Verwenden des JSON-Textformats mit base64-codiertem Audio für optimale Kompatibilität
  • Dateigrößenbeschränkung für Audiodateien: 500 MB
  • Unterstützte Sprachen: Niederländisch (nl-NL)

Transkribieren einer Audiodatei in Text

Lädt eine Audiodatei hoch und transkribiert sie mithilfe von Spracherkennung in Texttechnologie. Der Endpunkt akzeptiert Audiodateien in mehreren Formaten (MP3, WAV, M4A, MP4, FLAC, OGG, WebM).

  • Verwenden des JSON-Textformats mit base64-codiertem Audio für optimale Kompatibilität
  • Dateigrößenbeschränkung für Audiodateien: 500 MB
  • Unterstützte Sprachen: Niederländisch (nl-NL)

Parameter

Name Schlüssel Erforderlich Typ Beschreibung
name
name True string

Name der Audiodatei mit Erweiterung

Inhalt (base64)
contentBytes True byte

Base64-codierte Audiodateiinhalte

Ordnerpräfix
prefix string

Optionales Ordnerpräfix für die Organisation von Transkriptionen

Gibt zurück

Name Pfad Typ Beschreibung
Transkriptionstext
transcription string

Der transkribierte Text aus der Audiodatei

Transkriptionsdateiname
transcription_filename string

Name der Transkriptionsdatei

Der Status
status string

Verarbeitung von status