Compartir a través de


¿Qué es el SDK de Voz?

El SDK de Voz (kit de desarrollo de software) muestra muchas de las funciones del servicio de Voz, para desarrollar aplicaciones habilitadas para Voz. El SDK de Voz está disponible en muchos lenguajes de programación y en las plataformas. El SDK de Voz es ideal para escenarios en tiempo real y no en tiempo real, mediante el uso de dispositivos locales, archivos, Azure Blob Storage y flujos de entrada y salida.

En algunos casos, no puede o no debe usar el SDK de Voz. En esos casos, puede usar las APIs REST para acceder al servicio de voz. Por ejemplo, use la API REST de conversión de voz en texto para transcripciones por lotes y la administración de modelos de voz. Para escenarios de transcripción especializados con funcionalidades LLM Speech y transcripción rápida, use el SDK de transcripción de voz.

Idiomas compatibles

El SDK de Voz admite los siguientes lenguajes y plataformas:

Lenguaje de programación Referencia Compatibilidad con plataformas
C#1 .NET Windows, Linux, macOS, Mono, UWP
C++2 C++ Windows, Linux, macOS
Ir Go Linux
Java Java Android, Windows, Linux, macOS
JavaScript JavaScript Explorador, Node.js
Objective-C Objective-C iOS, macOS
Python Python Windows, Linux, macOS
Swift Objective-C3 iOS, macOS

1 Los ejemplos de código de C# están disponibles en la documentación. El SDK de Voz para C# se basa en .NET Standard 2.0, por lo que admite muchas plataformas y lenguajes de programación. Para obtener más información, consulte soporte de implementación de .NET.
2 C no es un lenguaje de programación compatible con el SDK de Voz.
3 El SDK de Voz para Swift comparte bibliotecas cliente y documentación de referencia con el SDK de Voz para Objective-C.

Importante

Al descargar cualquiera de los SDK de voz de Azure en Foundry Tools, reconoce su licencia. Para más información, consulte:

Demo del SDK de voz

En el vídeo siguiente se muestra cómo instalar el SDK de Speech para C# y escribir una aplicación de consola de .NET para voz en texto.

Ejemplos de código

Los ejemplos de código del SDK de Voz están disponibles en la documentación y GitHub.

Ejemplos de documentación

En la parte superior de las páginas de documentación que contienen los ejemplos, las opciones para seleccionar incluyen C#, C++, Go, Java, JavaScript, Objective-C, Python o Swift.

Captura de pantalla que muestra cómo seleccionar un lenguaje de programación en la documentación.

Si un ejemplo no está disponible en su lenguaje de programación preferido, puede seleccionar otro lenguaje de programación para get started y obtener información sobre los conceptos, o ver la referencia y los ejemplos vinculados desde el principio del artículo.

ejemplos de GitHub

Los ejemplos detallados están disponibles en el repositorio Azure-Samples/cognitive-services-speech-sdk en GitHub. Hay ejemplos para C# (incluido UWP), C++, Java, JavaScript (incluidos Browser y Node.js), Objective-C, Python y Swift. Los ejemplos de código para Go están disponibles en el repositorio Microsoft/cognitive-services-speech-sdk-go en GitHub.

Opciones de ayuda

Los foros de Stack Overflow están disponibles para el developer community para formular y responder preguntas sobre Azure Voz y otros servicios. Microsoft supervisa los foros y responde a preguntas que la comunidad aún no ha respondido. Para asegurarnos de que vemos su pregunta, etiquete con "azure-speech".

Puede sugerir una idea o notificar un error mediante la creación de un problema en GitHub:

Consulte también Opciones de soporte y ayuda de Herramientas de Foundry para obtener soporte técnico, mantenerse actualizado, enviar comentarios e informar de errores para Herramientas de Foundry.

Pasos siguientes