Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El SDK de Voz (kit de desarrollo de software) muestra muchas de las funciones del servicio de Voz, para desarrollar aplicaciones habilitadas para Voz. El SDK de Voz está disponible en muchos lenguajes de programación y en las plataformas. El SDK de Voz es ideal para escenarios en tiempo real y no en tiempo real, mediante el uso de dispositivos locales, archivos, Azure Blob Storage y flujos de entrada y salida.
En algunos casos, no puede o no debe usar el SDK de Voz. En esos casos, puede usar las APIs REST para acceder al servicio de voz. Por ejemplo, use la API REST de conversión de voz en texto para transcripciones por lotes y la administración de modelos de voz. Para escenarios de transcripción especializados con funcionalidades LLM Speech y transcripción rápida, use el SDK de transcripción de voz.
Idiomas compatibles
El SDK de Voz admite los siguientes lenguajes y plataformas:
| Lenguaje de programación | Referencia | Compatibilidad con plataformas |
|---|---|---|
| C#1 | .NET | Windows, Linux, macOS, Mono, UWP |
| C++2 | C++ | Windows, Linux, macOS |
| Ir | Go | Linux |
| Java | Java | Android, Windows, Linux, macOS |
| JavaScript | JavaScript | Explorador, Node.js |
| Objective-C | Objective-C | iOS, macOS |
| Python | Python | Windows, Linux, macOS |
| Swift | Objective-C3 | iOS, macOS |
1 Los ejemplos de código de C# están disponibles en la documentación. El SDK de Voz para C# se basa en .NET Standard 2.0, por lo que admite muchas plataformas y lenguajes de programación. Para obtener más información, consulte soporte de implementación de .NET.
2 C no es un lenguaje de programación compatible con el SDK de Voz.
3 El SDK de Voz para Swift comparte bibliotecas cliente y documentación de referencia con el SDK de Voz para Objective-C.
Importante
Al descargar cualquiera de los SDK de voz de Azure en Foundry Tools, reconoce su licencia. Para más información, consulte:
Demo del SDK de voz
En el vídeo siguiente se muestra cómo instalar el SDK de Speech para C# y escribir una aplicación de consola de .NET para voz en texto.
Ejemplos de código
Los ejemplos de código del SDK de Voz están disponibles en la documentación y GitHub.
Ejemplos de documentación
En la parte superior de las páginas de documentación que contienen los ejemplos, las opciones para seleccionar incluyen C#, C++, Go, Java, JavaScript, Objective-C, Python o Swift.
Si un ejemplo no está disponible en su lenguaje de programación preferido, puede seleccionar otro lenguaje de programación para get started y obtener información sobre los conceptos, o ver la referencia y los ejemplos vinculados desde el principio del artículo.
ejemplos de GitHub
Los ejemplos detallados están disponibles en el repositorio Azure-Samples/cognitive-services-speech-sdk en GitHub. Hay ejemplos para C# (incluido UWP), C++, Java, JavaScript (incluidos Browser y Node.js), Objective-C, Python y Swift. Los ejemplos de código para Go están disponibles en el repositorio Microsoft/cognitive-services-speech-sdk-go en GitHub.
Opciones de ayuda
Los foros de Stack Overflow están disponibles para el developer community para formular y responder preguntas sobre Azure Voz y otros servicios. Microsoft supervisa los foros y responde a preguntas que la comunidad aún no ha respondido. Para asegurarnos de que vemos su pregunta, etiquete con "azure-speech".
Puede sugerir una idea o notificar un error mediante la creación de un problema en GitHub:
- Azure-Samples/cognitive-services-speech-sdk
- Microsoft/cognitive-services-speech-sdk-go
- Microsoft/cognitive-services-speech-sdk-js
Consulte también Opciones de soporte y ayuda de Herramientas de Foundry para obtener soporte técnico, mantenerse actualizado, enviar comentarios e informar de errores para Herramientas de Foundry.
Pasos siguientes
- Instale el SDK
- Pruebe el inicio rápido de conversión de voz en texto
- Más información sobre el SDK de transcripción de voz para funcionalidades especializadas de transcripción