🔎
Más
Especiales
Filtros
IA hace 5 d

Nuevos modelos de voz en la API de OpenAI

Nuevos modelos de voz en la API de OpenAI

OpenAI ha lanzado nuevos modelos de voz en su API que permiten a los desarrolladores crear aplicaciones de voz más naturales y avanzadas. Estos modelos pueden razonar, traducir y transcribir el habla en tiempo real.

Entre los modelos lanzados se encuentran GPT-Realtime-2, GPT-Realtime-Translate y GPT-Realtime-Whisper. GPT-Realtime-2 es el primer modelo de voz con capacidad de razonamiento de clase GPT-5, que puede manejar solicitudes más complejas y mantener la conversación de manera natural. GPT-Realtime-Translate es un modelo de traducción en vivo que puede traducir el habla de más de 70 idiomas a 13 idiomas de salida. GPT-Realtime-Whisper es un modelo de transcripción de habla en vivo que puede transcribir el habla en tiempo real.

“GPT-Realtime-2 es el primer modelo de voz con capacidad de razonamiento de clase GPT-5, que puede manejar solicitudes más complejas y mantener la conversación de manera natural”

La capacidad de voz se está convirtiendo en una de las formas más naturales para que las personas interactúen con el software. Los desarrolladores pueden utilizar estos modelos para crear aplicaciones de voz que puedan entender lo que alguien significa, mantener el contexto, recuperarse cuando una solicitud cambia y responder de manera adecuada al momento. Los modelos de voz de OpenAI pueden ayudar a los desarrolladores a crear interfaces de voz que puedan realizar tareas, como escuchar, razonar, traducir, transcribir y tomar acción en tiempo real.

La empresa OpenAI es un líder en el desarrollo de inteligencia artificial y ha estado trabajando en la creación de modelos de lenguaje avanzados. La API de OpenAI permite a los desarrolladores acceder a estos modelos y crear aplicaciones innovadoras. Con la lanzamiento de estos nuevos modelos de voz, OpenAI está ayudando a los desarrolladores a crear aplicaciones de voz más avanzadas y naturales, lo que puede revolucionar la forma en que las personas interactúan con la tecnología. Los desarrolladores pueden utilizar estos modelos para crear aplicaciones de voz que puedan ayudar a las personas a realizar tareas de manera más eficiente y efectiva.

Más sobre IA