🔎
Más
Especiales
Filtros
IA hace 1 d

Modelo de interacción de voz en tiempo real

Modelo de interacción de voz en tiempo real

Thinking Machines ha presentado un modelo de interacción de voz en tiempo real que avanza el estado de la técnica en este campo. El modelo, llamado TML-Interaction-Small, es un modelo de 276B parámetros con 12B activos que permite una interacción continua y en tiempo real con el usuario.

El modelo utiliza una técnica llamada "encoder-free early fusion" que procesa imágenes y audio en menos de 200 milisegundos, lo que permite una interacción más fluida y natural con el usuario. El equipo de Thinking Machines ha creado varios benchmarks para evaluar el rendimiento del modelo, incluyendo TimeSpeak, CueSpeak, RepCount-A y ProactiveVideoQA, que miden la capacidad del modelo para iniciar speech en momentos específicos, traducir simultáneamente y realizar seguimiento visual en tiempo real.

El modelo ha demostrado superar a otros modelos como GPT-Realtime-2 y Gemini 3.1-Flash en varios benchmarks, y ha sido destacado por su capacidad para realizar interacciones en tiempo real y su potencial para cambiar la forma en que interactuamos con los sistemas de inteligencia artificial. El equipo de Thinking Machines ha mencionado que este modelo es solo el comienzo de su roadmap, y que están explorando la posibilidad de combinar agentes de fondo con modelos interactivos para crear sistemas aún más avanzados.

La presentación de este modelo ha generado un gran interés en la comunidad de inteligencia artificial, y varios expertos han destacado su potencial para cambiar la forma en que interactuamos con los sistemas de inteligencia artificial. Algunos han mencionado que este modelo no es solo otro demo de chatbot, sino que representa un cambio en las suposiciones de interfaz y que la interactividad nativa es la innovación más profunda que el modelo ofrece. Otros han destacado la capacidad del modelo para realizar seguimiento visual en tiempo real y su potencial para ser utilizado en una variedad de aplicaciones, desde la atención médica hasta la educación.

Más sobre IA