Three Workflows para Mejorar la Precisión de Agentes de Inteligencia Artificial Visual Usando Datos Sintéticos y Fine-Tuning
Los agentes de inteligencia artificial visual se están convirtiendo en una herramienta práctica para convertir datos de video del mundo físico en inteligencia operativa en fábricas, ciudades, almacenes y sistemas de transporte. Esto se debe a que cada vez más cargas de trabajo de inteligencia artificial se están trasladando hacia donde se genera la data.
Algunos hechos clave sobre la situación actual de los agentes de inteligencia artificial visual son: * Más de dos tercios de los datos gestionados por empresas se crearán y procesarán fuera del centro de datos o la nube para 2028. * Más de dos tercios de todas las empresas a nivel global desplegarán inteligencia artificial en el borde para 2029, lo que supone un aumento con respecto al 10% en 2025. * Hasta un 90% de los datos del borde existentes no se procesan. * Los agentes de inteligencia artificial visual necesitan entender video, adaptarse a condiciones del mundo real y conectar información a flujos de trabajo operativos.
“* Más de dos tercios de todas las empresas a nivel global desplegarán inteligencia artificial en el borde para 2029, lo que supone un aumento con respecto al 10% en 2025”
Para construir estos agentes, los desarrolladores necesitan formas repetibles de generar datos de entrenamiento, ajustar modelos y desplegar aplicaciones de video en entornos de borde y nube. Las habilidades y planos de NVIDIA Metropolis proporcionan a los desarrolladores flujos de trabajo reutilizables para construir, operar y optimizar agentes de inteligencia artificial visual a lo largo de su ciclo de vida.
Un enfoque de ciclo de vida completo para los agentes de inteligencia artificial visual implica el uso de habilidades y planos de NVIDIA, junto con NVIDIA Omniverse para la generación de datos sintéticos y simulación basada en OpenUSD, y NVIDIA Metropolis para el desarrollo de modelos y despliegue de inteligencia artificial de video. Esto permite a los desarrolladores generar datos, mejorar modelos y desplegar agentes de inteligencia artificial visual de manera más rápida y eficiente.
La generación de datos sintéticos y la mejora de modelos son aspectos clave en el desarrollo de agentes de inteligencia artificial visual. La habilidad de generación de imágenes de defectos ayuda a crear datos sintéticos de defectos, mientras que la habilidad de aumento de datos de video ayuda a expandir la cobertura de escenarios. Las habilidades de NVIDIA TAO permiten la mejora de modelos, y las habilidades de búsqueda y resumen de video de NVIDIA ayudan a convertir la comprensión de video en flujos de trabajo desplegables para alertas, informes y más.