MÁS

Esta inteligencia artificial ha sido entrenada en millones de videos de YouTube.

Investigadores de la Universidad de Washington y el Instituto Allen de Inteligencia Artificial entrenaron un sistema de inteligencia artificial para «explicar» lo que está sucediendo en el video.

Para lograr este objetivo, los investigadores han utilizado millones de videos de YouTube para entrenar la inteligencia artificial.

Si bien no es importante para nosotros explicar lo que está sucediendo en una imagen o video, ya que podemos comprender todos los elementos que interrumpen el contexto, se convierte en un problema importante incluso para los sistemas de inteligencia artificial más avanzados.

Teniendo en cuenta que una IA tiene que analizar cientos de datos para explicar una escena con una simple foto, podemos imaginar que la cantidad de datos y patrones necesarios para explicar lo que sucede en un video es inimaginable.

Sin embargo, los investigadores continúan desarrollando modelos que pueden acercarse a este objetivo. Un equipo de investigadores de la Universidad de Washington y el Instituto Allen de Inteligencia Artificial compartieron un nuevo estudio:

Presentamos MERLOT, un modelo que explora el conocimiento de la secuencia de comandos multimodal al ver millones de videos de YouTube con voces transcritas de una manera totalmente controlada y sin etiquetas. A través del entrenamiento previo, que combina una combinación de objetivos de fotogramas (espaciales) y de video (temporales), nuestro modelo no solo aprende a asociar imágenes con las palabras correspondientes a lo largo del tiempo, sino que también puede relacionar las condiciones climáticas que ocurren globalmente.

Como encontraron los investigadores, la inteligencia artificial ha sido entrenada en millones de videos de YouTube sobre varios temas. El objetivo es que el sistema de inteligencia artificial sea capaz de contextualizar el rendimiento del video, comprender eventos y situaciones, y ordenar los fotogramas con la transcripción adecuada.

Según los datos compartidos (con una precisión de 80,6), Merlot ha superado con éxito algunos de los desafíos de esta dinámica. Sin embargo, este sistema de entrenamiento de inteligencia artificial tiene algunas limitaciones. Por ejemplo, dado que los videoclips utilizados en la formación son limitados, ya sea en el idioma o en el tema, la inteligencia artificial puede obtener «malas plantillas».

Incluso si todavía les queda un largo camino por recorrer, los resultados son prometedores para un mayor desarrollo de estos modelos de IA.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

Botón volver arriba
error: Content is protected !!