Deepmind PLATO: Expectativas decepcionadas y su importancia para la física

| |

Deepmind cuenta con un sistema de IA que aprende física intuitiva. El equipo se inspiró en los hallazgos de la psicología del desarrollo.

Gracias a los avances en hardware, arquitecturas de red y métodos, la inteligencia artificial ha superado numerosos puntos de referencia y conquistado dominios de la inteligencia humana en los últimos años. Pero a pesar de éxitos como AlphaGo, AlphaFold, GPT-3 o DALL-E 2, todavía falta lo que a menudo se denomina sentido común denominado. Dentro de la investigación de IA, las posibles formas de lograr estas habilidades son objeto de un animado debate, por ejemplo recientemente, de manera particularmente prominente en Twitter entre el jefe de IA de Meta, Yann LeCun, y Gary Marcus.

Un equipo de Deepmind ahora aborda un aspecto específico de este debate, la física intuitiva, en el nuevo trabajo de investigación. En psicología del desarrollo, esto se usa a menudo para designar la red de conceptos que subyacen a nuestras consideraciones sobre las propiedades e interacciones de los objetos macroscópicos. Esta comprensión de la física es fundamental para la inteligencia incorporada, ya que es fundamental para cada acción en el entorno. También forma una base para el conocimiento conceptual y las representaciones compositivas en general.

Publicación Destacada

PLATO de Deepmind y el Paradigma de Violación de Expectativas

En el nuevo trabajo, el equipo se guía por hallazgos y métodos centrales de la psicología del desarrollo para la física intuitiva: así es como se entiende la física a nivel de objetos discretos y su interacción, escriben los investigadores en su publicación. Estos permiten la formación de cinco conceptos: continuidad de los objetos, permanencia de los objetos, solidez, inmutabilidad e inercia en los cambios de dirección. Si estos conceptos están presentes, un ser vivo ha desarrollado una comprensión intuitiva de la física.

En la psicología del desarrollo, estos conceptos se examinan utilizando el llamado paradigma de la violación de las expectativas (VoE). El paradigma establece que un ser humano que posea cualquiera de los conceptos enumerados anteriormente tiene un conjunto de expectativas sobre el comportamiento de los objetos. Por ejemplo, el concepto de permanencia de objetos establece que los objetos no dejan de existir cuando desaparecen de la vista.

Deepmind PLATO: Expectativas decepcionadas y su importancia para la física
Deepmind crea sus propios videos VoE. Aquí hay un ejemplo donde un objeto salta un área visible en la imagen.

En experimentos con bebés o niños pequeños, se rompen estas expectativas, por ejemplo en videos, para determinar si los niños se sorprenden. Si un bebé mira un objeto por más tiempo después de romper las leyes de la física, esto es una indicación de una violación de las expectativas y, por lo tanto, de un concepto existente de física intuitiva.

Por lo tanto, el equipo de Deepmind está entrenando PLATO (Physics Learning through Auto-encoding and Tracking Objects), un sistema de aprendizaje profundo que predice el comportamiento de objetos físicos simples en videos. Deepmind luego lo probó con los cinco conceptos mencionados anteriormente utilizando el paradigma de violación de expectativas.

Deepmind genera 300.000 videoclips de objetos físicos

Para el entrenamiento de PLATO, Deepmind creó el conjunto de datos de conceptos físicos, que consta de 300 000 videos cortos de objetos 3D animados simples, como una pelota que pasa rodando por un obstáculo y reaparece en el otro lado. PLATO consta de dos componentes: un módulo de percepción que convierte imágenes individuales en un conjunto de códigos de objetos y un predictor dinámico que predice imágenes futuras utilizando los códigos de objetos del módulo de percepción. Los códigos de objeto aquí corresponden a las representaciones de objetos discretos conocidos de la psicología del desarrollo, que sirven como base de la física intuitiva.

Deepmind PLATO: Expectativas decepcionadas y su importancia para la física
Deepminds PLATO consta de dos componentes. El elemento central es la representación y el procesamiento de objetos individuales como códigos de objetos. | Imagen: Deepmind / Piloto et al.

Así equipado, PLATO podría aprender física intuitiva y al menos algunos de los cinco conceptos, sospechaba el equipo. Después del entrenamiento, los investigadores probaron PLATO con diferentes videos VoE, es decir, clips cortos que prueban ciertos conceptos, por ejemplo, mediante un objeto que se teletransporta en el campo de visión.

PLATO se basa en objetos físicos

Cada video que muestra una violación de los principios físicos también se comparó con un video correspondiente físicamente correcto. Esto permitió a los investigadores comparar las predicciones. El equipo también entrenó variantes de un segundo modelo de IA agnóstico de objetos, que también predice fotogramas futuros de los videos, pero no funciona con códigos de objetos.

En la prueba, PLATO mostró efectos claros de VoE en las cinco muestras de concepto: las finalizaciones de IA se basaron fuertemente en conceptos físicos y, por lo tanto, no coincidieron con el curso del video en los casos de VoE. Por el contrario, los modelos agnósticos de objetos alternativos sin códigos de objeto no arrojaron resultados que excedieran el azar.

En otro experimento, el equipo también demostró que se pueden lograr resultados similares entrenando modelos con solo 50 000 videos, el equivalente a 28 horas de datos visuales. Una posible indicación de que el cerebro humano también podría aprender tales conceptos con la observación visual.

Sin embargo, el autor principal, Luis Piloto, enfatiza que PLATO no fue diseñado como un modelo para el comportamiento infantil. Sin embargo, podría ser un primer paso para un sistema de inteligencia artificial que podría probar hipótesis sobre cómo aprenden los bebés humanos.

Lina
Lina García ha escrito sobre tecnología y marketing, cubriendo todo, desde la analítica hasta la realidad virtual, desde 2010. Antes de eso, obtuvo un doctorado en inglés, enseñó a escribir a nivel universitario y lanzó y publicó una revista en formato impreso y digital. Ahora es escritora, editora y consultora de marketing a tiempo completo.