La IA y la fábrica de chocolate

Clasificación de tabletas de chocolate mediante el aprendizaje por refuerzo

El aprendizaje por refuerzo es un enfoque adoptado de la Inteligencia Artificial (IA), que aplica procesos matemáticos para imitar el aprendizaje natural.La fábrica de chocolate es un ejemplo de las aplicaciones de control de movimiento industrial que pueden desarrollarse mediante este procedimiento y sorprender incluso a los expertos.

Varias cintas transportadoras trasladan tabletas de chocolate: forman parte de la máquina de demostración que muestra cómo puede utilizarse la Inteligencia Artificial para el control del movimiento.Lo que queda por hacer en una fábrica real es envasar las tabletas de chocolate, de forma automatizada, por supuesto. En esta máquina de demostración de alimentación inteligente de Siemens Digital Industries, las barras de chocolate deben colocarse en ranuras espaciadas uniformemente en la cinta de salida."Las barras se colocan en la cinta de entrada a intervalos aleatorios", explica Martin Bischoff, experto en mecatrónica virtual de Technology, la división de investigación de Siemens. "El controlador del sistema lo consigue modificando las velocidades de las cintas transportadoras.Una línea de tres cintas transportadoras puede acelerarse o ralentizarse para garantizar que el chocolate se coloque correctamente en la cinta de salida.El desarrollo de un algoritmo de control optimizado para esta aplicación es una tarea de programación complicada; si no lo cree, pruébelo usted mismo.Mediante el aprendizaje por refuerzo, hemos entrenado un controlador de inteligencia artificial para realizar esta tarea"

 

Refuerzo - aprendizaje: fracaso y éxito

El aprendizaje por refuerzo es un concepto de Inteligencia Artificial que funciona de forma similar a como la mayoría de la gente aprende a montar en bicicleta: por ensayo y error, sin conocer la física subyacente.Tanto si una técnica es buena como si no, los alumnos experimentan inmediatamente en sus intentos y poco a poco van mejorando.

  

"Así es exactamente como funciona el aprendizaje por refuerzo", explica Michel Tokic, experto en IA en Tecnología y profesor de Aprendizaje por Refuerzo Aplicado en la Universidad Ludwig Maximilian de Múnich. "La IA recibe una especificación de objetivo, como por ejemplo: Las barras de chocolate sólo deben colocarse en los campos de destino y el sistema debe realizar la tarea lo más rápidamente posible.A continuación, la IA realiza intentos de control -al principio completamente aleatorios- sobre el modelo de simulación para cumplir este requisito.Activado por señales de sensores fotoeléctricos, recibe información sobre la calidad de estos intentos. En el ejemplo del chocolate, se necesitaron unos tres millones de ciclos de entrenamiento antes de que la IA fuera capaz de colocar correctamente los productos en los campos.

 

Formación sobre el Gemelo Digital

Los errores en una aplicación de control de movimiento pueden tener consecuencias caras y peligrosas. Por eso es una práctica habitual desarrollar y probar los controladores en gemelos digitales de la máquina sin ningún riesgo(Siemens Virtual Commissioning). Este gemelo digital puede utilizarse del mismo modo para entrenar la IA

"Tras unas 72 horas de entrenamiento con el gemelo digital en un ordenador comercial estándar (con los clústeres informáticos basados en la nube eso se reduce a unas 24 horas), la IA está lista para controlar la planta real", dice Bischoff. "En cualquier caso, es mucho más rápido que cuando los humanos desarrollan estos algoritmos de control. En Erlangen hemos trabajado con nuestros colegas de Siemens Digital Industries para construir el demostrador controlado por esta IA, y funciona exactamente como esperábamos: es un hito importante para este proyecto, financiado por Siemens Innovationsfund".  

Un enfoque diferente al de los ingenieros

"Si se observan las cintas transportadoras controladas por la IA, se verá que esta ha encontrado una estrategia que consiste en transportar todas las tabletas de chocolate lo más rápido posible en las primeras cintas transportadoras, y solo controlar la velocidad con precisión en la última cinta", dice Thomas Hennefelder, el ingeniero de Siemens Digital Industries responsable de la máquina. "Esta estrategia funciona bien, y es interesante que sea bastante diferente de la que utiliza nuestro controlador convencional". Sigue creyendo que hay mucho potencial en el método que permite a la IA aprender tareas de control complejas de forma independiente utilizando el gemelo digital. "Gracias a este enfoque, ahora podemos desarrollar controladores específicos para cada aplicación de forma más rápida y con menos esfuerzo. En el futuro, los sistemas de producción ya no se limitarán a las tareas para las que ya se ha desarrollado un programa de control, sino que podrán realizar todas las tareas que la IA sea capaz de aprender."

Aenne Barnard, julio de 2021

Suscríbase a nuestro boletín de noticias

Manténgase al día en todo momento: todo lo que necesita saber sobre electrificación, automatización y digitalización.