Artículo técnico - 4 de octubre de 2019

¿El aprendizaje automático está tomando el control en la industria de procesos?

Escrito por Expert: Cosmin Koch-Ciobotaru 7 min lectura

Información

Esta página, publicada originalmente en inglés, se ofrece en español con la ayuda de traductores automáticos. ¿Necesita ayuda? Póngase en contacto con nosotros

La frase "los datos son el nuevo petróleo" (The Economist, 2017) lleva ya unos años destacando el cambio al que nos enfrentamos en todos los sectores: desde el comercio minorista hasta los medios de comunicación y el entretenimiento, pasando por la asistencia sanitaria y los asistentes personales, el transporte y las plataformas sociales, la realidad hiperconectada genera enormes cantidades de datos. Alimentándose de estos datos, los algoritmos de análisis y aprendizaje automático (ML) están buscando patrones e información para impulsar aplicaciones, empresas en auge y nuevos modelos de negocio.

¿Es el aprendizaje automático aplicable a todos los sectores? ¿Cuál es el lugar del aprendizaje automático en la industria de procesos? ¿Hasta qué punto son seguros y fiables estos algoritmos para operar los procesos?

Estas respuestas están en la confluencia de la teoría de los Sistemas de Control, el Machine Learning y la apertura de la industria a las nuevas tecnologías.

La gran mayoría de los algoritmos que se utilizan son de aprendizaje supervisado: esto significa que estos algoritmos necesitan conjuntos de datos de entrenamiento que sean similares (tengan la misma distribución) a los datos de prueba o de operación normal. Una vez entrenado, el modelo de aprendizaje automático se utiliza con nuevos datos para evaluarlo.
Las empresas que han desarrollado sus productos y servicios integrando el uso de los datos en su núcleo y aplican la recogida de datos respaldada por la monetización de los mismos, lo están haciendo muy bien utilizando toda la paleta de algoritmos que ofrece el Machine Learning. El ejemplo más claro de este tipo de empresas es Facebook, que genera ingresos casi exclusivamente de la publicidad digital. Otra pista sobre lo importante que es tener los datos integrados en el núcleo del negocio es el hecho de que todos los datos que tienen estas empresas, sólo pueden ser monetizados en su máximo valor por la misma empresa; sacados de su plataforma, supongamos que en un dispositivo de almacenamiento (muy grande), los mismos datos no generan el mismo valor por sí mismos; el valor viene cuando los datos se utilizan en el contexto de la plataforma de la empresa: los productos, los servicios, las interfaces con otros terceros son los que generan valor a partir de los datos.

Para las empresas que tenían un negocio antes de la era del Machine Learning, aplicar algoritmos de Machine Learning sobre los datos disponibles y modificar el funcionamiento para incluir las nuevas tecnologías en todo su potencial es un reto, y en eso consiste la transformación digital.

La industria de procesos, como su nombre indica, se ocupa de operar diversos procesos para producir bienes, es una "industria física". El resultado de la operación es un producto final. Ya sea en una planta farmacéutica, petroquímica, energética o de tratamiento de aguas, el proceso tiene que funcionar con valores de consigna controlados, ser robusto frente a perturbaciones y fallos, y tener una estabilidad garantizada. Todo ello se consigue aplicando la teoría de los sistemas de control, una rama de las matemáticas aplicadas que en los dos últimos siglos ha hecho posible la aplicación de todos los avances tecnológicos. Desde el mantenimiento de una presión constante en un depósito hasta la potencia constante de una planta energética o el caudal de agua de una depuradora, la teoría de los Sistemas de Control ayuda a diseñar los bucles de retroalimentación que mantienen los procesos operativos de forma óptima.

El aspecto más importante a la hora de diseñar el control es asegurar la estabilidad de un proceso. El recuerdo de los fallos de estabilidad está presente en la cultura popular como el de la catástrofe de la central de Chernóbil. La primera conferencia del premio Bode del IEEE, "Respetar lo inestable" (Stein, 2003), ofrece una visión profunda del uso de las herramientas de los sistemas de control para evaluar la estabilidad de un proceso.

Aparte de la estabilidad, el control del funcionamiento de un proceso implica la robustez, es decir, asegurar que las acciones de control se vean afectadas sólo en una pequeña parte por mediciones ruidosas o errores de diseño y garantizar que el proceso funcione dentro de los límites de diseño.

Otro aspecto es la naturaleza determinista del proceso y del control: aunque los procesos suelen ser no lineales y se aplican diferentes tipos de algoritmos de Sistemas de Control, al final se obtiene y se utiliza un modelo matemático; este modelo tiene una interpretación directa en el mundo físico y todo el sistema (proceso + control) puede entenderse en detalle. Este aspecto es muy diferente al uso de una red neuronal de Machine Learning donde los diferentes coeficientes de las neuronas en todas las diferentes capas no tienen una interpretación física - esto representa un gran obstáculo en la adopción de Machine Learning en esta industria.

Cerrar la retroalimentación a través de una red neuronal y dejar que un algoritmo de Machine Learning tome el control total de un proceso podría estar muy lejos. Sin embargo, los algoritmos de Machine Learning, con su poder de identificación de patrones, pueden utilizarse para evaluar el estado del proceso en un bucle abierto y dar apoyo a los operadores; en otras palabras, para funcionar como un sistema de apoyo a la decisión.

Las principales ventajas de utilizar algoritmos de aprendizaje automático en este tipo de industrias son: la predicción de fallos, la programación del mantenimiento, la reducción del tiempo de inactividad y de los costes de funcionamiento, y la mejora de la eficiencia mediante la identificación de cuellos de botella y estados de funcionamiento subóptimos.

Los algoritmos de ML más utilizados en los procesos son la detección de anomalías y la clasificación. Un algoritmo de Machine Learning puede ser entrenado con años de datos históricos para predecir y alertar cuando un componente empieza a funcionar mal, cuando se desvía del funcionamiento normal. El arte consiste en proporcionar los datos correctos y las etiquetas correctas al algoritmo: éste informará de una anomalía fuera de la región representada por el conjunto de entrenamiento.
El algoritmo de aprendizaje por refuerzo tiende un puente entre el aprendizaje automático y los sistemas de control, ya que cierra el bucle de retroalimentación e interactúa con el proceso en ambos sentidos: leyendo las mediciones y enviando acciones. Este algoritmo mapea el entorno en un modelo interno y en cada paso selecciona entre un rango de posibles acciones para interactuar con el entorno real con el objetivo de minimizar una función de optimización. Este tipo de algoritmos fue utilizado por DeepMind para ganar al Go contra el campeón del mundo (Silver, 2018) y también para ganar contra oponentes humanos jugando a juegos de PC (Hodson, 2019). Estos algoritmos también encontraron su camino en una aplicación más crítica para el proceso de optimizar el consumo de energía de un centro de datos (Judge, 2019). El reto con este tipo de algoritmos es la alta sensibilidad a los cambios del entorno (como siempre ocurre en la industria): un cambio en el tamaño de la mesa de Go, el cambio de las posibles acciones en un juego de PC o un cambio físico de un elemento de un proceso hace que el modelo quede obsoleto e impone un reentrenamiento costoso y lento.

Aunque todavía es muy optimista esperar que el Machine Learning resuelva todos los problemas que tenemos y optimice el funcionamiento de toda una planta, estos algoritmos pueden funcionar muy bien en algunas aplicaciones particulares que pueden apoyar la toma de decisiones. Al igual que en la parte de optimización, el "control óptimo" es una rama consagrada y madura de los Sistemas de Control con muchos años de estudio e implementaciones exitosas.



Bibliografía

  • Hodson, H., 2019. 1843magazine. [En línea] Disponible en: https://www.1843magazine.com/features/deepmind-and-google-the-battle-to-control-artificial-intelligence [Consultado el 18 de septiembre de 2019].
  • Judge, P., 2019. datacenterdynamics. [En línea] Disponible en: https://www.datacenterdynamics.com/analysis/smartening-how-ai-and-machine-learning-can-help-data-centers/ [Consultado el 18 de septiembre de 2019].
  • Silver, D., 2018. DeepMind. [En línea] Disponible en: https://deepmind.com/blog/article/alphazero-shedding-new-light-grand-games-chess-shogi-and-go [Consultado el 18 de septiembre de 2019].
  • Stein, G., 2003. Respetar lo inestable. IEEE Control Systems Magazine, 7, pp. 12-25, ago. 2003, doi: 10.1109/MCS.2003.1213600 [En línea] Disponible en: https://ieeexplore.ieee.org/document/1213600
  • TheEconomist, 2017. TheEconomist. [En línea] Disponible en: https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-resource-is-no-longer-oil-but-data [Consultado el 18 de septiembre de 2019].

¿Le gusta este artículo? Compártalo con sus amigos