Cómo aplicar el aprendizaje automático industrial

Comprender los diferentes tipos de aprendizaje automático, los algoritmos que los respaldan y cómo aplicarlos es fundamental para el éxito de las implementaciones.

El mantenimiento predictivo es la principal aplicación para el aprendizaje automático en la actualidad, seguido de cerca por el control de calidad, el pronóstico de la demanda y la capacitación de robots.
El mantenimiento predictivo es la principal aplicación para el aprendizaje automático en la actualidad, seguido de cerca por el control de calidad, el pronóstico de la demanda y la capacitación de robots.

El concepto de aprendizaje automático se está entendiendo cada vez mejor, a medida que interactuamos con él de manera más cotidiana. Desde las recomendaciones de Netflix y Amazon, pasando por el reconocimiento de voz de Siri y Cortana, hasta los cálculos de tiempo de viaje de Google Maps, cada vez nos familiarizamos más con las tecnologías de aprendizaje automático, incluso si aún no nos damos cuenta de su presencia.

Sin embargo, la aplicación del aprendizaje automático en la industria es otra historia. Aunque varias compañías lo están haciendo, no es tan omnipresente como las aplicaciones orientadas al consumidor mencionadas anteriormente. Y eso fue lo que hizo tan interesante la presentación de Kathy Applebaum y Kevin McClusky sobre la Automatización Inductiva durante la Conferencia de la Comunidad Ignition 2018. En esta presentación se explicaron las principales ramas del aprendizaje automático, los diferentes tipos de algoritmos aplicados en el aprendizaje automático y, lo que es más importante, los pasos que los usuarios industriales pueden dar para empezar a utilizarlo en sus instalaciones.

En cuanto al estado actual del uso del aprendizaje automático en la industria, Applebaum dijo que el mantenimiento predictivo es la principal aplicación de la tecnología, seguida de cerca por el control de calidad, el pronóstico de la demanda y la capacitación de robots.

Applebaum (izquierda) y McClusky durante la presentación de aprendizaje automático en la Conferencia de Ignition Community 2018 de Inductive AutomationApplebaum (izquierda) y McClusky durante la presentación de aprendizaje automático en la Conferencia de Ignition Community 2018 de Inductive Automation

Dado el claro y creciente interés en el aprendizaje automático para aplicaciones industriales, McClusky señaló que el software de Ignition de Inductive Automation puede utilizase ahora en este campo. Con el lanzamiento de Ignition 7.9.8 el pasado mes de mayo, las bibliotecas de Ignition contienen ahora algoritmos de aprendizaje automático que "cubren una variedad de casos de uso", dijo McClusky.

Tipos de aprendizaje automáticoApplebaum señaló que primero es importante entender que existen tres tipos principales de tecnología a los que se hace referencia cuando se habla de aprendizaje automático, y que no faltan los argumentos sobre la superposición entre estos tres. Los tres tipos son:

  • Analítico- "Este es el descubrimiento de conocimiento", dijo ella. "Probablemente ya estemos realizando análisis descriptivos (por ejemplo, ejecutando informes desde bases de datos). El análisis diagnóstico añade un componente de "por qué" a la analítica descriptiva para identificar la causa del problema (por ejemplo, por qué se descompuso la máquina). El análisis predictivo examina lo que podría suceder en el futuro y no suele ser muy específico, pero se basa en lo que ha sucedido antes. Finalmente, la analítica prescriptiva se basa en el análisis predictivo, recomendando un próximo paso para abordar el problema".
  • El aprendizaje automático en sí mismo se refiere al uso automatizado de datos para aprender y mejorar a partir de la experiencia.
  • La inteligencia artificial: "La componen tareas[computacionales] que simulan la inteligencia humana", dijo Applebaum.

AlgoritmosPara ilustrar cómo funcionan los diferentes algoritmos para ofrecer aprendizaje automático en cualquiera de sus tres variantes, McClusky comenzó mostrando cómo la aplicación de aprendizaje automático de Ignition puede utilizarse para agrupar varios puntos de datos. Para esta demostración utilizó mediciones de datos de calidad de aspectos individuales de un proceso de producción (tales como la temperatura y la humedad). Mostrando estos datos en un gráfico de Ignition, McClusky explicó cómo un usuario puede ver los datos de múltiples aspectos en el espacio 2D. "EL software Ignition categoriza sobre la marcha los datos entrantes de los sensores para su uso en las comparaciones gráficas, de modo que se puede ver cómo actúa cada grupo [de datos] al realizar comparación entre sí", dijo.

El algoritmo de aprendizaje automático empleado por McClusky en este ejemplo se conoce como una mina K (que agrupa puntos de datos). "Las minas K no saben lo que representan las categorías, solo calculan centros averiguando dónde está cada punto de datos y qué tan lejos se encuentran", explicó. Esta capacidad hace que las minas k sea buenas en la categorización de datos para el análisis de defectos. Por ejemplo, a medida que una nueva pieza pasa [por producción], se pueden utilizar sus datos para ver si encaja en los parámetros establecidos de 'buena calidad' y determinar si la pieza se acepta o requiere un análisis más profundo.

Otro tipo de algoritmo de aprendizaje automático se conoce como Árbol de decisión. Este algoritmo es "muy potente", dijo Applebaum, "ya que puede llevarnos paso a paso a determinar categorías o fórmulas" para los datos. Los árboles de decisión son útiles para el mantenimiento predictivo porque se pueden utilizar para ver la manera como se tomaron las decisiones. Además, pueden utilizarse junto con otros algoritmos.

El análisis de regresión es un algoritmo de aprendizaje automático que puede utilizarse para el ajuste de procesos y los pronósticos de producción. "Para el ajuste del proceso, el uso de un análisis de regresión puede tomar un proceso manual y hacer que el sistema genere puntos de ajuste recomendados [para aplicación manual] o hacer que los puntos de ajuste vayan directamente al PLC", dijo McClusky. "Incluso puede usarse esto para el control avanzado del proceso de ajuste que se esté ejecutando." Añadió que el análisis de regresión puede utilizarse para el pronóstico de la producción basado en un conjunto actual de variables (es decir, cualquier punto de datos) para determinar, por ejemplo, lo que se producirá en una sola línea, o en general al final de un turno. "También se pueden hacer proyecciones a largo plazo basadas en experiencias pasadas para todas las variables, tales como: de qué manera se verá la producción dentro de una semana o un mes. Incluso puede introducir variables de otros sistemas, como SAP. Para el aprendizaje automático [aplicaciones de análisis de regresión], cuantas más variables se utilicen, mejores serán los resultados, siempre y cuando, para empezar, los datos sean buenos", señaló.

Los algoritmos de la red neuronal simulan la forma en que pensamos que funcionan nuestros cerebros, dijo Applebaum. Una de las formas en que las redes neuronales se utilizan comúnmente en la industria son los sistemas de visión. Con las redes neuronales, se pueden ver elementos específicos en líneas o procesos y usar sensores existentes para inferir datos [de esas áreas] que permitan simplificar los procesos".

Al referirse a una aplicación de aprendizaje automático de sistemas de visión usando Ignition en Frito Lay, McClusky dijo que la compañía la aplicó a un área de una línea donde se encontraba una báscula para pesar las papas. Frito Lay quería utilizar el sistema de visión para determinar la densidad de las papas en la línea, de modo que los tiempos de cocción se pudieran ajustar en consecuencia para cada lote. Pudieron hacerlo con éxito, lo que les permitió eliminar el descarte de una porción de papas por razones de su peso.

Independientemente del tipo de aplicación de aprendizaje automático que se planee utilizar o del algoritmo que se busque aplicar, se requiere contar con buenos datos desde el principio, lo que significa que es necesario tener una estrategia para encontrar los datos correctos y manejarlos de modo que pueda haber seguridad sobre su calidad. "Hay que utilizar estadísticas para tomar muestras de los datos y poder saber si son buenos", dijo McClusky. "Es necesario conocer todo el universo de lo que se está manejando para poder alcanzar buenos resultados. Por lo tanto, no se pueden tomar los datos de los registros históricos por sí solos; hay que tener en cuenta las técnicas de muestreo y la correlación frente a la causalidad. Luego, se debe considerar qué tan buenos son los resultados. Aquí es donde el conocimiento del dominio y de los procesos es importante. Los expertos de los dominios, no los científicos de los datos, saben qué tipo de datos son prometedores y cuándo los resultados no tienen sentido".

ImplementaciónCon una buena comprensión de los tipos de aprendizaje automático y los algoritmos que los respaldan, el siguiente paso es comenzar a pensar en las aplicaciones. Applebaum describió los siguientes cinco pasos para lograr el éxito en la implementación del aprendizaje automatizado: identificar el problema o problemas que desea abordar, recopilar los datos, crear el modelo, implementarlo y supervisar su éxito.

Para identificar el problema, Applebaum afirma que es mejor elegir una pregunta que desee responderse, es decir, si se desea mejorar un proceso específico, disminuir los defectos, etc. Al hacer esto, debe tenerse cuidado con la decisión de alto valor frente a la decisión fácil, advierte. Ella aconseja: "Empezar con una implementación fácil, porque los proyectos de alto valor pueden ser un punto de partida difícil".

Dicho esto, Applebaum subrayó que sigue siendo importante, incluso con proyectos "fáciles" de aprendizaje automático, garantizar que se obtenga algún valor y que no se trate de un proyecto que exista únicamente para demostrar la tecnología. "Hay que comprender la función del costo, la diferencia entre la predicción y los resultados reales, con base en lo que se está tratando de hacer".

Esta es otra área en la que el conocimiento del dominio puede jugar un papel importante en las aplicaciones de aprendizaje automático en términos de selección de datos útiles para el proyecto, adquisición de datos faltantes, aseguramiento de la entrada de datos de calidad e identificación de variables dependientes, es decir, puntos de datos que están vinculados entre sí, como la temperatura y la hora del día.

McClusky agregó que, al implementar un proyecto de aprendizaje automático, hay que asegurarse de usar un proceso de extracción, transformación y carga (ETL en inglés) para adquirir los datos en lugar de la base misma de datos de producción. Hay que automatizar el proceso de adquisición de datos [con un ETL] para que los datos se adquieran y se depuren, y se manejen automáticamente los valores que faltan.

Luego, se comienzan a visualizar los datos de Ignition para ayudar a comprenderlos, de modo que pueda verse qué tipo de algoritmo desea aplicarse, aconsejó Applebaum. "Y no tengan miedo de probar más de uno [algoritmo]". Añadió que Ignition ofrece minas K, escáneres de bases de datos, redes neuronales y regresiones simples; Amazon Web Services, Microsoft Azure y Google Cloud ofrecen otras herramientas para un análisis más profundo.

"Mucha gente intenta economizar en este proceso de pruebas", señaló Applebaum, "pero no lo hagan. Asegúrense de que sus modelos realmente predigan cosas que no han visto antes. Vuelvan atrás y prueben de nuevo las veces que sea necesario hasta obtener un modelo útil. Es mejor pasar tiempo haciéndolo para que quede bien en lugar de tener que arreglar problemas más tarde".