SCADA/Automatizacion industrial con NLP ¿Es buena idea?
► 19 May 2020 08:25 AM por Oscar Calcaterra
Tiene sentido automatizar un ascensor con reconocimiento de voz para indicarle el nivel deseado, incluso es más rápido y eficaz gritar una orden de “Pare!”, que saltar y localizar el botón correcto de apertura de puerta ante una eventualidad, pero ¿tiene sentido contar con el mismo poder verbal en una línea de producción de alimentos o barbería?
Estamos muy acostumbrados a una pantalla (táctil o no) y teclado para interactuar con una máquina, donde es tradicional, incluso ya familiar e intuitivo el uso de interfaces muy estudiadas que mejoran la experiencia del usuario, todo gracias a décadas de evolución en tecnologías que hacen más económico fabricar, distribuir y usar pantallas digitales de todos los sabores.
También estamos habituados al uso de credenciales de acceso, generalmente en la forma de usuario/clave para ingresar a un sistema protegido y así identificarnos para realizar tareas autorizadas inherentes al grado otorgado y esta metodología, combinada con cifrado ha funcionado muy bien, proporcionando seguridad y privacidad.
Ahora bien, con la ayuda de NLP (Natural Language Processor o Procesamiento de Lenguajes Naturales) podemos interactuar con una máquina de forma elocuente y sin necesidad de hablar de forma especial o técnica; solo basta con indicar naturalmente en una corta frase la acción deseada y los algoritmos extraen con bastante certeza los parámetros y acciones a tomar, como lo vemos actualmente en productos tipo Alexa, Google Home, Siri, y que proporcionan una forma de entrada al mundo de control y automatización.
Entonces, es buena idea controlar un SCADA industrial con el uso de la voz?
Estas reflexiones son producto de varias preguntas e hipótesis que tenido mientras hacemos el desarrollo de proyectos para clientes y con ello he tratado de buscar argumentos para determinar si estamos en el momento de invertir o enfocarnos en el desarrollo de interfaces controlables de forma verbal o, si es simplemente algún aditamento de moda que no tiene bondades tangibles y más bien puede representar grandes desafíos en temas de seguridad. (identificar quien da el comando por ejemplo)
Pedir una dirección al asistente virtual del teléfono y nos de un mapa detallado con instrucciones es una tarea común y ya vemos el uso de Bots en aplicaciones como Whatsapp para hacer pedidos de comida, consulta produtos, disponibilidad de vuelos, información de conciertos, gestiones administrativas, etc; las 24 horas y con respuesta inmediata.
En NLP no es suficiente con comprender solo palabras, se deberá comprender al conjunto de palabras que conforman una oración, y al conjunto de líneas que comprenden un párrafo. Dando un sentido global al análisis del texto/discurso para poder sacar buenas conclusiones.
Nuestro lenguaje está lleno de ambigüedades, de palabras con distintas acepciones, giros y diversos significados según el contexto. Esto hace que el NLP sea una de las tareas más difíciles de dominar.
Entonces, hablemos de automatizar una empresa, específicamente en la línea de producción que cuenta con un SCADA que permite el monitoreo y control de varios elementos y fases en la línea, la cual es monitoreada por operadores humanos que realizan acciones de mantenimiento, producción y algunas veces paradas de emergencias (botón rojo).
El comando “aumentar 5 grados el horno 3” gana en perfección de entendimiento, pero qué ocurre con la instrucción “un poco más frío este horno”? Con el primer ejemplo podemos extraer la variable (5 grados) y donde debe ser cambiada (horno 3), sin embargo, la segunda instrucción es tan vulgar que se requiere de la ayuda de NLP para determinar con algún grado de certeza cuánto se debe reducir la temperatura y de cual horno. Es importante entender el mensaje y obtener del mismo la acción a tomar y para ello nada mejor que usar NLP.
Los humanos no hablamos ni nos expresamos igual para referirnos a alguna acción a tomar, las instrucciones verbales pueden estar acompañadas de gestos con las manos que ayudan a comprender el mensaje y es por ello que pienso en propuestas (dignas de un mundo utópico), que pueden ser logradas si usamos las “convenciones” técnicas correctas.
Qué hacemos con la seguridad y reconocer quién da el comando?
Hablar a un ascensor e indicar el nivel o piso deseado es una tarea super trivial que no representa ningún riesgo de seguridad o prohibición, es decir, cualquier persona de forma anónima puede indicar un piso y la máquina cumplira su funcion de llegar hasta él mismo para abrir sus puertas. Pero qué hacemos en ambientes donde se requiere identificar a la persona que habla y verificar así si tiene privilegios para realizar la acción deseada?
Si bien estamos hablando de reconocer y traducir el significado de una frase verbal, en ningún momento el NLP identifica quien es la persona que habla. Para el dispositivo es igual las instrucciones de un adulto que un niño pequeño.
Debemos contar con un identificador único de voz universal (así como usamos las huellas digitales, usuario/clave o ADN), para poder crear estas interfaces controladas sólo por la voz del operador autorizado.
Reglamentación de seguridad y marco jurídico sobre el cual operar.
El mundo avanza, las innovaciones son constantes y los métodos más aceptados terminan siendo regulados, por lo que no sería sorpresa que en algún momento se fomente globalmente el uso de normas/leyes/buenas prácticas cuando se interactúe con una máquina de control. Establecer responsabilidades si el sistema es vulnerado, dañado o intervenido violando parámetros de seguridad es indispensable.
Estamos hablando de micrófonos encendidos en todo momento, capturando y analizando todos los sonidos, y las empresas requieren garantía en la privacidad de sus comunicaciones, y prácticas correctas en cuanto al manejo de la información.
Conclusiones
El poder de procesamiento y almacenamiento de datos está distribuido globalmente y cada día en más locaciones al menor costo posible, gracias a la feroz competencia en la industria de los Datacenter o servicios en la nube, así que no debe sorprendernos que existan herramientas como DialogFlow de Google disponibles, básicamente sin costo de entrada a cualquier persona que requiera integrar NLP pero no cuente con la infraestructura en AI o redes neuronales.
Repensar en cómo interactuamos con maquinas por medio de voz es indispensable y desconozco si existe algún manifiesto, guía o incluso reglamentaciones a nivel de estado para regular, condicionar y promover el uso de estas tecnologías. Esta es la siguiente tarea que tengo en esta búsqueda de argumentos.
¿Existen leyes (y precedentes) donde se pueda culpar a X persona de una mala acción, cuando la orden vino de otra persona Y pero que fue reconocida por la máquina como X.?
Ciertamente habrá elementos donde agregar control por voz sea una buena idea, especialmente tras la pandemia del COVID-19 que ha creado un nuevo orden mundial y se busca evitar tocar cosas en sitios públicos. Veo parte del confort y buenas prácticas, al igual que contar con A/C, controles remotos, cámaras, etc., el implementar servicios autónomos que no requieran tocar teclados, pantallas o dinero en efectivo.
Explicarle a un robot barbero el tipo de corte que deseamos por medio de comandos tan subjetivos y emocionales como lo puede ser un estilo de peinado, puede no ser tan buena idea y terminar con otro estilo totalmente distinto al deseado, solo por la interpretación distinta que tuvo el robot del NLP.
REALIZADO POR:
Oscar Calcaterra
ocalcaterra@innotica.net
REFERENCIAS:
Escrito por:
Oscar Calcaterra
Edificios inteligentes
Sistemas HVAC
Construcción sostenible
Ciudades inteligentes