Machine Learning: cómo implementarlo en su negocio

El aprendizaje automático tiene varios resultados comerciales potenciales. Como elemento fundamental de análisis predictivo , su aplicación es la base para la implementación y evolución de los procesos de Analytics, que ofrecen valiosos subsidios para la toma de decisiones.

Sin embargo, los resultados de Machine Learning en las mejoras no siempre son tan sorprendentes como esperaban los analistas de implementación, ni tan prácticos y aplicables como la empresa contratante quería …

En general, las empresas a veces no logran las mejoras comerciales que ofrece el proyecto. En nuestra amplia experiencia con varios proyectos de inteligencia y analítica de datos, encontramos que cuando esto ocurre, las causas están relacionadas con la dificultad de diseñar, ejecutar y medir las acciones necesarias para obtener las mejoras en base a los resultados. de modelos de aprendizaje automático .

En este artículo, analizaremos el proceso de implementación y aplicación del aprendizaje automático en empresas que tienen como objetivo mejorar procesos y estrategias.

Hablaremos sobre los desafíos y cómo enfrentarlos, los procedimientos involucrados y qué se necesita para acercar su negocio a resultados realmente efectivos con Analytics avanzado .

En primer lugar, ¿qué es el aprendizaje automático?

Machine Learning es una rama de la inteligencia artificial (IA) que busca equipar a las máquinas con capacidades de aprendizaje , es decir, generar conocimiento a partir de un conjunto de experiencias. Para comprender mejor, piense en la comparación: programar una máquina para que se pueda mover es muy diferente de permitirle aprender para moverse.

Algunas técnicas dentro del aprendizaje automático son árboles de decisión, modelos de regresión, modelos de clasificación, técnicas para generar clústeres y, posiblemente, las redes neuronales más recordadas.

En el contexto de la estrategia y los negocios, el aprendizaje automático está estrechamente relacionado con el procesamiento y análisis avanzado y dinámica de datos para apoyo constante al proceso de decisión.

¿Cuáles son los desafíos para obtener resultados con el aprendizaje automático?

En proyectos de Analytics problemáticos, los resultados de la aplicación de modelos de Machine Learning suelen ser confusos. No reflejan claramente los problemas reales y manejables del negocio, generando una gran frustración ante el esfuerzo e inversión realizados.

Las causas que generan esta situación se pueden agrupar en 3 amplias categorías:

  • expectativas de las personas involucradas,
  • técnicas utilizadas
  • enfoque del proyecto

Las diferentes expectativas de quienes participan en proyectos de aprendizaje automático

Desafortunadamente, es relativamente común que no exista una reconciliación orgánica y natural entre las expectativas de los ejecutivos de la empresa y los resultados entregados por el científico de datos.

El ejecutivo espera poder obtener conocimientos que le ayuden a decidir qué hacer, es decir, qué acciones o decisiones debe tomar y cuáles serán los resultados obtenidos. Por ejemplo, en qué porcentaje puede revertir el comportamiento de un determinado indicador si realiza determinadas acciones.

Por otro lado, el científico de datos se enfoca en encontrar las variables y sus respectivos pesos que discriminan el problema predicho. Esta situación puede generar un abismo irreconciliable entre estos 2 “mundos”, el del analista y el del gerente.

En general, las empresas a veces no logran las mejoras comerciales que ofrece el proyecto. En nuestra amplia experiencia con varios proyectos de inteligencia y analítica de datos, encontramos que cuando esto ocurre, las causas están relacionadas con la dificultad de diseñar, ejecutar y medir las acciones necesarias para obtener las mejoras en base a los resultados. de modelos de aprendizaje automático .

En este artículo, analizaremos el proceso de implementación y aplicación del aprendizaje automático en empresas que tienen como objetivo mejorar procesos y estrategias.

Hablaremos sobre los desafíos y cómo enfrentarlos, los procedimientos involucrados y qué se necesita para acercar su negocio a resultados realmente efectivos con Analytics avanzado .

En primer lugar, ¿qué es el aprendizaje automático?

Machine Learning es una rama de la inteligencia artificial (IA) que busca equipar a las máquinas con capacidades de aprendizaje , es decir, generar conocimiento a partir de un conjunto de experiencias. Para comprender mejor, piense en la comparación: programar una máquina para que se pueda mover es muy diferente de permitirle aprender para moverse.

Algunas técnicas dentro del aprendizaje automático son árboles de decisión, modelos de regresión, modelos de clasificación, técnicas para generar clústeres y, posiblemente, las redes neuronales más recordadas.

En el contexto de la estrategia y los negocios, el aprendizaje automático está estrechamente relacionado con el procesamiento y análisis avanzado y dinámica de datos para apoyo constante al proceso de decisión.

¿Cuáles son los desafíos para obtener resultados con el aprendizaje automático?

En proyectos de Analytics problemáticos, los resultados de la aplicación de modelos de Machine Learning suelen ser confusos. No reflejan claramente los problemas reales y manejables del negocio, generando una gran frustración ante el esfuerzo e inversión realizados.

Las causas que generan esta situación se pueden agrupar en 3 amplias categorías:

  • expectativas de las personas involucradas,
  • técnicas utilizadas
  • enfoque del proyecto

Las diferentes expectativas de quienes participan en proyectos de aprendizaje automático

Desafortunadamente, es relativamente común que no exista una reconciliación orgánica y natural entre las expectativas de los ejecutivos de la empresa y los resultados entregados por el científico de datos.

El ejecutivo espera poder obtener conocimientos que le ayuden a decidir qué hacer, es decir, qué acciones o decisiones debe tomar y cuáles serán los resultados obtenidos. Por ejemplo, en qué porcentaje puede revertir el comportamiento de un determinado indicador si realiza determinadas acciones.

Por otro lado, el científico de datos se enfoca en encontrar las variables y sus respectivos pesos que discriminan el problema predicho. Esta situación puede generar un abismo irreconciliable entre estos 2 “mundos”, el del analista y el del gerente.

Los errores técnicos más comunes en los proyectos de aprendizaje automático

En el aspecto técnico, podemos señalar 2 tipos de errores que se observan con frecuencia al implementar Machine Learning en el negocio.

El primero se refiere a los entregables del proyecto. Las técnicas actuales de Machine Learning no generan entregables que permitan acciones directas para el negocio. En otras palabras, resultados puramente matemáticos y estadísticos presentan una gran dificultad para ser leídos comercialmente . Son números y datos que contienen información, pero esa información no se convierte en recomendaciones prácticas para la empresa.

El segundo error se refiere a resultados de medición . Es extremadamente importante para cualquier empresa poder evaluar con precisión el resultado de cada medida o decisión. Y en muchos proyectos de Machine Learning es difícil medir las mejoras logradas por el negocio con la implementación de las acciones propuestas. Por ejemplo, un porcentaje de mejora no se puede asociar fácilmente con cada acción realizada. Con esto, no se sabe con certeza qué movimiento de la empresa logró la mejora esperada .

Los desafíos del enfoque del proyecto

Finalmente, abordamos los proyectos con enfoque en satisfacer los deseos o necesidades comerciales . Pero esto a menudo se hace sin hacer una identificación metodológica de los problemas comerciales, los casos de uso, que reflejan cómo el aprendizaje automático se integrará con el día a día y sus estrategias de la empresa.

Este cuidadoso proceso de identificación lleva tiempo, pero ciertamente vale la pena. Sin ella, no se siguen metodologías integrales, abarcando desde la detección del caso de negocio de forma exhaustiva y completa, hasta las formas de medir las mejoras y los factores que evidencian la monetización.

Ajuste de expectativas, técnicas empleadas, enfoque metodológico completo: todos estos son factores esenciales para alinear los resultados con la estrategia empresarial. También son la base para crear componentes analíticos y agregar mejoras reales a los proyectos de aprendizaje automático.

Ahora que hemos planteado los principales puntos de alerta, exploremos con mayor profundidad los aspectos que deberían estar presentes en un proyecto de Analytics consistente que involucre Machine Learning < / b> .

Descripción general de un proyecto de Analytics avanzado

Una buena manera de resumir hacia dónde queremos llegar con un proyecto de Analytics avanzado que está «en ejecución» en la organización es considerar que tenemos:

  • Datos de diferentes fuentes en los que se trabajará y que formarán parte del conjunto de datos comerciales junto con otros elementos
  • Machine Learning en acción , habilitando la tecnología utilizada para analizar estos datos y “training -a ”constantemente para hacerlo aún mejor (en términos de habilidades predictivas, incorporando nuevos conocimientos y factores de impacto)
  • Entregas : conocimientos, información y datos nuevos que respaldarán la toma de decisiones. la implementación de acciones y la medición precisa de sus resultados en diferentes aspectos del negocio

Para que todo esto suceda, son necesarias diferentes etapas de planificación y ejecución, conocimientos especializados, así como una atención especial a los obstáculos y desafíos que se deben prevenir y controlar. Además, por supuesto, las técnicas aplicadas, nuestro próximo tema aquí.

EL VALOR DE LOS ASPECTOS TÉCNICOS

El problema técnico es un pilar fundamental para proyectos exitosos que involucran Machine Learning. Conoce a continuación sus principales elementos a la hora de implementar Analytics avanzado en el negocio:

1. Construyendo un conjunto de datos de calidad

El conjunto de datos, el conjunto de datos en el que se trabajará, es la «materia prima» para la extracción de información de valor comercial . Por lo tanto, es esencial crear un conjunto de datos con la mayor cantidad de columnas «sin procesar» de los sistemas de origen. El conjunto de datos debe recibir y absorber datos de diferentes fuentes, incluidos DWH, ODS, CRM y los Data Lakes recientemente incorporados.

  • DWH, o Data Warehouse: es un repositorio unificado de todos los datos que recopilan los distintos sistemas de información de un empresa. Tiene fines analíticos y de informes.
  • OSD: es un repositorio unificado que generalmente solo almacena datos operativos y tiene fines analíticos y de informes.
  • CRM: solución de seguimiento de relaciones con los clientes, normalmente orientada a gestionar tres áreas básicas: gestión comercial, marketing y posventa o servicio al cliente.
  • Data Lake: es un repositorio de almacenamiento que contiene una gran cantidad de datos sin procesar, estructurados y no estructurados, independientemente de su fuente o formato. Actualmente, en la mayoría de los casos, se basa en el sistema Hadoop.

2. Elección de la técnica de aprendizaje automático

Este es el momento de elegir y aplicar una técnica de aprendizaje automático

  • que sea realmente adecuado para el problema que desea modelar;
  • que utiliza los datos disponibles;
  • y aproveche al máximo los datos.

Aquí viene el análisis cuidadoso de los recursos de Inteligencia Artificial disponibles. La inteligencia artificial es una rama de la informática que busca desarrollar máquinas y sistemas capaces de «imitar» comportamientos inteligentes, como realizar interacciones, analizar patrones, reconocer voces o jugar un juego. En ciertos aspectos, el desempeño es superior al de un ser humano, especialmente en términos de agilidad y precisión.

3. Elección de algoritmos de análisis

Una vez que se selecciona la técnica de Machine Learning, es el momento de seleccionar el algoritmo o conjunto de algoritmos que ofrecen el mejor resultado en el análisis predictivo. Es decir, cómo se procesarán y trabajarán los datos de manera efectiva para brindar conclusiones precisas y realmente útiles para la empresa.

Nunca está de más enfatizar la importancia de evaluar cuidadosamente estos algoritmos: después de todo, estamos hablando de algo que se convertirá en una fuente de información para una organización.

Un buen ejemplo de una técnica para hacer esta elección es utilizar la matriz de confusión. Se trata de una forma de medir el rendimiento del aprendizaje automático, en la que los aciertos y errores del algoritmo se evalúan de forma ponderada, de acuerdo con su “peso” en los procesos en los que se insertan – procesos de decisión empresarial, por ejemplo. En otras palabras, el impacto real del rendimiento del aprendizaje automático se mide en función del contexto de su aplicación.

Enriquecimiento del conjunto de datos

Como mencionamos anteriormente, el conjunto de datos es como la materia prima para Analytics. Y para obtener el mejor rendimiento, no puede limitarse solo a datos sin procesar: las variables «sin procesar».

A partir de la experiencia profesional en el apoyo a muchas empresas en sus procesos de análisis avanzados, la importancia de enfatizar es muy clara
proceso de creación del conjunto de datos y enriquecimiento con variables derivadas e hipótesis comerciales .

De esta manera, el conjunto de datos se convierte en un «punto de partida» más sólido para la ruta que conduce a análisis más precisos y efectivamente aplicables.

Por lo tanto, el conjunto de datos enriquecido consta de:

  • VARIABLES “RAW”: los datos tal como están, provenientes de sus diferentes fuentes y recién organizado e incorporado al sistema
  • VARIABLES DERIVADAS: se crean a partir de variables sin procesar. Incorporar conocimiento empresarial , aumentando la capacidad predictiva del algoritmo de aprendizaje automático. Su uso puede evitar la obtención de resultados obvios en los procesos de modelado predictivo, lo que se considera la pesadilla de un científico de datos.
  • HIPÓTESIS DE NEGOCIOS: definido como situaciones comerciales comunes a los problemas que serán modelados / tratados y que ya se han observado en otros clientes e industrias, especialmente en el mismo segmento de la empresa en cuestión. Aportan amplitud y aplicabilidad a la analítica predictiva.

Conjunto de datos enriquecido y nuevos componentes de modelo predictivo

Con el conjunto de datos enriquecido, los resultados obtenidos de las pruebas e hipótesis comerciales permiten incorporar nuevos componentes a los modelos predictivos. Estos componentes son características que permiten:

  • Desarrollar la inteligencia artificial
  • Segmentar clientes por situaciones comerciales comunes
  • Utilice técnicas de aprendizaje por refuerzo , permitiendo abordar el mismo problema simultáneamente con el mismo conjunto de datos a partir de diferentes técnicas de Machine Learning (supervisadas y por refuerzo), aumentando así el rendimiento del modelo predictivo
  • En técnicas supervisadas, identifica las «fuerzas» eso
    • mantener a los clientes o la entidad estudiada en condiciones estables
    • mueva clientes o entidades fuera de balance incluso

Por lo tanto, los procesos de analítica avanzada verdaderamente efectivos deben apoyarse en la adopción de estos componentes, que brindan una mejora comprobada y resultados con un alto apego a las acciones que las empresas deben desarrollar.


LOS 7 GRANDES DESAFÍOS DEL APRENDIZAJE MÁQUINA PARA SU NEGOCIO

Ahora que tenemos una mejor comprensión de los elementos técnicos estructurales, profundicemos en el tema de los desafíos que pueden enfrentar las empresas que deciden adoptar un proyecto de Analytics coherente.

1. El desafío de la incertidumbre para utilizar los entregables del proceso analítico

¿Se pueden activar los entregables del modelo? En otras palabras, su organización tiene el análisis en la mano, pero ¿hasta qué punto será realmente posible convertirlo en acciones que resuelvan o minimicen los problemas en foco?
Un ejemplo práctico: los resultados en proyectos para el desarrollo de modelos analíticos para identificar de manera predictiva a los clientes que presentarán una queja en ese período de tiempo han demostrado que en muchos casos , 3 de las variables de mayor impacto serían la frecuencia de visita al punto de servicio, la cantidad de crédito asignado y la ubicación geográfica. Si bien explicaron la probabilidad de quejas en un 80%, se necesita un esfuerzo importante por parte de la empresa para definir estrategias comerciales que, utilizando estas 3 variables, reduzcan las quejas.

La aplicabilidad de los entregables de un modelo predictivo está estrechamente relacionada con la forma en que se construyó y cómo evoluciona, dentro de la realidad de cada negocio. El cuidado en la etapa inicial marca la diferencia: después de todo, es él quien alineará los modelos y análisis con las necesidades y capacidades reales de su empresa.

Por eso son tan importantes

  • la construcción y el mantenimiento de un conjunto de datos que incorpore no solo datos simples, sino también las variables e hipótesis que conectan los análisis a su negocio
  • la calidad del proceso de aprendizaje automático, que permite la constante evolución de la asertividad de los análisis realizados < / li>

Ahora, considerando la aplicabilidad de las entregas, las organizaciones también deben estar equipadas para hacer los movimientos necesarios . No tiene sentido tener análisis precisos a la mano: estos por sí solos no promoverán el cambio.

2. El desafío de alinearse con las creencias organizacionales sobre los problemas enfrentados

Aquí, la pregunta es: ¿los entregables del proceso analítico permitirán responder o aclarar las dudas de los ejecutivos sobre los principales problemas «conocidos» por la empresa?
El proceso analítico debe poder probar (o negar, si corresponde) sobre una base sólida las creencias de la organización sobre los hechos de negocio , con el fin de generar un análisis que se convierta en nuevo conocimiento. Definitivamente no estamos hablando de suposiciones, y esa capacidad es un componente metodológico obligatorio en el proceso de modelado predictivo.

Además: las organizaciones deben estar preparadas para enfrentarse a la forma en que ven sus problemas . Los análisis bien fundamentados a menudo amplían, y a menudo transforman, la percepción de los gerentes y tomadores de decisiones, sacando a la luz elementos que antes estaban al margen y definiendo el impacto real de los factores en los resultados comerciales.

3. El desafío de identificar problemas estructurales o cíclicos

Este aspecto está relacionado con la frecuencia de situaciones comerciales. Es fundamental identificar con precisión si las situaciones empresariales probadas con hechos y datos son problemas estructurales o cíclicos. Este es un factor determinante tanto para la calidad del análisis en sí como para la efectividad de las acciones derivadas del mismo .

Es de gran valor para las empresas poder ver si los problemas comerciales que se tratan a través de los modelos de aprendizaje automático son nuevos, antiguos, esporádicos, endémicos, tienen una periodicidad definida y si afectan o no a los principales indicadores del negocio.

4. El desafío de no mirar «solo el ombligo»

¿La situación empresarial en la que trabaja la empresa objetivo es «exclusiva» para el desarrollo del modelo? ¿O se repite en otras organizaciones?

Para la definición de movimientos estratégicos, es de gran importancia para la empresa probar o desmentir en su interior situaciones de negocio que ocurren en otras empresas, ya sea de la misma industria o de un segmento diferente .
Resolver / minimizar un «problema propio» o tratar un «problema crónico» puede requerir caminos muy diferentes. Además, el conocimiento profundo del mercado incorporado a su proyecto tiene un impacto decisivo en el alcance y la calidad de los modelos predictivos desarrollados. < / span>

5. El desafío de la alineación comercial y estratégica con los resultados de los modelos predictivos

¿Existen campañas o acciones comerciales en su empresa, como atraer, retener, monetizar, retener, etc., ya definidas y que puedan ser activadas por los resultados de los modelos?

Los resultados de los modelos predictivos no deberían requerir que la empresa cree estrategias comerciales complejas «desde cero» . Si esto sucede, estos resultados pueden convertirse simplemente en «teoría», o proyectos que, aunque están muy bien desarrollados técnicamente, no tienen ningún efecto o impacto en el negocio, debido a su imposibilidad de implementación.

6. El desafío de conocer las situaciones comerciales que acercan o alejan a la empresa de sus objetivos

¿Cuáles son las situaciones comerciales, comprobadas con hechos y datos, que la empresa debe promover y cuáles debe evitar?

Muchos de los entregables de Machine Learning se centran solo en aprender a evitar una situación, por ejemplo, abandonar a los clientes y aumentar las quejas. Por tanto, necesitan ser complementados con datos derivados del proceso analítico y, con ello, informar a la empresa si está tomando las acciones correctas para que los clientes queden satisfechos.

Y es fundamental que los factores relacionados no solo con acciones correctivas o preventivas – sino también aquellos relacionados con acciones que impulsen el negocio hacia sus objetivos y que sean capaces de < / span> promover la verificación de la efectividad de las acciones implementadas.

7. Desafíos inherentes al proceso de generación de conocimiento con Machine Learning

2021-02-18T15:00:57-03:00
Go to Top