Estamos asistiendo a la época dorada del aprendizaje automático, que alberga grandes oportunidades para las organizaciones a escala mundial. Cerner, líder global en salud y tecnología, está utilizando el aprendizaje automático para predecir la insuficiencia cardíaca congestiva 15 meses antes del diagnóstico clínico. Intuit, una empresa mundial de software empresarial y financiero, identifica las transacciones fraudulentas gracias a esta tecnología. Y con el aprendizaje automático integrado en AWS, la NFL generará nuevos datos sobre las lesiones de los jugadores, las reglas del juego, el equipamiento y la recuperación.
Es fundamental incorporar una mentalidad de aprendizaje automático en el lugar de trabajo. En Amazon, hemos estado trabajando en ello en los últimos 20 años, aplicado machine learning a ámbitos como la personalización, la gestión de la cadena de suministro y los sistemas de previsión para nuestros procesos de logística. Esto no ocurrió de la noche a la mañana; exigió un cambio de cultura corporativa y tecnológico y, hoy en día, no hay una sola función empresarial en Amazon que no se haya mejorado a través del aprendizaje automático.
Estos son los pasos que debes dar para sacar el máximo provecho al machine learning.
Ordena tus datos
Al adoptar el aprendizaje automático, los datos suelen convertirse en el principal desafío. Basándonos en nuestra experiencia con los clientes, más de la mitad del tiempo de desarrollo de modelos de aprendizaje automático se puede dedicar a las controversias y la limpieza de datos, así como a las fases de preprocesamiento.
Deberías empezar por plantearte las siguientes preguntas: ¿Qué datos están disponibles hoy en día? ¿Qué datos pueden facilitarse? Y dentro de un año, ¿qué datos desearemos haber empezado a recopilar hoy?
Para determinar qué datos están disponibles hoy en día, tendrás que superar el «apego» a los datos, esa tendencia de los equipos a guardar los datos con los que trabajan más estrechamente y a no compartirlos con otros grupos. Es crucial superar la compartimentación entre los equipos para tener una visión más amplia del panorama de datos. Además, conviene que te asegures de tener el control de acceso y la gestión de datos adecuados.
Asimismo, necesitas saber qué datos son realmente importantes en el marco de tu enfoque de aprendizaje automático. Al planificar tu estrategia de datos, piensa en los mejores métodos para almacenar los datos e invierte lo antes posible en herramientas de procesamiento de datos para la anonimización si es necesario.
Identificar los problemas empresariales adecuados
Cuando se evalúa cómo aplicar el aprendizaje automático, se debe valorar el problema en tres dimensiones: preparación de los datos, impacto empresarial y aplicabilidad del aprendizaje automático.
Concéntrate en determinados casos de uso empresarial críticos que podrían resolverse en 6-10 meses. En primer lugar, busca lugares donde ya tengas numerosos datos sin explotar y, a continuación, evalúa si el área se beneficiará del aprendizaje automático. Evita escoger problemas llamativos, pero con un valor empresarial poco claro.
Por ejemplo, la Fórmula 1 buscaba nuevas formas de facilitar métricas de las carreras que pudieran cambiar el modo en que los aficionados y los equipos las viven, pero tenía más de 65 años de datos históricos de carreras por analizar. Después de determinar qué datos sin explotar tenían el mayor potencial para ofrecer valor, los científicos de datos de la Fórmula 1 recurrieron a Amazon SageMaker para entrenar modelos de aprendizaje profundo basándose en estos datos históricos con el objetivo de extraer estadísticas de desempeño críticas, realizar predicciones de carreras y transmitir percepciones interesantes a sus aficionados sobre las decisiones y estrategias adoptadas por los equipos y los pilotos en fracciones de segundo.
Además, durante cada carrera, 120 sensores en cada coche generan 3 GB de datos, y se registran 1.500 puntos de datos cada segundo. Para aprovechar esta enorme cantidad de datos, la Fórmula 1 utiliza Amazon Kinesis, que transmite datos en tiempo real para captar y procesar análisis clave de desempeño de todos los coches participantes. A continuación, pueden determinar con precisión cómo se comporta cada conductor en cada vuelta.
Impulsa una cultura corporativa de aprendizaje automático
Tanto los responsables como los desarrolladores deben pensar siempre en cómo pueden aplicar el aprendizaje automático a los diversos problemas empresariales. El aprendizaje automático es una experimentación que mejora con el tiempo, por lo que las organizaciones también deben aceptar los fracasos y adoptar una visión a largo plazo de lo que pueden conseguir.
Un error común es poner a los expertos en tecnología en un equipo separado. Las empresas necesitan combinar expertos técnicos y que dominen la materia para trabajar de forma retroactiva desde el problema del cliente. Esto también ayuda a eliminar la barrera cultural de la adopción con una aceptación más rápida por parte de la empresa.
Del mismo modo, los responsables deben encontrar constantemente formas de facilitar a sus desarrolladores la aplicación del aprendizaje automático. Al utilizar herramientas que abarcan todo el flujo de trabajo para desarrollar, entrenar y desplegar modelos de aprendizaje automático, las empresas pueden llegar a la producción más rápidamente con mucho menos esfuerzo y a un coste inferior.
Por ejemplo, Intuit quería simplificar el proceso de clasificación de gastos para sus clientes autónomos de TurboTax con vistas a ayudar a identificar las posibles deducciones. Utilizando Amazon SageMaker para su herramienta ExpenseFinder, que extrae automáticamente el valor de un año de transacciones bancarias, el algoritmo de aprendizaje automático de Intuit ayuda a sus clientes a descubrir un promedio de 4.300 dólares en gastos empresariales y el tiempo que tardan en desarrollar modelos de aprendizaje automático pasó de 6 meses a menos de una semana.
Desarrolla a tu equipo
El desarrollo de tu equipo es esencial para establecer una cultura de aprendizaje automático exitosa. Esto abarca el desarrollo de las habilidades adecuadas para tus ingenieros y asegurarte de que los responsables de negocio también reciban formación para entender el aprendizaje automático. La contratación de profesionales con talento y amplia experiencia implica una ardua competencia y costes elevados. Puedes cultivar las habilidades de aprendizaje automático de tus desarrolladores a través de programas de formación interna, que también atraen y retienen el talento.
Amazon ha creado una amplia gama de programas para ayudar a los aspirantes a ingenieros a familiarizarse con el aprendizaje automático, independientemente del nivel de habilidad o del sector en cuestión. Hace años, Amazon creó una Universidad de Aprendizaje Automático interna (MLU) para ayudar a sus propios desarrolladores a perfeccionar sus habilidades en la materia o contribuir a que los neófitos adquirieran las herramientas para ponerse en marcha. En 2018, pusimos a disposición de todos los desarrolladores los cursos de aprendizaje automático utilizados para formar a nuestros ingenieros a través de la oferta de Formación y Certificación de AWS. Y en agosto de este año, anunciamos nuevos cursos acelerados impartidos por expertos de Amazon ML que ahora están disponibles online. A partir de 2021, todas las clases de MLU estarán disponibles a través de vídeos a la carta, junto con el material de codificación asociado.
Otro enfoque utilizado por Morningstar —una empresa global de servicios financieros— fue la formación práctica de sus empleados con AWS DeepRacer para acelerar la aplicación del aprendizaje automático en todos los productos, servicios y procesos de inversión de la empresa. Más de 445 empleados de Morningstar participan actualmente en la Liga AWS DeepRacer, que ofrece una forma interesante de mejorar las habilidades y aglutinar a sus equipos globales.
Swami Sivasubramanian
Vice President, Amazon Machine Learning, AWS