Cada vez más empresas abrazan el big data. Algunas para poder gestionar el gran volumen de información de la que disponen, proveniente de una creciente variedad de formatos y orígenes, no solo internos sino externos y que requieren de una alta velocidad de tratamiento y gestión para poder tomar las decisiones necesarias en el momento adecuado. Y otras para reducir sus costes tecnológicos.
Desplegar, administrar y gobernar una arquitectura big data no es una tarea baladí. Es un nuevo ecosistema tecnológico que contempla múltiples componentes y requiere nuevas competencias para su gestión. Además, es necesario disponer de capacidades de analítica avanzada que posibiliten la extracción de valor de los datos.
Pero a todas estas dificultades, que hay que superar para aprovechar las capacidades del big data, hay que añadir otros retos inherentes al trabajo con grandes volúmenes de datos y con técnicas de analítica avanzada que las empresas no pueden obviar, ya que suponen grandes riesgos.
Retos
En este artículo abordo los principales retos a los que se tendrán que enfrentar las compañías que procesen grandes cantidades de información para que puedan incorporarlos en el plan de desarrollo de esta estrategia.
Vivimos en un mundo conectado que nos permite interactuar con nuestros clientes, con organizaciones públicas y con otras empresas. Esto nos posibilita capturar una cantidad ingente de información disponible que enriquezca nuestros modelos de datos y mejoren todos los procesos. Pero esta conexión también contribuye a que las empresas puedan ser víctimas de ciberataques como el robo de 500 millones de cuentas a Yahoo en 2014 o un caso más reciente, el robo de 2,5 millones de libras de las cuentas de 9.000 clientes de Tesco Bank https://www.theguardian.com/business/2016/nov/08/tesco-bank-cyber-thieves-25m el pasado noviembre. Ninguna empresa está libre de estos ataques, que suponen un enorme riesgo operacional y por supuesto, perjudica su reputación. Las empresas no pueden poner en riesgo la información, ni los bienes o servicios digitales de sus clientes. Por este motivo, deben disponer de protocolos de seguridad que aseguren la robustez e integridad del sistema ante ciberataques.
El uso de información privilegiada por parte de los propios empleados de la compañía o incluso su venta a terceros es otro riesgo que puede afectar a todas las compañías, como le ocurrió a la aseguradora Aviva cuando un empleado vendió información confidencial http://www.bbc.com/news/business-35063022
de 14.000 clientes a terceros que lo utilizaban con fines comerciales. Este caso se une a otros más mediáticos como la lista Falciani del banco HSBC o los papeles clasificados de la CIA desvelados por Edward Snowden. Los datos que procese cualquier empresa, incluso aunque no sean personales, deben ser considerados como un activo muy valioso y muy delicado que debe ser tratado con responsabilidad. Las empresas no pueden limitarse a cumplir la Ley Orgánica de Protección de Datos, tienen que ser conscientes de la importancia de una gestión responsable de los datos. Para esto, es necesario establecer un sistema de gobernanza del dato que permita la trazabilidad completa de la información y la de su uso por parte de los empleados e instaurar un sistema de control para impedir los usos inadecuados de los datos.
Las empresas están transformándose en compañías orientadas al dato, incluyendo tanto los internos como los externos en todos los procesos de toma de decisiones. En este sentido, cobra especial importancia la veracidad de los datos puesto que una decisión con información errónea puede mermar la rentabilidad de la compañía. Las empresas no pueden confiar en la veracidad de la información que captura y almacena, principalmente la generada fuera de la misma, como ha pasado en las pasadas elecciones estadounidenses donde empresas de contenidos, como Facebook, han divulgado información no veraz entre sus clientes http://www.vox.com/new-money/2016/11/16/13637310/facebook-fake-news-explained. Las empresas deben establecer sistemas de control de la veracidad de la información y, en caso de duda, no incluirla en los procesos automáticos de toma de decisiones.
Dotar de inteligencia artificial los productos y servicios de la entidad es una de los objetivos en los próximos años. Pero esto conlleva una gran responsabilidad debido a que las decisiones autónomas de los productos desarrollados dependerán del aprendizaje del algoritmo utilizado y las reglas básicas que se hayan considerado. Así, actualmente se plantean dilemas éticos, por ejemplo en la conducción autónoma donde el coche, ante una situación de accidente, tendrá que decidir qué hacer para minimizar los daños y su decisión dependerá de los criterios y las valoraciones que se le hayan incluido. En este sentido, la estrategia de la compañía será clave. Con el objetivo de atraer a los compradores, Mercedes-Benz anunció que sus vehículos priorizarían la vida de los ocupantes por delante del resto http://fortune.com/2016/10/15/mercedes-self-driving-car-ethics/. Aunque más tarde matizaron que las empresas no pueden cuantificar el valor de las vidas humanas. Del mismo modo, la inteligencia artificial tendrá que decidir a qué cliente vender el último producto, qué pedidos priorizar, qué pacientes atender primero, qué clientes asegurar, etc.. Por este motivo, las empresas tendrán que establecer principios éticos a la hora de desarrollar sus productos o servicios que incorporen inteligencia artificial.
Durante 2016 han sido muchos los casos de empresas, como Microsoft o Tesla y productos como Pokemon Go, que han desplegado productos o servicios basados en técnicas de machine learning o inteligencia artificial que no han cumplido el objetivo acordado o han presentado sesgos conflictivos, entre ellos racistas http://www.techrepublic.com/article/top-10-ai-failures-of-2016/ Por este motivo, las empresas no pueden fiarse ciegamente de los algoritmos de machine learning o inteligencia artificial. Deben contar con profesionales expertos en dichas disciplinas que aseguren que los productos o servicios desarrollados que incluyan inteligencia cumplen los objetivos esperados.
El Big Data no ha mostrado aún todo su potencial en la gestión de la información, sin embargo las empresas que lo utilizan están aprovechando su gran poder. Pero como concluyeron grandes personajes como Voltaire, Roosevelt o Churchill: “Un gran poder conlleva una gran responsabilidad”. Aunque nos fascine el poder que nos ofrece, no podemos olvidar la responsabilidad que tenemos los que trabajamos con datos, puesto que un uso irresponsable o una dejadez de nuestras responsabilidades puede suponer un riesgo enorme para las compañías.
Antonio Pita
Director de business analytics en Liberbank