En realidad, la IA (inteligencia artificial) se viene utilizando desde hace años en el terreno del almacenamiento, y forma parte activa de la gestión de los sistemas. Lo que va a suponer una disrupción histórica es la aplicación de esas técnicas a la forma en que las propias cabinas gestionan los datos que albergan, y como los distribuyen. A buen seguro, cualquier CIO o responsable de gestión y protección de datos sabrá perfectamente a lo que me refiero, y a buen seguro estará pensando «a ver cuándo llega el día en que lo vemos».
De la gestión externa al dato a la gestión del dato
Porque, hasta ahora, la IA se utilizaba sobre todo como ayuda para la administración de las cabinas. El reporting, por ejemplo, se gestionaba con herramientas dotadas de capacidades de este tipo, que permiten capturar numerosa información desde múltiples cabinas y, mediante herramientas de big data e inteligencia artificial, predecir posibles fallos, establecer medidas probabilísticas sobre el rendimiento y gestionar el mantenimiento de una manera más inteligente.
Hablamos, en definitiva, de una gestión externa al dato. Lo que cambia ahora, y donde está la verdadera disrupción, es que la IA permitirá mejorar la forma en que los sistemas gestionan los datos. A dia de hoy eso es una tendencia, sin duda, pero lo cierto es que hay algunas empresas, como es el caso de Infinidat, que han centrado en esta dirección sus esfuerzos de cara al futuro.
¿Como mejora la IA la forma en que se tratan los datos?
No es sencillo explicarlo, pero su relevancia obliga a intentarlo. En primer lugar, y comenzando por los beneficios tangibles –perceptibles desde el primero momento– podríamos hablar de que permite un uso más eficiente de los recursos. Las funcionalidades de inteligencia artificial permiten a los sistemas de almacenamiento proveer la Información de una forma más rápida, más precisa y más segura. Por poner un ejemplo, es como el cambio que se produjo en la conducción cuando pasamos del callejero al GPS. ¿Alguien querría conducir con un callejero, si se puede circular por cualquier parte del mundo con un GPS?
Estandarización y manejo de datos
Hasta ahora, se habían utilizado diversas políticas para determinar exactamente qué datos se almacenan y dónde. Estas políticas eran definidas desde el principio, en el momento de crear las estructuras correspondientes, y seguían siendo prácticamente iguales, incluso si se realizaban modificaciones menores durante las actividades operativas según fuera necesario. Ahora, sin embargo, todo es mucho más heterogéneo. Asistimos a una profunda transformación en la propia naturaleza del dato, su tipología y su propósito.
Con los sistemas tradicionales, mucho menos dinámicos, una vez hecha la inversión en una determinada dirección, si cambia la naturaleza del dato, gran parte de los esfuerzos anteriores habrán sido en balde; y, por otra parte, los modelos tradicionales no permiten consolidar, porque al haber tantos perfiles diferentes, al final se generan silos. Por contra, el uso de la AI permite a la máquina comportarse en función de cómo se comporta la aplicación, y ofrecer el dato tal como los usuarios de la aplicación lo necesitan.
Automatización
Porque aquí, precisamente, está una de las claves: como automatizar al máximo la gestión del dato. Y lo cierto es que el propio concepto de IA lleva implícita una metodología de automatización, que permite realizar ajustes inmediatos y sin la necesidad de intervención manual, permitiendo además un almacenamiento más económico. Mediante el machine learning, por ejemplo, un motor de IA puede evaluar el comportamiento de los usuarios ante tipos de datos concretos y la naturaleza de su acceso, y asignar ubicaciones para el almacenamiento en función de estos datos. Además, la IA puede servir también para hacer pronósticos sobre la memoria y rendimiento que se van a requerir en el futuro, lo que ayudará a la planificación de la infraestructura y los presupuestos.
¿Donde debe estar el dato?
Un magnífico ejemplo de como la IA puede impactar decisivamente en la forma en que almacenamos los datos: los algoritmos utilizados por los sistemas más modernos son ya capaces de identificar donde debe estar el dato para que sea accesible, para que su almacenamiento y gestión tenga el menor impacto posible en el rendimiento general y, por supuesto, en los costes globales de TI. Todo ello de manera automatizada (inteligente) en función de datos específicos, y no de la intuición de un ser humano. Dada la enormidad de los datos a manejar, decidir de forma precisa dónde deben residir los datos es una tarea que desborda a la mente humana. La intuición ya no vale. Pero la Inteligencia Artificial, aplicada a los sistemas de almacenamiento, sí es capaz de gestionarlo. Y, como en otros muchos aspectos, el día de mañana será una funcionalidad habitual, como otras muchas que ahora no somos capaces ni de imaginar.
Un ejemplo de ello es lo que denominamos «caché neuronal», consistente en algoritmos de machine learning que localizan los patrones de acceso a los datos y asignan recursos según sea necesario, lo que permite al sistema decidir por sí mismo qué datos son relevantes para su acceso desde las aplicaciones de los usuarios. Por ejemplo, los datos utilizados frecuentemente se almacenarán automáticamente en la RAM (mucho más rápida que los medios Flash), mientras que en los medios Flash se almacenarán los datos «calientes» y, por último, los datos que se utilizan con menos frecuencia serán almacenados en unidades SAS mucho más económicas.
Control de costes
Los beneficios de la IA son numerosos, y entre ellos, por supuesto, se encuentra el ahorro de costes. Los sistemas tradicionales de IA (aquellos que comentábamos que se centran en mejorar la gestión externa al dato) la empresa ahorra porque tiene una mucho mayor control de sus sistemas, lo que, por ejemplo, redunda en un mejor servicio de mantenimiento. Pero este nuevo modelo, el que va a suponer una importante disrupción en el almacenamiento tal como lo conocemos actualmente, trae consigo nuevos niveles de eficiencia en costes en por parte de los propios sistemas en la gestión de la información, mejoras muy significativas en rendimiento y disponibilidad. La ecuación es sencilla: los usuarios recibirán un mejor servicio, a un coste inferior.
En definitiva, es un hecho que la Inteligencia Artificial es un aliado de futuro para analizar grandes conjuntos de datos de datos e identificar patrones. Y, precisamente por ello, es y va a ser cada vez más un aliado para los gestores de TI. El siguiente avance pasa por multiplicar la eficacia y la eficiencia en que los sistemas gestionan los datos.
Israel Serrano
Country manager de Infinidat Iberia