El buen momento por el que atraviesa el sector de los centros de datos deja cifras como el crecimiento del gasto en los mismos de un 3,1 % con respecto al año pasado, superando los 46.000 millones de dólares, según la consultora Gartner. Un dato que la tecnológica española PUE, enfocada a la consultoría e implementación de proyectos data & machine learning, pone en valor por la importancia que cobran los datos en la toma de decisiones de las empresas y la expansión de su negocio. Por ello PUE da las claves que marcarán la gestión del sector en 2024, claves que pasan por la implementación del aprendizaje automático, la consolidación del lakehouse como vía de almacenamiento, la creación de espacios de datos para compartir información entre entidades, el diseño de data products específicos para el gobierno de datos y la federación de datos como solución en entornos híbridos y multicloud.
En el primer apartado PUE apuesta porque las empresas asimilen más rápidamente los últimos avances en machine learning, sobre todo en los grandes modelos de lenguaje (LLM) que hacen uso de técnicas de aprendizaje automático para aprender patrones complejos de lenguaje natural basados en enormes cantidades de datos. Y, aunque el procesamiento del lenguaje natural (PNL) seguirá predominando, las compañías acelerarán la incorporación de LLM como GPT de OpenAI y BERT de Google, redundando en avances en la calidad de la interacción con proveedores y clientes, automatización de tareas de procesamiento de lenguaje natural, desarrollo de prototipos y aplicaciones en este ámbito y mejoras en la extracción de la información y la generación de contenidos creativos.
En el ámbito del almacenamiento cada vez más empresas adoptarán arquitecturas data lakehouse, apuntan. Solución que combina las ventajas de los datalakes y los data warehouse ya que los data lakehouse aprovechan la flexibilidad que ofrecen los datalakes, en los que el almacenamiento se lleva a cabo sin procesar, con la capacidad analítica y la estructuración de los datos del data warehouse. Un almacenamiento más completo, sobre todo en lo relativo a la eficiencia, reducción de tiempos y optimización de procesos.
La compartición de información entre entidades en espacios de datos cobrará importancia en las colaboraciones empresariales. Entornos virtuales donde se ponen en común conjuntos de datos de distinta procedencia bajo unas mismas reglas, facilitando la compartición de los mismos entre compañías.
La creación de data products propios por parte de las compañías para optimizar la gobernanza de sus datos y responder a necesidades específicas de su negocio es otra de las previsiones. Herramientas que convierten los datos en información de utilidad que mejora los procesos.
Por último la federación de datos como respuesta al reto de dar acceso a datos distribuidos y descentralizados sin la necesidad de consolidarlos físicamente en un único repositorio central. Esto permite mantener la autonomía de su origen y sacar el máximo partido a los datos sin tener que moverlos físicamente, redundando en la reducción de costes, optimización de recursos y aceleración de procedimientos.