Siempre que hablamos de big data pensamos en grandes cantidades de datos, pero esta tecnología es más que un cúmulo de datos de proporciones increíbles y es por esto que se suelen tener en cuenta las cinco «v» para definir los objetivos que se pueden lograr mediante el big data.
Las cinco «V» del big data
1. Volumen
Un sistema big data está pensado para trabajar con es grandes volúmenes de datos y es capaz de almacenar esa gran cantidad de datos mediante infraestructuras escalables y distribuidas. Los sistemas de datos tradicionales, que en la actualidad continúan vigentes en muchas empresas, comenzaron a padecer problemas de rendimiento al tener que trabajar con cantidades de datos que superaban, en muchos casos, los petabytes.
2. Velocidad
Una de las características más importantes de nuestras sociedad actual es el afán por obtener respuestas en tiempo real. Todo circula a velocidades de vértigo para satisfacer las demandas de los usuarios y por este motivo, el tiempo de procesado y de respuesta sobre estos grandes volúmenes de datos, debe ser la preocupación principal de las empresas. Sin embargo, obtener resultados en tiempo real y procesarlos de forma rápida, no lo es todo. La forma de recibir estos datos también es importante ya que las fuentes de las que proceden los datos pueden llegar a generar mucha información cada segundo y obligan al sistema receptor a tener la capacidad para almacenar dicha información de forma rápida y eficaz.
3. Variedad
Gracias a las nuevas fuentes de datos ha surgido una amplia variedad de información y, por tanto, han aparecido nuevos tipos y formatos de esta. Un ejemplo, son los datos no estructurados que un sistema big data es capaz de almacenar y procesar sin tener que realizar un pre-proceso para estructurar o indexar la información.
4. Variabilidad
Las tecnologías que componen una arquitectura big data deben ser flexibles para poder adaptarse a nuevos cambios en el formato de los datos, tanto en la forma de obtención de estos como en su almacenamiento y su procesado.
5. Valor
El objetivo final del big data es extraer valor de toda la información almacenada, a través de distintos procesos, de manera eficiente y con el coste más bajo posible. De esta manera, un sistema big data debe extraer dicho valor en forma de nueva información de la manera más rápida y eficiente posible, adaptándose a todos los formatos existentes y futuros.