Sobre el papel muchas opciones pueden parecernos inicialmente claras frente a otras. Así, un coche deportivo puede parecernos ofrecer un rendimiento significativamente mayor que un vehículo normal y corriente, pero sus deficiencias se aprecian fácilmente cuando llega la hora de llevar a los niños a la escuela, trasladar a casa las compras del supermercado o pasar a recoger unos muebles por una tienda. Y para la mayoría de las personas es necesario elegir una opción u otra. Un dilema similar se aplica en el mundo del almacenamiento de datos. Sobre el papel los SSD son claramente los ganadores, ya que ofrecen un alto rendimiento, mientras que la conocida alternativa de HDD, aunque más barata e incluso ofreciendo más capacidad por unidad, resulta la menos atractiva de las dos. Pero esta comparativa sobre el papel no tiene en cuenta lo que supone verdaderamente ponerse al volante y conducir a diario estos dos medios de almacenamiento.
Llevando a cabo una comparativa
En los últimos años el almacenamiento basado en flash, como los SSD, ha evolucionado para proporcionar capacidades enormes en formatos con un tamaño cada vez más pequeño. Al no ser mecánicos, son resistentes y robustos para su uso en portátiles y otros dispositivos móviles. Como no necesitan buscar sectores en un plato giratorio, también son significativamente más sensibles que los discos duros y, por lo general, proporcionan un mayor rendimiento en comparación con los HDD en términos de operaciones de entrada / salida por segundo (IOPS). Los discos duros, por su parte, se han centrado en el almacenamiento masivo, creciendo hasta alcanzar capacidades de 16 TB por unidad y 20 TB en el horizonte. La introducción del helio como el gas utilizado dentro de la unidad, junto con las mejoras continuas en la tecnología del eje y el controlador del disco, significan que otras especificaciones, tales como el ruido, el consumo de energía y el rendimiento, también se encuentran en un proceso de mejora continua. Sin embargo, es evidente que los HDD nunca competirán contra los SSD simplemente por el ruido, el rendimiento o el consumo energético.
Con la comparación frente a frente inclinada obviamente hacia una preferencia por los SSD, el siguiente asunto clave es el coste. Las ventajas de los SSD tienen un alto precio, y actualmente tienen un coste por TB hasta 18 veces superior que los HDD entre dispositivos de igual clase. Algunas aplicaciones justifican este gasto, como la unidad de arranque de un servidor u otras aplicaciones de nivel 0 en las que tiene sentido el uso de una o un conjunto de unidades. Por supuesto, esto también conduce a considerar que podría construirse un sistema equipado con SSD y HDD que proporcione lo mejor de ambos mundos, al ofrecer una combinación de alto rendimiento y un gran volumen de almacenamiento.
Sin embargo, a escala, la realidad resulta diferente, especialmente cuando se trabaja dentro de los límites de un presupuesto definido. La mayoría de las aplicaciones de almacenamiento necesitan encontrar un buen equilibrio entre la capacidad total y el rendimiento, especialmente en las áreas de aplicaciones comunes de alojamiento web, servicio de correo electrónico, almacenamiento genérico, virtual y en la nube, backup y archivo, y entrega de contenido. Utilizando un presupuesto definido, Toshiba realizó una investigación para ver en qué punto el cambio a HDD proporciona más rendimiento que un sistema basado únicamente en SSD empresariales (eSSD).
Para este análisis se construyó un sistema basado en ocho eSSD SATA de 1.6 TB conectados a un controlador SuperRAID Adaptec de Microsemi en un chasis Supermicro. Configurado en RAID6 para proporcionar la mayor cantidad de almacenamiento posible, el sistema ofrece una capacidad neta de alrededor de 10 TB pero con doble paridad para la protección de datos. Las unidades seleccionadas también ofrecen 3DWPD (escritura de unidades por día), el mínimo recomendado para aplicaciones activas de almacenamiento empresarial.
Con la misma inversión, se construyó un sistema comparable con 24 discos duros SAS de 10.500 RPM y 2,4 TB. Como el sistema competía con SSD de alto rendimiento, se configuraron en RAID10. Esto permitió que las bandas RAID0 paralelas agregaran rendimiento mientras que la duplicación RAID1 brindaba protección de datos, aunque con una sobrecarga del 50% para esa protección. El controlador RAID procedía del mismo proveedor que el anterior sistema, con un chasis para la mayor cantidad de unidades en un JBOD (Just a Bunch of Disks) de 2U con intercambio en caliente de AIC. Esta configuración proporcionó un almacenamiento total de alrededor de 30 TB.
Se crearon cargas de trabajo aleatorias utilizando la herramienta Flexible IO Tester “FIO” de código abierto para la evaluación comparativa sintética de diferentes cargas de trabajo en sistemas de almacenamiento. Esto proporcionó un método para comparar resultados para diferentes tamaños de bloque en los dos sistemas. Como era de esperar, la solución eSSD ofrece mayor rendimiento y transferencia de datos para bloques pequeños de entre 4k y 32k bytes. La plataforma HDD se sitúa entre 1,6 y 7 veces por detrás de la plataforma eSSD en términos de IOPS en este rango.
Sin embargo, para bloques con tamaños de 64k byte y superiores, el impacto en el rendimiento del mayor número de HDD empieza a apreciarse. De hecho, se lograron mejoras en IOPS del 14%, que alcanzaron hasta el 86% en el caso del aumento del tamaño del bloque a 512k byte.
Por supuesto, hay que tener en cuenta que las aplicaciones del mundo real no consisten en un único tamaño de bloque, sino que incluso dividen el sistema 20/50/20/10 en bloques de 4k, 64k, 256k y 2M de bytes, respectivamente; y aquí el servidor HDD continúa proporcionando un IOPS un 37% superior en comparación con su equivalente eSSD.
Investigaciones adicionales también muestran que, con el mismo presupuesto, 60 discos duros SATA de 2TB y 7.200 RPM pueden organizarse en una configuración RAID10 y ofrecen IOPS aún más altos. En comparación con la disposición eSSD con un tamaño de bloque de 64k bytes, el IOPS es un 69% más alto, e incluso ofrece una mejora del 48% sobre el servidor equipado con unidades de disco duro de 10.500 RPM. Todo esto en el caso de una capacidad total de alrededor de 60 TB, el doble que el ejemplo anterior de HDD y seis veces más que la solución eSSD.
Por supuesto, los centros de datos están cada vez más preocupados por el consumo energético y, obviamente, grandes cantidades de discos duros HDD no pueden competir con la baja demanda de energía de los eSSD. Sin embargo, en conjunto, la solución HDD no queda tan mal parada cuando también se considera que el rendimiento respecto a los eSSD ha mejorado y que la capacidad de almacenamiento disponible es significativamente mayor. Volviendo a los dos primeros ejemplos, la solución eSSD requeriría alrededor de 788 kWh por año frente a 2015 kWh por año del HDD. Asumiendo un coste 0.07€/kWh y una eficacia de uso de energía (PUE) de 1.3, la solución HDD solo requiere 110 € más en coste de energía al año, lo que equivale a menos de 10 € adicionales al mes.
Los centros de datos no se construyen ni se actualizan todos los días, de modo que un administrador diligente también necesita tener en cuenta las mejoras tecnológicas que probablemente llegarán en el futuro. La tecnología Flash parece estar avanzando a un ritmo rápido y es justo preguntarse si los SSD podrían alcanzar un precio que los haga más atractivos en ese periodo de tiempo. La realidad es que la industria fabricó alrededor de 800 EB (Exabyte – 800M TB) de almacenamiento HDD en 2018, pero solo se fabricaron alrededor de 100 EB por parte de los proveedores de SSD.
Actualmente, los fabricantes de memoria flash están destinando sus inversiones al aumento de la capacidad, pero las proyecciones actuales indican que se requerirán entre 100.000 y 200.000 millones de dólares para duplicar la capacidad de memoria flash existente. Teniendo en cuenta las tasas actuales, eso solo cubriría una cuarta parte del consumo existente. Con los discos duros HDD, destinados a alcanzar 20 TB por unidad en los próximos 12-18 meses, está claro que en el futuro previsible los SSD no lograrán reducciones significativas en el coste por terabyte, ni tampoco se producirá una mejora significativa de su precio por terabyte.
Está claro que hay aplicaciones y casos de uso específicos en los que los SSD tienen una clara ventaja sobre los HDD, y es probable que ese número aumente con el tiempo en lugar de disminuir en la comparación de funcionalidad, capacidad y precio. Lo que es seguro es que los HDD tienen un papel claro que desempeñar y por mucho tiempo. La mejora continua en el consumo energético y el rendimiento, aunque limitada, ayudará a que la balanza se incline a favor de los HDD, mientras que el precio por terabyte y la capacidad por unidad siempre serán favorables a los HDD. Lo que muestra claramente esta investigación es que el rendimiento de un sistema al mismo coste y bajo condiciones similares, los HDD pueden superar significativamente a los SSD y con capacidades totales convincentes, por un coste mínimo adicional en energía.
Rainer W. Kaese
Director senior de Toshiba Electronics Europe GmbH