¿Flash penetrará en los entornos de almacenamiento secundario?
Cuando se presentaron las primeras matrices All-Flash (AFA) en 2011, muchas empresas, analistas y proveedores de almacenamiento empresarial establecidos consideraron que este tipo de sistemas sería demasiado costoso para un uso generalizado en la empresa. Pero para 2019, los AFA estaban generando casi el 80% de los ingresos de almacenamiento externo primario , y las fuentes de ingresos para matrices híbridas flash (HFA) y matrices solo HDD estaban en declive.
La clave de este éxito fue la reducción del costo por gigabyte entre HDD y SSD, impulsada tanto por el uso de tecnologías de reducción de datos en línea como por la continua caída en los costos flash que todavía está en curso.
Las cargas de trabajo primarias sensibles a la latencia proporcionaron otro impulso a la penetración de AFA, ya que la latencia mucho más baja de los SSD generó otros ahorros de costos no disponibles con los arreglos basados en HDD, lo que es más importante, aumentó significativamente la utilización de cómputo, lo que impulsó la necesidad de menos servidores y menos software costos de licencia.
¿Se puede repetir el dominio del gasto de almacenamiento externo primario por parte de sistemas basados en flash para cargas de trabajo de almacenamiento secundario y de nivel 2 menos sensibles a la latencia? Algunos observadores de la industria son escépticos de que esto pueda ocurrir porque el costo de los discos duros utilizados en cargas de trabajo secundarias es mucho más bajo que los discos duros que antes de la llegada de los AFA se usaban con cargas de trabajo primarias de alto rendimiento. Los requisitos de baja latencia que ayudaron significativamente a dominar el gasto de almacenamiento primario tampoco existen con muchas cargas de trabajo secundarias, lo que hace que la barra sea mucho más alta.
Dejando a un lado la baja latencia, flash ofrece una serie de beneficios, aunque son de interés para las cargas de trabajo secundarias. A diferencia de las cargas de trabajo primarias, donde la baja latencia y la disponibilidad muy alta tienden a ser requisitos importantes, las cargas de trabajo secundarias tienden a centrarse más en la escalabilidad de la capacidad y el costo de $ / GB. Pero veamos algunos de los otros beneficios que trae Flash a la mesa:
- Mayor rendimiento y ancho de banda. La capacidad de mover conjuntos de datos grandes rápidamente puede ser muy importante en entornos de respaldo y recuperación ante desastres, tanto para la ingesta rápida de nuevos respaldos como para acelerar la recuperación. Las cargas de trabajo de análisis de big data a menudo también necesitan mover grandes conjuntos de datos, por lo que estas capacidades también podrían ser interesantes allí, particularmente con cargas de trabajo de análisis que tienen algún tipo de sensibilidad temporal.
- Mayor densidad de infraestructura. Muchas cargas de trabajo secundarias escalan al rango de petabytes (PB), y hay muchos centros de datos que se ocupan de decenas o cientos de PB de datos que deben conservarse con el tiempo. Hoy en día, los discos duros más grandes superan los 14 TB, aunque los proveedores de componentes ya están hablando de discos duros de 20 TB en sus hojas de ruta. Los SSD de 30 TB ya se han enviado durante aproximadamente un año, y los proveedores de componentes tienen discos SSD más grandes en sus hojas de ruta. también. Al construir una infraestructura de 10 PB, el sistema que usa los HDD más grandes disponibles sería al menos dos veces más grande que el que usa los SSD más grandes disponibles. Esto no solo requiere más espacio en el piso, sino que también requiere más energía y capacidad de enfriamiento, factores que contribuyen a un TCO general más alto para los sistemas basados en HDD. Si bien el ahorro de costos debido al consumo de energía y espacio en el piso podría ser mínimo si un sistema tiene solo varios cientos de TB de tamaño, con los sistemas de escala PB esos ahorros de costos se vuelven mucho más significativos.El aumento de la densidad del dispositivo reduce el costo de $ / GB de ese almacenamiento. El costo de quince unidades SSD de 1 TB es mayor que el costo de una unidad SSD de 15 TB. A diferencia de los discos duros donde se necesitaba el uso de múltiples dispositivos de menor capacidad para cumplir con los requisitos de mayor rendimiento, el rendimiento de lectura no se ve afectado de esta manera con flash (y las escrituras generalmente se reconocen desde NVRAM en un controlador en sistemas empresariales en lugar de un SSD por lo que no es necesario implementar múltiples dispositivos más pequeños para escalar el rendimiento de escritura para la mayoría de las cargas de trabajo empresariales).Además de las caídas de precios flash debido al volumen y las presiones competitivas, también estamos viendo menores costos flash debido a los nuevos enfoques de empaque de medios, como la tecnología de celda de triple nivel y la celda de cuatro niveles. A medida que los medios flash se vuelven más densos, hay problemas de resistencia y confiabilidad que deben abordarse, pero hasta ahora los proveedores han podido introducir software que hace que estas tecnologías de medios flash más densos sean de «clase empresarial».
- Mejor confiabilidad. Como dispositivos mecánicos, los discos duros tienen partes móviles. Los dispositivos de estado sólido, por otro lado, no tienen partes móviles y, como tales, son más confiables. Los enfoques de codificación de borrado y RAID aseguran que las fallas del dispositivo no afecten la disponibilidad del servicio de la aplicación, pero aún existe el factor de molestia de tener que identificar y reemplazar los dispositivos con fallas. Este problema solo se agrava en configuraciones más grandes como las que se usan a menudo para cargas de trabajo secundarias.
En 2015, Western Digital presentó el primer AFA dirigido para cargas de trabajo de nivel 2 y secundarias, denominado InfiniFlash, pero el sistema no funcionó bien debido a limitaciones de precio y funcionalidad. En 2017, Nimble Storage (ahora propiedad de HPE) introdujo lo que llamó su Secondary Flash Array, un HFA que había sido optimizado específicamente para cargas de trabajo de almacenamiento secundario, pero retiró ese producto del mercado en 2018.
También en 2018, Pure Storage se dio cuenta de que su FlashBlade AFA, que originalmente se había introducido para el sistema de archivos escalable y las cargas de trabajo de análisis de grandes datos, a menudo era comprado por los clientes como un dispositivo de respaldo debido a su capacidad para mover grandes conjuntos de datos muy rápidamente . FlashBlade ofreció un precio mucho más agresivo que Western Digital con su sistema InfiniFlash, debido no solo a la disminución de los precios flash sino también al hecho de que Pure Storage usó sus propios dispositivos de estado sólido de 52TB en lugar de SSD estándar (permitiéndoles para ofrecer un costo menor de $ / GB a escala).
Pure Storage buscó servir más directamente a los mercados de almacenamiento secundario mediante la introducción de un sistema en 2019, FlashArray // C, que había sido específicamente diseñado y destinado a cargas de trabajo de almacenamiento secundario y de nivel 2. En 2019, una startup de almacenamiento, VAST Data, también había introducido una plataforma totalmente flash que estaba específicamente dirigida a este tipo de cargas de trabajo. IDC espera ver más presentaciones como esta de los proveedores en el futuro, incluidos algunos proveedores establecidos.
¿Estos tipos de productos encontrarán un mercado en crecimiento? Un AFA, independientemente de si está dirigido a cargas de trabajo primarias o secundarias, no necesariamente tiene que ofrecer el mismo costo de $ / GB que las plataformas alternativas basadas en HDD. Solo tiene que estar lo suficientemente cerca para que los otros beneficios flash (rendimiento, facilidad de uso, ancho de banda, densidad, confiabilidad y menor costo total de propiedad) ganen el día.
Al igual que en los mercados de almacenamiento primario, los AFA se vendieron inicialmente para aquellas cargas de trabajo más sensibles al rendimiento, y a medida que los costos cayeron con el tiempo, los AFA se vuelven lo suficientemente rentables para un conjunto más amplio de cargas de trabajo. IDC espera que esto suceda en los mercados secundarios. Esas cargas de trabajo que tienen cierta sensibilidad de rendimiento (en términos de rendimiento o ancho de banda) migrarán primero a estos sistemas y, a medida que los costos secundarios de AFA disminuyan con el tiempo, se utilizarán para un conjunto más amplio de cargas de trabajo. Probablemente siempre habrá algunos entornos de almacenamiento en frío, como el archivo profundo, que nunca se moverán a flash, pero eso no significa que los AFA secundarios no serán una mejor propuesta de valor para muchas cargas de trabajo de nivel 2 y secundarias que HDD- sistemas basados.
Traducción del artículo original de IDC
https://blogs.idc.com/2019/12/09/will-flash-penetrate-secondary-storage-environments/
Dic 9,2019 / por Eric Burgener