La era del petabyte ya ha llegado. Según pruebas realizadas por Toshiba Electronics Europe GmbH en su Lab de Almacenamiento, en la actualidad ya es posible proporcionar un petabyte (1000TB) de almacenamiento online en HDD gracias a los últimos discos duros de capacidad empresarial de 16 TB en un JBOD de 4U con un consumo de energía inferior a 500V. Este consumo varía entre 420V (en reposo, sin actividad de lectura/escritura) y 480V (lectura/escritura continua de bloques de diferentes tamaños).

En configuraciones de almacenamiento típicas, como el mirroring o RAID, también se pueden encontrar capacidades de almacenamiento neto de entre 480 TB (RAID10/mirroring dividido) y 800 TB (RAID60 / paridad dual dividida) utilizando 60 unidades de 16 TB. Esto se traduce en que, en el sistema general, se produce un consumo de energía de aproximadamente 1V por TB de capacidad neta (mirroring) y hasta 0,5V por TB (RAIDs de paridad).

Tal y como se expone en el análisis de la multinacional japonesa, el volumen de datos online está incrementándose de forma continua, por lo que es fundamental desarrollar sistemas de almacenamiento que sean capaces de poder soportar esta avalancha de datos. Obligatoriamente, los criterios para este desarrollo pasan por ajustar el coste por terabyte; reducir las dimensiones físicas de las unidades para no tener que incrementar el espacio de los centros de datos; ajustar el consumo de energía y ofrecer un elevado rendimiento que permita, por ejemplo, hacer una copia de restauración lo más rápido posible.

Así se hizo el estudio

Los discos duros mecánicos o HDDs (Hard Disk drives) ofrecen, con mucho, el coste más bajo por unidad de capacidad para almacenamiento online, por lo que la elección del sistema de almacenamiento es, por supuesto, la unidad de disco duro. Respecto a la relación coste por terabyte, los modelos superiores actuales tienen una ratio similar en discos de 12 TB, 14 TB o 16 TB. Por lo tanto, no existe una preferencia cuando se trata de optimizar la relación coste por terabyte. Sin embargo, cuando se utilizan discos duros de 16 TB son necesarios menos discos para contar con una capacidad determinada en vez de emplear discos de 12 TB o 14 TB. Esto tiene un impacto en otro criterio de optimización: dado que menos discos ocupan menos espacio, a mayores capacidades, la disipación de energía por capacidad también será bastante menor.

Y dentro del mercado de discos duros destaca la oferta de Toshiba. Concretamente, los discos duros de 16 TB de la serie MG08 de Toshiba están disponibles con interfaces SAS o SATA. La interfaz SAS tiene dos canales de 12GB/s, por lo que es adecuada para arquitecturas en las que es importante la velocidad y, sobre todo, la alta disponibilidad. Esto se consigue a expensas de la disipación de energía ya que los discos duros SAS consumen aproximadamente 1-2 V más de energía que los discos duros SATA, debido al mayor consumo de energía de la interfaz. Por ello, el modelo MG08ACA16TE con interfaz SATA es el que permite esa disipación de la energía que se buscaba.

Concretamente, los discos duros de 16 TB de la serie MG08 de Toshiba están disponibles con interfaces SAS o SATA

Otro apartado importante es el de la elección de la arquitectura. En este caso, los modelos superiores de cargador de 45-100 bahías con cuatro unidades de altura (HE) ofrecen el mejor uso de espacio para unidades de disco duro de 3,5” de capacidad empresarial (“nearline”). Están disponibles como servidor (con una placa base) o como JBOD con expansores SAS simples o duales. Para la realización del estudio, Toshiba escogió un modelo común de 60 bahías de AIC, que se adapta a cualquier rack existente de 1000 mm debido a su diseño compacto. Se optó un modelo con expansor único. Esto ahorra costes y disipación de energía, y encaja con los discos duros SATA elegidos que, en todo caso, cuentan con un solo canal de datos en la interfaz. El modelo de AIC seleccionado es el JBOD AIC-J4060-02.

Configuración

Para la realización de este completo estudio, el consumo de energía del JBOD de 60 bahías completamente lleno se midió en los terminales de 220V de las fuentes de alimentación redundante, siempre a una temperatura ambiente de 24°C. En primer lugar, se midió la disipación de energía del JBOD con alimentación, pero sin los discos duros instalados, con un resultado de 80V. El siguiente paso fue instalar una sola unidad en el JBOD y tomar mediciones en diferentes condiciones de carga de trabajo. Además, se midió el consumo de energía durante la lectura /escritura aleatoria de bloques de 4KB, correspondiente a la carga de trabajo del almacenamiento ágil de “datos calientes” en las bases de datos. Para todas las configuraciones de prueba, se midió la disipación de energía, así como el rendimiento resultante (IOPS para aleatorio, MB/s para secuencial). Adicionalmente a estos casos límite, se realizó una prueba con una carga de trabajo próxima a la realidad.

Los valores para la unidad individual (diferencia con los 80V del JBOD vacío) fueron consistentemente más bajos. Con todas las ranuras del JBOD llenas de discos duros de 16 TB se registró la máxima disipación de energía (720V) en la puesta en marcha junto con el consumo de energía en modo inactivo sin actividad de lectura/escritura (420V).

Finalmente, los 60 discos duros en JBOD fueron directamente llamados en paralelo por el sistema operativo con cargas de trabajo sintéticas. En este caso, el consumo de energía activa permaneció constante por debajo de 500V.

Como punto final, los 60 discos duros se configuraron como un pool de almacenamiento en un entorno definido por software, un ZFS (sistema de archivos zettabyte), administrado por el software JovianDSS de Open-E.

En definitiva, toda esta configuración cumple con los parámetros que se propusieron a la hora de realizar el estudio.

Para comprobar como la era del petabyte ya es una realidad, puede ver el caso completo en este whitepaper, PULSANDO EN ESTE LINK.



Source link