Los nuevos Terabytes son los Petabytes

  • Opinión
Israel Serrano, Infinidat (2)

El almacenamiento de datos se ha convertido en un área crítica no sólo para los departamentos de TI, sino para toda la sociedad. El crecimiento exponencial de los datos que transitan por todo el planeta es uno de los pocos retos tecnológicos actuales que quedan por resolver. Pero esa ?explosión de datos? ha pillado con el pie cambiado a las tecnologías imperantes en el panorama tecnológico actual, ya que los costes derivados de enfrentarse a esta situación a través de sucesivas ampliaciones, actualizaciones o sustituciones del hardware es, sencillamente, inasumible.

Analizando la situación, cabe establecer como paralelismo otro fenómeno para el que también era necesario encontrar una solución, como es el problema del agua en Sudáfrica. Hablamos de un déficit de mil millones de metros cúbicos por año entre 2015 y 2018, y 60 millones de personas en riesgo. El pensamiento convencional dice que, ante una situación así, lo lógico es tender a incrementar el suministro, es decir, aumentar la producción de agua. Así se ha hecho, por ejemplo, con la puesta en marcha de costosísimas desalinizadoras que, sin embargo, sólo han atendido a un 2% de ese déficit.

Tras años de respuestas ineficaces, algunas localidades del país han adoptado un nuevo enfoque, centrado no tanto en incrementar la producción de agua, sino en hacer la gestión más eficiente. Un buen ejemplo es la agricultura de precisión, programa puesto en marcha por la firma especialista en tecnología de farming Senwes junto con INFINIDAT y John Deere, y que consiste en un gran número de centros de IoT que transfieren datos telemétricos sobre la salud de las plantas, el estado del suelo, etc. Esos datos se analizan y se generan señales de control que permiten a los equipos acudir de inmediato allí donde haga falta agua o fertilizante. Los resultados han sido sorprendentes: una reducción de hasta un 40% en el gasto de agua y fertilizante, con impacto cero sobre el rendimiento.

Volviendo al ámbito de la tecnología, la estrategia de incrementar el rendimiento y la capacidad del hardware para escalar, que ha sido la tónica general mientras los datos se contaban por Terabytes, es del todo inaplicable ante los volúmenes actuales y futuros, que se miden en Petabytes, porque los costes se disparan. Empresas como INFINIDAT proponen un nuevo enfoque que, al igual que con la lucha contra la escasez de agua, se centran en mejorar la eficiencia en la gestión de los datos, a través de un modelo definido por software con técnicas de machine learning e inteligencia artificial.

Además de ser mucho más rápidos y capaces de manejar enormes volúmenes de datos, estos sistemas deben ser eficientes en costes, a fin de poder aplicar esta tecnología en países como Sudáfrica (donde la renta media en algunas partes del país es un tercio de la media de la OCDE), que no pueden permitirse esquemas de precios como los que se aplican en Norteamérica o Europa.

La clave está en el software

Hasta ahora, cuando había que mejorar una infraestructura de almacenamiento, se ha venido haciendo como se haría, por ejemplo, con un PC estándar; si se quiere almacenamiento barato, se integra una unidad de disco de bajo coste, o se puede poner un SSD; si se necesita velocidad, pasamos a NVMe… Pero este modelo, que funcionaba muy bien a escala Terabyte, se vuelve enormemente costoso cuando se trabaja a escala Petabyte. Hablamos de añadir discos para subir uno, dos, cinco Terabytes; imaginen dónde llegaríamos con este modelo si hubiera que escalar a 4 o 5 Petabytes.

Para solventar esta problemática, los esfuerzos en I+D en algunas empresas, en lugar de centrarse en un hardware de alto coste que luego habrá que integrar y configurar con software, se han basado en utilizar un software más inteligente, y ejecutarlo con hardware de propósito general. En el caso de INFINIDAT, esto es posible dotando al sistema de un cerebro, un núcleo que mantiene una memoria de todas las escrituras que se han hecho, desde el nacimiento y lo largo de toda la vida del dato, hasta el presente. Los metadatos son almacenados en una estructura especial que permite mantener un índice y un seguimiento de los datos, y que es per se la historia de todo lo que el sistema de almacenamiento ha visto. Todo ello manejado por el sistema de cache neuronal, un algoritmo de machine learning que procesa esa historia y utiliza esos datos para predecir el futuro.

Por explicarlo de forma gráfica, sería como hablar de un iceberg: existe una pequeña porción de los datos en la superficie (los que se utilizan más frecuentemente, que son ubicados en unidades RAM, y los datos calientes, que se ubican en unidades Flash); y luego, sumergida, una enorme cantidad de datos (Petabytes) con baja probabilidad de uso y que estarían en una plataforma de almacenamiento de muy bajo coste. Todo ello permite, además, llegar a un esquema de precios realmente competitivo, cercano al coste de un disco estándar, pero que rinde como una cache RAM multi-Petabyte.

En definitiva, el futuro está marcado por la transformación digital, y ésta, a su vez, exige tratar volúmenes de datos sin precedentes. Los Petabytes son los nuevos Terabytes. Las empresas deberán potenciar su ventaja competitiva basándose en los datos, y la elección de una infraestructura de almacenamiento moderna, que crezca y que aprenda, a escala multi-Petabyte, es una decisión crítica en el presente que afectará decisivamente en el futuro.

Israel Serrano, Country Manager de INFINIDAT Iberia