Un centro de datos moderno usa demasiada electricidad y aire acondicionado para funcionar de manera eficiente. Un proveedor de servicios de Internet con tecnología ARM puede llegar a ofrecer páginas web con mucha menos energía que las arquitecturas convencionales (http://tinyurl.com/ApacheOnARM). Al mismo tiempo, los núcleos ARM están siendo rápidamente utilizados por la comunidad científica de Datacenter porque éstos son más rápidos con operaciones intensivas en matemáticas de punto flotante, por una décima parte de los costes de energía, y su hoja de ruta muestra que estar por llegar una arquitectura con un mayor rendimiento por vatio. También existe un creciente interés en HPC (Informatica de Alto Rendimiento) y sus usos en dominios más amplios de la comunidad de desarrolladores de ARM. En el entorno académico, también se habla de la denominada Informática Extrema de Alto Rendimiento (http://www.ieee-hpec.org/) y de la Supercomputación IEEE, que fueron probadas en la reciente conferencia SC13 en Denver, Colorado. Además, el clúster IEEE, con el que se contó en Indiana en 2013, ha propiciado un notable aumento de las publicaciones centradas en ARM.
La mayoría de los modernos centros de supercomputación tienen miles o decenas de miles de núcleos dedicados a sus necesidades particulares de procesamiento. Cada vez que un programador quiere ejecutar una aplicación con una relación de rendimiento mejorada (por vatio, dólar o metro cuadrado) supone una gran ventaja para las partes implicadas del Datacenter, así como para los clientes de dominio informático-científico que soporte. Este es el caso en el que cada vez son más frecuente las situaciones en las que las aplicaciones deben ejecutarse varias veces y en las que múltiples aplicaciones comparten recursos en HPC, de forma muy similar a la nube volviéndose al uso compartido de recursos al viejo estilo.
¿Por qué ARM?
La arquitectura ARMv7 ha demostrado estar a la altura de los desafíos del HPC de diversas formas en las que anteriores arquitecturas ARM no lo consiguieron. Uno podría usar ARM al margen de la eficiencia energética, ya que esta tecnología representa una ruta de crecimiento muy rápida en lo que respecta a la informática integrada. Cuando un Datacenter se compone de más de 10.000 núcleos, se consiguen considerables ventajas a través de mejoras graduales. Estos pequeños cambios pueden sumar ahorros significativos en cuanto a espacio, potencia y refrigeración. Cuando la memoria se comparte entre la CPU y la GPU en SoCs ARM (Sistema en un Chip), se duplica las extensiones SIMD (Single Instruction, Multiple Data) en la GPU NEX Cortex-A15 y se cuenta con un potencial acceso a la memoria considerablemente mayor, se obtienen beneficios en el lugar donde más los necesitamos; donde la aplicación y los conjuntos de datos se entrecruzan. Con la creciente aceptación de GP-GPU (GPU de propósito general) y la expansión de aplicaciones de tipo HPC basadas en aplicaciones de big data, los rápidos modos de computación ARM son más relevantes que nunca, con una ruta tecnológica hacia una participación del HPC en constante expansión.
¿Por qué ODROID?
Hoy en día, ODROID tiene un procesador de la familia Exynos con al menos 4 núcleos ARM. La próxima serie Exynos5 tiene 8 núcleos, 4 de los cuales son ARM Cortex-A15. Hardkernel, al igual que el consorcio de investigación de RunTime Computing Solutions, han demostrado mejoras sustanciales de potencia y rendimiento del XU en comparación con otras arquitecturas modernas. Con el ambicioso calendario de lanzamiento de nuevas tecnologías de Hardkernel, los usuarios de esta plataforma siguen la ley de Moore y el lanzamiento de ARM de manera eficiente, permitiéndoles unirse a la ola de sistemas novedosos, mejores, de bajo coste y con mayor rendimiento a medida que aparecen con una significativa compatibilidad ascendente.
Además, el Cortex-A15 gana en la mayoría de pruebas de rendimiento ARM-HPC (por ejemplo, las NAS Parallel Benchmarks en http://tinyurl.com/ODROID-HPC). El equipo de RunTime Computing Solutions ha demostrado recientemente ventajas muy significantes del A15 frente al A9 en el HPCC Challenge, el estándar de evaluación preferido para HPC (http://hpcchallenge.org/). Esta prueba sólo utiliza los núcleos A15 en el Exynos 5410 y los mantiene a la máxima capacidad durante toda la prueba (http://tinyurl.com/ODROID-LINPACK) lo cual no es una comparación completamente equitativa. No obstante, se puede extraer cierta información significativa de ella; XUJessie es doblemente mejor que U2Whisper en G-HPLINPACK, la primera prueba. Los autores mostraron el SOX BOX en SC13 incluyendo muchas modificaciones de hardware que mejoraron el rendimiento. Echa un vistazo a nuestros sitios para más información.
Conclusión
Actualmente podemos ejecutar muchas aplicaciones de HPC en ODROID, y como las demandas al alza de la eficiencia energética provocan que los profesionales de la industria reconsideren el diseño de los Datacenter, progresivamente más centros adoptarán estas arquitecturas. El futuro es brillante para los diseñadores, ya que la tendencia hacia la computación escalable marca el inicio de un nuevo y emocionante tópico en las tecnologías SoC integradas.
Be the first to comment