Hace ya un mes que comenzó el nuevo curso en la Universidad de Virginia, así que a la vuelta de vacaciones nos hemos encontrado con Charlottesville lleno de estudiantes de nuevo. Antes de empezar a planear este nuevo curso académico creo que es mejor hacer un resumen del último año, que me quedé después de aprobar los exámenes de cualificación. Este primer post va sobre el paper que nos aceptaron y presenté en Chicago en el workshop Science Cloud -asociado con la conferencia HPDC (High Performance Parallel and Distributed Computing).
El texto completo lo podéis encontrar en este enlace: http://dsl.cs.uchicago.edu/ScienceCloud2010/p01.pdf Un resumen por encima y para los que no estéis especializados en el tema es el siguiente: ahora mismo es posible alquilar ordenadores para ejecutar programas y/o guardar datos en intervalos muy pequeños, a partir de una hora, y a un precio muy barato. Es lo que se llama el cloud computing y hay empresas importantes como Amazon, Google y Microsoft que se están metiendo en este modelo de negocio. Hay muchas personas a las que este modelo les viene muy bien y nosotros ponemos como ejemplo a la comunidad científica. Por ejemplo, un científico tiene su modelo de cómo evoluciona el clima global y lo ejecuta en su ordenador personal. Sin embargo, el nivel de detalle que se puede conseguir con un solo ordenador (incluso de última generación con varios procesadores) es bastante pobre: digamos que el enorme estado de Virginia se modela con 5 puntos diferentes y cada punto nos da información sobre temperaturas medias, etc. Si queremos una resolución mayor, es decir, enterarnos de cómo va a afectar el nuevo clima a las temperaturas de la costa en Virginia Beach o más en el interior en la cordillera de las Blue Rigde Mountains el científico necesita acceso a más ordenadores. Digamos unos 200 ordenadores durante 10 horas. Comprar 200 ordenadores, instalarlos, mantenerlos, pagar por la electricidad, etc. es carísimo y no todos los científicos pueden permitírselo o tener acceso a un centro que lo tenga. Por eso sale mejor pagar a Amazon unos 10 centavos por hora por ordenador: $200 y el cálculo está hecho en una noche en vez de en tres meses.
Éste va a ser el contexto de mi tesis doctoral. A principios del año pasado mi grupo estuvo realizando diversos experimentos en la cloud (nube) de Microsoft, llamada Azure. Nuestra pregunta sería: estoy muy interesado en usar la nube pero la información que veo en las páginas web es bastante vaga, ¿cómo puedo saber cómo se va a comportar mi aplicación y cuál va a ser su rendimiento? ¿Cuáles son las limitaciones o “realmente puedo tener 200 ordenadores a la vez machacando mi base de datos”? Por supuesto, esto es una simplificación y las respuestas tienen muchos matices. Para los que estéis interesados echarle un vistazo al paper que representa mi trabajo del otoño de 2009. Aquí os dejo con el abstract:
A significant open issue in cloud computing is performance. Few, if any, cloud providers or technologies offer quantitative performance guarantees. Regardless of the potential advantages of the cloud in comparison to enterprise-deployed applications, cloud infrastructures may ultimately fail if deployed applications cannot predictably meet behavioral requirements. In this paper, we present the results of comprehensive performance experiments we conducted on Windows Azure from October 2009 to February 2010. In general, we have observed good performance of the Windows Azure mechanisms, although the average 10 minute VM startup time and the worst-case 2x slowdown for SQL Azure in certain situations -relative to commodity hardware within the enterprise- must be accounted for in application design. In addition to a detailed performance evaluation of Windows Azure, we provide recommendations for potential users of Windows Azure based on these early observations. Although the discussion and analysis is tailored to scientific applications, the results are broadly applicable to the range of existing and future applications running in Windows Azure.
Por cierto, la conferencia estuvo bastante interesante y entretenida, incluso nos llevaron en un yate/restaurante por el lago a cenar un día. Y por supuesto, visita al chicagüense de turno.