30.07.2015 Views

Actas JP2011 - Universidad de La Laguna

Actas JP2011 - Universidad de La Laguna

Actas JP2011 - Universidad de La Laguna

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Actas</strong> XXII Jornadas <strong>de</strong> Paralelismo (<strong>JP2011</strong>) , <strong>La</strong> <strong>La</strong>guna, Tenerife, 7-9 septiembre 2011MétricaIPCTABLA II: Métricas seleccionadasLLC miss rateL2 miss rateExecution stallsRetirement stallsDescripciónNúumero <strong>de</strong> instrucciones retiradaspor cicloNúmero <strong>de</strong> fallos <strong>de</strong> cache <strong>de</strong> últimonivel (L3) por cada mil instruccionesretiradasNúmero <strong>de</strong> fallos <strong>de</strong> cache <strong>de</strong> L2por cada mil instrucciones retiradasNumero <strong>de</strong> ciclos por cada mil ciclos<strong>de</strong> procesador en los ningunainstrucción ha finalizado su fase <strong>de</strong>ejecuciónNumero <strong>de</strong> ciclos por cada mil ciclos<strong>de</strong> procesador en los que no seretira ninguna instrucciónaditiva permiten establecer un ranking <strong>de</strong> las métricasexploradas en base a su relevancia. Esta informaciónfacilita la selección <strong>de</strong>l subconjunto <strong>de</strong> métricasque contribuyen en mayor medida a la aproximación<strong>de</strong>l SF, permitiendo una utilización efectiva <strong>de</strong> loscontadores hardware <strong>de</strong>l procesador.El proceso completo para la generación <strong>de</strong>l mo<strong>de</strong>lo<strong>de</strong> estimación pue<strong>de</strong> resumirse en los siguientespasos:1. Seleccionar un conjunto AP <strong>de</strong> aplicaciones secuencialesrepresentativas y un conjunto M <strong>de</strong>métricas <strong>de</strong> rendimiento.2. Ejecutar las aplicaciones <strong>de</strong> AP en ambos tipos<strong>de</strong> core para obtener su SF y monitorizar lasmétricas <strong>de</strong> rendimiento en M usando los contadoreshardware <strong>de</strong>l procesador.3. Construir el mo<strong>de</strong>lo <strong>de</strong> estimación para aproximarel SF <strong>de</strong>s<strong>de</strong> cada core <strong>de</strong> la siguiente forma:a) Aplicar regresión aditiva para aproximar el SFusando como training set los SFs obtenidospara las aplicaciones en AP junto con los valores<strong>de</strong> las métricas en M.b) Obtener el subconjunto <strong>de</strong> métricas SM ⊆ Mcon mayores coeficientes <strong>de</strong> regresión obtenidosen el paso anterior, tal que los contadoreshardware necesarios para monitorizar esasmétricas no exceda el número <strong>de</strong> contadoreshardware en la plataforma.c) Aplicar regresión aditiva <strong>de</strong> nuevo para obtenerel mo<strong>de</strong>lo <strong>de</strong> estimación final usando únicamentelas métricas en SM.Como conjunto AP <strong>de</strong> aplicaciones representativaspara construir el mo<strong>de</strong>lo en nuestra plataformaseleccionamos los benchmarks <strong>de</strong> las suites SPECCPU2006 y CPU2000. <strong>La</strong> tabla II <strong>de</strong>scribe el conjuntoSM <strong>de</strong> métricas, usado para la construcción <strong>de</strong>los mo<strong>de</strong>los finales en ambos cores. <strong>La</strong>s figuras 2ay 2b muestran la comparación entre el SF observadoy el estimado en cores rápidos y lentos, respectivamente.Los resultados revelan una mayor precisiónen los SFs predichos <strong>de</strong>s<strong>de</strong> el core rápido que <strong>de</strong>s<strong>de</strong>el lento. No obstante, este no es un comportamientoinesperado, ya que, intuitivamente, resulta muchomás sencillo pre<strong>de</strong>cir qué aplicaciones sufrirían másal reducir ciertas capacida<strong>de</strong>s microarquitectónicasestimated SFestimated SF2.221.81.61.41.2mgrid00 applu00wupwise00perlbmk00crafty00galgel00sixtrack0011 1.2 1.4 1.6 1.8 2 2.2observed SF2.221.81.61.41.2lbm06(a) Estimación en el core rápidogobmk06mgrid00tonto06wupwise00hmmer06calculix0611 1.2 1.4 1.6 1.8 2 2.2observed SF(b) Estimación en el core lentoFig. 2: SFs observados y predichos para losbenchmarks <strong>de</strong> las suites SPEC CPU2000 y SPECCPU2000. Se proporciona el nombre <strong>de</strong> aquellas aplicacionescon peores resultados <strong>de</strong> predicción.en un core (estimación <strong>de</strong> SF <strong>de</strong>s<strong>de</strong> el core rápido),que i<strong>de</strong>ntificar <strong>de</strong> manera precisa qué programas experimentaríanlos mayores beneficios al añadir hardwareadicional (estimación <strong>de</strong> SF <strong>de</strong>s<strong>de</strong> el core lento).Durante el proceso <strong>de</strong> diseño <strong>de</strong> CAMP <strong>de</strong>tectamosque las imprecisiones presentes en el mo<strong>de</strong>lo <strong>de</strong>estimación <strong>de</strong> SF pue<strong>de</strong>n mitigarse utilizando intervalos<strong>de</strong> SFs, en lugar <strong>de</strong> emplear directamente elvalor numérico proporcionado por la estimación. <strong>La</strong>sfronteras entre los intervalos <strong>de</strong> SF mencionados semuestran en las figuras 2a y 2b como líneas rojashorizontales.Finalmente, cabe <strong>de</strong>stacar que para realizar unaevaluación más exhaustiva <strong>de</strong> la efectividad <strong>de</strong> nuestromo<strong>de</strong>lo, hemos incluido experimentos con cargas<strong>de</strong> trabajo que incluyen aplicaciones que no han estadoinvolucradas en la generación <strong>de</strong> los mo<strong>de</strong>los <strong>de</strong>estimación (sección V).V. ExperimentosPara el análisis <strong>de</strong>l planificador CAMP hemos empleadoun prototipo <strong>de</strong> sistema asimétrico diseñado<strong>JP2011</strong>-248

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!