13.07.2015 Views

Módulo II. Diseño y evaluación en la experimentación formal.

Módulo II. Diseño y evaluación en la experimentación formal.

Módulo II. Diseño y evaluación en la experimentación formal.

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Módulo</strong> <strong>II</strong>. <strong>Diseño</strong> y <strong>evaluación</strong> <strong>en</strong> <strong>la</strong> experim<strong>en</strong>tación <strong>formal</strong>.


• <strong>Diseño</strong> y <strong>evaluación</strong> <strong>en</strong> <strong>la</strong> experim<strong>en</strong>tación<strong>formal</strong>.• Esca<strong>la</strong>s y medición• Proceso y diseño de <strong>la</strong> experim<strong>en</strong>tación <strong>formal</strong>Agradecimi<strong>en</strong>tos por parte del material aJavier Do<strong>la</strong>do, Universidad del País Vasco


• La experim<strong>en</strong>tación provee una manera sistemática,disciplinada, cuantificable y contro<strong>la</strong>da de evaluaractividades desarrol<strong>la</strong>das por humanos (Wholin et al,2000).• Refer<strong>en</strong>cias <strong>en</strong> <strong>la</strong> ing<strong>en</strong>iería del software• Do<strong>la</strong>do Cosín, J.J. y Fernández Sanz L. (2000). Mediciónpara <strong>la</strong> gestión <strong>en</strong> <strong>la</strong> Ing<strong>en</strong>iería del Software. Ra‐Ma.• Wohlin C., Runeson P., Höst M., Ohlson M., Regnell B. andWesslén A. (2000). Experim<strong>en</strong>tation in SoftwareEngineering: An Introduction. Kluwer AcademicPublishers.• Juristo, N. Mor<strong>en</strong>o, A., (2001) Basics of SoftwareExperim<strong>en</strong>tation, Kluwer Academic Publishers.


• Definición de los elem<strong>en</strong>tos y <strong>la</strong>s propiedadesque deb<strong>en</strong> cumplir los estudios empíricos• C<strong>la</strong>sificación los difer<strong>en</strong>tes tipos de diseñosexperim<strong>en</strong>tales• Riesgos para <strong>la</strong> validez interna de cada uno deellos, con indicación de <strong>la</strong>s técnicas útilespara el control y <strong>la</strong> medición• Réplicas de experim<strong>en</strong>tos y familias deestudios


• La teoría de <strong>la</strong> repres<strong>en</strong>tación de <strong>la</strong>medición establece los principios g<strong>en</strong>eralesde <strong>la</strong> medición y su validez.• Esta teoría trata de expresar de formanumérica (mundo <strong>formal</strong>) <strong>la</strong>s <strong>en</strong>tidades delmundo real (o mundo empírico) y <strong>la</strong>correspond<strong>en</strong>cia <strong>en</strong>tre ambos mundos.


• Se d<strong>en</strong>omina <strong>en</strong>tidad a un objeto que va a sercaracterizado mediante una medición de susatributos. (ISO/IEC 15939)• Un atributo es una característica medible deuna <strong>en</strong>tidad.


• La medición es el proceso por el que se asignannúmeros o símbolos a atributos de <strong>en</strong>tidades delmundo real para describirlos según unas reg<strong>la</strong>sdefinidas de antemano.• Medida es <strong>la</strong> asignación de un símbolo o númeroresultado de una medición a una <strong>en</strong>tidad paracaracterizar un atributo.F<strong>en</strong>ton, N.E. y Pfleeger S.L., Software Metrics: ARigorous and Practical Approach, 2nd edition, 1998


• Una esca<strong>la</strong> de medición es un conjunto devalores que permite establecer re<strong>la</strong>ciones<strong>en</strong>tre medidas. Con frecu<strong>en</strong>cia dichoconjunto es continuo, está ord<strong>en</strong>ado y vi<strong>en</strong>edelimitado por un punto inicial y otro final.


• Esca<strong>la</strong> nominal. Formada por categorías <strong>en</strong>tre <strong>la</strong>s cuales no existe ningún ord<strong>en</strong>.P.e., L<strong>en</strong>guaje: {Java, C++, Phyton}.• Esca<strong>la</strong> ordinal. Define categorías pero existe una re<strong>la</strong>ción de ord<strong>en</strong> "es m<strong>en</strong>or que"<strong>en</strong>tre el<strong>la</strong>s. P.e., <strong>la</strong> esca<strong>la</strong> de Likert, {Muy poco, Poco, Medio, Bastante, Mucho}.• Esca<strong>la</strong> intervalo. En esta esca<strong>la</strong> <strong>la</strong> distancia <strong>en</strong>tre intervalos es conocida y siempre <strong>la</strong>misma, si bi<strong>en</strong> no ti<strong>en</strong><strong>en</strong> un valor inicial de refer<strong>en</strong>cia o cero absoluto.• P.e. <strong>la</strong> temperatura <strong>en</strong> Celsius donde <strong>la</strong> difer<strong>en</strong>cia <strong>en</strong>tre 12ºC y 13ºC es <strong>la</strong> mismaque <strong>en</strong>tre 24ºC y 25ºC, pero no podemos decir que a 24ºC haga ``el doble de calor''que a 12ºC. Fechas, podemos decir que un proyecto estará <strong>en</strong> el día 200, pero noque un proyecto va a empezar el ``doble de tarde'' que otro.• Esca<strong>la</strong> de ratio. Ti<strong>en</strong><strong>en</strong> un valor inicial de refer<strong>en</strong>cia o cero absoluto, y permit<strong>en</strong>definir ratios coher<strong>en</strong>tes con los valores de <strong>la</strong> esca<strong>la</strong> (se pued<strong>en</strong> comparar los valoresestableci<strong>en</strong>do proporciones). P.e., temperatura <strong>en</strong> Kelvin.• Esca<strong>la</strong> absoluta. Las esca<strong>la</strong>s absolutas ti<strong>en</strong><strong>en</strong> <strong>la</strong>s características de <strong>la</strong>s esca<strong>la</strong>santeriores, si bi<strong>en</strong> consist<strong>en</strong> simplem<strong>en</strong>te <strong>en</strong> el conteo. P.e., número deprogramadores.


Esca<strong>la</strong>OperacionesestadísticasNominal moda =Ordinal medina >,


• La experim<strong>en</strong>tación <strong>formal</strong> busca medir re<strong>la</strong>ciones causales con <strong>la</strong> mayorexactitud posible, i.e., establecer el grado de influ<strong>en</strong>cia de unas variables <strong>en</strong>otras.• Para ello es necesario configurar <strong>en</strong>tornos <strong>en</strong> los que se t<strong>en</strong>ga un alto nivel de control sobre <strong>la</strong>svariables para, modificándo<strong>la</strong>s, medir sus efectos.• F<strong>en</strong>ton y Plfeeger c<strong>la</strong>sifican <strong>la</strong> experim<strong>en</strong>tación <strong>formal</strong> como investigación a pequeña esca<strong>la</strong>(research in the small) debido a <strong>la</strong> dificultad de contro<strong>la</strong>r todos los posibles factores.• Se suel<strong>en</strong> realizar <strong>en</strong> <strong>en</strong>tornos académicos o <strong>en</strong> organizaciones con un grupo reducido detrabajadores, precisam<strong>en</strong>te por <strong>la</strong> dificultad m<strong>en</strong>cionada, lo que ha hecho que a estos estudiostambién se los conozca como experim<strong>en</strong>tos in vitro.• Los experim<strong>en</strong>tos <strong>formal</strong>es son por tanto más difíciles de diseñar y más costososque <strong>la</strong>s <strong>en</strong>cuestas o los casos de estudio.• La experim<strong>en</strong>tación <strong>formal</strong> ayuda a confirmar teorías, explorar re<strong>la</strong>ciones causaefecto<strong>en</strong>tre variables, corroborar o rechazar cre<strong>en</strong>cias sobre métodos, procesosy tecnologías, validar métricas, etc.


• Definición: int<strong>en</strong>ción del experim<strong>en</strong>to, es decir, cuáles son sus objetivos, <strong>en</strong> qué contextose llevará a cabo, cuál es su propósito, etc.• Objetivo‐Preguntas‐Métricas Goal Question Metric)• P<strong>la</strong>nificación: Se diseña el experim<strong>en</strong>to mediante el <strong>en</strong>unciado de <strong>la</strong>s hipótesis, <strong>la</strong>selección de variables de estudio, <strong>la</strong> selección de los sujetos y finalm<strong>en</strong>te el diseño delexperim<strong>en</strong>to propiam<strong>en</strong>te dicho.• Operación: es <strong>la</strong> fase de preparación del experim<strong>en</strong>to, consist<strong>en</strong>te <strong>en</strong> <strong>la</strong> selección departicipantes, formu<strong>la</strong>rios y guías para que los participantes <strong>en</strong>ti<strong>en</strong>dan el proceso, <strong>en</strong>tr<strong>en</strong>ara los participantes si es necesario, y acciones necesarias para poner <strong>en</strong> marcha elexperim<strong>en</strong>to. Suele realizarse un estudio piloto para <strong>en</strong>contrar errores <strong>en</strong> el diseño.• Interpretación: A <strong>la</strong> hora de analizar e interpretar los resultados, el tipo de análisis estácondicionado por <strong>la</strong> hipótesis del experim<strong>en</strong>to, el tipo de variables seleccionadas según suesca<strong>la</strong> y el diseño experim<strong>en</strong>tal. El primer paso es caracterizar los datos utilizandoestadística descriptiva, para posteriorm<strong>en</strong>te realizar el test de hipótesis con el fin deconfirmar o rechazar <strong>la</strong>s hipótesis <strong>en</strong>unciadas.• Conclusiones y pres<strong>en</strong>tación de resultados: Informe com<strong>en</strong>tado del proceso seguido. Eneste informe se debe <strong>en</strong>fatizar por qué es relevante <strong>la</strong> hipótesis del estudio y cómo se hansolv<strong>en</strong>tado o minimizado <strong>la</strong>s am<strong>en</strong>azas a <strong>la</strong> validez e información que permita crearposibles réplicas del experim<strong>en</strong>to.


• Kitch<strong>en</strong>ham et al han definido una guía para t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>taaspectos de investigación empírica <strong>en</strong> <strong>la</strong> ing<strong>en</strong>iería del software,aunque g<strong>en</strong>eralizable (de hecho, se basan <strong>en</strong> guías médicas).• Provee guías <strong>en</strong> contexto, diseño, recabar datos, análisis ypres<strong>en</strong>tación de los resultados.Kitch<strong>en</strong>ham, B.A.; Pfleeger, S.L.; Pickard, L.M.; Jones, P.W.;Hoaglin, D.C.; El Emam, K.; Ros<strong>en</strong>berg, J., "Preliminary guidelinesfor empirical research in software <strong>en</strong>gineering," SoftwareEngineering, IEEE Transactions on , vol.28, no.8, pp. 721‐734, Aug2002.DOI 10.1109/TSE.2002.1027796http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=1027796&isnumber=22077

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!