AYUDA SPSS-ESCALAMIENTO MULTIDIMENSIONAL TUTORIAL ...
AYUDA SPSS-ESCALAMIENTO MULTIDIMENSIONAL TUTORIAL ...
AYUDA SPSS-ESCALAMIENTO MULTIDIMENSIONAL TUTORIAL ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>AYUDA</strong> <strong>SPSS</strong>-<strong>ESCALAMIENTO</strong> <strong>MULTIDIMENSIONAL</strong><br />
<strong>TUTORIAL</strong> MDS<br />
Tutorial en <strong>SPSS</strong> 10.07<br />
<strong>ESCALAMIENTO</strong> <strong>MULTIDIMENSIONAL</strong> (MDS)<br />
(PROXSCAL: PROXimites SCALing)<br />
Escalamiento Multidimensional (MDS)<br />
Menú Analizar ><br />
Por Rubén José Rodríguez<br />
8 de abril de 2008<br />
Concepto: El escalamiento multidimensional trata de encontrar la estructura<br />
existente en un conjunto de medidas de proximidades entre objetos.<br />
Esto se logra asignando las observaciones a posiciones específicas<br />
en un espacio conceptual de pocas dimensiones, de modo que las distancias<br />
entre los puntos en el espacio concuerden al máximo con las similaridades<br />
(o disimilaridades) dadas. El resultado es una representación<br />
de mínimos cuadrados de los objetos en dicho espacio de pocas di-<br />
1
mensiones que, en muchos casos, le ayudará a entender mejor los datos.<br />
Ejemplo. El escalamiento multidimensional puede ser muy útil en la determinación<br />
de relaciones perceptuales. Por ejemplo, al considerar la<br />
imagen de un producto e empresa, se puede llevar a cabo un estudio<br />
con el fin de obtener un conjunto de datos que describa la similaridad<br />
percibida (o proximidad) de este producto con el de la competencia. Mediante<br />
estas proximidades y las variables independientes (como el precio),<br />
puede intentar determinar las variables que son importantes en la<br />
visión que el público tiene del producto y ajustar la imagen de acuerdo<br />
con ello.<br />
Estadísticos y gráficos. Historial de iteraciones, medidas de stress,<br />
descomposición del stress, coordenadas del espacio común, distancias<br />
entre objetos dentro de la configuración final, ponderaciones del espacio<br />
individual, espacios individuales, proximidades transformadas, variables<br />
independientes transformadas, gráficos del stress, diagramas de dispersión<br />
del espacio común, diagramas de dispersión de la ponderación del<br />
espacio individual, diagramas de dispersión de los espacios individuales,<br />
gráficos de transformación, gráficos residuales de Shepard y gráficos de<br />
transformación de las variables independientes .<br />
Pulse en Cómo, situado más arriba, para obtener información detallada.<br />
Pulse en Temas relacionados para obtener información sobre los<br />
estadísticos, los gráficos, el formato y consideraciones sobre los datos<br />
(incluidos los procedimientos relacionados).<br />
Pulse con el botón derecho del ratón en un elemento del cuadro de<br />
diálogo para ver su descripción.<br />
2
Ventana <strong>ESCALAMIENTO</strong> <strong>MULTIDIMENSIONAL</strong> 1<br />
Concepto: El escalamiento multidimensional trata de encontrar la estructura<br />
de un conjunto de medidas de distancia entre objetos o casos.<br />
Esto se logra asignando las observaciones a posiciones específicas en<br />
un espacio conceptual (normalmente de dos o tres dimensiones) de modo<br />
que las distancias entre los puntos en el espacio concuerden al<br />
máximo con las disimilaridades dadas. En muchos casos, las dimensiones<br />
de este espacio conceptual son interpretables y se pueden utilizar<br />
para comprender mejor de los datos. Si las variables se han medido objetivamente,<br />
puede utilizar el escalamiento multidimensional como técnica<br />
de reducción de datos (el procedimiento Escalamiento multidimensional<br />
permitirá calcular las distancias a partir de los datos multivariados,<br />
si es necesario). El escalamiento multidimensional puede también<br />
aplicarse a valoraciones subjetivas de disimilaridad entre objetos o conceptos.<br />
Además, el procedimiento Escalamiento multidimensional puede<br />
tratar datos de disimilaridad procedentes de múltiples fuentes, como<br />
podrían ser múltiples evaluadores o múltiples sujetos evaluados por un<br />
cuestionario.<br />
1 Las ventanas primarias o principales contienen el botón ACEPTAR mientras que<br />
los botones FORMA, MEDIDA, MODELO, y OPCIONES generan ventanas segundarias<br />
que disponen del botón CONTINUAR que habilita el retorno a la ventana de origen. La<br />
ventana principal de MDS tiene cuatro botones.<br />
3
Ejemplo. ¿Cómo percibe el público las diferencias entre distintos coches?<br />
Si posee datos de las valoraciones de similaridad emitidas por los<br />
sujetos sobre las diferentes marcas y modelos de coches, puede utilizar<br />
el escalamiento multidimensional para identificar las dimensiones que<br />
describan las preferencias de los consumidores. Puede encontrar, por<br />
ejemplo, que el precio y el tamaño de un vehículo definen un espacio de<br />
dos dimensiones, capaz de explicar las similaridades de las que informan<br />
los encuestados.<br />
Estadísticos. Para cada modelo: Matriz de datos, Matriz de datos escalada<br />
óptimamente, S-stress (de Young), Stress (de Kruskal), R², Coordenadas<br />
de los estímulos, Stress promedio y R² para cada estímulo<br />
(modelos RMDS). Para modelos de diferencias individuales (INDSCAL):<br />
ponderaciones del sujeto e índice de peculiaridad para cada sujeto. Para<br />
cada matriz en los modelos de escalamiento multidimensional replicado:<br />
stress y R² para cada estímulo. Diagramas: coordenadas de los<br />
estímulos (de dos o tres dimensiones), diagrama de dispersión de las<br />
disparidades frente a las distancias.<br />
Pulse en Temas relacionados, situado más arriba, para obtener descripciones<br />
de cuadros de diálogo y procedimientos relacionados.<br />
Pulse con el botón derecho del ratón en un elemento del cuadro de diálogo<br />
para ver su descripción.<br />
Cómo: Para obtener un Análisis de Escalamiento Multidimensional<br />
(MDS).<br />
Elija en los menús:<br />
Analizar<br />
> Escalas<br />
> Escalamiento multidimensional...<br />
En Distancias, seleccione Los datos son distancias o bien Crear distancias<br />
a partir de datos.<br />
Si los datos son distancias, debe seleccionar al menos cuatro variables<br />
numéricas para el análisis y puede pulsar en el botón Forma para<br />
indicar la forma de la matriz de distancias.<br />
Si quiere que <strong>SPSS</strong> cree las distancias antes de analizarlas, debe<br />
seleccionar al menos una variable numérica y puede pulsar en el botón<br />
Medida para especificar el tipo de medida de distancia que desea.<br />
4
Botón FORMA<br />
Si el archivo de datos de trabajo representa distancias entre un o<br />
dos conjuntos de objetos, debe especificar la forma de la matriz de datos<br />
para obtener los resultados correctos. Elija una opción: Cuadrada<br />
simétrica, Cuadrada asimétrica o bien Rectangular. Nota: No puede seleccionar<br />
Cuadrada simétrica si el cuadro de diálogo Modelo especifica<br />
condicionalidad de filas.<br />
Consideraciones sobre los datos<br />
Datos. Si los datos son de disimilaridad, todas las disimilaridades deben<br />
ser cuantitativas y deben estar medidas en la misma métrica. Si los datos<br />
son datos multivariantes, las variables pueden ser datos cuantitativos,<br />
binarios o de recuento. El escalamiento de las variables es un tema<br />
importante, ya que las diferencias en el escalamiento pueden afectar a<br />
la solución. Si las variables tienen grandes diferencias en el escalamiento<br />
(por ejemplo, una variable se mide en dólares y otra en años), debe<br />
considerar el tipificarlas (esto puede llevarse a cabo automáticamente<br />
con el propio procedimiento Escalamiento multidimensional).<br />
Supuestos. El procedimiento Escalamiento multidimensional está relativamente<br />
libre de supuestos distribucionales. Compruebe que selecciona<br />
el nivel de medida adecuado (ordinal, de intervalo, o de razón) en Opciones<br />
para asegurar que los resultados se calculan correctamente.<br />
Procedimientos relacionados. Si su objetivo es la reducción de los datos,<br />
un método alternativo a tener en cuenta es el Análisis Factorial, sobre<br />
todo si las variables son cuantitativas. Si desea identificar grupos de casos<br />
similares, considere complementar el Análisis de Escalamiento<br />
Multidimensional con un análisis de conglomerados jerárquico o de kmedias.<br />
5
Botón MEDIDA<br />
6
Crear la medida a partir de los datos<br />
El escalamiento multidimensional utiliza datos de disimilaridad para<br />
crear una solución de escalamiento. Si los datos son datos multivariantes<br />
(los valores de las variables medidas), debe crear los datos de<br />
disimilaridad para poder calcular una solución de escalamiento multidimensional.<br />
Puede especificar los detalles para la creación de las medidas<br />
de disimilaridad a partir de los datos.<br />
Medida. Le permite especificar la medida de disimilaridad para el análisis.<br />
Seleccione una opción del grupo Medida que se corresponda con el<br />
tipo de datos y, a continuación, seleccione una de las medidas de la lista<br />
desplegable correspondiente a ese tipo de medida. Las opciones disponibles<br />
son:<br />
Intervalo: Distancia euclídea, Distancia euclídea al cuadrado, Chebychev,<br />
Bloque, Minkowski o Personalizada.<br />
Recuento. Medida de chi-cuadrado o Medida de phi-cuadrado.<br />
Binaria. Distancia euclídea, Distancia euclídea al cuadrado, Diferencia<br />
de tamaño, Diferencia de configuración, Varianza, Lance y<br />
Williams.<br />
Crear matriz de distancias. Le permite elegir la unidad de análisis.<br />
Las opciones son Entre variables o Entre casos.<br />
Transformar valores. En determinados casos, como cuando las variables<br />
se miden en escalas muy distintas, puede que desee tipificar los<br />
valores antes de calcular las proximidades (no es aplicable a datos binarios).<br />
Seleccione un método de tipificación de la lista desplegable Estandarizar<br />
(si no se requiere ninguna tipificación, seleccione Ninguna).<br />
8
Botón MODELO<br />
La estimación correcta de un modelo de escalamiento multidimensional<br />
depende de aspectos que atañen a los datos y al modelo en sí.<br />
Nivel de medida. Le permite especificar el nivel de medida de los datos.<br />
Las opciones son Ordinal, Intervalo y Razón. Cuando las variables<br />
son ordinales, si se selecciona Desempatar observaciones empatadas se<br />
solicitará que sean consideradas como variables continuas, de forma<br />
que los empates (valores iguales para casos diferentes) se resuelvan<br />
óptimamente.<br />
Condicionalidad. Le permite especificar qué comparaciones tienen sentido.<br />
Las opciones son Matriz, Fila o Incondicional.<br />
Dimensiones. Le permite especificar la dimensionalidad de la solución<br />
o soluciones del escalamiento. Se calcula una solución para cada número<br />
del rango especificado. Especifique números enteros entre 1 y 6; se<br />
permite un mínimo de 1 sólo si selecciona Distancia euclídea como modelo<br />
de escalamiento. Para una solución única, especifique el mismo<br />
número para el mínimo y el máximo.<br />
Modelo de escalamiento. Le permite especificar los supuestos bajo<br />
los que se realiza el escalamiento. Las opciones disponibles son Distancia<br />
euclídea o Distancia euclídea de diferencias individuales (también<br />
conocida como INDSCAL). Para el modelo de Distancia euclídea de diferencias<br />
individuales, puede seleccionar Permitir ponderaciones negativas<br />
de sujetos, si es adecuado para los datos.<br />
9
Medidas de disimilaridad para datos binarios en el escalamiento<br />
multidimensional<br />
Las medidas de disimilaridad siguientes son las disponibles para los datos<br />
binarios:<br />
Distancia euclídea. Se calcula a partir de una tabla 2*2 como SQRT<br />
(b+c), donde b y c representan las casillas diagonales correspondientes<br />
a los casos presentes en un elemento pero ausentes en el otro.<br />
Distancia euclídea al cuadrado. Se calcula como el número de casos<br />
discordantes. Su valor mínimo es 0 y no tiene límite superior.<br />
Diferencia de tamaño. Se trata de un índice de asimetría. Oscila de<br />
0 a 1.<br />
Diferencia de configuración. Medida de disimilaridad para datos<br />
binarios que oscila de 0 a 1. Se calcula a partir de una tabla 2*2 como<br />
bc/(n**2), donde b y c representan las casillas diagonales correspondientes<br />
a los casos presentes en un elemento pero ausentes<br />
en el otro y n es el número total de observaciones.<br />
Varianza. Se calcula a partir de una tabla 2x2 como (b+c)/4n, donde<br />
b y c representan las casillas diagonales correspondientes a los<br />
casos presentes en un elemento pero ausentes en el otro y n es el<br />
número total de observaciones. Oscila de 0 a 1.<br />
Lance y Williams. Se calcula a partir de una tabla 2*2 como<br />
(b+c)/(2a+b+c), donde a representa la casilla correspondiente a los<br />
casos presentes en ambos elementos y b y c representan las casillas<br />
diagonales correspondientes a los casos presentes en un elemento<br />
pero ausentes en el otro. Esta medida oscila entre 0 y 1. También se<br />
conoce como el coeficiente no métrico de Bray-Curtis.<br />
Si lo desea, puede cambiar los campos Presente y Ausente para especificar<br />
los valores que indican que una característica está presente o ausente.<br />
El procedimiento ignorará todos los demás valores.<br />
Pulse en Temas relacionados, situado más arriba, para obtener descripciones<br />
de cuadros de diálogo y procedimientos relacionados.<br />
Pulse con el botón derecho del ratón en un elemento del cuadro de diálogo<br />
para ver su descripción.<br />
10
Medidas de disimilaridad para datos de intervalo en el escalamiento<br />
multidimensional<br />
Las siguientes medidas de disimilaridad están disponibles para datos de<br />
intervalo:<br />
Distancia euclídea. La raíz cuadrada de la suma de los cuadrados<br />
de las diferencias entre los valores de los elementos. Ésta es la medida<br />
por defecto para datos de intervalo.<br />
Distancia euclídea al cuadrado. La suma de los cuadrados de las<br />
diferencias entre los valores de los elementos.<br />
Chebychev. La diferencia absoluta máxima entre los valores de los<br />
elementos.<br />
Bloque. La suma de las diferencias absolutas entre los valores de<br />
los elementos. También se conoce como la distancia de Manhattan.<br />
Minkowski. La raíz p-ésima de la suma de las diferencias absolutas<br />
elevada a la potencia p-ésima entre los valores de los elementos.<br />
Personalizada. La raíz r-ésima de la suma de las diferencias absolutas<br />
elevada a la potencia p-ésima entre los valores de los elementos.<br />
Pulse en Temas relacionados, situado más arriba, para obtener descripciones<br />
de cuadros de diálogo y procedimientos relacionados.<br />
Pulse con el botón derecho del ratón en un elemento del cuadro de diálogo<br />
para ver su descripción.<br />
Medidas de disimilaridad para datos de recuento en el escalamiento<br />
multidimensional<br />
Las siguientes medidas de disimilaridad son las disponibles para los datos<br />
de recuento:<br />
Medida de chi-cuadrado. Basado en la prueba de igualdad de chicuadrado<br />
para dos conjuntos de frecuencias. Ésta es la medida por<br />
defecto para datos de recuento.<br />
Medida de Phi-cuadrado. Esta medida es igual a la medida de chicuadrado<br />
normalizada por la raíz cuadrada de la frecuencia combinada.<br />
Pulse en Temas relacionados, situado más arriba, para obtener descripciones<br />
de cuadros de diálogo y procedimientos relacionados.<br />
Pulse con el botón derecho del ratón en un elemento del cuadro de diálogo<br />
para ver su descripción.<br />
11
Transformación de valores en el escalamiento multidimensional<br />
Las siguientes opciones están disponibles para la transformación de valores:<br />
Puntuaciones Z. Los valores se estandarizan a una puntuación Z,<br />
con una media de 0 y una desviación típica de 1.<br />
Rango -1 a 1. Cada valor del elemento que se tipifica se divide por<br />
el rango de los valores.<br />
Rango 0 a 1. El procedimiento sustrae el valor mínimo de cada elemento<br />
que se tipifica y después lo divide por el rango.<br />
Magnitud máxima de 1. El procedimiento divide cada valor del elemento<br />
que se tipifica por el máximo de los valores.<br />
Media 1. El procedimiento divide cada valor del elemento que se tipifica<br />
por la media de los valores.<br />
Desviación típica 1. El procedimiento divide cada valor de la variable<br />
o caso que se tipifica por la desviación típica de los valores.<br />
Además, se puede escoger el modo de realizar la tipificación. Las opciones<br />
son Por variable o Por caso.<br />
Ventana OPCIONES<br />
Puede especificar opciones para el análisis de escalamiento multidimensional:<br />
Mostrar. Le permite seleccionar varios tipos de resultados. Las opciones<br />
disponibles son Gráficos de grupo, Gráficos para los sujetos individuales,<br />
Matriz de datos y Resumen del modelo y de las opciones.<br />
12
Criterios. Le permite determinar cuándo debe detenerse la iteración.<br />
Para cambiar los valores por defecto, introduzca valores para la Convergencia<br />
de s-stress, el Valor mínimo de s-stress y el Nº máximo de iteraciones.<br />
Tratar distancias menores que n como perdidas. Las distancias<br />
menores que este valor se excluyen del análisis.<br />
13