Manual rápido de uso de Tools for Population Genetics (TFPGA)

Manual rápido de uso de Tools for Population Genetics (TFPGA) 

Recuerda que el programa viene con un manual en pdf (llamadao TFPGADOC.pdf) ubicado en la misma carpeta en la que 

instalaste el programa (generalmente: C:/TFPGA/TFPGADOC.PDF) LEELO!!! 

1.- Abrir el archivo, revisar datos y describirlos 

1.- File 2.- Open Data File 

3.- Indicar que muestre todos los archivos (no solo los .dat o .txt) 4.- Indicar la unidad en la que se ecuentra nuestro 

archivo (generalmente C:) 5.- Buscar la carpeta en la que se encuentra nuestro archivo (nota: dos puntos es para subir un 

nivel) 6.- Indicar nuestro archivo 7.- Picar Abrir. 

8.- Revisa que el recuadro Data esté seleccionado ya que de lo contrario no te mostrará tus datos y te mostrará los 

resultados (que aún no existen). 

El formato de TFPGA es como sigue: en cada renglón se indica un individuo. Las columnas están separadas por una coma 

y divididas en dos secciones: antes del espacio y después del espacio. Las columnas que se encuentran antes del espacio se 

llaman cabecera e indican la población, subpoblación y sub-subpoblación a la que pertenece el individuo; cada número 

indica una población y/o subpoblación. En nuestro ejemplo tenemos dos poblaciones: la uno con tres subpoblaciones (1,1 

1,2 y 1,3) y la dos con otras tres subpoblaciones (2,1 2,2 2,3). Las columnas que se encuentra después del espacio 

indican los alelos de cada locus. Cada locus se indica en una sola columna (en nuestro ejemplo solo tenemos un locus) y 

los alelos se indican con números: - para geles dominantes 0 indica ausencia y 1 indica presencia – para geles codominantes 

cada alelo se indica con dos números 11, 12, 22 - (en nuestro ejemplo tenemos un locus con 5 alelos: 1, 2, 3, 4, 5 que nos 

dan los genotipos indicados en el archivo: 11, 12, 13, 14, 15, 22, 23, 24, 25, 33, 34, 35, 44, 45, 55) 

9.- Pica Describe Data Set. 10.- Indica el nivel al que llegan tus datos (en nuestro caso subpoblaciones).

11.- Indica el número de loci que estamos analizando (en nuestro caso uno) 12.- Indica el número máximo de alelos que 

puede haber por locus (en nuestro caso tenemos un solo locus y este tiene 5 alelos) 13.- Indica el número de poblaciones 

estudiadas (en nuestro caso dos) 14.- Indica el número máximo de subpoblaciones que hay en las poblaciones (en nuestro 

caso cualquiera de las dos poblaciones tienen un máximo de tres 15.- Indica si el organismo es diploide o haploide 16.- 

Indica si el marcador es dominante o codominante (los ISSR son dominantes, los microsatélites son codominantes). 17.- 

pica OK. 

Nota: si te sale una ventanita como esta: 

Quiere decir que la descripción que acabas de hacer no coincide con la base de datos que abriste. Revisa de nuevo tus datos 

y vuelve a describirlos. 

Ahora ya están cargados tus datos. Inicia tu análisis!!!!

2.- Descriptive Statistics 

Este análisis estima las frecuencias alélicas, frecuencias genotípicas, heterocigosis y el polimorfismo de 

tus datos. 

1.- Pica Analyze 2.- pica Descriptive Statistics 3.- Pica Options para indicar cómo calcular la heterocigosis y el 

polimorfismo. 

4.- Indica a qué niveles quieres el análisis Entire data set Populations y Subpopulations si quieres que te indique el 

nivel de diversidad (Heterocigosis y polimorfismo) para cada uno de estos niveles. Entire data set te da la H y P para todos 

los datos sin considerar estrucrura. Populations te va a dar la H y P para cada población y Subpopulations te va a dar la 

H y P para cada subpoblación. 

5.- Indica las opaciones que desees: Calculate Allele and Heterozygote Frequencies para que te muestre las frecuencias 

alélicas y genotípicas. Calculate Per Locus Heterozygosities para que te indique las heterocigosis por cada locus (además 

de las indicadas en el punto 4). Calculate Average Heterozygosities over Loci para que te indique la Heterocigosis 

promedio . Calculate Percent Polymorphic Loci para que te indique el polimorfismo. 

6.- Pica OK 

7.- Para iniciar el análisis pica Analyze --> Descriptive Statistics --> Start analysis. La pantalla va a mostrar los 

resultados (Nota: no le hagas caso a -unbiased- ni a -direct count-). En algunos casos, cuando el archivo de resultados es 

muy grande, el programa no puede mostrarlo en pantalla, por lo que te va a pedir que lo guardes en un archivo, en ese caso, 

guárdalo como txt (ponle el nombre que quieras con la terminación .txt - punto txt-) y luego abrelo con el block de notas. 

8.- Interpreta los datos de diversidad genética.

3.- F-statistics 

Este análisis estima la estructura poblacional. 

1.- Pica Analyze 2.- pica F-statistics 3.- pica Options. 

4.- Selecciona las opciones que desees que el programa ejecute: Show results for each allele si deseas conocer la 

estructura de los alelos (además de las poblaciones) Show results for each locus (si deseas conocer la estructura de cada 

locus) Jackknife over loci para que haga una prueba de que tan sólidos son tus datos (el jacknife hace muchas repeticiones 

del análisis pero cambiando los datos en cada vez para probar la solidez de tus resultados). 

5.- Determina si deseas o no hacer la prueba de Bootstrap (esta es otra prueba de solidez de datos en la que el análisis se 

repite el número de veces que le indiques y te indica con un porcentaje de confianza -que también le indicas- qué tan sólidos 

son tus datos-) 

6.- pica OK 

7.- pica Analyze --> F-statistics --> Start analysis. para iniciar el análisis. 

8.- Interpreta los datos de estructura poblacional. Recuerda que para TFPGA: f indica Fis, F indica Fit y theta indica Fst. 

Theta S indica Fst, Theta P indica Fis y Theta SS indica Fis. En algunos casos, cuando el archivo de resultados es muy 

grande, el programa no puede mostrarlo en pantalla, por lo que te va a pedir que lo guardes en un archivo, en ese caso, 

guárdalo como txt (ponle el nombre que quieras con la terminación .txt - punto txt-) y luego abrelo con el block de notas.

4.- Genetic distance 

Calcula la distancia genética entre las poblaciones y/o subpoblaciones. Este análisis nos va a mostrar una tabla 

de distancias genéticas entre todos los pares de poblaciones y/o subpoblaciones de nuestra muestra. Una distancia de 0 

indica que las poblaciones comparten el 100% de sus alelos, es decir que son idénticas y una distancia grande (generalmente 

de 1) indica que no comparten ninguno de sus alelos, es decir, que son completamente diferentes. Nota: este parámetro se 

entiende e interpret mejor luego de hacer el UPGMA (árbol de distancias o representación gráfica entre las distancias) 

1.- Pica Analyze 2.- Genetic Distance 3.- Options. 

4.- Selecciona entre quienes quieres calcular las distancias: entre las poblaciones y/o entre las subpoblaciones 

5.- Selecciona el modelo con el que se va a medir la distancia genética (te recomiendo usar Nei, 1972,1978 que va de 0 a 1). 

6.- Selecciona el tipo de tabla que quieres que te muestre: en columnas (expanded format) o en tabla de contingencia 

(matrix format). 7.- pica OK. 

8.- Pica Analyze --> Genetic Distance --> Start analysis para iniciar el análisis. El programa te va a mostrar dos valores la 

distancia genética (dist.) y la identidad genética (ident.) que indica lo contrario a la distancia (I=1-dist), es decir, que 

cuando las poblaciones son idénticas la distancia es 0 y la identidad es 1. Por el momento no le hagas caso a unbiased dist. 

ni a unbiased ident. 

En algunos casos, cuando el archivo de resultados es muy grande, el programa no puede mostrarlo en pantalla, por lo que te 

va a pedir que lo guardes en un archivo, en ese caso, guárdalo como txt (ponle el nombre que quieras con la terminación .txt 

- punto txt-) y luego abrelo con el block de notas.

5.- Hardy Weinberg 

Este análisis realiza pruebas para determinar si la población se encuentra o no en equilibrio de H.W. 

1.- Pica Analyze --> 2.- Hardy-Weinberg --> 3.- Options. 

4.- Determina si quieres determinar se el Entire data set se encuentra en H.W., si las Populations se encuentran en H.W. y/ 

o si las Subpopulatins se encuentran en H.W. 5.- Determina el tipo de prueba que quieres hacer: prueba de Xi cuadrada 

(te la recomiendo, ya que es la que vimos en clase), G-test o Extact Test (que realiza remuestreos de tu muestra para 

indicar un error estandard y en cuyo caso, se activaría la parte 5a para solicitarte información sobre el remuestreo). 

6.- Determina si deseas que agrupe los genotipos iguales y realice la prueba con los “tipos” (Pooled Genotypes no te lo 

recomiendo) o que utilice todos los genotipos que indicaste (All Genotypes, si te lo recomiendo). 

7.- Pica Analyze --> Hardy-Weinberg--> Start analysis. El programa te va a mostrar la Xi calculada, y los grados de 

significancia, ve a una tabla estadística y determina si se encuentra o no en H.W. 




6.- UPGMA 

Este análisis calcula las distancias genéticas de igual forma que el apartado 4 (Genetic distance), pero además las 

representa mediante un dendograma de distancias mediante el método UPGMA, es decir, que te va a dar un árbol de 

distancias entre las poblaciones, subpoblaciones o sub-subpoblaciones. 

1.- Pica Analyze 2.- UPGMA 3.- Options 

4.- Determina si quieres hacer un árbol de distancia entre las Populations (lo cual sería aburrido en caso de que solo 

tuvieras dos poblaciones) on entre Subpopulations. 

5.- Determina el tipo de distancia genética que vas a utilizar (te recomiendo Nei, 1972). 

6.- Determina si quieres que te calcule el porcentaje de loci que utilizó para determinar cada rama del árbol (un soporte del 

100% indica una rama cuya distancia se determinó de manera muy sólida, un soporte del 0% indica una rama en la que no 

hay loci que soporten su valor de distancia, por lo que es una rama en la que no podemos confiar). 

7.- Determina si quieres hacer una prueba de remuestreo mediante Boostrap, es decir que el programa repita el análisis el 

número de veces que le indiques en # of permutations para indicarte el número de veces que salió igual la rama (un valor 

de 100 de boostrap quiere decir que del total de repeticiones el 100% de las veces la rama salió en la misma posición y con 

la misma distancia, es decir, que es una rama muy sólida; un boostrap de 0 quiere decir que cada vez que repitió el análisis 

la rama salió en posiciones distintas y con distancias diferentes, es decir, que es una rama muy poco soportada). Como regla 

de dedazo: el número de repeticiones mínimas es de tres veces el número de datos que estás usando. 8.- pica OK 

9.- Pica Analyze--> UPGMA --> Start analysis. Si le indicaste al programa que realizara Boostrap, entonces va a tardar 

un poco en darte el resultado. El programa va a abrir dos ventanas: una ventana gráfica en la que te va a mostrar el árbol 

(puedes guardarlo picando File--> Save tree as Bitmap file para que lo guarde donde le indiques en formato .bmp) y otra 

ventana de resultados que te va a dar: una clave numérica de tus poblaciones (Key to subpopulation identifyers), una 

tabla con las distancias genéticas de cada nodo (Distance) indicando las poblaciones que incluyen a ese nodo y el porcentaje 

de soporte mediante boostrap de cada nodo (estandarizado de 0 a 1, siendo 1=100%).

Manual rápido de uso de Tools for Population Genetics (TFPGA)

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?