Descarga en formato PDF - Centro RamÃ³n PiÃ±eiro para a ...

More documents

Recommendations

Info

Antonio Pamies Bertrán e José Manuel Pazos Bretaña Antonio Pamies Bertrán e José Manuel Pazos Bretaña BG UF (dens.%) 0 a 10% 50 (47%) 10 a 20% 48 (46%) 20 a 30% 45 (43%) 30 a 40% 39 (37%) 40 a 50% 29 (28%) 50 a 60% 18 (17%) 60 a 70% 15 (14%) 70 a 80% 13 (12%) 80 a 90% 5 (5%) 90 a 100% 3 (3%) Como vemos, a lematización permitiu duplica-lo número de UF detectadas, tanto na totalidade do texto coma nas que se acumulan no primeiro tramo, manténdose –con maior regularidade- a liña descendente da densidade fraseolóxica entre cada tramo, polo que resulta metodoloxicamente máis eficaz. Con todo, proporcionalmente, a densidade fraseolóxica é a mesma ca no texto non lematizado: no mellor dos casos (primeiro tramo) seguimos arredor do 49% de UF. Isto demostra que os bigramas recorrentes aleatorios tamén se viron beneficiados pola lematización na mesma proporción. As combinacións casuais (sangrar+pensar, orar+clavo) ou temáticas (fumar+pitillo, encender+luz) demostran ser tan frecuentes coma as combinacións fraseolóxicas no primeiro tramo, e moito máis frecuentes se consideramos a totalidade dos bigramas extraídos con métodos estatísticos. No mellor dos casos, o “ruído” representa aquí o 51% malia os filtros empregados. Outra posibilidade sería amplia-lo tamaño da fiestra de busca, aínda que é de supoñer que, ó igual que acontece coa lematización, o ruído tamén se beneficiaría na mesma proporción, pois como observan Kilgarriff e Rundell: different windows show different kinds of information [...] lists of this type are usefully suggestive but contain too much noise, require too much interpretation and are too arbitrary in how they are specified, to be an indispensable lexicographic tool (Kilgarriff e Rundell 2002: 811) 9 . 3. Aspectos cualitativos A metodoloxía aquí descrita exclúe totalmente os pares de palabras que coaparecen unha única vez, o que podería eventualmente influír no resultado. Para esquivar este obstáculo o sistema máis simple é duplica-lo texto 10 , estatisticamente non mellora a recuperación automática, posto que o ruído tamén será favorecido na mesma proporción; así e todo, 9 Por outra parte, Berry-Roghe (1973) xa sinalaba que a fiestra óptima depende da natureza estilística do corpus elixido. 10 Só leva uns minutos, posto que o texto xa está filtrado e lematizado. 6 196
Extracción automática de colocacións e modismos Extracción automática de colocacións e modismos permite obter datos estatísticos sobre calquera combinación independentemente da súa frecuencia. Aplicamos este método nun quinto experimento e obtemos en La familia de Pascual Duarte un total de 11.921 bigramas, dos cales 10.871 corresponden a pares que coaparecen unha única vez, é dicir, obtéñense dez veces máis datos cun corpus dúas veces maior. Naturalmente, as combinacións irrelevantes resultaron igualmente favorecidas por esta operación, pero isto permítenos investigar unhas colocacións en particular con respecto ó resto das combinacións. Investigando as colocacións verbo-nominais cuxo soporte son os verbos dar, hacer, tener e tomar, obtemos en Pascual Duarte 230 bigramas dos que só 53 foran detectados no texto “simple”, ou sexa, detectando 177 bigramas que só coaparecen unha vez, entre os cales 33 son UF (dar+consejo, dar+corazonada, dar+dolor, dar+abrazo, etc). Estes resultados demostran que a capacidade de detección de colocacións (a partir dun compoñente) se incrementa nunha razón moi superior a dous se duplicámo-lo corpus: dar: 230 BG [53 UF] (só 53 BG [20 UF] coaparecen dúas ou máis veces) hacer: 217 BG [48 UF] (só 52 BG [16 UF] coaparecen dúas ou máis veces) tener: 272 BG [45 UF] (só 72 BG [13 UF] coaparecen dúas ou máis veces) tomar: 28 BG [10 UF] (só un bigrama coaparecía máis dunha vez, tomar+tren) Dentro do ficheiro que contén só as combinacións do verbo seleccionado, verifícase que, ó seren ordenadas mediante o valor fD de cada combinación, a maior densidade colocacional tende unha vez máis a concentrarse na zona inicial do listado 11 . BG UF dar hacer tener tomar tramo nº % nº % nº % nº % 0 a 10% 18 78 14 64 9 33 0 0 10 a 20% 7 30 6 27 2 7 2 67 20 a 30% 5 22 5 23 3 11 0 0 30 a 40% 4 17 4 18 3 11 1 33 40 a 50% 6 26 3 14 7 26 1 33 50 a 60% 3 13 4 18 6 22 2 67 60 a 70% 4 17 0 0 2 7 3 100 70 a 80% 2 9 4 18 4 15 1 33 80 a 90% 3 13 4 18 7 26 0 0 90 a 100% 1 4 4 18 2 7 0 0 11 O resultado é negativo para o verbo tomar, pero o número total de datos para esta palabra é tan escaso neste texto (10% de 30 aparicións) que a estatística non pode funcionar, como parece confirmalo o feito de que fD e z-score dean exactamente o mesmo resultado nesta columna. 7 197
Page 1 and 2:
eciña de v xos boten uvas. uén).
Page 3 and 4:
CADERNOS DE FRASEOLOXÍA GALEGA 6 E
Page 5 and 6:
Presentación O número 6 de Cadern
Page 7 and 8:
Índice ESTUDOS ...................
Page 9:
Estudos
Page 12 and 13:
Dolors Català Guitart Dolors Catal
Page 14 and 15:
Page 16 and 17:
Page 18 and 19:
Page 20 and 21:
Page 22 and 23:
Page 24 and 25:
Page 26 and 27:
Page 28 and 29:
Germán Conde Tarrío Germán Conde
Page 30 and 31:
Page 32 and 33:
Page 34 and 35:
Page 36 and 37:
Page 38 and 39:
Page 40 and 41:
Page 42 and 43:
Page 44 and 45:
Page 46 and 47:
Page 48 and 49:
Page 50 and 51:
Page 52 and 53:
Page 54 and 55:
Page 56 and 57:
Page 58 and 59:
Xesús Ferro Ruibal Xesús Ferro Ru
Page 60 and 61:
Page 62 and 63:
Page 64 and 65:
Page 66 and 67:
Page 68 and 69:
Page 70 and 71:
Page 72 and 73:
Page 74 and 75:
Page 76 and 77:
Page 78 and 79:
Page 80 and 81:
Page 82 and 83:
Xosé María Gómez Clemente Xosé
Page 84 and 85:
Page 86 and 87:
Page 88 and 89:
Page 90 and 91:
Page 92 and 93:
Page 94 and 95:
Page 96 and 97:
Page 98 and 99:
Page 100 and 101:
Page 102 and 103:
Page 104 and 105:
Page 106 and 107:
Page 108 and 109:
Page 110 and 111:
Page 112 and 113:
Page 114 and 115:
María Isabel González Rey María
Page 116 and 117:
Page 118 and 119:
Page 120 and 121:
Page 122 and 123:
Page 124 and 125:
Page 126 and 127:
Page 128 and 129:
Page 130 and 131:
Page 132 and 133:
Ekaterina Guerbek, Valerii Mokienko
Page 134 and 135:
Page 136 and 137:
Page 138 and 139:
Page 141 and 142:
Cadernos de Fraseoloxía Galega 6,2
Page 143 and 144:
Colocacións verbais: estabilidade
Page 145 and 146: Colocacións verbais: estabilidade
Page 147: Colocacións verbais: estabilidade
Page 150 and 151: Carmen Mellado Blanco Carmen Mellad
Page 160 and 161: Károly Morvay Károly Morvay moder
Page 162 and 163: Károly Morvay Károly Morvay maior
Page 164 and 165: Károly Morvay Károly Morvay ten n
Page 166 and 167: Károly Morvay Károly Morvay rexi
Page 168 and 169: Károly Morvay Károly Morvay 179 r
Page 170 and 171: Károly Morvay Károly Morvay 1. Co
Page 172 and 173: Károly Morvay Károly Morvay frase
Page 174 and 175: Károly Morvay Károly Morvay abai
Page 176 and 177: Károly Morvay Károly Morvay conse
Page 178 and 179: Károly Morvay Károly Morvay que c
Page 180 and 181: Károly Morvay Károly Morvay éss
Page 182 and 183: Károly Morvay Károly Morvay da ax
Page 184 and 185: Károly Morvay Károly Morvay Como
Page 186 and 187: Károly Morvay Károly Morvay Por
Page 188 and 189: Károly Morvay Károly Morvay (2001
Page 191 and 192: Cadernos de Fraseoloxía Galega 6,2
Page 193 and 194: Extracción automática de colocaci
Page 195: Extracción automática de colocaci
Page 203: Extracción automática de colocaci
Page 206 and 207: Mª Carmen Paz Roca Mª Carmen Paz
Page 218 and 219: Mª Carmen Paz Roca ª Carmen Paz R
Page 221 and 222: Cadernos de Fraseoloxía Galega 6,2
Page 223 and 224: O concepto “correspondencia” na
Page 229: O concepto “correspondencia” na
Page 232 and 233: Mª Rosario Soto Arias e Luís Gonz
Page 246 and 247:
Mª Rosario Soto Arias e Luís Gonz
Page 248 and 249:
Page 250 and 251:
Page 253 and 254:
Page 255 and 256:
Novo manuscrito paremiolóxico de V
Page 257 and 258:
Page 259 and 260:
Page 261 and 262:
Page 263 and 264:
Page 265:
Recensións e Bibliografía
Page 268 and 269:
Recensións María Álvarez de la G
Page 270 and 271:
Page 272 and 273:
Page 274 and 275:
Page 276 and 277:
Page 278 and 279:
Page 280 and 281:
Page 282 and 283:
Page 285 and 286:
Page 287 and 288:
Noticias de traballos fraseolóxico
Page 289 and 290:
Cadernos de Fraseoloxía Galega Not
Page 291 and 292:
CENTRO RAMÓN PIÑEIRO PARA A INVES
Page 293 and 294:
Narrativa e poesía recuperada Filo
show all

Descarga en formato PDF - Centro RamÃ³n PiÃ±eiro para a ...

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?