15.11.2013 Views

Análisis sintáctico conducido por un diccionario de patrones de ...

Análisis sintáctico conducido por un diccionario de patrones de ...

Análisis sintáctico conducido por un diccionario de patrones de ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Capítulo 4. Colección <strong>de</strong> estadísticas <strong>de</strong> las combinaciones <strong>de</strong> subcategorización como<br />

método práctico<br />

q<br />

k<br />

es la probabilidad <strong>de</strong> que la combinación no se seleccione y su valor es:<br />

q = 1 – p<br />

es el número <strong>de</strong> variante<br />

r es 1 si correspon<strong>de</strong> a la variante correcta (se representa con “+”).<br />

es 0 si correspon<strong>de</strong> a variantes erróneas (se representa con “−”).<br />

n<br />

es el número <strong>de</strong> combinaciones<br />

Así que tenemos las siguientes probabilida<strong>de</strong>s:<br />

p<br />

q<br />

p<br />

q<br />

+<br />

n<br />

+<br />

n<br />

−<br />

n<br />

−<br />

n<br />

si f<br />

si f<br />

si f<br />

si f<br />

n<br />

n<br />

n<br />

n<br />

∈ P y k es la variantecorrecta<br />

∉ P y k es la variantecorrecta<br />

∈ P y k es varianteerrónea<br />

∉ P y k es varianteerrónea<br />

Entonces la probabilidad <strong>de</strong> P es:<br />

P (P) =∏α n k,<br />

r<br />

(2)<br />

puesto que cada característica <strong>de</strong> manera in<strong>de</strong>pendiente está incluida en la frase P con<br />

las probabilida<strong>de</strong>s α. Don<strong>de</strong> r la <strong>de</strong>notamos como:<br />

r = δ<br />

k<br />

i<br />

⎧1<br />

⎨<br />

⎩0<br />

si k = i<br />

si k ≠ i<br />

(variante<br />

(otras variantes)<br />

correcta)<br />

Estas probabilida<strong>de</strong>s pue<strong>de</strong>n verse como <strong>un</strong>a matriz V con k filas, <strong>un</strong>a fila para<br />

cada variante, y n columnas, <strong>un</strong>a columna para cada combinación. Entonces los<br />

valores en la matriz son:<br />

⎧<br />

k<br />

δ<br />

, ⎪ p i<br />

k r n V k[<br />

n]<br />

> 0<br />

α =<br />

(3)<br />

n ⎨<br />

⎪ δ<br />

k<br />

⎩q<br />

i<br />

n V k[<br />

n]<br />

= 0 .<br />

don<strong>de</strong> V k [n] representan los valores <strong>de</strong> las probabilida<strong>de</strong>s <strong>de</strong> ocurrencia <strong>de</strong> las<br />

combinaciones presentes, n ∈ V k . Si la combinación n está presente, entonces V k [n] ><br />

0, <strong>de</strong> lo contrario V k [n] = 0.<br />

El <strong>diccionario</strong> F <strong>de</strong> las características es tan gran<strong>de</strong> que cada característica<br />

específica f n es mucho más frecuente que esté ausente en <strong>un</strong>a frase a que esté presente.<br />

Este hecho es inherente a los textos, cada palabra, excepto alg<strong>un</strong>as conj<strong>un</strong>ciones y<br />

preposiciones muy com<strong>un</strong>es, aparecen en <strong>un</strong>a minoría <strong>de</strong> las frases en el texto. En (2)<br />

el producto se toma para todas las variantes y para todas las combinaciones en F.<br />

Consi<strong>de</strong>rando el conj<strong>un</strong>to <strong>de</strong> las variantes <strong>de</strong> la estructura sintáctica<br />

250

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!