geração (semi)automática de metadados - Universidad Autónoma ...

More documents

Recommendations

Info

XML. Para la elaboración de este sistema de reglas se puede necesitar de la opinión de muchos expertos. Dado que estas opiniones son subjetivas, se introduce la imprecisión. Para gestionar estas imprecisiones se debe utilizar la lógica difusa, que permite la agregación de diferentes opiniones. En muchas ocasiones, para poder tener valoraciones de datos almacenados en un documento XML es necesario aportar una serie de metadatos que complementen el significado de los datos con respecto a la dimensión de calidad que cada parte interesada desempeñando un rol específico necesite evaluar. En (Verbo et al., 2007) se propone una estructura de datos basada en XML Schema, DQXSD, para almacenar conjuntamente los datos junto con sus correspondientes metadatos. El resto del artículo sigue la siguiente estructura: en la sección 2 se hace una pequeña introducción al concepto de calidad de datos, en la sección 3 se explica el enfoque propuesto para la clasificación difusa de documentos XML, y en la sección 4 se presentan una serie de conclusiones y líneas de trabajo futuro. 2. CONCEPTO Y DIMENSIONES DE CALIDAD DE DATOS La definición más aceptada de calidad de datos es “adecuación para su uso” (“fitness for use”): los datos tienen calidad si sirven para el propósito que se necesita. A la vista de esta definición, se deduce que la calidad de datos es un concepto subjetivo (depende del uso que vaya a hacer cada persona) y multidimensional (es factible entender la calidad desde distintos puntos de vista – al estilo del software con ISO 9126). A los diferentes puntos de vista se les llama dimensiones de calidad de datos. Estas dimensiones son ampliamente discutidas y explicadas en la literatura (Lee et al., 2006). Para poder hacer una gestión adecuada de la calidad de los datos, es necesario definir medidas para cada una de las dimensiones requeridas para un escenario. La forma en la que se definen las medidas depende fuertemente del método de medición que cada parte interesada necesite emplear según sus necesidades: así una misma dimensión de calidad puede tener tantas medidas diferentes como partes interesadas haya en un escenario. En cualquier caso, las medidas de calidad de los conjuntos de datos pueden clasificarse como orientadas al modelo de datos (suelen ser objetivas) o las orientadas a los propios datos (pueden requerir metadatos que complementen el significado del dato con respecto a la dimensión de calidad de datos según la parte interesada). En (Lee et al., 2006) y en (Batini and Scannapieco, 2006) se dan indicaciones oportunas sobre cómo definir estas medidas. Estas medidas serán la base para la creación del sistema de reglas. 3. CLASIFICACIÓN DIFUSA DE DOCUMENTOS XML Conferência IADIS Ibero-Americana WWW/Internet 2007 El objetivo de nuestra propuesta es la construcción de un sistema que permita clasificar documentos XML de acuerdo a la calidad de los datos que contiene. Puesto que la evaluación de la calidad de datos es un proceso muy dependiente del dominio de aplicación y de una subjetividad inherente, debe ser capaz de manejar imprecisión y ser configurable para cada contexto en el que se quiera implantar. Las técnicas de softcomputing dan soporte a estas necesidades ya que la imprecisión es uno de sus principios básicos. En concreto, para nuestra propuesta nos hemos basado en la técnica de tablas de repositorios difusos, propuesta en (Castro-Sánchez et al., 2001) y que ha sido aplicada con éxito en distintos dominios como la adquisición de conocimiento y sistemas de ayuda a la decisión. Esta técnica se basa en la utilización de opiniones de expertos para extraer las características definitorias de los documentos que están siendo clasificados. Después de varias iteraciones y mediante el uso de la tabla de repositorios difusos, explicada más adelante, se obtiene un sistema de reglas que permite diferenciar los documentos utilizados como entrada del sistema. En nuestro enfoque, estos documentos serán ficheros XML sobre los que se realizarán una serie de mediciones tras las que, después de aplicar el sistema de reglas obtenido anteriormente, se podrá devolver como resultado el nivel de calidad de datos asignado al documento XML. El proceso de clasificación se divide en las etapas que se describen a continuación. Para explicar mejor este proceso, en cada uno de estos pasos se dará un ejemplo teórico: 1. Identificar los niveles de calidad en los que se desean dividir los documentos XML, usando por ejemplo una escala Likert en la que se podrían dividir en documentos de calidad “alta”, “media” y “baja”. 367
ISBN: 978–972–8924–45-4 © 2007 IADIS 2. Proporcionar casos de estudio controlados para el aprendizaje del sistema de reglas. Ello requiere formar un conjunto de documentos XML de muestra en el que haya al menos dos documentos para cada nivel de calidad. El nivel de calidad de datos de estos documentos se establecerá de acuerdo a la experiencia previa de los expertos implicados en el proceso, de forma que el uso de los documentos haya permitido revelar su utilidad para el fin requerido. En nuestro ejemplo teórico, se podría tener un conjunto de muestra formado por seis elementos: dos documentos de alta calidad, D1 y D2; dos de calidad media, D3 y D4; y dos de baja calidad, D5 y D6. 3. Seleccionar un subconjunto aleatorio de tres elementos de los elementos del conjunto de muestra que todavía no hayan sido distinguidos. Por ejemplo, {D1, D4, D5}. 4. Identificar una dimensión de calidad de datos común a los tres documentos del subconjunto que permita distinguir cada uno de ellos, es decir, que el valor de la medida de la dimensión sea distinto para cada documento. En (Castro-Sánchez et al., 2001) se propone que esta decisión quede a juicio de un experto en el dominio de aplicación. No obstante no deja de ser un juicio subjetivo difícil de revisar. Para disminuir el grado de subjetividad, se propone el uso de algunas de las medidas referidas en (Verbo et al., 2007)o. Sin embargo, no se puede obviar la alta dependencia respecto al dominio de aplicación que tiene el criterio a utilizar. Así, por ejemplo, una noticia deportiva puede ser de gran relevancia para un sistema que procese información deportiva, pero tener importancia nula para un sistema de análisis bursátil. De esta forma, también resulta necesario introducir en este paso características dependientes del contexto como, por ejemplo, el grado de fiabilidad de una determinada fuente de datos. Como resultado se obtiene la tabla de valores para esa característica, que muestra sus distintos valores difusos. En la Tabla 1 se pueden ver los rangos de valores definidos para la medida GCD (bajo, medio y alto) mientras que en la Figura 1 se puede ver su representación gráfica. La medida GCD se utiliza para calcular el grado de completitud de un documento y su definición, que queda fuera del alcance de este artículo, puede ser consultada en (Verbo et al., 2007) junto con las definiciones de otras medidas interesantes para el propósito de esta técnica. Tabla 1. Valores de la variable GCD Bajo Medio Alto a 0 0,5 0,8 b 0 0,6 0,9 c 0,5 0,8 - d 0,6 0,9 - Figura 1. Representación gráfica de los valores de la variable GCD Los valores de a, b, c y d definen la función trapezoidal habitualmente utilizada para representar valores difusos. Siendo v el valor continuo de la variable a calificar, esta función trapezoidal se define de la siguiente forma: 368 ⎧ 0 ⎪( v − a) ⎪ ( b − a) ⎪ ∏( v; a, b, c, d) ⎨ 1 ⎪( d − v) ⎪ ( d − c) ⎪ ⎩ 0 v < a, a ≤ v ≤ b, b ≤ v ≤ c, c ≤ v ≤ d, v > d. (1)
Page 2:
. CONFERÊNCIA IADIS IBERO-AMERICAN
Page 5 and 6:
Copyright 2007 IADIS Press Todos os
Page 7 and 8:
E-GOV BRASILEIRO: UMA ANÁLISE DOS
Page 9 and 10:
APLICACIÓN DE UN ÍNDICE DE EVALUA
Page 11 and 12:
POSTERS UNA ONTOLOGÍA DE VINOS ESP
Page 13 and 14:
Por fim desejamos que todos os part
Page 15 and 16:
Carlos Juiz, Universidad de las Isl
Page 17 and 18:
María Dolores Ayuso, Universidad d
Page 19 and 20:
xviii
Page 21 and 22:
Os Ambientes Inteligentes podem ser
Page 24 and 25:
EM BUSCA DE UM ENSINO COMPLEMENTAR
Page 26 and 27:
Figura 1. Simulador de robô O requ
Page 28 and 29:
Conferência IADIS Ibero-Americana
Page 30 and 31:
AGRADECIMENTOS Intel Educação; Mi
Page 32 and 33:
Ao longo dos últimos anos, a ESEB
Page 34 and 35:
Contrariamente às etapas anteriore
Page 36 and 37:
3.3 Resource Description Framework
Page 38 and 39:
Page 40 and 41:
Page 42 and 43:
a) Acompanhamento de acesso e freq
Page 44 and 45:
Nesta perspectiva, houve um redimen
Page 46 and 47:
troca representa apenas 1 (um) dos
Page 48 and 49:
UMA FERRAMENTA PARA ACOMPANHAMENTO
Page 50 and 51:
permite analisar a capacidade cogni
Page 52 and 53:
• Objeto de aprendizagem (OA) = u
Page 54 and 55:
5. VALIDAÇÃO DA FERRAMENTA Para v
Page 56 and 57:
RECOMENDACIÓN DE PERFILES ACADÉMI
Page 58 and 59:
Page 60 and 61:
Número de Vecinos Factor de relev
Page 62 and 63:
Figura 3. Recomendaciones para asig
Page 64 and 65:
UMA FERRAMENTA DE MINERAÇÃO DE TE
Page 66 and 67:
Os trabalhos encontrados no levanta
Page 68 and 69:
3.2 Módulo de Inteligência Figura
Page 70 and 71:
seleção executa os seguintes pass
Page 72 and 73:
HIPERMÍDIA ADAPTATIVA COMO ESTRAT
Page 74 and 75:
3. SISTEMAS DE HIPERMÍDIA ADAPTATI
Page 76 and 77:
Page 78 and 79:
âncoras ordenadas poderão estar e
Page 80 and 81:
MODELO PARA LA GESTIÓN DEL E-LEARN
Page 82 and 83:
2. EL MODELO 2.1 El Contexto Confer
Page 84 and 85:
Duart y Sangrà (2000), debe permit
Page 86 and 87:
Eje 5: eProcesos Medida 5.1: eMárk
Page 88 and 89:
A ATENÇÃO AO ECONÓMICO, AO SOCIA
Page 90 and 91:
A região de Lisboa aparece-nos com
Page 92 and 93:
do ambiente. O valor dos muito fort
Page 94 and 95:
É esmagador, 195, o número de sit
Page 96 and 97:
E-GOV BRASILEIRO: UMA ANÁLISE DOS
Page 98 and 99:
2.2 Coleta e Integração dos Dados
Page 100 and 101:
município brasileiro, sendo que: (
Page 102 and 103:
significa que um cidadão com acess
Page 104 and 105:
MSB: UNA APLICACIÓN WWW PARA GENER
Page 106 and 107:
minar qué eventos resultan relevan
Page 108 and 109:
daños > caudal > volumen > lluvia
Page 110 and 111:
MSB presenta también similitudes c
Page 112 and 113:
DISEÑO DE UNA HERRAMIENTA PARA EL
Page 114 and 115:
Page 116 and 117:
Figura 2. Creación de Caso de Uso
Page 118 and 119:
conjuntamente con la información r
Page 120 and 121:
UM MODELO ONTOLÓGICO PARA O CONTEX
Page 122 and 123:
sejam capazes de reconhecer quais o
Page 124 and 125:
Figura 3. data flow pipeline Confer
Page 126 and 127:
administrative region (como por exe
Page 128 and 129:
INTEGRACIÓN SEMÁNTICA DE INFORMAC
Page 130 and 131:
Figura 1. Arquitectura • Document
Page 132 and 133:
4.2 Generación y Conversión de Co
Page 134 and 135:
SPARQL toma la descripción de lo q
Page 136 and 137:
EN BUSCA DEL TIPO DE SERVICIO WEB S
Page 138 and 139:
En la actualidad conviven cuatro pr
Page 140 and 141:
A continuación presentamos una tab
Page 142 and 143:
Page 144 and 145:
tecnologías de comunicación [3] p
Page 146 and 147:
para la conexión un cifrado median
Page 148 and 149:
Figura 4. Lanzamiento de la aplicac
Page 150 and 151:
USABILIDAD EN UN JUEGO DE MEMORAMA
Page 152 and 153:
Al finalizar la animación introduc
Page 154 and 155:
fueron asignados después de realiz
Page 156 and 157:
Page 158 and 159:
DEFINIENDO UNA ESTRUCTURA DE EVALUA
Page 160 and 161:
Consideración de la audiencia. Nue
Page 162 and 163:
Page 164 and 165:
señalan que con dos puede ser sufi
Page 166 and 167:
EXPERIÊNCIA NA CUSTOMIZAÇÃO DE U
Page 168 and 169:
temporal e o detalhamento das class
Page 170 and 171:
hipermídia, projetista de interfac
Page 172 and 173:
Index.csp Imovel.cls Imovel.csp P
Page 174 and 175:
ALGORITMOS PARA TOKENS DE AUTENTICA
Page 176 and 177:
3. PLATAFORMA Como token de baixo c
Page 178 and 179:
Tabela 1. Uso dos algoritmos de MAC
Page 180 and 181:
de processamento são executadas em
Page 182 and 183:
acadêmica, distribuição de mater
Page 184 and 185:
utilizados pelo sistema, e de como
Page 186 and 187:
5. FRAMEWORK PARA DOCUMENTAÇÃO DE
Page 188 and 189:
6. CONCLUSÃO A especificação de
Page 190 and 191:
Page 192 and 193:
Page 194 and 195:
Page 196 and 197:
EVOLUCIÓN DE LA TOPOLOGÍA DE INTE
Page 198 and 199:
3. ADQUISICIÓN DE DATOS 3.1 Descri
Page 200 and 201:
4. MÉTRICAS CALCULADAS Todo los c
Page 202 and 203:
6. CONCLUSIONES Tabla 6. Evolución
Page 204 and 205:
INTERNET COMO CANAL DE COMPRA: RESP
Page 206 and 207:
3. HIPÓTESIS Conferência IADIS Ib
Page 208 and 209:
SEÑALES DE LA WEBMOSPHERE Dimensi
Page 210 and 211:
Page 212 and 213:
USO DA INTERNET NO TURISMO: UMA PES
Page 214 and 215:
Além das já citadas facilidades p
Page 216 and 217:
enquadramento profissional dos entr
Page 218 and 219:
Tabela 9. Opinião dos turistas sob
Page 220 and 221:
SIMULADOR DO SERVIDOR DE HABILITAÇ
Page 222 and 223:
Todas as conexões externas com o s
Page 224 and 225:
3.3 Base de Dados Internet Aplicaç
Page 226 and 227:
etorno (número de identificação
Page 228 and 229:
ANALISE DE DESEMPENHO DE PROTOCOLOS
Page 230 and 231:
• EAP-TLS - EAP Transport Layer S
Page 232 and 233:
Figura 2. Cenário dos testes No Qu
Page 234 and 235:
Média de atraso Jitter Médio Nív
Page 236 and 237:
aAUTOMATOR: HERRAMIENTA FLEXIBLE PA
Page 238 and 239:
• aAUTOMATOR API. Librería en la
Page 240 and 241:
URLDownloader Cada cadena de texto
Page 242 and 243:
Los robots se van construyendo dire
Page 244 and 245:
MODELO DE QUALIDADE DE COMPONENTES
Page 246 and 247:
Page 248 and 249:
Integração, configuração e inte
Page 250 and 251:
implementação das funcionalidades
Page 252 and 253:
UTILIZACIÓN DE GOOGLE SEARCH APPLI
Page 254 and 255:
Page 256 and 257:
Figura 2. Control y Lógica de Nego
Page 258 and 259:
Figura 5. Visualizador OpenMap Figu
Page 260:
REFERENCIAS Conferência IADIS Iber
Page 264 and 265:
EMOÇÕES COMO PARTE DE UM AMBIENTE
Page 266 and 267:
2.2 Identificação dos Eventos Con
Page 268 and 269:
Sair do jogo Como você se sente sa
Page 270 and 271:
efecto de solventar esta separació
Page 272 and 273:
5. El Generador de Informes, Diplom
Page 274 and 275:
CONTEXTUALIZAÇÃO DA APRENDIZAGEM
Page 276 and 277:
Os alunos de LabIII estavam numa fa
Page 278 and 279:
REFERÊNCIAS Conferência IADIS Ibe
Page 280 and 281:
debate, um exemplo gráfico desenha
Page 282 and 283:
• Nome: Tom Características: Pes
Page 284 and 285:
Este trabalho descreve o desenvolvi
Page 286 and 287:
4. CONCLUSÕES A proposta Web 2.0
Page 288 and 289:
Page 290 and 291:
La valoración de cada uno de los e
Page 292 and 293:
Page 294 and 295:
ao enunciado ou a submissão do fic
Page 296 and 297:
Figura 2. Exemplo da construção d
Page 298 and 299:
PROJECTO DE APLICAÇÃO EM INTERNET
Page 300 and 301:
No desenvolvimento para a Internet
Page 302 and 303:
AQUISIÇÃO E TRATAMENTO DE INFORMA
Page 304 and 305:
• Inclui políticas de autentica
Page 306 and 307:
com a perspectiva de manter a plata
Page 308 and 309:
contextualizada (e.g.. com base no
Page 310 and 311:
utilizador. O componente de gestão
Page 312 and 313:
Sistema de Archivos Protocolo Servi
Page 314 and 315:
Sistema B: Entorno: Windows/Access
Page 316 and 317:
APLICANDO CONCEPTOS DE TEORÍA DE L
Page 318 and 319:
comprobar la posibilidad de mejorar
Page 320 and 321:
EXTRACCIÓN DE PERFILES BASADA EN A
Page 322 and 323:
sesión Si se encuentra la distanci
Page 324 and 325:
datos fue dividido en conjunto de e
Page 326 and 327:
Page 328 and 329:
como o caminho de soluções de pro
Page 330 and 331:
PORTAIS WEB: ENQUADRAMENTO CONCEPTU
Page 332 and 333:
Page 334 and 335:
Page 336 and 337:
SOCIALIZACIÓN DE LA WEB SEMÁNTICA
Page 338 and 339: 1.4 Dimensiones de la Web 2.0 y la
Page 340 and 341: facilitara la comparación de preci
Page 342 and 343: palavras do autor, BI teria como um
Page 344 and 345: configuração vinculado à soluç
Page 346 and 347: 2004) e de se conseguirem identific
Page 348 and 349: Conferência IADIS Ibero-Americana
Page 352 and 353: O objectivo deste artigo é identif
Page 354 and 355: 3.2 Modelos de Maturidade para o Co
Page 356 and 357: PANORÁMICA Y SITUACIÓN DEL ESTÁN
Page 358 and 359: los mensajes distintos, etc. Este a
Page 360 and 361: Ante este panorama, esperemos que e
Page 364 and 365: significativos para a elaboração
Page 366 and 367: MATERIALIZAÇÃO DE VANTAGENS COMPE
Page 368 and 369: humanos, administração de serviç
Page 370 and 371: execução das tarefas, à implanta
Page 372 and 373: CATEGORIZAÇÃO AUTOMÁTICA DE DOCU
Page 374 and 375: 3. PROTÓTIPO No protótipo da ferr
Page 376 and 377: REFERÊNCIAS Conferência IADIS Ibe
Page 378 and 379: 1998) e o da Pedagogia Instituciona
Page 380 and 381: constituiriam novas versões sequen
Page 382 and 383: UMA ARQUITETURA TOLERANTE A FALHAS
Page 384 and 385: Os passos para descoberta e execuç
Page 386 and 387: Nesse modelo, com o intuito de evit
Page 390 and 391: 5. Aplicar las medidas sobre cada u
Page 392 and 393: UMA PROPOSTA PARA O DESENVOLVIMENTO
Page 394 and 395: Atualmente, o termo ontologia vem s
Page 396: propomos o desenvolvimento de uma o
Page 400 and 401: MERCHANDISING EN INTERNET: NUEVAS T
Page 402 and 403: documentos electrónicos, influyen
Page 404 and 405: E_ReInAc: ELEARNING_REUSABILIDAD, I
Page 406 and 407: 2. MODELO TECNOPEDAGÓGICO DE SESIO
Page 408 and 409: BIBLIOTECAS DIGITALES: CONCEPTOS Go
Page 410 and 411: catálogo en línea, aunque este el
Page 412 and 413: ESTRATEGIA COLABORATIVA Y DE CONOCI
Page 414 and 415: PORTAL Portal del Instituto de la M
Page 416 and 417: E-MERCADOS MEDIANTE P2P: UN NUEVO M
Page 418 and 419: se han adoptado los requisitos mín
Page 420 and 421: O CONTRIBUTO DAS TIC PARA O DESENVO
Page 422 and 423: 3. SISTEMA DE INFORMAÇÃO DO PATRI
Page 424: destacar que o Abandono, a Erosão
Page 428 and 429: UNA ONTOLOGÍA DE VINOS ESPAÑOLES
Page 430 and 431: Como procedimiento de desarrollo de
Page 432 and 433: FACTORES CRÍTICOS DA ADESÃO DAS P
Page 434 and 435: Portugal, utilizando entrevistas; e
Page 436 and 437: 2. REPOSITÓRIOS DIGITAIS Um reposi
Page 438 and 439:
ESPECIFICAÇÃO DE UMA APLICAÇÃO
Page 440 and 441:
4. PROTÓTIPO FUNCIONAL Figura 2. D
Page 442 and 443:
AGENTES INTELIGENTES NO AMBIENTE VI
Page 444 and 445:
performativa confirm se for verdade
Page 446 and 447:
4. RESULTADOS DE LA INVESTIGACIÓN
Page 448 and 449:
ANÁLISE DE PROJECTOS DE INVESTIMEN
Page 450 and 451:
3. CONCLUSÃO O presente artigo rep
Page 452 and 453:
Os utilizadores VRIRI, Gestor Erasm
Page 454 and 455:
UTILIZAÇÃO DE OPÇÕES REAIS NA A
Page 456 and 457:
particularmente adequada em matéri
Page 458 and 459:
SISTEMA DE GESTÃO DE PROJECTOS ACA
Page 460 and 461:
alunos com base em critérios de at
Page 462 and 463:
como variáveis de restrição: des
Page 464 and 465:
REFERÊNCIAS Conferência IADIS Ibe
Page 466 and 467:
ocorrer. Desta forma, o risco como
Page 468:
organização. O desenvolvimento da
Page 471 and 472:
Guerra, A. ........................
show all

geração (semi)automática de metadados - Universidad Autónoma ...

Create successful ePaper yourself

Delete template?

Save as template?