MineraÃ§Ã£o de dados para inferÃªncia da relaÃ§Ã£o solo ... - IAC

More documents

Recommendations

Info

4.2 Análise dos dados e elaboração do modelo preditivo dos solosa) São PedroOs diferentes mapas de variáveis geomorfométricas foram sobrepostos e suasinformações cruzadas em SIG, gerando novos mapas, do qual foi possível obter umatabela que relacionou as variáveis descritoras do relevo com as unidades demapeamento associadas a esse conjunto, como ilustrado na tabela 3.A matriz de dados da folha São Pedro apresentou 826.134 pixels, com 900metros quadrados cada, o que equivale a aproximadamente 74.000 hectares. O númerode pixels representa o número de linhas da matriz de entrada de dados no programa demineração de dados. Esse elevado número de linhas gerou tabelas extensas, com dadosconflitantes, como a ausência de valores em determinadas colunas ou ausência deunidades de mapeamento pela atribuição de outros usos, como municípios e corpos deágua. Essas linhas foram eliminadas para que as análises tornassem possíveis, sendo queforam eliminadas 23.192 linhas, o que representou aproximadamente 3 % do totalinicial.Por exemplo, na tabela 3, a linha 182 foi eliminada por não apresentar valordefinido naunidade de mapeamento, enquanto as linhas 43.772 e 491.160 forameliminadas por apresentarem seu valor discreto na unidade de mapeamento comomunicípio e água, respectivamente, informações que não contribuiriam com o modelogerado.Tabela 3 – Exemplo de matriz de variáveis morfométricas associadas as unidades de mapeamento, comexemplos de linhas eliminadas em negrito e itálico.LINHA GEOLOGIA DECLIVIDADEDISTÂNCIADIAGONALCURVATURAPLANTACURVATURAPERFILÁREACONTRIBUIÇÃO UNIMAP182 Itaqueri ondulado média divergente retilínea muito baixa Sem valor210 Itaqueri suave média divergente retilínea baixaLVA muitoarg575 Pirambóia suave pequena plano retilínea muito baixaPVAdaren/médmuito41463 Botucatu montanhoso grande plano retilínea muito baixa RLe arg43772 Pirambóia ondulado média plano retilínea muito baixa município3801 Corumbatai planomuitopequena convergente retilínea muito baixa PVAd arg397462 Pirambóia ondulado média plano retilínea muito baixa GX + GM491160Sedimentosaluvionais planomuitopequena divergente retilínea baixa água512415Sedimentosaluvionaisplanomuitopequena divergente retilínea baixa GX_+ GM53
Após a correção da matriz de dados iniciaram-se as análises, selecionando-sealeatoriamente uma amostra de 10 % dos dados da folha São Pedro pelo programa demineração de dados WEKA, de modo que todas as unidades de mapeamento fossemcontempladas. Posteriormente, gerou-se um modelo relacional de aprendizado, sem osdados estratificados, através de árvores de decisão, na qual cada folha da árvorecorrespondeu às diferentes unidades de mapeamento a serem preditas e os ramosreferiam-se às classes discretas das variáveis geradas na construção do modelo para osdados brutos. A avaliação da acurácia desse modelo foi obtida quando as unidades demapeamento de solo resultantes foram testadas nos dados selecionados no início eobservados a porcentagem de acerto e erro.Com a finalidade de melhorar essa acurácia foi realizado o balanceamento declasses, pois algumas unidades de mapeamento apresentam grande representatividade nafolha, enquanto outras não chegaram a 2 % do total. Essa técnica consiste em aumentara proporção de amostragem nas classes com menor área de ocorrência e reduzir aproporção nas unidades com maior área (Figura 10).Muitos sistemas de aprendizado assumem previamente que as classes estãobalanceadas e acabam falhando ao induzir um classificador que seja incapaz de predizera classe minoritária com acurácia. Na maioria dos casos o classificador possui uma boaacurácia para a classe majoritária, mas uma acurácia baixa para a classe minoritária. Oproblema agrava-se ainda mais quando o custo da classificação incorreta da classeminoritária é muito maior que o custo da classificação incorreta da classe majoritária(BATISTA, 2003).Para solucionar esses problemas podem ser aplicados alguns métodos, como osdesenvolvidos por JAPKOWICZ & STEPHENS (2002), através da atribuição doscustos da classificação incorreta, under-sampling ou over-sampling. Esses dois últimossão métodos de pré-processamento dos dados. Consistem em balancear artificialmente adistribuição das classes no conjunto de exemplos. Através do under-sampling oconjunto de dados é balanceado pela eliminação das unidades de mapeamento commaior representatividade, enquanto no over-sampling as unidades são balanceadas pelareplicação das de menor proporção.54
Page 1 and 2:
INSTITUTO AGRONÔMICOCURSO DE PÓS-
Page 4 and 5:
Primeiramente a Deus, pela vida,Ao
Page 6 and 7:
- A toda turma do geoprocessamento
Page 8 and 9:
ÍNDICE DE TABELASTabela 1 - Distri
Page 10 and 11:
ÍNDICE DE FIGURASFigura 1 - Repres
Page 12 and 13:
CRIVELENTI, Rafael Castro. Mineraç
Page 14 and 15:
CRIVELENTI, Rafael Castro. Data min
Page 16 and 17:
1 INTRODUÇÃOA distribuição espa
Page 18 and 19: 2 REVISÃO DE LITERATURA2.1 Histór
Page 20 and 21: 2.2 Levantamento pedológico por m
Page 22 and 23: corretivas ou compensatórias de ca
Page 24 and 25: Nesta perspectiva, é oportuno dese
Page 28 and 29: irregulares (MONTGOMERY, 2003). As
Page 30 and 31: o objetivo de diminuir o erro por e
Page 32 and 33: Recentemente, SIRTOLI et al. (2008)
Page 34 and 35: intermediário, é a unidade de tom
Page 36 and 37: −∑H x / y)= p .ln( p / p )[3](i
Page 38 and 39: Estes sistemas manipulam dados geor
Page 40 and 41: 2.9 Comparação entre resultados d
Page 42 and 43: mapeamento, considerando as classes
Page 44 and 45: correlacionaram com a distribuiçã
Page 46 and 47: 3 MATERIAL E MÉTODOS3.1 Descriçã
Page 48 and 49: (a)120Extrato do Balanço Hídrico
Page 50 and 51: (a)(b)Figura 5 - Mapas de geologia
Page 52 and 53: Conforme PONÇANO (1981), o ambient
Page 54 and 55: h) Cambissolo: Solos constituídos
Page 56 and 57: 1:1.000.000 (IPT, 1981), e evidenci
Page 58 and 59: ) Curvatura em perfil (VALERIANO, 2
Page 60 and 61: dados estratificados retirados ante
Page 62 and 63: 4 RESULTADOS E DISCUSSÃO4.1 MDE, G
Page 64 and 65: (a)(b)(c)Figura 7 - Mapas de variá
Page 66 and 67: (a)(b)(c)Figura 8 - Mapas de variá
Page 70 and 71: BalanceamentosFigura 10 - Distribui
Page 72 and 73: ocorrência deixe de ser amostrada
Page 74 and 75: unidades de mapeamento de solos fos
Page 76 and 77: devido a sua grande representativid
Page 78 and 79: Tabela 12 - Atualização da legend
Page 80 and 81: A análise do mapa permite verifica
Page 82 and 83: Tabela 15 - Ordenamento das variáv
Page 84 and 85: A partir da sobreposição dos mapa
Page 86 and 87: Tabela 16 - Matiz de confusão das
Page 88 and 89: Tabela 17 - Porcentagem de acerto e
Page 90 and 91: Como pode ser observado na figura 1
Page 92 and 93: unidades de mapeamento. Por exemplo
Page 94 and 95: O latossolo vermelho amarelo textur
Page 96 and 97: mapeamento de solos fosse classific
Page 98 and 99: predominância de latossolos (64 %)
Page 100 and 101: um banco de dados digitais para ess
Page 102 and 103: 6 SUGESTÕESComo trabalhos futuros
Page 104 and 105: mapa de solos na região de Três P
Page 106 and 107: COSTA CABRAL, M. & BURGES, S.J. Dig
Page 108 and 109: IBGE - INSTITUTO BRASILEIRO DE GEOG
Page 110 and 111: McBRATNEY, A.B.; MENDONÇA SANTOS,
Page 112 and 113: PISSARA, T.C.T.; POLITANO, W.; FERR
Page 114 and 115: TURCOTTE, R.; FORTIN, J.P.; ROUSSEA
Page 116 and 117: 8 ANEXO(S)Anexo I………………
Page 118 and 119:
65,9 0,9 3,6 6,8 LVdf text. argilos
Page 120 and 121:
Balanceamento de classes = 1a b c d
Page 122:
Anexo VI - Matriz de confusão para
show all

MineraÃ§Ã£o de dados para inferÃªncia da relaÃ§Ã£o solo ... - IAC

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?