12.07.2015 Views

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Associacao_uri_stem.pyimport stringimport os.pathimport timeprint time.strftime("%a, %d %b %Y %H:%M:%S", time.localtime())print 'Gera associacoes principais com determinada uri-stem'print '----------------------------------------------------'#le arquivo de configuracao (diretorio de trabalho)arqconf = 'Configuracao.txt'entradaconf = open(arqconf)if os.path.isfile(arqconf):for line in entradaconf:diretorio = line[0:len(line)-1]breakelse:print 'Arquivo de configuracao nao encontrado...'entradaconf.close()total = 0desprezado = 0considerado = 0grav_sessao = 0grav_lista = 0gravado = 0rec_ant = ['1']arqin = diretorio + '\Trabalho\\sessao_considerada_transposta.log'arqout = diretorio + '\Trabalho\\associacoes_principais_uri_stem_a.log'saida = open(arqout, 'w')tempo_min = 5 #tempo minimo (em segundos) de permanencia numa pagina para ser consideradoqtde_assoc = 3 #qtde de paginas a serem consideradas na analise, alem da pagina de referencia e ultima paginapagref = '/2004/imc/imc.asp\n'pagini = ['/2004/index.shtml\n']print ' 'print 'arqin: ', arqinprint 'arqout: ', arqoutprint ' 'print 'Visao: ', pagrefprint ' 'if os.path.isfile(arqin):entrada = open(arqin)sessao = []lista = []grav_sessao_lista = 0for line in entrada:rec = string.splitfields(line, ' ')#coloca zeros a esquerda em rec[0] , rec[1] e rec[2] para acertar o sort das listasfor j in range(0,10-len(rec[0])):rec[0] = '0' + rec[0]for j in range(0,10-len(rec[1])):rec[1] = '0' + rec[1]192

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!