12.07.2015 Views

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Calcula_tempo_sessao.pyimport stringimport os.pathimport timeimport datetimeprint time.strftime("%a, %d %b %Y %H:%M:%S", time.localtime())print 'Calcula tempo de permanencia e separa sessoes geradas...'print '--------------------------------------------------------'#le arquivo de configuracao (diretorio de trabalho)arqconf = 'Configuracao.txt'entradaconf = open(arqconf)if os.path.isfile(arqconf):for line in entradaconf:diretorio = line[0:len(line)-1]breakelse:print 'Arquivo de configuracao nao encontrado...'entradaconf.close()timeout = 1800 #tempo maximo de inatividade para ser considerado da mesma sessaodeltamin = 1 #tempo minimo a ser considerado entre duas solicitacoes de paginastotal = 0gravado = 0arqin = diretorio + '\Trabalho\\navegacao_total.log'arqout = diretorio + '\Trabalho\\sessao.log'saida = open(arqout, 'w')repeticoes = ['/2004/index.shtml']print ' 'print 'arqin: ', arqinprint 'arqout: ', arqoutprint ' 'if os.path.isfile(arqin):entrada = open(arqin)for line in entrada:total = total + 1if total % 10000 == 0:print totalline = line[0:len(line)-1]rec = string.splitfields(line, ' ')qtde = int(rec[0])ip = rec[1]agente = rec[2]head = rec[1]+' '+rec[2]d1 = string.splitfields(rec[3], '-')h1 = string.splitfields(rec[4], ':')data1 = datetime.datetime(int(d1[0]),int(d1[1]),int(d1[2]),int(h1[0]),int(h1[1]),int(h1[2]))linha = head+' '+rec[3]+' '+rec[4]+' '+rec[5]if qtde > 1:for j in range(1, qtde):186

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!