(a) C-S(b) C-CS(c) S-CS(d) CS-CSFigura 5. Histograma da Distribuição Conjunta Empírica <strong>de</strong> Grau por Papéis (Intervalologarítmo base 2)• CS-C: 124717 a<strong>re</strong>stas (4,66%)• CS-S: 26932 a<strong>re</strong>stas (1,01%)• CS-CS: 2396 a<strong>re</strong>stas (0,09%)As proporções <strong>de</strong> a<strong>re</strong>stas nos <strong>re</strong>velam que a adjacência mais comum na <strong>re</strong><strong>de</strong> éa <strong>de</strong> Clientes com Servido<strong>re</strong>s. Outra maneira <strong>de</strong> interp<strong>re</strong>tar esses dados diz <strong>re</strong>speito àf<strong>re</strong>quência <strong>re</strong>lativa da classificação dos vértices adjacentes a um <strong>de</strong>terminado tipo. Nestesentido, os vértices do tipo S t<strong>em</strong> 98,94% <strong>de</strong> vizinhos do tipo C e apenas 1,06% do tipoCS. Já os vértices do tipo C t<strong>em</strong> 95,28% <strong>de</strong> vizinhos do tipo S e 4,72% do tipo CS.Vértices CS t<strong>em</strong> 80,96% <strong>de</strong> vizinhos C, 17,48% S e apenas 1,56% CS.Distribuição Conjunta Empírica <strong>de</strong> Grau por <strong>papéis</strong>: <strong>re</strong>p<strong>re</strong>senta a fração <strong>re</strong>lativa<strong>de</strong> a<strong>re</strong>stas que conectam um vértice <strong>de</strong> grau k 1 do tipo 1 e <strong>de</strong> grau k 2 do tipo 2 . Comoa<strong>re</strong>stas do tipo C-C e S-S não são possíveis, a distribuição conjunta para estas a<strong>re</strong>stas énula. As <strong>de</strong>mais distribuições <strong>em</strong>píricas conjuntas estão <strong>re</strong>p<strong>re</strong>sentadas na Figura 5. A Figura5 nos <strong>re</strong>vela algumas tendência <strong>de</strong> vizinhança da <strong>re</strong><strong>de</strong>. Em 5(a) v<strong>em</strong>os que S <strong>de</strong> graualto estão conectados na sua maioria com C <strong>de</strong> grau baixo e C <strong>de</strong> grau alto conectam-se,<strong>em</strong> geral, a S <strong>de</strong> grau baixo. Tal padrão – <strong>re</strong>lação ent<strong>re</strong> grau alto e baixo – é <strong>re</strong>petidotambém na Figura 5(b) e menos intensamente nas Figuras 5(c) e 5(d).5. Re-<strong>i<strong>de</strong>ntificação</strong> <strong>de</strong> <strong>papéis</strong>A inferência <strong>de</strong> informações <strong>re</strong>levantes provenientes apenas da estrutura <strong>de</strong> Re<strong>de</strong>s anonimizadast<strong>em</strong> sido alvo <strong>de</strong> diversos trabalhos [Hay et al. 2008] e [Pang et al. 2006]. Nesta1936
seção ap<strong>re</strong>sentamos algumas técnicas, propostas neste trabalho, para a <strong>re</strong>-<strong>i<strong>de</strong>ntificação</strong><strong>de</strong> <strong>papéis</strong> (cliente, servidor, cliente/servidor) <strong>em</strong> Re<strong>de</strong>s <strong>de</strong> <strong>Conexão</strong> anonimizadas. Astécnicas ap<strong>re</strong>sentadas exploram apenas as proprieda<strong>de</strong>s estruturais <strong>de</strong>stas <strong>re</strong><strong>de</strong>s <strong>de</strong>scritase avaliadas na seção 4 <strong>de</strong>ste trabalho. Todas as técnicas propostas p<strong>re</strong>ocupam-se <strong>em</strong> gerarclassificações consistentes, ou seja, classificações possíveis, observadas as <strong>re</strong>strições<strong>de</strong> <strong>re</strong>lação <strong>de</strong> adjacência. Uma classificação consistente para uma Re<strong>de</strong> <strong>de</strong> <strong>Conexão</strong> nãopermite que existam a<strong>re</strong>stas do tipo C-C ou S-S.5.1. Classificador <strong>de</strong> Or<strong>de</strong>m Dec<strong>re</strong>scenteEsta técnica tenta explorar, <strong>de</strong> modo simples, a <strong>re</strong>lação ent<strong>re</strong> as caudas da distribuição<strong>em</strong>pírica <strong>de</strong> grau dos dife<strong>re</strong>ntes tipos <strong>de</strong> vértice. Po<strong>de</strong>mos inferir que os vértices <strong>de</strong> maiorgrau da <strong>re</strong><strong>de</strong> serão do tipo servidor, <strong>de</strong> acordo com a avaliação na seção 4.2. Além disso,esta técnica <strong>de</strong> classificação <strong>re</strong>speita as possíveis <strong>re</strong>lações <strong>de</strong> adjacências ent<strong>re</strong> os vértices,não permitindo que um vértice do tipo cliente ou servidor sejam adjacentes a vértices domesmo tipo. A idéia geral <strong>de</strong>ste classificador é percor<strong>re</strong>r os vértices da Re<strong>de</strong> <strong>de</strong> <strong>Conexão</strong><strong>em</strong> or<strong>de</strong>m <strong>de</strong>c<strong>re</strong>scente quanto ao grau, observar os vizinhos já classificados e atribuir umaclassificação consistente. O esqu<strong>em</strong>a <strong>de</strong>sta técnica está <strong>de</strong>scrito abaixo:Classificador Or<strong>de</strong>mDec<strong>re</strong>scente (Maio<strong>re</strong>s:FILA, Grafo: GRAFO)INTEIRO: Cli, ServVERTICE: e, vPara v <strong>em</strong> Vertices(Grafo): rotulo[v] := 0Para e <strong>em</strong> Maio<strong>re</strong>s:Cli, Serv := 0Para v <strong>em</strong> Vizinhos(Grafo, e):caso rotulo[v] = C: Cli ++caso rotulo[v] = S: Serv ++Fim Parase Serv=0 rotulo[e] := Sse nao, se Cli=0 rotulo[e] := Cse nao rotular[e] := CSFim ParaFim Classificador5.2. Classificador BFSA Busca <strong>em</strong> Largura (BFS – B<strong>re</strong>adth-First Search) é um dos algoritmos mais simples eutilizados para se percor<strong>re</strong>r um grafo. Este método explora sist<strong>em</strong>aticamente as a<strong>re</strong>stas<strong>de</strong> um Grafo a partir <strong>de</strong> um vértice, até <strong>de</strong>scobrir todos os vértices acessíveis por esteiniciador [Cormen et al. 2001].A idéia geral <strong>de</strong>ste classificador parte da combinação da propagação <strong>de</strong> uma BFScom algumas constatações provenientes da análise das Re<strong>de</strong>s <strong>de</strong> <strong>Conexão</strong>, feita na seção4, como a inferência quanto à classificação do vértice <strong>de</strong> maior grau como servidor e a<strong>re</strong>lação <strong>de</strong> adjacências possíveis ent<strong>re</strong> os vértices. As proporções das adjacências existentesjustificam o fato da utilização da BFS. Dado que 98,94% dos vértices adjacentes a umvértice servidor são clientes e que 95,28% dos vértices adjacentes a um vértice cliente sãoservido<strong>re</strong>s, tenta-se classificar vértices como servido<strong>re</strong>s ou clientes alternadamente <strong>em</strong>cada onda <strong>de</strong> propagação. Adicionalmente, esta técnica utiliza-se também da constataçãoda existência <strong>de</strong> ao menos um vértice cliente/servidor <strong>em</strong> ciclos <strong>de</strong> tamanho ímpar.A existência <strong>de</strong> ao menos um vértice cliente/servidor <strong>em</strong> um ciclo ímpar é <strong>re</strong>sultadodas <strong>re</strong>lações <strong>de</strong> adjacência possíveis. De outra maneira, se pudéss<strong>em</strong>os classificar <strong>em</strong>1937