Inhaltsbasierte Analyse Des Tauschverhaltens In P2P-Netzwerken
Inhaltsbasierte Analyse Des Tauschverhaltens In P2P-Netzwerken
Inhaltsbasierte Analyse Des Tauschverhaltens In P2P-Netzwerken
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
INHALTSBASIERTE ANALYSE DES TAUSCHVERHALTENS IN <strong>P2P</strong>-NETZWERKEN 36<br />
Der Hash ist hierbei die eindeutige Identifikation für jede übertragene Datei. Die<br />
übertragenen Bytes sind alle durch das eDonkey Modul gezählten Bytes. Ist<br />
diese Summe 0, so wurde diese Datei von einem Client angefragt, aber keine<br />
Nutzdaten übertragen. Die erkannten Dateinamen sind die vom eDonkey Pro-<br />
tokoll übertragenen Dateinamen.<br />
Jedem Hash innerhalb dieser Rohdaten wird in ein zweistufiges Klassifikations-<br />
schema eingeordnet (Siehe Kapitel 5.1). Dabei wurden verschiedene Techni-<br />
ken angewendet, um jeden Hash in genau eine Haupt- und in eine Unterkate-<br />
gorie einzuordnen.<br />
Für die Einordnung in die Hauptkategorie wurde, wenn vorhanden, die Datei-<br />
endung verwendet.<br />
Hauptkategorie Verwendete Endungen<br />
Video .avi , .wmv , .divx , .xvid , .asf , .qt<br />
Audio .mp3 , .ogg<br />
Software .exe<br />
eBook .pdf , .chm<br />
Bilder .gif , .jpg , .jpeg , .png , .tiff ,<br />
Tabelle 8: verwendete Endungen für die eDonkey - Klassifikation nach Dateinamen<br />
Alle nicht klassifizierten Werke wurden danach, wenn möglich, manuell klassifi-<br />
ziert. Dabei wurde deutlich, dass viele Dateien rar- oder zip-Archive sind, die<br />
nur anhand des Namens klassifiziert werden können.<br />
Die Unterkategorie (siehe Kap 5.1) wurde automatisch anhand vorgegebener<br />
Schlüsselwörter innerhalb der übertragenen Dateinamen bestimmt.