11.07.2015 Aufrufe

PDF-Version - Home - Graz University of Technology

PDF-Version - Home - Graz University of Technology

PDF-Version - Home - Graz University of Technology

MEHR ANZEIGEN
WENIGER ANZEIGEN
  • Keine Tags gefunden...

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

3.5. BEWÄLTIGUNG DER INFORMATIONSFLUT 35Rolls-Royce in Abschnitt 4.5 nocht zeigen wird.Als Beispiel für das starke Informationsaufkommen kann auch eine sehr alte wissenschaftlicheDisziplin, nämlich die Mathematik, dienen. Im Jahre 1870 wurden ca. 840 wissenschaftliche mathematischeArbeiten publiziert. 1994 waren es etwa 50.000 Arbeiten. In diesen 124 Jahren verdoppeltesich also die Anzahl der Publikationen ca. alle 20 Jahre. Ein genauerer Blick auf die Zahlen zeigt aber,dass sich die Anzahl nach dem 2. Weltkrieg etwa alle 10 Jahre verdoppelte, die Zahl der Publikationenpro Jahr steigt also nicht linear, sondern exponentiell an. Wenn man daher die Summe der bis jetztpublizierten mathematischen Arbeiten bildet, kommt man auf mehr als 1.000.000 Arbeiten. Durch dasexponentielle Verhalten ist ableitbar, dass die Hälfte davon in den letzten 10 Jahren erschienen ist.[Krottmaier 1998]Der steigenden Zahl an Publikationen wirkt allerdings die Nutzung von Informationstechnologieentgegen. Mit IT-Systemen lassen sich diese Publikationen, die im Grunde nichts anderes als externalisertesWissen darstellen, verwalten und dadurch gezielt nach bestimmten Informationen durchsuchen.In den letzten 10 Jahren immer größerer Beliebtheit erfreute sich dabei das WWW 2 . Im World WideWeb gilt – wie auch in der IT-Infrastruktur eines großen Unternehmens –, dass eine effiziente Nutzungwegen der enormen Anzahl an Dokumenten und deren kontinuierlicher Veränderung und Erweiterungohne die Hilfe von Suchdiensten nicht mehr möglich wäre. [Knögler 1999]In einem großen Konzern bringt bereits die Verteilung von Informationen über mehrere IT-Systemedas Problem mit sich, dass Redundanzen wie beispielsweise das mehrfache Verwalten der gleichenDokumente entstehen. Genauso erhöht die Bereitstellung von mehrsprachigen Dokumenten das Datenaufkommenim Intranet. Hierzu kommt, dass Unternehmen im allgemeinen Wissen aus dem Internetbeziehen und somit auch mit dieser externen Informationsflut konfrontiert sind.Heute verfügbare Suchverfahren und die Aufbereitung der Informationen durchsuchter Dokumentestellen in Teilbereichen hilfreiche Werkzeuge zur Verfügung. Doch mit den gegenwärtigen Methodenund der Zunahme von Dokumenten und Suchmaschinen wird allerdings die dadurch verursachte NetzundServerbelastung künftig andere Anwendungen weitgehend beeinträchtigen. Ein weiteres Problemergibt sich durch das Wachstum und die enorme Dynamik des Web, sodass auch größere Suchdiensteimmer nur einen Bruchteil aller Dokumente erfassen können. Die Dynamik äußert sich durch einenkontinuierlichen Wandel der Dokumente und ihrer Inhalte, durchschnittlich ändert sich ein Dokumentalle 75 Tage. [Knögler 1999]Informationsauffindung und AufbereitungBevor ein Mitarbeiter die Möglichkeit der Suche im Intra- oder Internet hat, müssen Informationenüber die unternehmensrelevante Dokumente erst gesammelt werden. Es gibt verschiedene Möglichkeiten,wie Dokumente in einem IT-System lokalisiert werden, wobei die Grenzen durchaus fließendineinander übergehen und Kombinationen möglich sind.Bei der vollautomatischen Auffindung verfolgt ein Programm ähnlich wie ein Benutzer Hyperlinksauf Web-Seiten bzw. Verzeichnisstrukturen auf diversen Servern. Diese sogenannten Robots oder Spiderverarbeiten vollautomatisch alle gefundenen Dokumente und versuchen, relevante Informationenwie etwa Namen von Autoren, Titel und Schlüsselwörter zu ermitteln. [Knögler 1999]Relevante Informationen können aus Dokumenten extrahiert werden, indem man beispielsweiseSchlüsselwörter durch einen Algorithmus, der Wörter mit geringer relativer Häufigkeit bevorzugt, ermittelt.Gewissen Formatierungen (beispielsweise Überschriften oder Fettdruck) bieten ebenfalls Ansatzpunkte,relevante Beschreibungen zu extrahieren. Auch die Verarbeitung von sogenannten Meta-Tags im Dokument kann zusätzliche Informationen bringen. Eine weitere Möglichkeit besteht darin,2 World Wide Web oder auch W3

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!