22.12.2012 Aufrufe

Effizient suchen leicht gemacht - Centre fri-tic

Effizient suchen leicht gemacht - Centre fri-tic

Effizient suchen leicht gemacht - Centre fri-tic

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Effizient</strong> <strong>suchen</strong> <strong>leicht</strong> <strong>gemacht</strong><br />

Ein Lehrmittel für den IKT-Unterricht<br />

von Giancarlo Gareiss


EFFIZIENT SUCHEN<br />

LEICHT GEMACHT<br />

2


Inhaltsverzeichnis<br />

Vorwort zum Gebrauch 4<br />

1. Bedeutung von Suchmaschinen 5<br />

2. Die Entwicklung des Internets 6<br />

3. Wie funktionieren Suchmaschinen 11<br />

4. <strong>Effizient</strong>es Suchen 18<br />

5. Gefahren im Umgang mit Google 25<br />

6. Anhang A 30<br />

a. Glossar 30<br />

b. Nützliche Links 34<br />

c. Quellenangabe 36<br />

7. Anhang B 43<br />

a. Lösungen 43<br />

3


Vorwort zum Gebrauch<br />

Was ist das Ziel des vorliegenden Lehrmittels?<br />

Das Lehrmittel „<strong>Effizient</strong> Suchen <strong>leicht</strong> <strong>gemacht</strong>“ soll dir einen<br />

Einblick in verschiedene Aspekte von Suchmaschinen und insbesondere<br />

Google verleihen. Es bringt dir einerseits die Funktionsweise<br />

von Suchmaschinen näher, andererseits lernst du Techniken<br />

für ein gezielteres Suchen im Internet und wirst auf die Gefahren<br />

im Umgang mit Google aufmerksam <strong>gemacht</strong>. Die Entstehungsgeschichte<br />

des Internets und die Bedeutung von Google und Co. runden<br />

das Lehrmittel ab und setzen Suchprogramme in einen grösseren<br />

Zusammenhang. Für die Bearbeitung brauchst du keinerlei<br />

Vorkenntnisse. Dein Wissen vom täglichen googeln reicht vollständig<br />

aus.<br />

Wie ist es aufgebaut?<br />

Das Lehrmittel ist in fünf Kapitel unterteilt, die jeweils verschiedene<br />

Aspekte von Suchmaschinen abhandeln. Zu Beginn jedes<br />

Kapitels steht eine Einführungsseite in grün, die einerseits dein<br />

Vorwissen aktivieren soll und andererseits eine Heranführung an<br />

die Thematik des Kapitels darstellt. Der blaugefärbte Hauptteil<br />

eines jeden Kapitels ist in eine linke und rechte Spalte unterteilt.<br />

Die linke soll dir Informationen zum Thema beschaffen und enthält<br />

auch Theorieteile, die rechte dient der Vertiefung mittels Aufgaben<br />

und der Auflockerung. Zum Schluss jedes Kapitels folgt<br />

eine rote Abschlussseite, die einerseits mit einer Zusammenfassung<br />

der wichtigsten Punkte, andererseits mit Repetitionsaufgaben<br />

dienen soll. Im Anhang finden sich die Lösungen sämtlicher Aufgaben,<br />

ein Glossar, welcher die unterstrichenen Begriffe erklärt<br />

und dazu noch einige nützliche Internetseiten für den Schulalltag.<br />

Tipps zur Bearbeitung<br />

� Bearbeite das Lehrmittel in der vorgegebenen Reihenfolge<br />

der Kapitel und Unterkapitel.<br />

� Lies vor den Aufgaben immer den Theorieteil genau<br />

durch.<br />

� Versuche die Aufgaben, sofern nicht anders vermerkt,<br />

selbständig zu lösen und notiere die Lösungen auf ein separates<br />

Blatt Papier.<br />

� Die Lösungen im Anhang müssen nicht immer mit deinen<br />

übereinstimmen.<br />

� Löse auch die Einstiegs- und Repetitionsaufgaben. Sie<br />

dienen der Aktivierung deines Vorwissens bzw. der Festigung<br />

des Erlernten.<br />

4


Die Entstehung des Internet<br />

1. Bedeutung von Suchmaschinen<br />

1958<br />

Als<br />

Menschen<br />

Reaktion<br />

stellten<br />

auf den<br />

schon<br />

russischen<br />

immer<br />

Satelliten<br />

Fragen. Es<br />

Sputnik<br />

liegt wohl<br />

(1957)<br />

einfach<br />

ruft das<br />

in<br />

Verteidigungsministerium<br />

der Natur des Menschen neugierig<br />

der USA<br />

zu<br />

die<br />

sein<br />

ARPA<br />

und alles<br />

(Advanced<br />

wissen<br />

Re-<br />

zu<br />

search<br />

wollen.<br />

Projects<br />

Denn wir<br />

Agency)<br />

<strong>suchen</strong><br />

ins<br />

für<br />

Leben.<br />

alles Gründe<br />

Das erklärte<br />

und wollen<br />

Ziel der<br />

nichts<br />

Behörde<br />

als<br />

ist,<br />

gegeben<br />

im Bereich<br />

hinnehmen.<br />

der Technik<br />

Früher vor<br />

nie<br />

mehr<br />

mehr<br />

als<br />

überraschend<br />

zweitausend<br />

geschlagen<br />

Jahren stell-<br />

zu<br />

werden.<br />

ten die Griechen ihre Fragen einem Orakel.<br />

1964<br />

Paul Baran entwickelt als erster die Idee zur Paketvermittlung in<br />

einem verteilten Netz. Sie stellt ein alternatives Verfahren zur<br />

Durchschaltevermittlung dar. [1]<br />

1969<br />

Die Rechner der Universität von Kalifornien, der Universität von<br />

Kalifornien in Santa Barbara, der Universität von Utah und des<br />

Stanford Research Institute werden miteinander verbunden und<br />

bilden zusammen das ARPANET. Finanziert und geleitet wird das<br />

Projekt von der ARPA. Das Ziel ist, eine Möglichkeit für die Zusammenarbeit<br />

und den Datenaustausch der Universitäten zu schaffen.<br />

[2]<br />

1970<br />

Das ARPANET wächst praktisch jeden Monat um einen Rechner.<br />

[3]<br />

1971<br />

Das Netzwerk umfasst mittlerweile 15 Knoten, [4] wird aber weiterhin<br />

nur von einigen Wenigen genutzt. Meistens Informatiker und<br />

Studenten an Universitäten und Forschungseinrichtungen. Die<br />

breite Öffentlichkeit weiss praktisch nichts von der Existenz des<br />

Netzwerks. [5]<br />

1973<br />

Vint Cerf und Robert Kahn legen den Grundstein für das Zusammenschliessen<br />

von verschiedenen Netzwerken:<br />

Sie entwickeln die Protokolle TCP/IP [6] und das Konzept der Gateways<br />

(Netzkoppler), mit deren Hilfe Netzwerke mit unterschiedlichen<br />

Protokollen und Geschwindigkeiten miteinander kommunizieren<br />

können. Jetzt konnte mit einem Router, der als Gateway<br />

fungierte, und dem TCP/IP-Protokoll jedes beliebige Netzwerk mit<br />

einem anderen in Verbindung treten. [7] Als erster nicht amerikanischer<br />

Rechner wird ein Rechner des NORSAR (Norwegian Seismic<br />

Array) mit dem ARPANET verbunden. [8]<br />

Aber in dem unaufhaltsamen Prozess der technischen Weiterentwicklung,<br />

in dem sich die Menschheit seit dem Anbeginn ihrer<br />

Existenz befindet, war es nur eine Frage der Zeit, bis auch das<br />

Beantworten von Fragen automatisiert und zu neuer Perfektion<br />

vorangetrieben werden sollte.<br />

Heutzutage sind sie in aller Munde. Die Rede ist von Suchmaschinen.<br />

Allen voran von einer. Von Google, dem Informationslieferanten<br />

schlechthin. Wenn man Leute fragt, einem eine Suchmaschine<br />

zu nennen, werden sie einem die Antwort in einem Wort<br />

geben: Google. Google ist omnipräsent. Keine andere Suchmaschine<br />

ist so oft in den Medien, wie der Suchgigant aus Kalifornien.<br />

Google stellt andere wie Yahoo! oder Microsofts Bing in den<br />

Schatten. Doch was steckt wirklich hinter dem Weltkonzern und<br />

welche Bedeutung kommt der Suchmaschine zu?<br />

Dank Google finden wir heute auf viele Fragen eine Antwort.<br />

Nicht nach fragen über den Sinn des Lebens oder der Zukunft<br />

(noch nicht), aber z.B. nach Zugverbindungen. Vor ein paar Jahren<br />

wäre das noch unmöglich gewesen. Suchmaschinen vollbringen<br />

rein technisch gesehen eine grossartige Leistung. Und wir müssen<br />

noch nicht einmal lange auf die Antworten warten. Denn das ganze<br />

passiert in Sekundenbruchteilen. Fast schon schneller als wir denken<br />

können, bekommen wir die Resultate. Menschen fragen Google<br />

für praktisch alles. Die Suchmaschine kontrolliert die Informationen,<br />

wie niemand jemals zuvor in der Geschichte der Menschheit.<br />

Google bestimmt was wir finden. Und somit auch was wir wissen.<br />

Was wir für ein Weltbild haben. Mehr als Zeitungen oder das<br />

Fernsehen dies tun.<br />

Deshalb ist es wichtig, dass wir uns bewusst werden, wie gross<br />

Googles Einfluss ist und wir andere Möglichkeiten kennen, an<br />

Informationen zu kommen. Denn was wir nicht finden – oder auf<br />

den Ergebnisseiten weit hinten steht –, existiert für viele auch<br />

nicht. Gerade auch deshalb ist es so wichtig, dass wir lernen im<br />

Internet gezielt nach den Informationen zu <strong>suchen</strong> und diese auch<br />

kritisch zu bewerten.<br />

5<br />

� Suchmaschinen vollbringen eine<br />

grossartige technische Leistung.<br />

� Wenn wir etwas mit einer Suchmaschine<br />

nicht finden, heisst das<br />

nicht, dass es die Sache nicht gibt.<br />

� Suchmaschinen beeinflussen unser<br />

Weltbild.


Wusstest du, dass…<br />

� Im Jahr 1972 das erste Mal gechattet<br />

wurde?<br />

� das Verb „googeln“ im Duden<br />

steht?<br />

� der Absender des ersten Spam-<br />

Mails Ärger mit dem amerikanischen<br />

Verteidigungsministerium<br />

bekam?<br />

2. Die Entwicklung des Internets<br />

Was weiss ich schon?<br />

Diskutiere mit deinen Kollegen, was ihr über folgende S<strong>tic</strong>hworte<br />

schon wisst? Haltet eure Gedanken schriftlich fest.<br />

� ARPANET<br />

� Internet<br />

� WWW<br />

� E-Mail<br />

� Google<br />

Nach diesem Kapitel weiss ich…<br />

� wie sich das Internet entwickelte.<br />

� was man unter Paketvermittlung versteht.<br />

� was ein verteiltes Netzwerk ist und welche Vorteile es besitzt.<br />

� dass das Internet und WWW nicht dasselbe sind.<br />

� was die Aufgaben der Protokolle TCP und IP sind.<br />

� wann es die ersten Suchmaschinen gab.<br />

� einige Fakten über Google.<br />

Eine Entwicklung, die unser Leben veränderte…<br />

Das Internet, wie wir es heute kennen (mit Suchergebnissen in<br />

Sekundenbruchteilen, mit sozialen Netzen und Plattformen für<br />

Musikdownloads) entwickelte sich nicht von heute auf morgen.<br />

Ebenso wenig wurde es von einem einzelnen entwickelt. Nicht<br />

einmal die ARPA (eine Forschungsbehörde), die als Begründer des<br />

Internets gilt, kann die Entdeckung des Internets als ihre alleinige<br />

Erfindung beanspruchen. Vielmehr waren es unzählige Erfindungen<br />

über Jahre hin weg, die immer wieder Teilprobleme lösten.<br />

Aufgabe:<br />

Studiere die Zeitlinie auf den nächsten Seiten und bearbeite anschliessend<br />

die Seite mit der Zusammenfassung. Die Bemerkungen<br />

in der rechten Spalte dienen dir, wie immer, mit zusätzlichen Informationen<br />

und witzigem Zusatzmaterial.<br />

6


Die Entstehung des Internet<br />

1958<br />

Als Reaktion auf den russischen Satelliten Sputnik (1957) ruft das<br />

Verteidigungsministerium der USA die ARPA (Advanced Research<br />

Projects Agency) ins Leben. Das erklärte Ziel der Behörde<br />

ist, im Bereich der Technik nie mehr überraschend geschlagen zu<br />

werden.<br />

1964<br />

Paul Baran entwickelt als erster die Idee zur Paketvermittlung in<br />

einem verteilten Netz. Sie stellt ein alternatives Verfahren zur<br />

Durchschaltevermittlung dar. [1]<br />

1969<br />

Die Rechner der Universität von Kalifornien, der Universität von<br />

Kalifornien in Santa Barbara, der Universität von Utah und des<br />

Stanford Research Institute werden miteinander verbunden und<br />

bilden zusammen das ARPANET. Finanziert und geleitet wird das<br />

Projekt von der ARPA. Das Ziel ist, eine Möglichkeit für die Zusammenarbeit<br />

und den Datenaustausch der Universitäten zu schaffen.<br />

[2]<br />

1970<br />

Das ARPANET wächst praktisch jeden Monat um einen Rechner.<br />

[3]<br />

1971<br />

Das Netzwerk umfasst mittlerweile 15 Knoten, [4] wird aber weiterhin<br />

nur von einigen Wenigen genutzt. Meistens Informatiker und<br />

Studenten an Universitäten und Forschungseinrichtungen. Die<br />

breite Öffentlichkeit weiss praktisch nichts von der Existenz des<br />

Netzwerks. [5]<br />

1973<br />

Vint Cerf und Robert Kahn legen den Grundstein für das Zusammenschliessen<br />

von verschiedenen Netzwerken:<br />

Sie entwickeln die Protokolle TCP/IP [6] und das Konzept der Gateways<br />

(Netzkoppler), mit deren Hilfe Netzwerke mit unterschiedlichen<br />

Protokollen und Geschwindigkeiten miteinander kommunizieren<br />

können. Jetzt konnte mit einem Router, der als Gateway<br />

fungierte, und dem TCP/IP-Protokoll jedes beliebige Netzwerk mit<br />

einem anderen in Verbindung treten. [7] Als erster nicht amerikanischer<br />

Rechner wird ein Rechner des NORSAR (Norwegian Seismic<br />

Array) mit dem ARPANET verbunden. [8]<br />

7<br />

Oft glauben die Leute, das<br />

ARPANET wurde erstellt, um nach<br />

einem atomaren Anschlag auf die<br />

USA die Kommunikation aufrecht zu<br />

erhalten. Dies war nicht das Ziel des<br />

Netzwerkes. Vielmehr wollte man<br />

eine Möglichkeit finden die knappen<br />

Rechnerkapazitäten der Universitäten<br />

miteinander zu verbinden und so den<br />

Datenaustausch untereinander zu<br />

fördern. Natürlich wurde das Netzwerk<br />

auch auf Ausfallsicherheit und<br />

Stabilität getestet, was aber eher auf<br />

die sowieso - auch ohne nukleare<br />

Angriffe - schon sensiblen Netzwerkverbindungen<br />

zurückzuführen ist. [9]<br />

NICE TO KNOW:<br />

Die ersten Daten, die über das ARPA-<br />

NET verschickt wurden, waren 1969<br />

ein „LOG“ – ein verunglücktes „LOG-<br />

IN“. Die Universität von Kalifornien<br />

versuchte sich in den Rechner der Universität<br />

Stanford einzuwählen. [10]<br />

Aufgabe 2.1<br />

Schau auf der folgenden Seite die<br />

verschiedenen Karten an und informiere<br />

dich darüber, wie sich das AR-<br />

PANET im Laufe der Zeit verändert<br />

hat:<br />

http://som.csudh.edu/fac/lpress/<br />

history/arpamaps/<br />

Löse mit Hilfe der Karten folgende<br />

Aufgaben:<br />

1. In welchem Jahr wurde das Pentagon<br />

an das ARPANET angeschlossen?<br />

2. Warum sind gerade in Boston und<br />

um Kalifornien herum so viele<br />

Rechner ans Netzwerk angeschlossen?


Wann wurde das erste Mal gechattet?<br />

1972 fand ein Chat zwischen zwei<br />

Kommunikationsprogrammen statt, das<br />

eine lief auf einem Rechner am SRI,<br />

das andere bei BBN. PARRY spielte<br />

einen Psychotiker mit Verfolgungswahn<br />

und „Der Doktor“ imitierte einen<br />

Psychiater. Die Programme gaben dabei<br />

vorgefertigte Antworten und wenn<br />

sie etwas nicht verstanden eine neutrale<br />

Aussage zum Besten. [22]<br />

NICE TO KNOW:<br />

1978 wurde von Gary Thuerk das erste<br />

Spam-Mail verschickt. Dieser wollte so<br />

für den Computerhersteller DEC werben,<br />

bekam aber prompt Ärger mit dem<br />

Verteidigungsministerium, dem Betreiber<br />

des ARPANET. [23]<br />

Für weitere Informationen: Google<br />

selbst!<br />

NICE TO KNOW:<br />

Vielfach wird „googeln“ synonym für<br />

die Internetrecherche verwendet. 2004<br />

wurde das Verb „googeln“ sogar in den<br />

Duden aufgenommen. [24]<br />

1982<br />

Mit EUnet entsteht eines der ersten Netzwerke in Europa. Es verbindet<br />

Rechner in Grossbritannien, Holland, Dänemark und<br />

Schweden. [11]<br />

1983<br />

Ein Anschluss an das ARPANET ist teuer. So bilden die vielen<br />

amerikanischen Informatikfakultäten, die sich das nicht leisten<br />

können, ihr eigenes Netzwerk. Dank den TCP/IP-Protokolle konnten<br />

diese völlig verschiedenen Netzwerke über das ARPANET<br />

vereint werden und wachsen so mit der Zeit zu einem grossen Netz<br />

zusammen. Langsam kommt der Begriff Internet auf. [12]<br />

1988<br />

Zwischen den USA, Frankreich und England wird das erste transatlantische<br />

Glasfaserkabel verlegt. [13]<br />

1989<br />

Das ARPANET wird stillgelegt. Die Netzwerke des ARPANET<br />

werden an das NSFNET angeschlossen, welches jetzt zum zentralen<br />

Backbone des Internet wird. [14]<br />

1990<br />

Archie, die erste eigentliche Suchmaschine, mit deren Hilfe Archive<br />

durchsucht werden können, geht online. [15] Folgende Länder<br />

haben ein eigenes Netz an das NSFNET angeschlossen und somit<br />

Zugang zum Internet: Argentinien, Belgien, Brasilien, Chile,<br />

Griechenland, Indien, Irland, Österreich, die Schweiz, Spanien und<br />

Südkorea. [16]<br />

1991<br />

Das von Tim Berners-Lee am CERN entwickelte World Wide<br />

Web wird für die Öffentlichkeit zugänglich <strong>gemacht</strong>. Mit dem<br />

WWW lassen sich verschiedene Webseiten zu einem sogenannten<br />

Hypertextsystem verlinken. [17]<br />

1994<br />

Erstmals in der Geschichte des Internets gibt es mehr kommerzielle<br />

als wissenschaftliche Seiten. [18] Mit der Gründung von Amazon<br />

erfolgt ein Meilenstein im Onlinehandel. Ein Jahr später wird Ebay<br />

gegründet. Das heute grösste Internetauktionshaus macht den Online-Einkauf<br />

günstig und bequem. [19]<br />

1995<br />

Die beiden bedeutendsten Suchmaschinen der 90er-Jahre werden<br />

gegründet: Altavista [20] und Yahoo [21] . Altavistas Babel Fish war<br />

der erste Internet-Übersetzungsdienst.<br />

8


1998<br />

Netscapes Internetbrowser Netscape Navigator verliert den Browserkrieg<br />

gegen Microsofts Internet Explorer und wird eingestellt.<br />

Der Internet Explorer ist somit lange Zeit ohne ernsthafte Konkurrenz.<br />

[25] Mit Napster entsteht die erste Musiktauschbörse im Internet<br />

und darüber hinaus eine unglaublich schnell wachsende Community.<br />

[26] Völlig neuartig ist das dabei verwendete Peer-to-Peer-<br />

Verfahren (P2P). [27]<br />

2001<br />

Jimmy Wales gründet Wikipedia, eine Enzyklopädie, bei der jeder<br />

und jede zum Autor werden kann. [28]<br />

2003<br />

Der Begriff Web 2.0 wird erstmals öffentlich verwendet. Inbegriff<br />

des neuen Internet Zeitalters sind Plattformen wie Facebook,<br />

MySpace, YouTube, Wikipedia oder auch Twitter. Der Nutzer<br />

erstellt und verteilt Inhalte selber. [29]<br />

2007<br />

Weltweit werden 97 Milliarden Mails verschickt - täglich. 40 Milliarden<br />

sind Spam-Mails. [30]<br />

2009<br />

Im Jahr 2009 werden ungefähr 176 Exabyte Daten über das Internet<br />

transportiert. Dies entspricht der 424‘000-fachen Datenmenge<br />

aller Bücher der Welt. [31]<br />

2010<br />

Die Spam-Quote bei E-Mails ist auf 97% angestiegen. [32]<br />

9<br />

Google: Der Weg zum Imperium [33]<br />

1996<br />

Larry Page und Sergey Brin arbeiten<br />

an der Universität Stanford gemeinsam<br />

an einer Suchmaschine.<br />

1998<br />

Google wird als Firma eingetragen<br />

und das Suchprogramm öffentlich<br />

zugänglich.<br />

Mai 2000<br />

AdWords startet mit 350 Kunden.<br />

Juni 2000<br />

Mit einer Milliarde indizierten Seiten<br />

ist Google die grösste Suchmaschine<br />

der Welt.<br />

2006<br />

Google übernimmt für 1.65 Milliarden<br />

Dollar YouTube.<br />

2007<br />

Google ist erstmals die am meisten<br />

aufgerufene Website des Internets.<br />

2008<br />

Google hat im Internet eine Billion<br />

Seiten gefunden.<br />

2009<br />

99% der gesamten Einnahmen generiert<br />

Google aus dem Anzeigensystem<br />

AdWords. [34]<br />

2010<br />

Google ist die wertvollste Marke und<br />

hat einen weltweiten Marktanteil von<br />

85%. [35]<br />

Google ist ein Wortspiel mit dem<br />

Begriff Googol. Dieser steht für eine<br />

1 gefolgt von 100 Nullen. Die grosse<br />

Zahl versinnbildlicht das Bestreben<br />

der Firma die schier unendlich grosse<br />

Menge aller vorhandenen Informationen<br />

zu ordnen. [36]


Aufgabe 2.2<br />

Diskutiert in Gruppen was die Vorteile<br />

eines verteilten Netzes (Bild unten,<br />

rechte Graphik) gegenüber einem<br />

zentralen Netz sind! Ihr könnt euch<br />

dabei auch am Beispiel mit „dem<br />

Zügeln“ orientieren. (Weshalb ist es<br />

bei einer Fahrt von A nach B besser,<br />

wenn nicht alle Autobahnen über<br />

einen Knoten laufen?)<br />

Abbildung 1:<br />

Zentrales, dezentrales und verteiltes<br />

Knotennetz (v.l.n.r.).<br />

Aufgabe 2.3<br />

Beschreibe das Verfahren der Direktvermittlung<br />

anhand des Beispiels<br />

links mit der Paketvermittlung.<br />

„Am Anfang schuf die ARPA das<br />

ARPANET.<br />

Und das ARPANET war wüst und leer.<br />

Und es war finster in der Tiefe.<br />

Und der Geist der ARPA schwebte über<br />

dem Netzwerk, und die ARPA sprach:<br />

„Es werde ein Protokoll.“ Und es ward<br />

ein Protokoll.<br />

Und die ARPA sah, dass es gut war.<br />

Und die ARPA sagte:“Es seien mehr<br />

Protokolle.“ Und es geschah so. Und<br />

die ARPA sah, dass es gut war. Und die<br />

ARPA sagte:“Es seien mehr Netzwerke.“<br />

Und so geschah es.“ [38]<br />

Zusammenfassung<br />

Paketvermittlung<br />

Um das Prinzip der Paketvermittlung und des verteilten Netzwerkes<br />

besser zu verstehen, soll hier ein Vergleich mit einem Umzug<br />

herangezogen werden:<br />

Bei einem Umzug finden unmöglich alle Möbel in einem Auto<br />

platz. Also verteilen du und deine Freunde, die dir beim Zügeln<br />

helfen, das Mobiliar auf mehrere Fahrzeuge. Um den Überblick<br />

nicht zu verlieren, schreibt ihr die Zügelkisten an. Genauso funktioniert<br />

das Verschicken von Informationen durch ein Netzwerk:<br />

Die Information wird in kleine Stücke (Pakete) aufgeteilt, welche<br />

alle beschriftet werden. Dann fahren sie los: Zuerst geht’s von der<br />

Einfahrt auf die Quartierstrasse, danach auf die Hauptstrasse, von<br />

dort auf die Schnellstrasse und schliesslich auf die Autobahn. In<br />

einem Netzwerk gehen die Nachrichten vom PC zuerst in ein lokales<br />

Netzwerk (LAN), dann in ein MAN, von dort in ein WAN und<br />

schliesslich laufen sie über ein Backbone. Es spielt jedoch keine<br />

Rolle, welches Auto welche Route wählt oder welches wann ankommt.<br />

Entscheidend ist einzig und allein, dass alle am Zielort<br />

eintreffen. Das Auto welches als erstes losgefahren ist, kann also<br />

durchaus auch als letztes ankommen (macht nichts: Die Zügelkisten<br />

sind ja angeschrieben und müssen nicht in der richtigen Reihenfolge<br />

ankommen.). Deine Freunde, welche die Autobahn nicht<br />

kennen, benutzen dafür ein GPS und werden so automatisch zum<br />

richtigen Ort geführt. Die Datenpakete werden durch das Internet<br />

Protocol zum Zielort geführt. Am Ziel wird kurz kontrolliert, ob<br />

alle eingetroffen sind, dann geht’s ans Auspacken. Die Kisten sind<br />

angeschrieben und können so effizient in die neuen Zimmer gebracht<br />

werden. Ein grosses Büchergestell, das wegen seiner Grösse<br />

in mehreren Kisten transportiert werden musste, kann nun wieder<br />

zusammengesetzt werden. Das TCP (Transmission Control Protocol)<br />

sorgt dafür, dass die Information am Zielort wieder in der<br />

richtigen Reihenfolge zusammengesetzt wird. Zusätzlich kontrolliert<br />

es, ob auch alle Pakete angekommen sind und fragt fehlende<br />

einzeln noch einmal an.<br />

Unterscheidung Internet – WWW<br />

Das Internet und das World Wide Web sind nicht dasselbe. Das<br />

Internet ist die Hardware (die Infrastruktur, welche die verschiedenen<br />

Rechner miteinander verbindet). Das WWW hingegen ist die<br />

Software (also das Programm, das verwendet wird um Seiten, die<br />

auf den Rechnern liegen, miteinander zu einem „weltweiten Netz<br />

an Webseiten“ zu verknüpfen). Die Seiten des WWW sind durch<br />

Links miteinander verknüpft. [37]<br />

10


3. Wie funktionieren Suchmaschinen?<br />

Was weiss ich schon?<br />

Diskutiere mit deinen Kollegen, was ihr über folgende S<strong>tic</strong>hworte<br />

schon wisst? Haltet eure Gedanken schriftlich fest.<br />

� Archiv<br />

� Web-Suchmaschinen<br />

� Meta-Suchmaschine<br />

� Index<br />

Nach diesem Kapitel weiss ich…<br />

� den Unterschied zwischen einem Verzeichnisdienst und<br />

einer Suchmaschine.<br />

� wie eine Suchmaschine den Index erstellt.<br />

� was bei einer Suchanfrage passiert.<br />

� einige Kriterien, mit denen die Relevanz der Suchergebnisse<br />

bewertet wird.<br />

� was der PageRank bedeutet und was nicht.<br />

Als alles unübersichtlich wurde…<br />

Vor noch gar nicht so langer Zeit gab es keine Suchmaschinen.<br />

Jetzt wirst du dich wahrscheinlich fragen warum? Ganz einfach:<br />

Man brauchte keine. Zu klein war die Zahl der existierenden Webseiten.<br />

Doch dann, als in den Neunzigerjahren die Anzahl an Seiten<br />

im Internet immer grösser und das gesamte Netz unübersichtlich<br />

wurde, [39] musste eine Lösung auf den Tisch um schneller an<br />

Informationen zu kommen. Irgendwie musste die unüberblickbare<br />

Flut an Informationen in vernünftiger Zeit durchsucht werden können.<br />

Aufgabe:<br />

� Überlege dir, wie du ausserhalb des Internets nach Informationen<br />

suchst. Versuche dabei vor allem auf die zwei<br />

folgenden Fragen einzugehen:<br />

- Wo suchst du?<br />

- Wie findest du dich in diesen Medien zurecht?<br />

11<br />

Wusstest du, dass…<br />

� die Google-Gründer am Anfang<br />

für ihre Suchmaschine einfache<br />

Computer verwendet haben?<br />

� heute hingegen ein Google Rechenzentrum<br />

eigene Kühltürme für<br />

die Rechner hat und den Strom einer<br />

Kleinstadt verbraucht?


Suchmaschinen für…<br />

- Websites: http://www.google.ch/<br />

- Dokumente: http://docmazy.com/<br />

- Bilder:<br />

http://www.google.ch/imghp<br />

- Musik: http://www.playlist.com/<br />

- Videos: http://www.youtube.com/<br />

Aufgabe 3.1<br />

Diskutiert die Vor- und Nachteile von<br />

Katalog-Diensten im Gegensatz zu<br />

Websuchmaschinen und erstellt davon<br />

eine Tabelle. Beachtet folgende<br />

Punkte:<br />

Effektivität, Subjektivität, Aktualität,<br />

Vollständigkeit, Kosten.<br />

- Kataloge:<br />

Excite, All One Search.<br />

- Websuchmaschinen:<br />

Google, Yahoo!, Bing, Alta Vista.<br />

- Metasuchmaschine:<br />

Ixquick, Meta Crawler.<br />

- Vertikale Suchmaschine:<br />

Tucows, Medivista.<br />

Definition einer Suchmaschine:<br />

Eine Suchmaschine ist in erster Linie ein Programm das nach Informationen<br />

sucht. Diese Suche kann einerseits auf nur einem<br />

Rechner stattfinden oder sich über ein ganzes Netzwerk, wie z.B.<br />

das Internet, erstrecken. Unter dem Begriff Informationen werden<br />

Webseiten, Dokumente, Bilder, Musik- und Filmdateien zusammengefasst.<br />

Mit Suchmaschinen sucht (und findet) man also Informationen<br />

in den unüberschaubaren Tiefen des Internets.<br />

Suchmaschine ist nicht gleich Suchmaschine…<br />

Wie du sicher schon erahnen wirst, gibt es für diese verschiedenen<br />

Anforderungen auch unterschiedliche Arten von Suchmaschinen.<br />

Und wie du auch schnell sehen wirst, verdient nicht einmal jede<br />

den Namen Suchmaschine.<br />

Es gibt verschiedene Arten von Suchmaschinen…<br />

Man kann Suchmaschinen anhand von verschiedenen Kriterien<br />

unterscheiden. Ein erstes bezieht sich auf die Daten, welche das<br />

Programm sucht (Websites, Dokumente, Bilder, Musik, Videos).<br />

[40] Beispiele dazu findest du rechts (oberes blaues Textfeld).<br />

Ein weiteres Kriterium untersucht den Ursprung der Information:<br />

[41] Beispiele zu den unterschiedlichen Arten von Suchmaschinen<br />

findest du wieder rechts (im unteren blauen Textfeld).<br />

� Bei Katalogen (auch Verzeichnis genannt) tragen Menschen<br />

von Hand eine Zusammenstellung von verschiedenen<br />

Seiten nach Themen sortiert zusammen. Meist nur zu<br />

einzelnen Themenbereichen, manchmal jedoch auch themenübergreifend.<br />

[42]<br />

� Websuchmaschinen durch<strong>suchen</strong> grosse Teile des WWW<br />

nach allen möglichen Themen. Im Vergleich zu Katalogen<br />

werden hier die Seiten jedoch nicht von Hand in den Index<br />

übertragen, sondern von Programmen. Diese Pragramme<br />

(Crawler) durch<strong>suchen</strong> das Web vollautomatisch nach<br />

neuen Seiten. [43]<br />

� Metasuchmaschinen durch<strong>suchen</strong> den Index von mehreren<br />

Suchmaschinen und können so deutlich grössere Bereiche<br />

des WWW abdecken. [44]<br />

� Vertikale Websuchmaschinen indexieren nur Seiten zu einem<br />

bestimmten Thema und erfassen daher nur einen<br />

Teilbereich des WWW. [45]<br />

12


Bevor wir mit Suchmaschinen irgendetwas <strong>suchen</strong> können, muss<br />

das Suchprogramm jedoch zuerst einmal einen Index erstellen, in<br />

welchem später gesucht werden kann. Denn Suchmaschinen<br />

durch<strong>suchen</strong> nicht bei jeder einzelnen Suchanfrage das gesamte<br />

Web, sondern nur ihren Index. [46] Der Index ist vergleichbar mit<br />

dem S<strong>tic</strong>hwortverzeichnis/Index am Ende eines Buches. [47] Hier<br />

steht auf welchen Seiten die Suchbegriffe vorkommen. Um zu<br />

unter<strong>suchen</strong>, wie ein Index einer Websuchmaschine erstellt wird,<br />

wollen wir unser Augenmerk jetzt auf das bekannteste und viel<strong>leicht</strong><br />

auch wichtigste Suchprogramm richten: Google.<br />

Wie funktioniert Google?<br />

Studiere folgende Abbildung und versuche dir die Funktionsweise<br />

einer Suchmaschine mit Hilfe des Textes auf der nächsten Seite<br />

klar zu machen.<br />

Abbildung 2:<br />

Abbildung 3:<br />

Crawler<br />

Dokumente<br />

Zwischenablage<br />

Lexikon<br />

Index Suchergebnisse<br />

13


Abbildung 4:<br />

Die Rechner der Google-Gründer an<br />

der Stanford University. Auf diesen<br />

einfachen Computern lief die Suchmaschine<br />

in den Anfangszeiten.<br />

Abbildung 5:<br />

Google Rechenzentrum in Oregon<br />

(USA) in der Grösse eines Footballfeldes.<br />

Aufgabe 3.2<br />

Auf dem Pausenhof geht ein neues<br />

Gerücht um. Diskutiert in Gruppen,<br />

was Kriterien sind diesem Glauben zu<br />

schenken?<br />

Wir betrachten nun den Aufbau einer typischen Websuchmaschine<br />

am Beispiel von Google (Siehe Graphik Seite 13):<br />

Mithilfe der Crawler durchsucht Google das Web. Ein Crawler ist<br />

ein Programm, das nichts anderes macht, als bei einer beliebigen<br />

Seite zu starten und dann von da aus den Links zu folgen. Die<br />

besuchten Seiten werden vollständig heruntergeladen und in der<br />

Zwischenablage gespeichert. Die heruntergeladenen Seiten werden<br />

sortiert und auf den Rechnern nach S<strong>tic</strong>hworten abgelegt. Welches<br />

Dokument wo abgelegt wurde, steht im Index. Zusätzlich werden<br />

alle neuen Begriffe in einem Lexikon gespeichert. [48]<br />

Der Ablauf einer Suchanfrage an Google:<br />

Eine Suchanfrage wird über eine Eingabe von Keywords in die<br />

Suchmaske der Seite von google.ch (Query) an den Google Web<br />

Server gestellt. Dieser leitet die Anfrage weiter an den Index<br />

Server, der Seiten sucht, welche die Keywords enthalten. Danach<br />

reicht der Index Server die Abfrage an die Doc Servers weiter.<br />

Diese enthalten die indexierten Seiten. Aus allen Seiten, welche zu<br />

den S<strong>tic</strong>hwörtern passen, werden mit Hilfe von Bewertungskriterien<br />

die Ergebnissseiten (Snippets) zusammengestellt. Die<br />

Snippets werden an den Rechner des Benutzers geschickt. Was<br />

zurückkommt ist die Ergebnisseite, mit den einzelnen Treffern.<br />

Der ganze Prozess dauert selten länger als eine halbe Sekunde. [49]<br />

Abbildung 3<br />

14


Zusammenfassung<br />

Bewertung der Relevanz<br />

Suchmaschinen<br />

Was ist Relevanz?<br />

Es gibt mehrere Arten von Suchmaschinen, nicht nur Websuchmaschinen.<br />

Aber selbst bei diesen gibt es unzählige und nicht nur<br />

Google. Eine Liste mit verschiedenen Suchmaschinen findest du<br />

im Anhang (unter Nützliche Links). Es lohnt sich auch hier einmal<br />

etwas anderes auszuprobieren.<br />

Suchmaschinen durchforsten nicht erst bei einer Suchanfrage das<br />

gesamte Web und finden dann die richtige Seite. Vielmehr wird<br />

vorher ein Index erstellt und laufend aktualisiert, welcher dann bei<br />

einer Suchanfrage nach den passenden Seiten durchsucht wird. [60]<br />

Zur Relevanzbewertung werden unterschiedliche Kriterien herangezogen.<br />

[61] Nicht nur der PageRank, sondern auch der Abstand<br />

zwischen zwei Suchbegriffen, die Position der Suchbegriffe innerhalb<br />

des Dokuments, der Standort, von wo aus die Suchanfrage<br />

gestellt wird, das Dateiformat, die Aktualität und bei Google neuerdings<br />

auch die Ladegeschwindigkeit einer Seite. [62]<br />

Im Zusammenhang mit Suchmaschinen taucht immer wieder der<br />

Begriff Relevanz auf. Vielfach wird von relevanten Seiten gesprochen.<br />

Aber was bedeutet das überhaupt? Um relevant zu sein, muss<br />

eine Seite oder ein Dokument denjenigen Teil einer Information<br />

enthalten, der zur Aufklärung der Fragestellung dient. Im Klartext<br />

heisst das, eine Seite ist dann relevant, wenn sie die Frage, die<br />

hinter deiner Suchanfrage steckt, beantworten kann.<br />

Wie bewerten Suchmaschinen die Relevanz einer Seite?<br />

Um aus den vielen Seiten, die zum gestellten Suchbegriff passen,<br />

die relevantesten zu finden, gibt es für Suchmaschinen verschiedene<br />

Möglichkeiten, welche meistens alle miteinander angewandt<br />

werden. So kann z.B. der Abstand von zwei Suchbegriffen in einem<br />

Dokument relativ mit dem Abstand in anderen Dokumenten<br />

verglichen werden.<br />

PageRank<br />

Das Wichtigste am PageRank ist nicht die Berechnung zu kennen,<br />

sondern seine Bedeutung:<br />

[50] Da sich dieses Kriterium auf den Text einer<br />

Seite bezieht, nennt man es auch textbezogenes Relevanzkriterium.<br />

Mehr dazu in Kapitel vier. Es gibt jedoch noch unzählige weitere<br />

Kriterien zur Berechnung der Relevanz. So benutzt Google insgesamt<br />

über 200 verschiedene (meistens geheime) Kriterien. [51] Das<br />

sicher bekannteste davon ist der PageRank.<br />

Er sagt nichts<br />

Löse<br />

über<br />

nun Aufgabe<br />

die Qualität<br />

3.3<br />

einer<br />

bevor<br />

Seite<br />

du weiterliest.<br />

aus, sondern einzig und<br />

allein etwas über ihre Wichtigkeit. Dies solltest du für das Kapitel<br />

fünf im Hinterkopf behalten. Beim Erstellen von Suchstrategien<br />

gilt PageRank es dies zu beachten.<br />

Beim PageRank Verfahren wird eine Seite aufgrund von den Seiten,<br />

die auf sie verweisen, bewertet. Je mehr sogenannte Links<br />

(oder Backlinks genannt) eine Seite bekommt, desto höher ist ihr<br />

Wert. Natürlich spielt es eine nicht unwesentliche Rolle was für<br />

Seiten auf sie verweisen: Je höher der Wert der verweisenden Seite,<br />

desto grösser der Anstieg bei der anderen Seite. Der PageRank<br />

wird also vererbt. [52]<br />

Der PageRank sagt jedoch rein gar nichts über die Qualität einer<br />

Seite aus, sondern nur etwas darüber wie beliebt oder bekannt eine<br />

Seite ist. [53] So gesehen sagt der PageRank auch etwas über die<br />

Wichtigkeit einer Seite aus. Aber Achtung: Dadurch werden unbekannte<br />

Seiten benachteiligt und somit eher nicht gefunden.<br />

15<br />

Aufgabe 3.3<br />

Vergleiche den PageRank von folgenden<br />

Seiten miteinander und ziehe<br />

daraus Schlüsse über den Zusammenhang<br />

zwischen Qualität und dem von<br />

Google erstellten Ranking:<br />

� www.ethz.ch<br />

� www.ksrychenberg.ch<br />

� www.sf.tv<br />

� www.blick.ch<br />

� www.nytimes.com<br />

� www.nzz.ch<br />

� www.google.com<br />

� www.google.ch<br />

� www.yahoo.com<br />

Den PageRank jeder Seite kannst du<br />

hier herausfinden:<br />

http://www.databasesearch.com/sys/pre-check.php<br />

Gib dazu im Feld „Prüfe URL“ die<br />

Internetadresse ein, gib den auf der<br />

Seite angezeigten Code ein und klicke<br />

anschliessend auf „Prüfung starten“.<br />

Die Bewertung wird mit einer Zahl<br />

zwischen 1 und 10 ausgedrückt. Dabei<br />

bedeutet 10 hervorragend und 1<br />

schlecht.<br />

� Der PageRank sagt nichts über die<br />

Qualität einer Seite aus.<br />

� Sondern nur über die Wichtigkeit.<br />

� Unbekanntere Seiten werden durch<br />

den PageRank benachteiligt.


Aufgabe 3.4 [58]<br />

Berechne den PageRank für die Seite<br />

A. Jeder Pfeil stellt einen Link dar.<br />

Die Seiten B, C und D haben einen<br />

PageRank von 1. Der Dämpfungsfaktor<br />

wird auf 0.85 gesetzt:<br />

D<br />

Abbildung 6<br />

A<br />

NICE TO KNOW:<br />

Der PageRank hat seinen Namen nicht<br />

etwa von den Seiten, die er bewertet,<br />

sondern von seinem Erfinder Larry<br />

Page. [59]<br />

B<br />

C<br />

Die folgende Seite ist freiwillig. Sie ist entweder für etwas<br />

schnellere oder für besonders interessierte Schüler gedacht.<br />

Wenn du sie nicht bearbeiten willst, kannst du sie überspringen<br />

und direkt zur Zusammenfassung auf Seite 15 übergehen.<br />

Berechnung des PageRanks<br />

Der PageRank drückt im Grunde nichts anderes aus, als die Wahrscheinlichkeit,<br />

dass eine Seite besucht wird.<br />

Angenommen jemand der im Internet „surft“ startet willkürlich auf<br />

irgendeiner Seite und folgt dann immer den Links, so drückt der<br />

PageRank der nächsten Seite aus, wie gross die Wahrscheinlichkeit<br />

war auf dieser und nicht auf einer anderen Seite zu landen. [54] Nur<br />

rechnet man diese Wahrscheinlichkeit nicht wie in unserem Beispiel<br />

von nur einer Seite (Startseite des „Surfers“) sondern von<br />

allen Seiten, die einen Link zu dieser Seite gesetzt haben.<br />

Angenommen wir haben zwei Seiten (Seiten B und C), welche<br />

auf eine dritte Seite (Seite A) verweisen. N steht für die Anzahl<br />

der gesamten Links, welche auf der jeweiligen Seite gesetzt<br />

sind. PR ist der PageRank der Seiten. Die Folgende vereinfachte<br />

Formel besagt zur Berechnung des PageRanks also:<br />

Der PRA ist definiert durch den PageRank der darauf verweisenden<br />

Seiten dividiert durch ihre gesamte Anzahl ausgehender<br />

Links (N).<br />

d = Dämpfungsfaktor, definiert zwischen 0 und 1.<br />

Gewöhnlich auf 0.85 gesetzt. [55]<br />

N = Anzahl der ausgehenden Links. [56]<br />

Diese Berechnung ist natürlich stark vereinfacht. In Wirklichkeit<br />

setzt sich die Formel zur Berechnung des PageRanks aus über 500<br />

Millionen Variablen und zwei Milliarden Ausdrücken zusammen.<br />

[57]<br />

16


Zusammenfassung<br />

Suchmaschinen<br />

Es gibt mehrere Arten von Suchmaschinen, nicht nur Websuchmaschinen.<br />

Aber selbst bei diesen gibt es unzählige und nicht nur<br />

Google. Eine Liste mit verschiedenen Suchmaschinen findest du<br />

im Anhang (unter Nützliche Links). Es lohnt sich auch hier einmal<br />

etwas anderes auszuprobieren.<br />

Suchmaschinen durchforsten nicht erst bei einer Suchanfrage das<br />

gesamte Web und finden dann die richtige Seite. Vielmehr wird<br />

vorher ein Index erstellt und laufend aktualisiert, welcher dann bei<br />

einer Suchanfrage nach den passenden Seiten durchsucht wird. [60]<br />

Zur Relevanzbewertung werden unterschiedliche Kriterien herangezogen.<br />

[61] Nicht nur der PageRank, sondern auch der Abstand<br />

zwischen zwei Suchbegriffen, die Position der Suchbegriffe innerhalb<br />

des Dokuments, der Standort, von wo aus die Suchanfrage<br />

gestellt wird, das Dateiformat, die Aktualität und bei Google neuerdings<br />

auch die Ladegeschwindigkeit einer Seite. [62]<br />

PageRank<br />

Das Wichtigste am PageRank ist nicht die Berechnung zu kennen,<br />

sondern seine Bedeutung:<br />

Er sagt nichts über die Qualität einer Seite aus, sondern einzig und<br />

allein etwas über ihre Wichtigkeit. Dies solltest du für das Kapitel<br />

fünf im Hinterkopf behalten. Beim Erstellen von Suchstrategien<br />

gilt es dies zu beachten.<br />

17<br />

Aufgabe 3.5<br />

Suche je ein Verzeichnisdienst, eine<br />

Schweizer Websuchmaschine, eine<br />

internationale Suchmaschine (nicht<br />

Google, Yahoo! oder Bing), eine Meta-Suchmaschine<br />

und eine vertikale<br />

Suchmaschine.<br />

Aufgabe 3.6<br />

Vergleiche die Grösse des Index von<br />

Google, Ixquick und Lycos mit den<br />

Suchanfragen „Taio Cruz“ und „the“.<br />

Aufgabe 3.7<br />

Suche in den Suchmaschinen Google,<br />

Yahoo! und Ixquick nach dem Begriff<br />

„facebook“ und stelle Unterschiede<br />

bei den Top Ten-Platzierungen fest.


Wusstest du, dass…<br />

� Googles Index mehr als 25 Milliarden<br />

Seiten umfasst?<br />

� die Seltenheit, dass man bei einer<br />

Suchanfrage nur ein einziges Resultat<br />

zurück bekommt, einen eigenen<br />

Namen trägt?<br />

4. <strong>Effizient</strong>es Suchen.<br />

Was weiss ich schon?<br />

Diskutiere mit deinen Kollegen, was ihr über folgende S<strong>tic</strong>hworte<br />

schon wisst? Haltet eure Gedanken schriftlich fest.<br />

� Rangierung<br />

� Katalog vs. Suchmaschine<br />

� Wie suche ich im Internet nach Informationen?<br />

� Suchstrategie<br />

Nach diesem Kapitel weiss ich…<br />

� wie sich die Relevanzkriterien konkret auf meine Suchresultate<br />

auswirken.<br />

� wann ich einen Katalog und wann ich eine Suchmaschine<br />

verwenden soll.<br />

� zwei Suchstrategien, die bei jeder Suchanfrage effizient<br />

zum Ziel führen.<br />

� wie man mit einfachen Operatoren umgeht.<br />

� wie man die erweiterte Suche einsetzt und wie ich in kurzer<br />

Zeit komplizierte Suchanfragen formulieren kann und<br />

so schneller zur gesuchten Information komme.<br />

� dass auch das Suchen etwas Übung braucht.<br />

Die Internetrecherche schneller und besser machen…<br />

Im Internet findet man alles! Ok, zugegeben, alles ist ein bisschen<br />

übertrieben. Aber sehr, sehr vieles lässt sich im Internet finden.<br />

Deutlich mehr als du dir vorstellen kannst. Das einzige Problem<br />

dabei? Viele Leute wissen nicht, wie sie <strong>suchen</strong> müssen, um an<br />

dieser Unmenge an Informationen teilzuhaben. Wenn man nämlich<br />

wüsste wie, würde man innert kürzester Zeit genau das finden, was<br />

man wissen will. Damit du diesem Ziel zumindest etwas näher<br />

kommst, werden wir im folgenden Kapitel zwei Suchstrategien<br />

anschauen, die gepaart mit dem Wissen, wie man Anfragen richtig<br />

formuliert, in vielen Fällen zum Ziel führen.<br />

Aufgabe:<br />

� Überlege dir wie lange du im Internet suchst, wenn du etwas<br />

wissen willst? Eine Suchanfrage lang? Zehn Minuten? Oder gar<br />

bis du es gefunden hast?<br />

� Hast du bei der Internetrecherche eine feste Strategie oder<br />

suchst du einfach mal drauf los?<br />

18


Rangierungsprinzipien<br />

Um zu wissen wie man effizient sucht, müssen wir zuerst die Rangierungsprinzipien<br />

von Suchmaschinen etwas genauer unter die<br />

Lupe nehmen. Im Unterkapitel Relevanz hast du schon einiges<br />

über die Relevanzbewertung, die ein Suchprogramm durchführt,<br />

erfahren.<br />

Ein weiteres wichtiges Kriterium ist das Vorkommen von sogenannten<br />

Schlüsselwörtern im Text einer Seite. [63] Doch nicht nur<br />

dort, sondern bereits auf der Ergebnisseite sieht man in den kurzen<br />

Ausschnitten der Websites, dass die Suchbegriffe fett markiert<br />

sind. Du wirst dir die sechs wichtigsten Rangierungsprinzipien in<br />

den Aufgaben 4.1 bis 4.6 selbständig erarbeiten. In den Lösungen<br />

findest du anschliessend die korrekten Kriterien. Im obersten Textfeld<br />

siehst du jeweils die gestellte Suchanfrage mit den S<strong>tic</strong>hworten.<br />

Danach folgen zwei weitere Textfelder, mit den S<strong>tic</strong>hworten<br />

fett markiert. Du must nun entscheiden, weshalb das obere Textfeld<br />

besser zur gestellten Suchanfrage passt. Daraus formulierst du<br />

dann ein Rangierungsprinzip. Jede Aufgabe behandelt ein Rangierungsprinzip.<br />

Halte deine Ergebnisse wie immer schriftlich fest.<br />

Löse nun die Aufgaben 4.1 bis 4.6 bevor du hier weiterliest.<br />

Neben diesen sechs Kriterien die den Inhalt betreffen, gibt es auch<br />

noch solche, die vom Inhalt unabhängig sind. Das können Ranking-Verfahren,<br />

wie etwa der PageRank sein. Aber auch solche<br />

wie die Anzahl der Zugriffe auf die Seite. Seiten, welche häufiger<br />

angeklickt werden, sind auf der Ergebnisseite sicher weiter oben<br />

zu finden als andere. Somit ergibt sich ein ewiger Kreislauf, denn<br />

Seiten die auf der Ergebnisseite weiter oben angezeigt werden,<br />

werden wiederum häufiger angeklickt.<br />

19<br />

Aufgabe 4.1 [64]<br />

Eingabe:<br />

Taio Cruz Break Your Heart Lyrics<br />

1. Treffer:<br />

Original Lyrics. Break Your Heart.<br />

2. Treffer:<br />

Download Taio Cruz Pop, R&B, Hip<br />

Hop music singles.<br />

Aufgabe 4.2<br />

Eingabe:<br />

Roger Federer<br />

1. Treffer:<br />

Roger Federer hat zum 5. Mal die ATP-<br />

Finals gewonnen. Mit diesem Sieg hat<br />

Roger Federer…<br />

2. Treffer:<br />

Roger Federer ist ein Schweizer Tennisspieler.<br />

Aufgabe 4.3<br />

Eingabe:<br />

Nati WM Vorbereitung Feusisberg<br />

1. Treffer:<br />

Die Schweizer Nati hat in Feusisberg mit<br />

der Vorbereitung auf das…<br />

2. Treffer:<br />

Die Schweizer Fussball-Nati testet im<br />

Rahmen der WM-Vorbereitung gegen<br />

Uruguay.


Aufgabe 4.4<br />

Eingabe:<br />

Champions League<br />

1. Treffer:<br />

Wetten zur UEFA Champions League.<br />

2. Treffer:<br />

Perhaps one of the oddest champions in<br />

the League of Legends is the yordle<br />

known as Amumu.<br />

Aufgabe 4.5<br />

Eingabe:<br />

Usain Bolt<br />

1. Treffer:<br />

Usain Bolt (* 21. August 1986 im Trelawny<br />

Parish) ist ein jamaikanischer<br />

Sprinter.<br />

2. Treffer:<br />

Usain Bolt wird in diesem Jahr keine<br />

Rennen mehr absolvieren. Der herausragende<br />

Leichtahlet bricht seine Saison<br />

wegen Rückenbeschwerden vorzeitig ab.<br />

Der Jamaicaner hätte noch an den Meetings<br />

in Zürich und Brüssel teilnehmen<br />

sollen.<br />

Aufgabe 4.6<br />

Eingabe:<br />

Xherdan Shaqiri<br />

1. Treffer:<br />

Xherdan Shaqiri (* 10. Oktober 1991 in<br />

Gjilan) ist ein Schweizer Fussballspieler<br />

kosovarischer Herkunft.<br />

2. Treffer:<br />

Er ist einer der grössten Talente im<br />

Schweizer Fussball: Der 18-jährige FCB-<br />

Spieler Xherdan Shaqiri.<br />

Alles eine Frage der richtigen Suchstrategie<br />

Die eben neu gelernten Rangierungsprinzipien, welche bei den<br />

meisten Suchmaschinen verwendet werden, helfen uns, sich in die<br />

Funktionsweise eines Suchprogramms einzudenken und so für jede<br />

Suchanfrage die optimale Strategie zu entwickeln.<br />

Jedoch gleich vorneweg: Es gibt nicht eine richtige Suchstrategie,<br />

vielmehr erfordert jede Recherche eine etwas anders ausgelegte<br />

Suche. Wir werden uns jetzt zusammen zwei verschiedene Strategien<br />

erarbeiten, die beide zum Ziel führen. Anschliessend wirst du<br />

die wichtigsten Operatoren kennen lernen, die von Google unterstützt<br />

werden, um die Suchstrategien auch umsetzen zu können.<br />

Zum Abschluss werde ich dir noch die Erweiterte Suche vorstellen.<br />

Versuche dich jedoch nicht gleich dort, sondern arbeite dich<br />

Schritt für Schritt durch, denn das Suchen erfordert vor allem eins<br />

– Übung. Du wirst später auch die „Anfänger-Tipps“ gebrauchen.<br />

Strategie 1: Synonyme<br />

1. Überlege dir als erstes, was du genau suchst. Mach dir Notizen,<br />

was du wissen willst. Mit etwas Übung wird dir dieser Teil<br />

<strong>leicht</strong>er fallen und du kannst ihn im Kopf erledigen. Schreibe<br />

dir zu Beginn diesen Schritt präzise auf. Eine Suchmaschine<br />

kann keine Gedanken lesen, du musst also ganz genau umschreiben<br />

was du suchst. Dafür musst du dir zuerst selbst darüber<br />

im Klaren sein.<br />

2. Denke dich in das Dokument, das du finden willst, ein. Was für<br />

S<strong>tic</strong>hwörter werden darin vorkommen? Wähle den Begriff der<br />

dir am wahrscheinlichsten erscheint. Versuche jetzt dein Vorwissen<br />

zu aktivieren. Suche Synonyme zu diesem Begriff. Du<br />

brauchst, wie schon gesagt, ein paar Wörter, die charakteristisch<br />

sind für das Dokument oder die Seite die du suchst,<br />

gleichzeitig aber auf möglichst wenigen anderen Seiten vorkommen.<br />

3. Jetzt kommen die Rangierungsprinzipien ins Spiel. Beachte vor<br />

allem die Kriterien eins bis drei. Versuche möglichst viele Wörter<br />

zu finden, welche im Zieldokument vorkommen könnten.<br />

Achte darauf, dass sie im Text häufig vertreten sind und versuche<br />

sehr spezifische, nicht allgemein verwendete zu finden, die<br />

auf anderen Seiten sehr wahrscheinlich nicht vorhanden sind.<br />

4. Jetzt erst gibst du deine Suchbegriffe in die Suchmaske von<br />

Google ein. Die Reihenfolge der Wörter ist egal.<br />

5. Überfliege die Suchresultate (Titel, Zusammenfassung, Internetadresse).<br />

20


6. Ist keines dabei, das dir die relevanten Informationen liefert, so<br />

gehe zurück zu Schritt 2.<br />

Suchstrategie 2: Verfeinern<br />

1. Als erstes machst du dir wieder darüber Gedanken, was du genau<br />

wissen willst. Notiere es wieder auf einem Blatt Papier.<br />

2. Überlege dir ein S<strong>tic</strong>hwort, welches möglichst charakteristisch<br />

ist für die Seite die du suchst.<br />

3. Dann geht’s schon ab ins Netz. Gib den Suchbegriff in die<br />

Suchmaske der Suchmaschine ein.<br />

4. Überfliege wieder die Suchresultate (Titel, Textausschnitt, Internetadresse).<br />

5. Wenn du mit dem Ergebnis nicht zu<strong>fri</strong>eden bist, was sehr wahrscheinlich<br />

ist, versuchst du ein S<strong>tic</strong>hwort hinzuzufügen. So dass<br />

deine Suche eingeschränkt wird. Das siehst du ja anhand der<br />

Anzahl der Treffer, die das Suchprogramm anzeigt. Wie genau<br />

man Suchbegriffe hinzufügt, wird im Abschnitt Einfache Operatoren<br />

erklärt.<br />

6. Verfeinere deine Anfrage solange, bis du zur gewünschten Information<br />

kommst.<br />

Du fragst dich wahrscheinlich, warum du bei dieser Methode nicht<br />

gleich von Anfang an mit mehreren Suchbegriffen arbeiten kannst.<br />

Das wirst du mit der Zeit können. Für den Beginn ist es jedoch<br />

ganz gut, wenn du siehst, wie die Suchmaschine auf veränderte<br />

Suchanfragen reagiert.<br />

Merke:<br />

Du siehst, man kann beide Suchtechniken verwenden, um ans Ziel<br />

zu kommen. Es ist auch etwas eine „Geschmackssache“, welche du<br />

lieber verwendest. Du kannst natürlich auch deine eigene Suchstrategie<br />

entwickeln.<br />

Im nächsten Unterkapitel werden wir die Operatoren behandeln.<br />

Mit der Hilfe von Operatoren können wir noch genauere Abfragen<br />

formulieren.<br />

21<br />

Aufgabe 4.7<br />

Im Jahresbericht der KS Rychenberg<br />

sind Klassenlisten aufgeführt. Suche<br />

die Liste deiner Klasse (über die<br />

Suchmaske in Google und nicht über<br />

die Homepage der Schule).<br />

TIPP:<br />

Wenn du in einem Themengebiet<br />

suchst, über welches du kein eigenes<br />

Vorwissen besitzt, so kann Wikipedia<br />

eine gute Hilfestellung leisten. Gib<br />

einfach das Haupts<strong>tic</strong>hwort (siehe<br />

Schritt 2) in Wikipedia ein und überfliege<br />

die Seite nach weiteren Schlüsselwörtern.<br />

Aufgabe 4.8:<br />

Suche mit Hilfe von Suchstrategie 2<br />

eine Seite die Kino- und Fernsehprogramme<br />

aus der Schweiz publiziert.<br />

TIPP:<br />

Es ist sehr wahrscheinlich – vor allem<br />

am Anfang, dass du mehrere Suchanfragen<br />

starten musst um zum Ziel zu<br />

kommen. Habe also etwas Geduld und<br />

nimm dir die nötige Zeit.<br />

Aufgabe 4.9<br />

Katalog oder Suchmaschine?<br />

1. Petrologie<br />

2. Schauspieler, der in der Fernsehserie<br />

„Two and a Half Men“ den<br />

Jungen „Jake“ spielt.<br />

3. Du möchtest dich über alle<br />

Schweizer Universitäten erkundigen.<br />

4. Liste aller Schweizer Olympiasieger


Aufgabe 4.10<br />

Suche mit Hilfe der Operatoren nach<br />

Ballsportarten, nicht aber nach Fussball.<br />

Klein schreiben<br />

Du kannst die S<strong>tic</strong>hwörter in der<br />

Google-Suche alle klein schreiben.<br />

Grossgeschriebene Wörter werden automatisch<br />

als klein interpretiert.<br />

Aufgabe 4.11<br />

Suche einen Preisvergleichsbericht<br />

über die Produkte aus der Migros und<br />

dem Coop.<br />

Aufgabe 4.12<br />

Welches der sechs Rangierungsprinzipien<br />

könnte man missbrauchen,<br />

so dass eine Suchmaschine eine Website<br />

als relevanter einstuft?<br />

Aufgabe 4.13<br />

Suche das weltberühmte Foto, auf<br />

dem Bauarbeiter auf einem Stahlträger<br />

des Rockefeller Centers Mittagspause<br />

machen.<br />

Abbildung 8:<br />

Bauarbeiter auf Stahlträger.<br />

Einfache Operatoren [65]<br />

Logische Operatoren sind eigentlich nichts anderes, als „mathematische<br />

Rechenarten“. Sie werden auch Boolsche Operatoren genannt,<br />

nach George Boole. [66] Sie verknüpfen die verschiedenen<br />

Suchbegriffe miteinander. Die gängigsten Google-Operatoren sind:<br />

� AND (kann in Google durch Leerschlag ersetzt werden.)<br />

Der Operator AND verbindet zwei Suchbegriffe miteinander.<br />

So wird ein Dokument gesucht, in welchem die beiden Begriffe<br />

vorkommen.<br />

� NOT<br />

Der Operator NOT (bei Google geht auch einfach ein Minuszeichen)<br />

schliesst einen Begriff aus. So wird nach dem ersten<br />

Begriff gesucht, nicht aber nach dem Begriff, der nach dem<br />

Operator steht.<br />

� OR<br />

Mit dem Operator OR wird entweder nach dem einen, oder<br />

nach dem anderen Begriff gesucht.<br />

Erweiterte Suche [67]<br />

Abbildung 7<br />

Mit der erweiterten Google-Suche können wir gezielter und<br />

schneller Suchen. Die erweiterte Suche findest du unter:<br />

http://www.google.ch/advanced_search?hl=de.<br />

Auf der nächsten Seite erfährst du im Detail was dir für verschiedene<br />

Möglichkeiten zur Verfügung stehen mit der erweiterten Suche.<br />

Wir wollen uns im Folgenden auf die nützlichsten Möglichkeiten<br />

beschränken: Die Suche nach Sprache, Region, Dateiformat,<br />

Datum, Position, Domains.<br />

22


All diese Optionen kannst du miteinander mischen. Du musst dafür<br />

im hellblau gefärbten Bereich der Googlesuche als erstes die<br />

Suchbegriffe eingeben. Diese funktionieren genau gleich wie die<br />

einfachen Operatoren:<br />

� mit allen Wörtern: Funktioniert genau gleich wie die Suche<br />

mit AND. Liefert Treffer mit allen S<strong>tic</strong>hwörtern. Bsp.: „Fussball,<br />

Ballsportarten“. So zeigt Google Seiten an, welche die<br />

S<strong>tic</strong>hworte Fussball und Ballsportarten enthalten.<br />

� mit der genauen Wortgruppe: Sucht nach den S<strong>tic</strong>hworten in<br />

der genauen Reihenfolge. Bsp.: „Übung macht den Meister“.<br />

Diese Anfrage liefert Treffer, welche diese Wörter in derselben<br />

Reihenfolge beinhalten. Alternativ kann die Wortgruppe auch<br />

in der normalen Suchmaske mit Anführungs- und Schlusszeichen<br />

gesetzt werden.<br />

� mit irgendeinem der Wörter: Liefert entweder den einen oder<br />

den anderen Suchbegriff. Bsp.: „Fussball, Ballsportarten“ liefert<br />

Seiten, welche entweder mit Fussball oder mit Ballsportarten<br />

zu tun haben. Funktioniert genau gleich wie „OR“.<br />

� ohne die Wörter: Liefert Suchergebnisse ohne die erwähnten<br />

Wörter. Bsp.: „Fussball“ liefert Seiten auf denen Fussball nicht<br />

vorkommt. Funktioniert genau wie „NOT“. Achtung: Geht nur<br />

wenn du in einem der oberen drei Felder etwas eingibst.<br />

Jetzt hast du die Suchbegriffe eingegeben, nach denen du <strong>suchen</strong><br />

möchtest. Nun kannst du deine Suchergebnisse mit den folgenden<br />

Möglichkeiten einschränken:<br />

� Sprache: Hier kannst du deine Treffer auf eine Sprache beschränken.<br />

Zum Beispiel auf Deutsch.<br />

� Region: Hier kannst du deine Suchergebnisse auf ein Land beschränken.<br />

Zum Beispiel nur Schweizer Treffer.<br />

� Dateiformat: Um nach einem gewissen Format zu <strong>suchen</strong>. Zum<br />

Beispiel nur nach Word-Dokumenten: Einfach „Microsoft<br />

Word (.doc)“ auswählen.<br />

� Datum: Wenn du nach Seiten suchst, die z.B. im letzten Monat<br />

in den Index aufgenommen wurden, einfach „im letzten Monat“<br />

auswählen.<br />

� Position: Mit dieser Funktion kannst du den Ort auf der Seite<br />

bestimmen, an dem dein Suchbegriff gefunden werden sollte.<br />

Z.B. in der Internetadresse. Dafür einfach „in der URL der Seite“<br />

wählen.<br />

� Domains: Hier kannst du z.B. nach Seiten <strong>suchen</strong>, welche die<br />

Domain „.com“ haben. Einfach „.com“ eingeben.<br />

23<br />

Googlewhack [68]<br />

Einen Googlewhack schafft man wohl<br />

sehr selten. Wenn nach der Eingabe<br />

eines oder zweier Wörter (ohne Anführungszeichen!)<br />

als Suchergebnis nur ein<br />

einziger Treffer zurück kommt, spricht<br />

man von einem Googlewhack. Jemanden,<br />

der nach solchen Google-whacks<br />

Ausschau hält, nennt man Googlewhacker.<br />

Eine Auflistung aktueller<br />

Googlwhacks findet man unter folgendem<br />

Link:<br />

http://www.googlewhack.com/tally.pl<br />

Aufgabe 4.14<br />

Wie findest du heraus wer beim 3:3<br />

zwischen dem FC Liverpool und der<br />

AC Milan im Champions League<br />

Final 2005 das 3:2 schoss?<br />

Google ignoriert dich<br />

Deine Google-Suchanfrage darf übrigens<br />

höchstens 32 S<strong>tic</strong>hwörter beinhalten.<br />

Alles was darüber geht wird von<br />

Google nicht beachtet.<br />

Aufgabe 4.15<br />

Suche alle PDF Dokumente, die<br />

Google in den letzten 24 Stunden<br />

indiziert hat.<br />

Indexgrösse<br />

Auch wenn Google zur tatsächlichen<br />

Grösse seines Indexes schweigt, so<br />

kann man doch erahnen in welchen<br />

Dimensionen sich dieser bewegt. Die<br />

Suche nach „the*“ liefert fast 25.5 Milliarden<br />

Treffer. Das Sternchen steht<br />

dabei für ein beliebiges anderes S<strong>tic</strong>hwort.


„Mancher suchet, um zu finden; und<br />

mancher findet, um nicht weiter <strong>suchen</strong><br />

zu müssen“ [69]<br />

Aufgabe 4.16<br />

Finde einen Plan mit den verschiedenen<br />

Buslinien von Winterthur.<br />

Aufgabe 4.17<br />

Wo suchst du um alle Verfilmungen<br />

von „Wall Street“ zu finden?<br />

Zusammenfassung<br />

Rangierungsprinzipien<br />

Es gibt unzählige Rangierungsprinzipien, die von Suchmaschinen<br />

verwendet werden. Teilweise sind diese auch von Suchmaschine<br />

zu Suchmaschine etwas anders. Vor allem die textunabhängigen<br />

Kriterien (z.B.: wie oft eine Seite angeklickt wird) sind für uns<br />

meist unsichtbar. Diejenigen, die jedoch vom Text abhängig sind,<br />

sind für uns direkt wahrnehmbar und auch umso wichtiger für<br />

unsere Suchstrategie. Deshalb beachten wir bei jeder Suchanfrage,<br />

die wir stellen die oben gelernten Rangierungsprinzipien.<br />

Suchstrategien<br />

Es gibt unzählige Suchstrategien und nicht falsche oder richtige.<br />

Wähle deine Strategie der Situation angepasst und nach deinen<br />

Vorlieben.<br />

Katalog versus Suchmaschine<br />

Suchmaschinen – allen voran Google – stellen mittlerweile ein<br />

sehr mächtiges und auch effizientes Suchinstrument dar. Deshalb<br />

ist es vernünftig, in den meisten Fällen auch auf sie zurückzugreifen.<br />

In einigen wenigen Fällen jedoch ist es besser, wenn man einen<br />

Katalog bemüht. Vor allem, wenn man einen Überblick über<br />

den Inhalt eines Gebietes gewinnen möchte.<br />

Einfache Operatoren<br />

Mit den einfachen Operatoren (-, +) können wir unsere Suchanfragen<br />

differenzierter gestalten.<br />

Erweiterte Suche<br />

Mit den erweiterten Suchoptionen eröffnen sich uns ganz neue<br />

Suchmöglichkeiten. Mit der Profisuche schöpfen wir das riesige<br />

Potential, das in Google steckt, noch einen Schritt besser aus, als<br />

mit den einfachen Operatoren. Die Suchmaske der erweiterten<br />

Suche ist ausserdem sehr einfach zu bedienen.<br />

24


5. Gefahren im Umgang mit Google.<br />

Was weiss ich schon?<br />

Diskutiere mit deinen Kollegen, was ihr über folgende S<strong>tic</strong>hworte<br />

schon wisst? Haltet eure Gedanken schriftlich fest.<br />

� Cookies, IP-Adresse<br />

� Umgang mit persönlichen Daten, Persönlichkeitsprofile<br />

� Google Street View<br />

� sichere Browser-Einstellungen<br />

� Meinungsfreiheit<br />

� Zensur im Internet<br />

� Was für verschiedene Suchmaschinen kennst du?<br />

Nach diesem Kapitel weiss ich…<br />

� wie und warum Google Daten über seine Benutzer sammelt.<br />

� wie ich mich davor schützen kann.<br />

� wie ein Cookie funktioniert.<br />

� welche Möglichkeiten es gibt im Web anonym zu bleiben.<br />

� wo und warum im Internet zensiert wird.<br />

� was die Gefahren der Monopolstellung von Google sind.<br />

Google kennt dich besser als du denkst…<br />

Google sammelt Daten – schon seit Jahren. Und erstellt damit Nutzerprofile<br />

um die Suchergebnisse zu verbessern. Gefährlich wird<br />

dies vor allem, wenn die Daten der verschiedenen Dienste verbunden<br />

würden. Denn dann hätte Google keine Nutzerprofile mehr,<br />

sondern Persönlichkeitsprofile von Millionen von Menschen. So<br />

oder so, Google hat so viele Informationen angehäuft wie niemand<br />

zuvor.<br />

Aufgabe:<br />

Überlege dir wie du dich schützt, wenn du im Internet unterwegs<br />

bist und bearbeite anschliessend das Kapitel.<br />

25<br />

Wusstest du, dass…<br />

� Google all deine Suchanfragen<br />

speichert?<br />

� Suchergebnisse auch in der<br />

Schweiz zensiert werden?


„Die perfekte Suchmaschine würde<br />

genau erkennen, was der Nutzer meint<br />

und genau die gewünschten Ergebnisse<br />

anzeigen.“ [70]<br />

Larry Page, Mitbegründer von Google.<br />

Unter dem folgenden Link kannst du<br />

deine Facebook-<br />

Sicherheitseinstellungen testen:<br />

http://www.reclaimprivacy.org/<br />

Abbildung 9: Ein „Choco-Cookie“<br />

Datenschutz<br />

Personalisierte Suche<br />

Wie du in Kapitel zwei gesehen hast, ist es Googles Vision einerseits<br />

alle verfügbaren Informationen dieser Welt zusammenzutragen<br />

und zu organisieren, andererseits haben die Google-Gründer<br />

den Anspruch ihre Suchmaschine so weit zu perfektionieren, dass<br />

sie alle Fragen beantworten kann. [71] Das Ziel, so Googles Vision,<br />

soll ein Instrument sein, das nicht nur für die Beantwortung einfacher<br />

Fragen wie die nach den aktuellen Zugverbindungen, sondern<br />

auch auf Fragen wie: „Welches Auto soll ich kaufen?“ irgendwann<br />

einmal eine Antwort bereit halten soll. Nicht nächstes Jahr, sehr<br />

wahrscheinlich auch nicht in nächster, aber viel<strong>leicht</strong> in ferner<br />

Zukunft. Was eine Suchmaschine für eine sogenannte personalisierte<br />

Suche benötigt, sind Informationen. Informationen über den<br />

Benutzer. Und zwar nicht einmal eine Menge davon. Um obige<br />

Suchanfrage zu beantworten, müsste eine Suchmaschine nur einige<br />

Vorlieben des Benutzers kennen: Sportwagen oder Geländewagen.<br />

Seine Lieblingsfarbe, Lieblingsmarke. Diese drei einfachen Informationen<br />

reichen vollständig aus, um dem Benutzer Werbung mit<br />

perfekt auf seine Wünsche zugeschnittenen Angeboten vorzuschlagen.<br />

Was ein Autohersteller, der den perfekten Wagen für den<br />

oben erwähnten Benutzer hat, für diese drei einfachen Informationen<br />

zahlen würde – unvorstellbar.<br />

Googles Datenerhebung<br />

Personalisierte Suche ist schon längst Realität. Nicht im grossen<br />

Stil, wie oben beschrieben, aber (bisher) im Kleinen. Was für<br />

Suchresultate angezeigt werden, ist schon jetzt von Person zu Person<br />

unterschiedlich. Ein spezielles Cookie (für Erklärung siehe S.<br />

27) mit einer Lebensdauer von 180 Tagen speichert alle Seiten die<br />

du anklickst, alle S<strong>tic</strong>hwörter die du in Google eingibst und wann<br />

du das tust. Darauf basierend sehen die Suchergebnisse bei jedem,<br />

ganz auf seine Vorlieben abgestützt, wieder etwas anders aus. [72]<br />

Aber nebst diesem Cookie sammelt Google noch viel mehr: Zusätzlich<br />

zu den gespeicherten Daten für die personalisierte Suche,<br />

speichert der Suchriese Suchanfragen für 18 Monate inklusive IP-<br />

Adresse, Google-Domain, Zeitpunkt der Suchabfrage, S<strong>tic</strong>hwörter<br />

der Suche und Informationen über den Browser. Da ist es auch ein<br />

schwacher Trost, dass die Lebensdauer der Cookies auf 18 Monate<br />

heruntergesetzt wurde. Zuvor setzte Google Cookies, die bis ins<br />

Jahr 2038 lebten. Denn bei jeder erneuten Suchanfrage beginnen<br />

die 18 Monate von neuem. Wer bei einem Google-Dienst<br />

26


angemeldet ist, der kann über Google Web History all seine Suchanfragen,<br />

die jemals gestellt worden waren, nachschlagen. Diese<br />

Daten hat somit auch Google. Wer ein GMail Konto besitzt liefert<br />

dem Unternehmen zu seinen Daten den Namen. Beim E-Mail<br />

Dienst werden alle Nachrichten mitgelesen. Google scannt die<br />

Nachrichten mit einer Analyse-Software auf S<strong>tic</strong>hwörter um in den<br />

Mails Werbung platzieren zu können. Passend zum Inhalt. Wenn<br />

du in einer Nachricht einem Freund von deinen geplanten Ferien<br />

erzählst, ist die Wahrscheinlichkeit hoch, dass darin Werbung von<br />

einem Reisebüro platziert wird. Besonders gefährlich werden diese<br />

Daten, wenn sie miteinander verbunden würden. So liessen sich<br />

ganze Persönlichkeitsprofile erstellen.<br />

Schutzmassnahmen<br />

Du bist der Sammelwut des kalifornischen Suchgiganten aber nicht<br />

schutzlos ausgeliefert. Es gibt durchaus ein paar Sicherheitsvorkehrungen,<br />

die du treffen kannst, um im Internet Fremden nicht<br />

alles preiszugeben und nicht auf Googles hervorragende Suchmaschine<br />

verzichten zu müssen.<br />

� Als erstes solltest du die Cookies in den Griff bekommen. Cookies<br />

sind nichts anderes als Informationen in Form von Textdateien,<br />

die von bestimmten Webseiten erstellt werden, um Informationen,<br />

wie persönliche Einstellungen auf der entsprechenden<br />

Webseite zu protokollieren. Diese werden dann auf<br />

dem Browser abgelegt. Das nächste Mal, wenn die Seite aufgerufen<br />

wird, kann das Cookies die Informationen an den Server<br />

des Webseitenbetreibers übergeben. Bei einem erneuten Abrufen<br />

der Webseite, kann das Cookie zudem den Besucher identifizieren.<br />

Dadurch kann man sich zum Beispiel automatisch auf<br />

einer Seite anmelden. Dies kann unter Umständen sehr nützlich<br />

sein. So kann man heutzutage eine Vielzahl an Webseiten nur<br />

noch be<strong>suchen</strong>, wenn man in den Browsereinstellungen Cookies<br />

akzeptiert. So praktisch sie auch sein können, teilweise<br />

stellen sie auch eine Gefahr dar. Vor allem mit langlebigen<br />

Cookies kann der Serverbetreiber der Webseite von den Benutzern<br />

ein Nutzerprofil erstellen, die ihm seine Surfgewohnheiten<br />

verraten. Denn beim auswerten der „Kekse“ sieht man was für<br />

Seiten abgefragt worden sind. Auch die E-Mail-Adresse ist, auf<br />

der Webseite einmal eingetragen, im Cookie gespeichert. Dies<br />

kann der Betreiber der Webseite zusammen mit seinem Wissen<br />

über die Vorlieben des Benutzers ausnutzen und gezielte Spam-<br />

Mails an ihn verschicken. [73]<br />

27<br />

Die Cookies, die von Webseiten gesetzt<br />

wurden, kannst du in der Regel<br />

auch wieder löschen. Dies kannst du<br />

in deinem Webbrowser tun. Und zwar<br />

unter Tools, Options, Privacy, Cookies.<br />

Klicke auf „Show Cookies“.<br />

Jetzt werden alle Cookies angezeigt,<br />

die auf deinen Browser angesetzt<br />

worden sind. Um sie zu löschen,<br />

kannst du einfach „Remove all Cookies“<br />

drücken. Wenn du nach einer<br />

Weile wieder nachschaust, siehst du,<br />

wie schnell welche gesetzt werden.<br />

Unter den Sicherheitseinstellungen<br />

deines Browsers kannst du einstellen,<br />

wie strikt du mit Cookies umgehen<br />

möchtest. Aber Achtung, wenn du sie<br />

ganz aussperrst, können gewisse<br />

Webseiten nicht angezeigt werden. Es<br />

gilt also einen Kompromiss zu finden<br />

zwischen Sicherheit und Bequemlichkeit.<br />

Aufgabe 5.1<br />

Versuche dich daran zu erinnern, was<br />

du gestern gegoogelt hast? In der<br />

letzten Woche? Im letzten Monat? Im<br />

letzten Jahr? Die letzten 18 Monate?<br />

Wenn du jetzt eine Liste machst mit<br />

all diesen S<strong>tic</strong>hwörtern, weisst du was<br />

Google über dich weiss!<br />

Natürlich kann Google damit keinen<br />

Namen, sondern nur eine Nummer in<br />

Verbindung bringen – sofern du kein<br />

GMail-Konto hast.


Schau auf der folgenden Seite mit und<br />

ohne Proxy nach, was für Informationen<br />

du im Web preisgibst:<br />

http://www.whatsmyip.de/<br />

Hier findest du eine Seite mit einigen<br />

Proxy-Servern:<br />

http://www.onionproxy.com/<br />

Auch in der Schweiz wurde und wird<br />

teilweise politisch motivierte Zensur<br />

betrieben. So wurde die Seite<br />

www.appel-au-peuple.org mit einem<br />

richterlichen Beschluss wegen ehrverletzenden<br />

Verschwörungstheorien<br />

über die Schweizer Justiz gesperrt.<br />

Mit einem ausländischen Proxy-<br />

Server kann jedoch weiterhin darauf<br />

zugegriffen werden. [78]<br />

Mit dem China Channel Firefox Addon<br />

kann man die chinesische Zensur<br />

nachempfinden.<br />

http://chinachannel.hk/<br />

Aufgabe 5.2:<br />

Erkundige dich nach Alternativen zu<br />

Google und probiere sie aus. Im Anhang<br />

steht eine Liste mit unzähligen<br />

anderen Suchprogrammen.<br />

� Google kriegt neben deinen Suchbegriffen auch noch deine IP-<br />

Adresse. Dadurch kann er deine Aktivitäten im Netz dir zuordnen.<br />

Aber auch dagegen kann etwas getan werden. Mit sogenannten<br />

Proxy-Servern. Wenn du mit einem Proxy-Server im<br />

Web unterwegs bist, bleibt deine eigene IP-Adresse geheim. Du<br />

„surfst“ dann sozusagen mit derjenigen des Proxy-Servers. [74]<br />

� Benutze, wenn du nicht anonym im Netz bist, Google (und<br />

auch andere Suchmaschinenanbieter) mit Bedacht. Suchmaschinen<br />

sind, auch wenn sie auf den ersten Blick anonym wirken,<br />

kein Ort an dem man vertrauenswürdige Sachen deponieren<br />

sollte. Gib nicht alles in eine Suchmaschine ein. Eigentlich<br />

solltest du nichts in Google eingeben, was du nicht auch einem<br />

Fremden erzählen würdest.<br />

Zensur<br />

Zensiert wird im Internet nicht nur in Staaten wie China, Burma,<br />

Iran, Saudi-Arabien, Syrien, Kuba, Ägypten, Nord Korea oder dem<br />

Vietnam. [75] Nein, auch in Europa wird zensiert. Zugegeben nicht<br />

in demselben Mass wie in diesen teilweise totalitären Staaten und<br />

auch nicht aus demselben Grund, aber es wird zensiert. Während<br />

in China oder anderswo aus politischen Gründen zensiert wird, so<br />

werden in der westlichen Welt Seiten mit pornographischem Inhalt,<br />

Seiten der Kinderpornographie oder rechtsradikale, neosozialistische<br />

Seiten zensiert. [76] Sogar die Schweizer Regierung stellt<br />

immer wieder Anfragen gewisse Inhalte entfernen zu lassen. Sie<br />

fordert aber auch immer wieder die Herausgabe von sensiblen<br />

personenbezogenen Daten. [77] In China wird alles zensiert, was der<br />

Regierung nicht genehm ist. Begriffe wie „Free Tibet“ oder „Tian’anmen<br />

Massacre“ werden in China von einer Firewall der Zensurbehörde<br />

systematisch geblockt. Du fragst dich jetzt sicher, was<br />

das ganze mit Suchmaschinen zu tun haben soll. Eine ganze Menge.<br />

Denn in einer Zeit, in der fast in allen Staaten dieser Welt die<br />

Suchergebnisse „geschönt“ werden, wird der Druck auf die Suchmaschinen,<br />

allen voran auf Google, immer grösser. Sie werden von<br />

den Regierungen teilweise gezwungen Seiten aus dem Index zu<br />

löschen oder Daten herauszugeben. Suchergebnisse sind also auch<br />

beeinflussbar.<br />

Monopolstellung?<br />

Benutze auch einmal eine andere Suchmaschine als Google. Es<br />

gibt unzählige Alternativen. So kannst du etwas vergleichen. Wenn<br />

du danach zum Schluss kommst, Google ist doch die Beste, kannst<br />

du ja immer noch zurückwechseln. Wie sagt man so schön: Abwechslung<br />

macht das Leben süss.<br />

28


Zusammenfassung<br />

Datenschutz<br />

Google sammelt Daten, Daten und nochmal Daten. Doch dagegen<br />

kann (und soll) man sich schützen.<br />

Dazu gibt es unterschiedliche Methoden, die natürlich auch kombiniert<br />

angewandt werden können:<br />

� Alte Cookies löschen und die Einstellungen des Internetbrowsers<br />

optimieren.<br />

� Sich anonym im Netz bewegen. Entweder durch ein Proxy-Server<br />

oder durch einen Anonymizer.<br />

� Sich überlegen, was man in die Google Suchmaske eintippt.<br />

Denn: Die Google Datenbanken vergessen niemals!<br />

Zensur<br />

In China und anderen totalitären Ländern wird Zensur betrieben.<br />

Gegen alle politischen Feinde. Aber auch in den USA und Europa<br />

wird zensiert. Vorrangig Kinderpornographie, andere pornographische<br />

Inhalte, rechtsradikale und andere „populistisch gefährliche“<br />

Seiten. Aber nicht nur. Auch hier werden manchmal Seiten aus den<br />

Suchergebnissen gelöscht, die politisch „nicht korrekt“ sind. Aber<br />

Zensur kann, sofern man von der Seite schon die Internet-Adresse<br />

kennt, umgangen werden. Mit einem Proxy-Server. Der muss<br />

jedoch (in den meisten Fällen) eine ausländische Domain haben,<br />

da Internetprovider – auf Druck von Regierungen – Seiten meistens<br />

für eine gewisse Domain sperren (z.B. für alle Computer mit<br />

einer Schweizer IP-Adresse).<br />

Monopolstellung Google<br />

Über Google laufen vier von fünf Suchanfragen – weltweit! [79] Das<br />

bedeutet, dass Google für jeden zweiten Menschen mit einem Internetanschluss<br />

die Informationen organisiert. [80] Vorderhand machen<br />

so viele Menschen Gebrauch von Google, weil die Suchmaschine<br />

den mit Abstand grössten Index hat, am schnellsten ist, die<br />

relevantesten Suchergebnisse liefert, die Startseite und das Layout<br />

allgemein schlicht und einfach ist und Google cool, hip und beliebt<br />

ist. Vielfach kennen die Benutzer jedoch auch gar keine andere<br />

Suchmaschine. Google wurde zum Inbegriff des Suchens. Zurück<br />

zum Thema: Wenn eine Firma den Informationsfluss von beinahe<br />

einer Milliarde Menschen regelt, ist Vorsicht geboten. Denn für die<br />

meisten ist Google die einzige Informationsquelle.<br />

29<br />

Abbildung 10: Googeln in China.<br />

Abbildung 11


Anhang A:<br />

a. Glossar:<br />

A:<br />

AdWords<br />

AdWords ist Googles Anzeigensystem mit dem es sein Geld verdient.<br />

Mit Adwords kann man zu gewissen S<strong>tic</strong>hwörtern Anzeigeplätze<br />

ersteigern, an denen dann die eigene Werbung steht. Die<br />

Werbung ist immer von den Suchergebnissen getrennt in der rechten<br />

Spalte platziert.<br />

Archiv<br />

Ein Archiv ist eine Art Katalogdienst, auf den online zugegriffen<br />

werden kann.<br />

B:<br />

Backbone<br />

Das Backbone ist die Autobahn des Internetverkehrs. Ein Backbone<br />

kann mit einem riesigen Kabel verglichen werden, durch das die<br />

ganzen Daten laufen.<br />

Bit<br />

Ein Bit ist eine Grösse aus der elektronischen Datenspeicherung.<br />

Daten speichert man durch zwei verschiedene Zustände. Entweder<br />

fliesst Strom oder es fliesst kein Strom durch die Schalter der<br />

Harddisk (Hauptspeicher). Diese beiden Zustände werden mathematisch<br />

durch eine 1 oder eine 0 dargestellt. Die Information ob<br />

Strom fliesst oder nicht nennt man ein Bit. Acht Bits ergeben ein<br />

Byte. Um bei grossen Datenmengen besser rechnen zu können, hat<br />

man Bytes weiter zusammengefasst: 1024 Bytes sind ein Kilobyte<br />

(KB), 1024 KB sind ein Megabyte (MB), 1024 MB sind ein Gigabyte<br />

(GB), 1024 GB sind ein Terabyte (TB), 1024 TB sind ein<br />

Petabyte (PB) und 1024 PB sind ein Exabyte (EB).<br />

Browser<br />

Ein Browser ist ein Programm für die Darstellung von Webseiten.<br />

Mit ihm navigiert man durch das Web. Beispiele sind: Internet<br />

Explorer, Firefox, Opera oder Safari.<br />

D:<br />

Domain<br />

Als Domain wird ein im Web zusammenhängender Teil bezeichnet.<br />

Anhand der Top-Level-Domain sieht man in welchem Land<br />

der Rechner steht.<br />

30


Durchschaltevermittlung<br />

Die Durchschaltevermittlung ist eine Möglichkeit, wie man die<br />

Daten über ein Netzwerk vermitteln kann. Bei der Durchschaltevermittlung<br />

wird immer eine Leitung für die Datenvermittlung<br />

oder ein Telefongespräch (die Durchschaltevermittlung kommt aus<br />

der Telekommunikation) freigeschaltet. Dabei kann die Leitung<br />

jeweils nur für einen Datentransfer auf einmal genutzt werden.<br />

Dies änderte sich mit der Paketvermittlung. Bei der die Nachrichten<br />

in kleine Pakete aufgeteilt werden und unabhängig zu welchem<br />

Gespräch sie gehören durch die Leitung gehen und am Zielort<br />

wieder zusammengesetzt werden. So kann eine Leitung für mehrere<br />

Datentransfers auf einmal genutzt werden.<br />

E:<br />

Exabyte<br />

siehe Bit.<br />

G:<br />

Gateways<br />

Unter einem Gateway versteht man ein Protokollübersetzer. So<br />

können Netzwerke mit unterschiedlichen Protokollen miteinander<br />

kommunizieren.<br />

Glasfaserkabel<br />

Kabel aus Glasfäden mit denen sehr hohe Datenraten übertragen<br />

werden können.<br />

H:<br />

History<br />

In der History sind alle Suchbegriffe gespeichert, die früher einmal<br />

eingegeben worden sind.<br />

Hypertextsystem<br />

Ein Hypertextsystem verbindet verschiedene Seiten durch Links.<br />

So kann man durch das Anklicken von Links auf eine andere Seite<br />

gelangen.<br />

I:<br />

Internetbrowser<br />

siehe Browser.<br />

K:<br />

Knoten<br />

Ein Rechner der über ein Netzwerk mit anderen Rechnern verbunden<br />

ist.<br />

31


L:<br />

LAN<br />

LAN steht für Local Area Network. Ein LAN ist ein lokales Netzwerk<br />

über das man mit Rechnern Daten austauschen kann. Dies<br />

kann entweder (wie heute üblich) über Wireless-LAN oder über<br />

ein normales LAN mit Netzwerkkabeln sein.<br />

M:<br />

MAN<br />

Ein MAN ist ein Netzwerk, das sich über eine ganze Region erstreckt<br />

(Metropolitan Area Network).<br />

P:<br />

Paketvermittlung<br />

siehe Durchschaltevermittlung.<br />

Peer-To-Peer<br />

Ein Peer-To-Peer-Netzwerk steht im Gegensatz zu einem traditionellen<br />

Client-Server basierten Netzwerk, bei dem der Server den<br />

Dienst anbietet und der Client ihn nutzt. In einem P2P-Netzwerk<br />

hingegen sind alle Rechner gleichberechtigt. Sie sind vor allem<br />

typisch für Dienste wie Musiktauschbörsen, bei denen alle die<br />

Musik über viele verschieden Rechner gleichzeitig heruntergeladen<br />

wird und nicht wie sonst von nur einem Server.<br />

Protokoll<br />

Protokolle sind für die Kommunikation zwischen den verschiedenen<br />

Rechnern im Web zuständig. Sie legen fest, wie und in welcher<br />

Reihenfolge der Datenaustausch erfolgt.<br />

S:<br />

Spam-Mail<br />

Eine Spam-Mail ist eine Werbemail, welche in der Regel ohne<br />

Zustimmung des Empfängers zugestellt wird.<br />

T:<br />

TCP/IP<br />

Die Protokolle „Transmission Control Protocol“ und „Internet<br />

Protocol“ sind für die Paketvermittlung in Netzwerken zuständig.<br />

Das Internet Protocol schaut, dass die Daten am richtigen Ort ankommen.<br />

Das Transmission Control Protocol unterteilt die Nachricht<br />

in kleine Pakete, setzt sie am Zielort wieder zusammen und<br />

kontrolliert ob alle Pakete angekommen sind.<br />

32


W:<br />

WAN<br />

Ein Wide Area Network erstreckt sich im Gegensatz zu einem<br />

LAN oder MAN über ein grosses Gebiet. Manchmal sogar über<br />

ganze Regionen oder Länder.<br />

WWW<br />

Unter dem World Wide Web (auch WWW oder einfach Netz genannt)<br />

versteht man die Software, welche verwendet wird um die<br />

einzelnen Webseiten miteinander zu verknüpfen. Somit wird das<br />

WWW auch als Hypertextsystem bezeichnet. Die einzelnen Seiten<br />

sind durch sogenannte Hyperlinks (Links) miteinander verbunden.<br />

Wichtig ist die Unterscheidung zwischen dem WWW und dem<br />

Internet. Das Internet ist lediglich die Hardware. Also die Infrastruktur,<br />

welche die verschiedenen Rechner, auf welchen die Seiten<br />

liegen, mit einander verbindet.<br />

33


. Nützliche Links<br />

Internationale Suchdienste<br />

Google http://www.google.com/<br />

Yahoo! http://www.yahoo.com/<br />

Bing (Microsoft) http://www.bing.com/<br />

All The Web http://www.alltheweb.com/<br />

AltaVista http://www.altavista.com/<br />

Northern Light Search http://www.nlsearch.com/<br />

Ask http://www.ask.com/<br />

EntireWeb http://www.entireweb.com/<br />

Schweizer Suchdienste<br />

The Swiss Search Engine http://www.swisspage.ch/<br />

Google Schweiz http://www.google.ch/<br />

Yahoo Schweiz http://ch.search.yahoo.com/<br />

AltaVista http://ch.altavista.com/<br />

Schweizer Homepage Directory http://www.swisspage.ch/<br />

Die Schweizer Suchmaschine http://www.yoodle.ch/<br />

Meta-Suchmaschinen<br />

Ixquick http://www.ixquick.com/<br />

Web Crawler http://www.webcrawler.com/<br />

Meta Crawler http://www.metacrawler.com/<br />

Apollo 7 http://www.apollo7.de/<br />

Highway 61 http://www.highway61.com/<br />

MetaGer http://www.metager.de/<br />

Internationale Verzeichnisdienste<br />

Yahoo! http://www.yahoo.com/<br />

Excite http://www.excite.com/<br />

All One Search http://www.allonesearch.com/<br />

Alles klar http://www.allesklar.de/<br />

Sharelook http://www.sharelook.co.uk/<br />

Schweizer Verzeichnisdienste<br />

Sharelook http://www.sharelook.ch/<br />

Vertikale Suchmaschinen International<br />

Software http://www.tucows.com/<br />

Filme http://www.imdb.com/<br />

Medizin und Gesundheit http://www.medivista.de/<br />

Zeitungsartikel http://www.paperball.de/<br />

34


Vertikale Suchmaschinen Schweiz<br />

Firmen, Produkte, Marken http://www.swissguide.ch/<br />

Schweizer Musikszene http://www.music.ch/<br />

Literapedia http://literapedia.wikispaces.com<br />

Internet-Archive<br />

Zeitungsartikel http://www.paperball.de/<br />

FAZ-Archiv http://fazarchiv.faz.net/FAZ.ein<br />

NZZ-Archiv http://nzz.gbi.de/NZZ.ein<br />

Die Zeit http://www.zeit.de/2010/index<br />

Der Spiegel http://www.spiegel.de/<br />

3Sat-Mediathek http://www.3sat.de/mediathek/<br />

GEO http://www.geo.de/<br />

Bibliothekskataloge<br />

Schweizer Vitueller Katalog http://www.chvk.ch/<br />

Deutsche-Internet-Bibliothek http://www.internetbibliothek.de/<br />

NEBIS http://opac.nebis.ch/<br />

ETH-Bibliothek http://www.library.ethz.ch/<br />

Schweizerisches Sozialarchiv http://www.sozialarchiv.ch/<br />

Zentralbibliothek Zürich http://www.zb.unizh.ch/<br />

Winterthurer Bibliotheken http://bibliotheken.winterthur.ch/<br />

Enzyklopädien/Lexika<br />

Wikipedia http://en.wikipedia.org/<br />

Encyclopedia Britannica http://www.britannica.com/<br />

Brockhaus Enzyklopädie http://www.brockhaus.de/<br />

Meyers Lexikon Online http://www.iicm.tugraz.at/<br />

One Look http://www.onelook.com/<br />

Wörterbücher<br />

LEO http://www.leo.org/<br />

CANOO http://www.canoo.net/<br />

Google Translate http://translate.google.com/<br />

Babelfish http://babelfish.yahoo.com/<br />

LENGUA http://www.lengua.com/<br />

Computer-Wörterbuch http://foldoc.org/<br />

35<br />

Abbildung 12:<br />

Titelseite der „Encyclopédie“ von<br />

Diderot und D’Alembert.


c. Quellenangabe:<br />

Abbildungen:<br />

Titelbild: Rechenzentrum: http://farm4.sta<strong>tic</strong>.flickr.com/3380/3419237278_d5da5f22bb_o.jpg<br />

Google-Logo aus Lebensmittelverpackungen: http://picasaweb.google.com/gblogphotos/ Googley<br />

ArtWalls?feat=flashalbum#5509770875559110002<br />

Abbildung 1: http://interaktiv.mlpd.de/rf0502/rfart15.htm<br />

Abbildung 2: Graphik zur Funktionsweise von Google. Aus der Doktorarbeit der Google-Gründer übernommen<br />

(stark vereinfacht): http://infolab.stanford.edu/~backrub/google.html<br />

Abbildung 3: http://www.google.ch/intl/de/corporate/tech.html<br />

Abbildung 4: http://geektechnique.org/media/google/googlehardware.html<br />

Abbildung 5: http://communication.howstuffworks.com/google-docs5.htm<br />

Abbildung 6: Graphik (<strong>leicht</strong> modifiziert) übernommen aus: Hübener, Markus: Suchmaschinenoptimierung kompakt.<br />

Heidelberg 2009. S. 18.<br />

Abbildung 7: http://www.suchfibel.de/2kunst/feldsuche.htm<br />

Abbildung 8: http://lequattrostagioni.wordpress.com/2009/11/06/1931-2001-bilder-die-bewegen/<br />

Abbildung 9: http://commons.wikimedia.org/wiki/File:Choco_chip_cookie.jpg<br />

Abbildung 10: http://bureau.comandantina.com/archivos/2006/02/<br />

Abbildung 11: http://marketgoodstocks.com/humor-news/google-china-changing-im-feeling-lucky-to-im-feelingcommunist/<br />

Abbildung 12: http://en.wikipedia.org/wiki/File:ENC_1-NA5_600px.jpeg<br />

Endnoten:<br />

[1] Viele glauben der Brite Donald Davies hätte das Paketvermittlungsverfahren als erster entdeckt. Fakt ist<br />

aber: Er war zwar der Namensgeber des neuartigen Verfahrens, der Amerikaner Paul Baran hatte dieses jedoch<br />

zuerst entwickelt. Er erfuhr jedoch nicht dieselbe Unterstützung der Telefongesellschaften wie sein<br />

englischer Konkurrent, da die amerikanische Telefongesellschaft AT&T vorerst kein Interesse an der<br />

Technik der Paketvermittlung hatte. Siehe dazu: Wikipedia, Die freie Enzyklopädie, „Packet switching“,<br />

Bearbeitungsstand: 14.10.2010, 18:13 UTC. http://en.wikipedia.org/wiki/Packet_switching (17.10.10).<br />

Oder auch in: Hafner, Katie und Lyon, Matthew: ARPA KADABRA oder die Anfänge des Internet. Heidelberg<br />

2008. S. 72-75.<br />

[2] H'obbes' Zakon, Robert: Hobbes‘ Internet Timeline 10. http://www.zakon.org/robert/internet/timeline/<br />

(17.10.10).<br />

[3] Hafner und Lyon S. 198.<br />

36


[4] H'obbes' Zakon, Robert: Hobbes‘ Internet Timeline 10. http://www.zakon.org/robert/internet/ timeline/<br />

(17.10.10). Oder folgende Seite: California State University Dominguez Hills: ARPANET maps.<br />

http://som.csudh.edu/fac/lpress/history/arpamaps/f8sep1971.jpg (17.10.10). Auf letzterer sind zwar 18<br />

Hosts zu sehen. Drei davon scheint jedoch eine Sonderfunktion zuzukommen und sind auf der Karte mit<br />

einem „T“ versehen. Gut möglich, dass auch die erste Seite vom selben Bericht (ARPANET Completion<br />

Report) ausgeht, die drei speziellen Hosts jedoch nicht mitzählt.<br />

[5] Hafner und Lyon S. 210.<br />

Die meisten Amerikaner erfuhren zum ersten Mal überhaupt von der Existenz des ARPANET im Jahre<br />

1975. Und zwar durch einen Skandal: Militärische Geheimdienste sammelten während der Zeit des Kalten<br />

Krieges Informationen wie selten zuvor. Sie hatten nicht nur Daten über den kommunistischen Osten, sondern<br />

auch innerhalb der USA wurden die örtlichen Geschehnisse vom Pentagon aus genau mit verfolgt. Als<br />

dies 1972 an die Öffentlichkeit kam, wurde die Löschung dieser Daten verlangt. 1975 gingen jedoch Behauptungen<br />

umher, wonach die Daten gar nicht gelöscht, sondern vom Geheimdienst an einen anderen Ort<br />

geschickt worden waren – per ARPANET. Siehe dazu Ebd. S. 274.<br />

[6] Weiterführende Lektüre zu den Internet-Protokollen TCP/IP: Universität Karlsruhe: TCP/IP.<br />

http://www.lehrer.uni-karlsruhe.de/~za151/netz/tcpip.html (17.10.10).<br />

[7] Hafner und Lyon S. 264–269.<br />

[8] Wikipedia, Die freie Enzyklopädie, „NORSAR“, Bearbeitungsstand: 14.05.2010, 12:49 UTC.<br />

http://en.wikipedia.org/wiki/NORSAR (17.10.10).<br />

[9] Hafner und Lyon S. 10. Entkräftet den weitverbreiteten Mythos über die Ziele des ARPANET.<br />

Oder auch: Internet Society: A Brief History oft he Internet.<br />

http://www.isoc.org/internet/history/brief.shtml (17.10.10)<br />

Auch ein ehemaliger Direktor der DARPA (ehemals ARPA) konnte den Mythos, das ARPANET sei nur<br />

als Kommunikationsmöglichkeit nach einem nuklearen Anschlag erbaut worden, als falsche Annahme erklären:<br />

About.com: Charles Herzfeld on ARPANET and Computers. http://inventors.about.com/library/<br />

inventors/bl_Charles_Herzfeld.htm (17.10.10).<br />

[10] Hafner und Lyon S. 176f.<br />

[11] Wikipedia, Die freie Enzyklopädie, „EUnet“, Bearbeitungsstand: 05.07.2010, 11:49 UTC.<br />

http://en.wikipedia.org/wiki/EUnet (17.10.10).<br />

[12] Wann genau der Begriff Internet aufkam, ist schwierig zu sagen, da das Aufkommen eines Begriffes selten<br />

dokumentiert wird und oftmals einen langsamen Prozess darstellt, der sich über Jahre hinweg ziehen kann.<br />

Es wird jedoch vermutet, dass er Mitte der 80er-Jahre populär wurde. Zudem hatte sich eine Unterscheidung<br />

zwischen Gross- und Kleinschreibung entwickelt: Ein „internet“ war ein privates, kleines Netzwerk,<br />

das TCP/IP benutzte. Das „Internet“ schafte es zum festen Begriff, wie die Grossschreibung in englischer<br />

Sprache verrät und ist definiert als das grosse, staatliche Netzwerk. Man könnte es auch Backbone nennen.<br />

Siehe dazu: Hafner und Lyon S. 289.<br />

[13] Wikipedia, Die freie Enzyklopädie, „TAT-8“, Bearbeitungsstand: 26.08.2010, 19:38 UTC.<br />

http://en.wikipedia.org/wiki/TAT-8 (28.11.10).<br />

[14] Hafner und Lyon S. 301–303.<br />

37


[15] Wikipedia, Die freie Enzyklopädie, „Archie“, Bearbeitungsstand: 18.05.2010, 11:29 UTC.<br />

http://de.wikipedia.org/wiki/Archie (17.10.10).<br />

[16] H'obbes' Zakon, Robert: Hobbes‘ Internet Timeline 10. http://www.zakon.org/robert/internet/ timeline/#1990s<br />

(17.10.10).<br />

[17] Wikipedia, Die freie Enzyklopädie, „WWW“, Bearbeitungsstand: 25.09.2010, 22:20 UTC.<br />

http://de.wikipedia.org/wiki/World_Wide_Web (17.10.10).<br />

Oder auch: Hafner und Lyon S. 305f.<br />

[18] Wikipedia, Die freie Enzyklopädie, „Chronologie des Internets“, Bearbeitungsstand: 14.09.2010, 20:55<br />

UTC. http://de.wikipedia.org/wiki/Chronologie_des_Internets (17.10.10).<br />

[19] Wikipedia, Die freie Enzyklopädie, „Chronologie des Internets“, Bearbeitungsstand: 14.09.2010, 20:55<br />

UTC. http://de.wikipedia.org/wiki/Chronologie_des_Internets (17.10.10).<br />

[20] Wikipedia, Die freie Enzyklopädie, „Alta Vista“, Bearbeitungsstand: 14.09.2010, 01:30 UTC.<br />

http://en.wikipedia.org/wiki/AltaVista (17.10.10).<br />

[21] Wikipedia, Die freie Enzyklopädie, „Yahoo“, Bearbeitungsstand: 14.10.2010, 22:21 UTC.<br />

http://de.wikipedia.org/wiki/Yahoo (17.10.10).<br />

[22] Den vollständigen Chat findet man in: Hafner und Lyon S. 218-220.<br />

[23] Wikipedia, Die freie Enzyklopädie, „Spam“, Bearbeitungsstand: 16.10.2010, 20:25 UTC.<br />

http://en.wikipedia.org/wiki/Spam_(electronic) (17.10.10).<br />

[24] Neue Zürcher Zeitung: Google lässt Duden-Eintrag „googeln“ ändern. http://www.nzz.ch/2006/08/16/<br />

vm/newzzEQXM1K6L-12.html (17.10.10).<br />

Auf Wunsch des Unternehmens wurde der Begriff in der nächsten Auflage des Dudens mittels „mit Google<br />

im Internet recherchieren“ genauer definiert, um eine Gattungsbegriffbildung zu verhindern, die schon<br />

längst Tatsache geworden ist.<br />

[25] Wikipedia, Die freie Enzyklopädie, „Browserkrieg“, Bearbeitungsstand: 09.10.2010, 19:11 UTC.<br />

http://de.wikipedia.org/wiki/Browserkrieg (17.10.10).<br />

[26] Wikipedia, Die freie Enzyklopädie, „Napster“, Bearbeitungsstand: 16.10.2010, 09:06 UTC.<br />

http://de.wikipedia.org/wiki/Napster (17.10.10).<br />

[27] Das Peer-To-Peer-Verfahren wird ausführlich erklärt auf: Wikipedia, Die freie Enzyklopädie, „Peer-to-<br />

Peer“, Bearbeitungsstand: 12.10.2010, 12:41 UTC. http://de.wikipedia.org/wiki/Peer-to-Peer (17.10.10).<br />

[28] Wikipedia, Die freie Enzyklopädie, „Jimbo Wales“, Bearbeitungsstand: 16.10.2010, 10:43 UTC.<br />

http://de.wikipedia.org/wiki/Jimbo_Wales (17.10.10).<br />

[29] Wikipedia, Die freie Enzyklopädie, „Web 2.0“, Bearbeitungsstand: 16.10.2010, 01:42 UTC.<br />

http://de.wikipedia.org/wiki/Web_2.0 (17.10.10).<br />

[30] Marketing Boerse: 2007 täglich 97 Milliarden E-Mails weltweit.<br />

http://www.marketing-boerse.de/News/details/2007-t%E4glich-97-Milliarden-E-Mails-weltweit/6555<br />

(17.10.10).<br />

38


[31] Im Jahr 2009 wurden durchschnittlich 11‘627 Petabyte Daten pro Monat über das (öffentlich zugängliche)<br />

Internet transportiert, was einem täglichen Datenaufkommen von mehr als 415 Petabyte entspricht (415 Petabyte<br />

entsprechen der tausendfachen Datenmenge aller Bücher, die jemals in jeder Sprache auf der Welt<br />

geschrieben wurden). Die Tendenz ist weiter steigend: Bis zum Jahr 2014 wird sich die weltweit verschickte<br />

Datenmenge um ungefähr den Faktor 3.5 auf 485 Exabyte erhöhen. Ein Grossteil dieser Daten wird<br />

durch Videos verursacht.<br />

Siehe dazu: Wikipedia, Die freie Enzyklopädie, „Internet“, Bearbeitungsstand: 16.10.2010, 07:28 UTC.<br />

http://de.wikipedia.org/wiki/Internet (17.10.10).<br />

Das Telekommunikationsunternehmen Cisco Systems, welches in der Branche von Routern und Internetverkehr<br />

eine feste Grösse ist, spricht im Jahr 2009 von 176 Exabyte Daten. Zudem erstaunlich: Um sich das<br />

gesamte Videomaterial, das im Jahr 2014 in einer Sekunde über das Web verschickt werden wird, anzusehen,<br />

bräuchte man mehr als zwei volle Jahre: Cisco Systems: Forecast and Methodology, 2009-2014.<br />

http://www.cisco.com/en/US/solutions/collateral/ ns341/ns525/ns537/ns705/ns827/white_paper_c11-<br />

481360_ns827_Networking_Solutions_White_ Paper. html (17.10.10).<br />

[32] Das Löschen von Spam-Mails raubt weltweit 100 Milliarden Stunden Arbeitszeit: Wikipedia, Die freie<br />

Enzyklopädie, „Spam“, Bearbeitungsstand: 14.10.2010, 18:48 UTC. http://de.wikipedia.org/wiki/ Spam<br />

(17.10.10). Spam-Mails sind jedoch nicht nur nervig und halten einem vom Wesentlichen ab, nein sie sind<br />

auch umweltschädlich: Laut einer Studie von McAfee könnten in den USA mit dem weltweiten Energieverbrauch,<br />

der beim versenden, sichten, lesen und bekämpfen von Spam-Mails entsteht 2,4 Millionen Häuser<br />

versorgt werden. Spam-Filter sind deshalb auch umwelttechnisch gesehen ein Vorteil: Alle Filter zusammen<br />

sparen die Energie von 13 Millionen Autos pro Jahr. Für weitere Informationen:<br />

McAfee: The Carbon Footprint of Email Spam Report.<br />

http://newsroom.mcafee.com/images/10039/carbonfootprint2009.pdf (17.10.10).<br />

[33] Die Fakten und Zahlen der „Google-Timeline“ stammen, sofern nicht anders vermerkt, aus: Kowalsky,<br />

Marc: Krieg der Welten. Der Kampf zwischen Apple und Google um die Vorherrschaft in der IT-Industrie<br />

ist voll entbrannt – mit Konzepten, die unterschiedlicher nicht sein könnten. In: BILANZ. Das Schweizer<br />

Wirtschaftsmagazin Nr. 14. Zürich 2010. S. 28-35. Hier S. 31-33.<br />

[34] Maass Christian et al.: Der Markt für Internet-Suchmaschinen. In: Lewandowski, Dirk (Hrsg.): Handbuch<br />

Internet-Suchmaschinen. Nutzerorientierung in Wissenschaft und Praxis. Heidelberg 2009. S. 3-17. Hier S.<br />

7.<br />

Google AdWords ist ein Auktionssystem, bei dem die Anzeigen versteigert werden. Wie bei allen Auktionssystemen<br />

wird auch hier der Markt voll ausgelastet. Denn der Preis kann niemals zu hoch oder zu tief<br />

sein. Sondern pendelt sich immer auf dem Niveau ein, das der Markt bereit ist zu zahlen. Für genauere Informationen<br />

siehe: Brandt, Richard: Googles kleines Weissbuch. Die Managementstrategien der wertvollsten<br />

Marke der Welt. München 2010. S. 86.<br />

[35] Becker, Hendrik und Arnold, Arne: Die Akte Google. In: PC WELT Nr. 8. München 2010. S. 72-82. Hier<br />

S. 75.<br />

[36] In ihrer Doktorarbeit äussern sich die Google-Gründer über die Hintergründe der Namensgebung: Brin,<br />

Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web Search Engine.<br />

http://infolab.stanford.edu/~backrub/google.html (16.11.10).<br />

Zudem findet man auf Wikipedia etwas zur Herkunft des Begriffs „Googol“: Wikipedia, Die freie Enzyklopädie,<br />

„Googol“, Bearbeitungsstand: 16.10.2010, 12:26 UTC.<br />

http://de.wikipedia.org/wiki/Googol (17.10.10).<br />

39


[37] Wikipedia, Die freie Enzyklopädie, „WWW“, Bearbeitungsstand: 14.11.2010, 02:15 UTC.<br />

http://de.wikipedia.org/wiki/World_Wide_Web (28.11.10).<br />

[38] Zitat aus Hafner und Lyon S. 304.<br />

1989 von Danny Cohen vorgetragen als Hommage an das ARPANET auf dem Act One Symposium an der<br />

UCLA (University of California Los Angeles) anlässlich des 20. Geburtstags des ARPANET, <strong>leicht</strong> angepasst<br />

und überarbeitet von den Autoren des Buches.<br />

[39] Wikipedia, Die freie Enzyklopädie, „Geschichte des Internets“, Bearbeitungsstand: 14.11.2010, 13:20<br />

UTC. http://de.wikipedia.org/wiki/Geschichte_des_Internets (28.11.10).<br />

[40] Wikipedia, Die freie Enzyklopädie, „Suchmaschine“, Bearbeitungsstand: 01.10.2010, 20:56 UTC.<br />

http://de.wikipedia.org/wiki/Suchmaschine (18.10.10).<br />

[41] Ebd.<br />

[42] Wikipedia, Die freie Enzyklopädie, „Webkatalog“, Bearbeitungsstand: 25.09.2010, 08:31 UTC.<br />

http://de.wikipedia.org/wiki/Webkatalog (18.10.10).<br />

[43] Wikipedia, Die freie Enzyklopädie, „Suchmaschine“, Bearbeitungsstand: 01.10.2010, 20:56 UTC.<br />

http://de.wikipedia.org/wiki/Suchmaschine (18.10.10).<br />

[44] Wikipedia, Die freie Enzyklopädie, „Metasuchmaschine“, Bearbeitungsstand: 25.09.2010, 08:31 UTC.<br />

http://de.wikipedia.org/wiki/Metasuchmaschine (18.10.10).<br />

[45] Wikipedia, Die freie Enzyklopädie, „Suchmaschine“, Bearbeitungsstand: 01.10.2010, 20:56 UTC.<br />

http://de.wikipedia.org/wiki/Suchmaschine (18.10.10).<br />

[46] SirValUse: Wer sucht, der findet! Google liefert nach wie vor die besten Suchergebnisse.<br />

http://www.sirvaluse.de/presse/nutzenforschung-report/09-<strong>suchen</strong>-im-internet/das-interview/index.html<br />

(28.11.10).<br />

[47] Google: Unternehmensbezogene Informationen. http://www.google.ch/intl/de/corporate/tech.html<br />

(28.11.10).<br />

[48] Brin, Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web Search Engine.<br />

http://infolab.stanford.edu/~backrub/google.html (16.11.10).<br />

[49] Google: Unternehmensbezogene Informationen. http://www.google. ch/intl/de/corporate/tech.html<br />

(28.10.10).<br />

[50] Search Engine Optimization: Relevanzkriterien – Basis für Onpage- und Offpage-Optimierung.<br />

http://www.seo-duesseldorf.de/suchmaschinenoptimierung/relevanzkriterien.html (18.10.10).<br />

[51] SEO für Google: Suchmaschinenoptimierung (SEO). http://www.jugendwettbewerb.de/ (18.10.10).<br />

[52] Brin, Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web Search Engine.<br />

http://infolab.stanford.edu/~backrub/google.html (16.11.10).<br />

[53] Reischl, Gerald: Die Google Falle. Die unkontrollierte Weltmacht im Internet. Wien 2008. S. 32.<br />

Kontrovers dazu: Brin, Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web<br />

Search Engine. http://infolab.stanford.edu/~backrub/google.html (16.11.10).<br />

40


[54] Ebd.<br />

[55] Ebd.<br />

In ihrer Doktorarbeit argumentieren die beiden Google-Gründer, dass je mehr Links auf eine Seite verweisen,<br />

desto höher müsse automatisch auch ihre Wichtigkeit sein. Besonders, da bei Backlinks von Seiten mit<br />

einem hohen Ranking, sprich meistens renommierte Seiten, ein Teil deren Wert weitervererbt wird. Es gibt<br />

also Bonuspunkte für Links von gutbewerteten Seiten.<br />

[56] Das Beispiel wurde aus folgendem Buch, <strong>leicht</strong> modifiziert, übernommen: Hübener, Markus: Suchmaschinenoptimierung<br />

kompakt. Heidelberg 2009. S. 18.<br />

[57] Google: Unternehmensbezogene Informationen. http://www.google.ch/intl/de/corporate/tech.html<br />

(18.10.10).<br />

[58] Die Aufgabe wurde, <strong>leicht</strong> abgeändert, übernommen aus: Hübener S. 18.<br />

[59] Wikipedia, Die freie Enzyklopädie, „PageRank“, Bearbeitungsstand: 08.09.2010, 20:25 UTC.<br />

http://de.wikipedia.org/wiki/PageRank (18.10.10).<br />

[60] The Official Google Blog: Our new search index: Caffeine. http://googleblog.blogspot.com/2010/06/ournew-search-index-caffeine.html<br />

(18.10.10).<br />

Laut dieser Quelle, wurde früher der Google Index nur alle paar Wochen aktualisiert. Mit der Einführung<br />

des neuen Systems „Caffeine“ geschieht dies nun regelmässiger, in kleineren Portionen. So kommen jeden<br />

Tag einige Hunderttausend Gigabyte an neuen, aktualisierten Daten hinzu.<br />

[61] Official Google Webmaster Central Blog: Using site speed in web search ranking.<br />

http://googlewebmastercentral.blogspot.com/2010/04/using-site-speed-in-web-search-ranking.html<br />

(18.10.10).<br />

[62] Ebd.<br />

Laut dem offiziellen Google-Blog fliesst neuerdings, neben den übrigen Relevanzkriterien, auch die Ladegeschwindigkeit<br />

einer Seite in ihr Ranking mit ein. Dieser Faktor wird jedoch erst auf der englischsprachigen<br />

Seite Google.com angewandt und hat, laut Google, einen sehr geringen Einfluss. Was diese neue Methode<br />

jedoch tatsächlich für Auswirkungen mit sich bringt, ist noch nicht klar. Einige befürchten, dass Bilder<br />

und Videos grösstenteils aus dem Web verschwinden könnten, würde sich das „Speed-Ranking“ weltweit<br />

durchsetzten, da diese die Ladegeschwindigkeit enorm beeinträchtigen. Siehe dazu: tagSEOBlog:<br />

Neuer Rankingfaktor „page speed“ – Googles Bildersturm? http://www.tagseoblog.de/ neuerrankingfaktor-ladezeit-googles-bildersturm-im-internet<br />

(18.10.10).<br />

[63] Hartmann, Werner et al.: Informationsbeschaffung im Internet. Grundlegende Konzepte verstehen und<br />

umsetzen. Zürich 2000. S. 38.<br />

[64] Die Idee für die Aufgaben zum Herleiten der Relevanzkriterien stammt von mir. Die sechs Rangierungsprinzipien<br />

sind jedoch dem folgenden Buch entnommen: Ebd. S. 38-43. Die tatsächlichen Beispiele wurden<br />

von mir jedoch frei erfunden und der Text dazu der (entsprechenden) Abfrage bei Google entnommen.<br />

Teilweise musste auch auf <strong>leicht</strong> modifizierte Ergebnisseiten gewechselt werden, um explizitere Beispiele<br />

zu generieren.<br />

[65] Long, Johnny: Google Hacking. Bonn 2005. S. 28-30 und S. 88-91.<br />

41


[66] Wikipedia, Die freie Enzyklopädie, „Boolescher Operator“, Bearbeitungsstand: 01.05.2010, 09:00 UTC.<br />

http://de.wikipedia.org/wiki/Boolescher_Operator (19.10.10).<br />

[67] Übernommen von: Google: Erweiterte Suche. http://www.google.ch/advanced_search?hl=de (28.11.10).<br />

[68] Der Text über „Googlewhack“ wurde von der folgenden Seite übernommen und <strong>leicht</strong> abgeändert: Reischl,<br />

Gerald: Die Googlefalle. http://www.googlefalle.com/googlefalle/index.php/about/wussten-sie-dass/<br />

(20.10.10).<br />

[69] Weilenmann, Anne-Katharina: Fachspezifische Internetrecherche. München 2006. S. 9.<br />

[70] Google: Unternehmensbezogene Informationen. http://www.google.ch/intl/de/corporate/tech.html<br />

(20.10.10).<br />

[71] Ebd.<br />

[72] The Official Google Blog: Personalized Search for everyone. http://googleblog.blogspot.com/2009/12/<br />

personalized-search-for-everyone.html (20.10.10).<br />

[73] Glos, Michael: Sicher surfen, mailen, Daten tauschen. Poing 2004. S. 47.<br />

[74] Ebd. S. 205.<br />

[75] Reporters without Borders: Enemies of the Internet. http://en.rsf.org/IMG/pdf/Internet_enemies.pdf<br />

(21.10.10).<br />

[76] Wikipedia, Die freie Enzyklopädie, „Zensur im Internet“, Bearbeitungsstand: 07.10.2010, 08:36 UTC.<br />

http://de.wikipedia.org/wiki/Zensur_im_Internet (21.10.10).<br />

[77] Google: Transparency Report: Government Requests. http://www.google.com/transparencyreport/ governmentrequests/<br />

(21.10.10).<br />

[78] Wikipedia, Die freie Enzyklopädie, „Zensur im Internet“, Bearbeitungsstand: 07.10.2010, 08:36 UTC.<br />

http://de.wikipedia.org/wiki/Zensur_im_Internet (21.10.10).<br />

Mit einem ausländischen Proxy-Server kann weiterhin auf die Seite zugegriffen werden. Zum Beispiel: Auf<br />

http://youproxified.info/ einfach die Internet-Adresse: www.appel-au-peuple.org in das Feld „URL“ eingeben.<br />

[79] Becker, Hendrik und Arnold, Arne S. 75.<br />

[80] Weichert, Thilo: Datenschutz bei Suchmaschinen. In: Lewandowski, Dirk (Hrsg.): Handbuch Internet-<br />

Suchmaschinen. Nutzerorientierung in Wissenschaft und Praxis. Heidelberg 2009. S. 285-300. Hier S. 288.<br />

42


Anhang B:<br />

Lösungen:<br />

Lösungen zu 2.1<br />

1. 1976.<br />

2. In Kalifornien und Boston liegen besonders viele führende<br />

amerikanische Universitäten und Forschungseinrichtungen.<br />

Und das ursprüngliche Ziel des ARPANET war ja ein verbesserter<br />

Datenaustausch unter diesen.<br />

Lösungen zu 2.2<br />

Ein verteiltes (und in Ansätzen auch ein dezentralisiertes) Netz ist<br />

bei einem Ausfall eines Knotens oder auch mehrerer Knoten nicht<br />

einfach stillgelegt, sondern kann den Datenverkehr über die verbleibenden<br />

Knoten abwickeln.<br />

Lösungen zu 2.3<br />

Bei der Durchschaltevermittlung werden alle Möbel in einem Auto<br />

transportiert und nicht auf mehrere verteilt. Der Hauptunterschied<br />

besteht aber darin, dass bei dieser Methode die Autobahn für den<br />

Zügelwagen reserviert ist und zu dieser Zeit keine anderen Autos<br />

auf der Autobahn fahren dürfen.<br />

Lösungen zu 3.1<br />

� Kataloge sind zumindest in kleiner Grösse aktueller und zu<br />

einem kleinen Thema auch umfassender.<br />

� Suchmaschinen sind effizienter, objektiver, aktueller, vollständiger<br />

und auch vom Kosten-Nutzen-Aspekt her gesehen effektiver.<br />

Hier kann im Vergleich zu einem Katalog mit einem kleineren<br />

finanziellen Aufwand ein grosser Index erstellt und gepflegt<br />

werden.<br />

Lösungen zu 3.2<br />

Bei der Glaubwürdigkeit kommt es auf die Quelle an. Also wer das<br />

Gesagte verbreitet. Ist die Person auch sonst glaubhaft, wird dem<br />

Gerücht wohl eher Glauben geschenkt.<br />

Lösungen zu 3.3<br />

� www.ethz.ch (9)<br />

� www.ksrychenberg.ch (5)<br />

� www.sf.tv (7)<br />

� www.blick.ch (7)<br />

43


� www.nytimes.com (9)<br />

� www.nzz.ch (8)<br />

� www.google.com (10)<br />

� www.google.ch (7)<br />

� www.yahoo.com (9)<br />

Wie du sicher unschwer erkennen kannst, hat der PageRank also<br />

nicht direkt mit Qualität, sondern mit Popularität zu tun. Die Seite<br />

der ETH wird deutlich öfter zitiert, als die Seite der KSR, hat demzufolge<br />

also deutlich mehr Backlinks. Die Seiten des Schweizer<br />

Fernsehens und des Blicks sind was den PageRank betrifft gleichauf,<br />

was man vom Inhalt der Seiten sicher nicht behaupten kann.<br />

Die Website der New York Times hat ein <strong>leicht</strong> besseres Ranking<br />

als die NZZ, da die New York Times wahrscheinlich weltweit<br />

gesehen öfter zitiert wird, da sie über die Landesgrenzen hinaus<br />

bekannt ist. Dasselbe trifft auch auf den Vergleich zwischen den<br />

Google-Startseiten zu. Die Schweizer Seite wird im Vergleich zur<br />

internationalen Startseite deutlich weniger oft zitiert. Auch die<br />

Yahoo-Startseite kann „google.com“ nicht das Wasser reichen.<br />

Lösungen zu 3.4<br />

Bedenke jedoch, dass diese Rechnung stark vereinfacht ist. In<br />

Wirklichkeit setzt sich der PageRank aus einer riesigen Formel mit<br />

unzähligen Unbekannten zusammen. Diese Formel ist jedoch ein<br />

Firmengeheimnis.<br />

Lösungen zu 3.5<br />

Verzeichnisdienste: Open Directory Project, Sharelook, voodoo-it.<br />

Schweizer Suchmaschinen: search.ch<br />

Internationale Suchmaschinen: AltaVista, Entire Web, Ask,<br />

Gigablast, Lycos,<br />

Meta-Suchmaschine: Ixquick<br />

Vertikale Suchmaschinen: Google Code Search, ingenieur.de,<br />

Medisuch.<br />

Lösungen zu 3.6<br />

Mit einer Suchanfrage wie „Taio Cruz“ lässt sich gut die Aktualität<br />

der Indizes überprüfen. Während es Lycos nur auf schwache<br />

111‘000 Treffer bringt. Schafft Google gut 8 Millionen und<br />

Ixquick sogar gut 15 Millionen. Beide haben also einen sehr aktu-<br />

44


ellen Index. Bei der Grösse gilt es jedoch zu beachten, dass<br />

Ixquick Google nur schlägt, weil es eine Meta-Suchmaschine ist<br />

und die Indizes von Yahoo, Bing, AltaVista, Ask, EntireWeb,<br />

Gigablast, ODP, Semager, Sharelook, Suchclip, Voodoo-it und<br />

Wikipedia bemüht. Ein wahrlich unfairer Vergleich. Dennoch<br />

bringt es Ixquick auf nicht mehr als doppelt so viele Treffer. Der<br />

Index von Google ist also klar der Grösste. Bei der Eingabe von<br />

„the“ schafft Lycos gut 2 Milliarden, Google 12 Milliarden und<br />

Ixquick nicht mehr als gut 3,2 Milliarden Treffer.<br />

Lösungen zu 3.7<br />

Bei Google rangiert Wikipedia auf dem 5., bei Yahoo auf dem 7.<br />

und bei Ixquick auf dem 1. Platz. Dies liegt wahrscheinlich daran,<br />

dass Ixquick auch Wikipedia selbst durchsucht.<br />

Lösungen zu 4.1<br />

Das erste Ergebnis ist relevanter, da mehr Suchbegriffe darin vorkommen.<br />

Rangierungsprinzip 1<br />

Je mehr Suchbegriffe in einem Dokument vorkommen, desto<br />

wahrscheinlicher ist das Dokument relevant.<br />

Lösungen zu 4.2<br />

Der erste Treffer ist relevanter, da ein S<strong>tic</strong>hwort häufiger vorkommt<br />

als im ersten.<br />

Rangierungsprinzip 2<br />

Je häufiger ein Suchbegriff in einem Dokument vorkommt,<br />

desto wahrscheinlicher ist das Dokument relevant.<br />

Lösungen zu 4.3<br />

Das erste Suchergebnis ist relevanter als das zweite, da mit<br />

„Feusisberg“ ein seltener Begriff darin vorkommt.<br />

Rangierungsprinzip 3<br />

Dokumente, die seltene Suchbegriffe enthalten, sind mit einer<br />

höheren Wahrscheinlichkeit relevant, als Dokumente, die häufige<br />

Suchbegriffe enthalten.<br />

45


Lösungen zu 4.4<br />

Der erste Treffer ist relevanter, da die Suchbegriffe näher beieinander<br />

liegen.<br />

Rangierungsprinzip 4<br />

Je näher die Suchbegriffe beieinander liegen, desto wahrscheinlicher<br />

ist das Dokument relevant.<br />

Lösungen zu 4.5<br />

Der erste Treffer ist relevanter, da das Dokument kürzer ist, die<br />

Suchbegriffe aber gleich häufig enthält.<br />

Rangierungsprinzip 5<br />

Ein kurzes Dokument ist mit einer höheren Wahrscheinlichkeit<br />

relevant als ein langes Dokument, welches die gleichen Suchbegriffe<br />

gleich häufig enthält.<br />

Lösungen zu 4.6<br />

Hier ist das erste Dokument relevanter, da die gleichen Suchbegriffe<br />

früher vorkommen als im zweiten.<br />

Rangierungsprinzip 6<br />

Je früher die Suchbegriffe in einem Dokument vorkommen,<br />

desto höher seine Relevanz.<br />

Lösungen zu 4.7<br />

Dein Vorwissen, das du aktivieren kannst, sind die Namen. Gib ein<br />

paar Nachnamen deiner Klassenkammeraden bei Google ein. Fünf<br />

sollten genügen und du kannst die Treffer an einer Hand abzählen.<br />

Wenn du selbiges bei Yahoo und Bing versuchst, wirst du sehen,<br />

dass du keine brauchbaren Treffer bekommst…<br />

Lösungen zu 4.8<br />

Als erstes S<strong>tic</strong>hwort wäre wahrscheinlich „Fernsehprogramm“ eine<br />

gute Wahl. Da du jetzt keine Treffer mit integriertem Kinoprogramm<br />

dabei hast, ver<strong>suchen</strong> wir es mit „Fernsehprogramm Kino“.<br />

Mit dem geben wir uns aber nicht zu<strong>fri</strong>eden und geben „Fernsehprogramm<br />

Kino Schweiz“ ein. Einer der ersten Treffer scheint<br />

somit gleich brauchbar. „Cineman“ bietet sowohl das Kinoprogramm<br />

aus fast allen Schweizer Grossstädten, wie auch das Fernsehprogramm<br />

aller wesentlichen Sender an.<br />

46


Lösungen zu 4.9<br />

1. Hier empfiehlt sich eine Suchmaschine. Gleich der erste Treffer<br />

ist von Wikipedia. Wo du erfährst, dass Petrologie die Lehre<br />

von der Entstehung, den Eigenschaften und der Nutzung der<br />

Gesteine ist.<br />

2. Am besten suchst du hier über einen Katalog. Am geeignetsten<br />

ist wohl die „Internet Movie Database“. Gib hier einfach den<br />

Titel der Serie „Two and a Half Men“ in das Suchfeld ein. Der<br />

erste Treffer ist gleich der beste. Unter der Rubrik „Cast“ findest<br />

du jetzt die verschiedenen Schauspieler. So auch „Angus<br />

T. Jones“, der in der Fernsehserie „Jake Harper“ spielt.<br />

3. Am besten suchst du im Schweizer Katalog Sharelook.<br />

4. Wenn wir hier kein Vorwissen aktivieren können, versuche wir<br />

es erst einmal mit den simplen S<strong>tic</strong>hwörtern „Schweizer Olympiasieger“.<br />

Der Auszug der ersten Seite sieht gleich interessant<br />

aus. Denn auf der offiziellen Seite des Swissolympic Verbandes<br />

wird „Louis Zutter, der erste Olympiasieger der Neuzeit“ erwähnt.<br />

Sagt uns zwar nichts. Aber egal, wir klicken drauf. Hier<br />

finden wir eine Liste „Spotlights der Schweizer Sportgeschichte“.<br />

Die Seite liefert aber keine vernünftige Antwort auf unsere<br />

Frage. Eine übersichtliche Tabelle wäre nett. Aber viel<strong>leicht</strong><br />

finden wir ja etwas Vorwissen auf dieser Seite. Also <strong>suchen</strong> wir<br />

einmal die Passage, wo Louis Zutter erwähnt wurde. In Windows<br />

einfach den Namen eingeben und die Stelle wird grün<br />

markiert. Darunter finden wir eine nützliche Information: Dort<br />

steht nämlich, dass die erste Olympiasiegerin der Neuzeit „Helen<br />

de Pourtalès“ hiess. Gleich darunter finden wir in Verbindung<br />

mit einem Olympiasieg noch den Namen „Josef Imbach“.<br />

Wir geben also bei Google diese drei Namen ein: „Josef Imbach<br />

Louis Zutter Helen de Pourtalès“. Der erste Treffer ist logischerweise<br />

die gleiche Seite. Der zweite scheint jedoch sehr<br />

interessant zu sein: Olympians from switzerland – alphabe<strong>tic</strong>al<br />

listing. Wir klicken die Seite an und siehe da: Eine Liste mit allen<br />

Schweizer Olympiasiegern, erst noch alphabetisch geordnet.<br />

Was haben wir genau <strong>gemacht</strong>: Wir konnten zum Thema kein<br />

eigenes Vorwissen aktivieren. Also haben wir uns das Vorwissen<br />

durch das Eingeben von umschreibenden S<strong>tic</strong>hwörtern beschafft.<br />

47


Lösungen zu 4.10<br />

S<strong>tic</strong>hwörter: Ballsportart –Fussball<br />

Lösungen zu 4.11<br />

S<strong>tic</strong>hwörter: Preisvergleich Produkte Migros Coop. Auch hier<br />

scheinen schon unter den ersten Treffern einige vernünftige darunter<br />

zu sein.<br />

Lösungen zu 4.12<br />

Am häufigsten wird wohl das Rangierungsprinzip zwei missbraucht.<br />

So schreiben viele Webseiten-Betreiber gewisse S<strong>tic</strong>hwörter<br />

mehrere Tausend Mal auf ihre Website (Natürlich in der Farbe<br />

des Hintergrunds, sodass die Seite trotzdem noch lesbar bleibt).<br />

Denn das Rangierungsprinzip zwei besagt: Je häufiger ein S<strong>tic</strong>hwort<br />

vorkommt, desto wahrscheinlicher ist das Dokument relevant.<br />

Lösungen zu 4.13<br />

Die S<strong>tic</strong>hwörter „Rockefeller Center Bauarbeiter“ bei „Google<br />

Bilder“ eingeben genügt schon.<br />

Lösungen zu 4.14<br />

Hier überlegen wir uns als erstes wieder, wie eine Seite aussieht,<br />

die unsere Informationen bereithält. Am besten <strong>suchen</strong> wir nach<br />

einem Matchbericht. Dort sind alle Daten und Geschehnisse der<br />

ganzen Partei aufgelistet. Um den richtigen Matchbericht zu erwischen,<br />

müssen wir nur noch den Match eindeutig beschreiben. Wir<br />

ver<strong>suchen</strong> es also mit: „Matchbericht CL Final 2005 Milan Liverpool“.<br />

Und siehe da. Der erste Treffer ist bereits ein Volltreffer.<br />

Bei Wikipedia unter der Rubrik Details erfahren wir, dass der<br />

Tscheche Vladimír Šmicer Liverpool in der 56. Minute zurück ins<br />

Spiel gebracht hat.<br />

Lösungen zu 4.15<br />

Für diese Aufgabe verwenden wir die „Erweiterte Suche“. Im Feld<br />

„Dateiformat“ wählen wir „PDF“ und im Feld „Datum“ „in den<br />

letzten 24 Stunden“.<br />

48


Lösungen zu 4.16<br />

S<strong>tic</strong>hwörter: „stadtbus linie plan winterthur“.<br />

Der erste Treffer ist gleich der beste.<br />

Lösungen zu 4.17<br />

Internet Movie Database<br />

Lösungen zu 5.1<br />

Die Lösungen zu 5.1 können hier leider nicht angegeben werden:<br />

Weil ich erstens nicht Google bin und zweitens aus Platzgründen.<br />

Lösungen zu 5.2<br />

Auf den Seiten 34 und 35 findest du eine Liste mit einigen anderen<br />

Suchmaschinen.<br />

49

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!