Handout - Universität Duisburg-Essen
Handout - Universität Duisburg-Essen
Handout - Universität Duisburg-Essen
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Inhalt<br />
Interaktives Information Retrieval<br />
Norbert Fuhr<br />
<strong>Universität</strong> <strong>Duisburg</strong>-<strong>Essen</strong><br />
10. Juli 2013<br />
Ebenen-Architektur von IR-Systemen<br />
Information Seeking Behaviour<br />
Information Searching<br />
Strategische Unterstützung<br />
UNIVERSITÄT<br />
D U I S B U R G<br />
E S S E N<br />
Zusammenfassung und Ausblick<br />
Ebenen-Architektur von IR-Systemen<br />
Ebenen-Architektur von IR-Systemen
Physische Ebene<br />
Logische Ebene<br />
Syntaktische Ebene<br />
Semantische Ebene
Pragmatische Ebene<br />
Funktionale Ebene<br />
Benutzerschnittstelle<br />
Ebenen I<br />
◮ physische Ebene: interne<br />
Speicherungsstrukturen und<br />
zugehörige Algorithmen<br />
◮ logische Ebene: IR-Modelle<br />
◮ syntaktische Ebene: Betrachtung<br />
syntaktischer Objekteigenschaften<br />
(Text als Zeichenkette, Bilder als<br />
Pixelmatrix, . . . )<br />
→ Freitextsuche<br />
◮ semantische Ebene: dargestellte<br />
Objekte und Beziehungen<br />
dazwischen<br />
→ Dokumentationssprachen
Ebenen II<br />
Anmerkungen zur Ebenenarchitektur<br />
◮ pragmatische Ebene: Aussage eines<br />
Dokumentes/Anwendungszweck<br />
→ Relevanzdefinition<br />
◮ funktionale Ebene: Suchfunktionen,<br />
Unterstützung des Benutzers beim<br />
Suchprozess<br />
→ dieses Kapitel<br />
◮ Benutzerschnittstelle<br />
→ nächstes Kapitel<br />
In der Regel nicht alle Ebenen vorhanden<br />
◮ Benutzer muss fehlende Ebenen kompensieren<br />
(insbesondere pragmatische und Teile der funktionalen Ebene)<br />
◮ fehlende Trennung zwischen Ebenen<br />
(u.a. keine logische und physische Datenunabhängigkeit wie in<br />
DBMS)<br />
Modelle zur Informationssuche<br />
Information Seeking Behaviour<br />
Information Seeking Behaviour und Information Searching<br />
Ellis’ Behavioural Model of Information Seeking Strategies<br />
Unterstützung des Suchverhaltens nach Ellis/Meho/Tibo<br />
◮ Verschiedene Modelle bezüglich des Benutzerverhaltens zum<br />
besseren Verständnis des Prozesses der Informationssuche<br />
◮ Klassisches Information Retrieval<br />
◮ Informationssuche in wenig strukturierten Datenbeständen<br />
(Texte, Multimediadaten)<br />
◮ Vagheit des Informationsbedürfnisses, unsichere Repräsentation<br />
des Inhalts<br />
◮ Systembasiert, statisches Informationsbedürfnis<br />
◮ Interaktives Information Retrieval<br />
◮ Interaktion des Benutzers mit Informationssystem im<br />
Vordergrund<br />
◮ Dynamisches Informationsbedürfnis<br />
◮ Zwei Betrachtungsweisen zum interaktiven IR<br />
1. Information Seeking Behaviour<br />
2. Information Searching
Information Seeking Behaviour<br />
Information Searching<br />
◮ Breitere Sicht auf die Informationssuche als inhaltsorientierte<br />
IR-Systeme<br />
◮ Verhalten, Motivation und Vorgehen des Benutzers zur<br />
Befriedigung einer Aufgabe modelliert<br />
◮ Zentrale Fragen:<br />
◮ Wodurch wird ein Informationsbedürfnis ausgelöst?<br />
◮ Wie verhalten wir Menschen uns daraufhin, um das Problem<br />
zu lösen?<br />
◮ Sicht auf die Interaktion des Benutzers mit den<br />
Informationsquellen im Allgemeinen<br />
◮ Umfasst klassische IR-Systeme im Sinne einer Suchmaschine<br />
und andere Quellen (z.B. das persönliche Umfeld)<br />
Ellis’ Behavioural Model of Information Seeking Strategies<br />
◮ Generelles Modell zum Suchverhalten<br />
◮ Basiert auf empirischer Evaluation in Sozialwissenschaften und<br />
in Ingenieursfirmen<br />
◮ Allgemeine Kategorien oder Eigenschaften des Suchverhaltens:<br />
Starting, Chaining, Browsing, Differentiating, Monitoring,<br />
Extracting, Verifying, Ending<br />
Kategorien des Suchverhaltens nach Ellis (1)<br />
Starting<br />
◮ alle Aktivitäten zu Beginn der Suche nach Informationen, zum<br />
Beispiel<br />
◮ Auswahl der Informationsquelle (z.B. persönliche Kollektion,<br />
aber auch Bibliothek)<br />
◮ Literatursuche<br />
◮ Befragung von Kollegen<br />
◮<br />
Überblick über die Literatur
Kategorien des Suchverhaltens nach Ellis (2)<br />
Kategorien des Suchverhaltens nach Ellis (3)<br />
Chaining<br />
◮ Aufeinander aufbauende Informationen werden sowohl<br />
vorwärts- als auch rückwärtsgerichtet verfolgt<br />
◮ Ähnlich dem Suchen nach Referenzen aus der Literaturliste<br />
eines Artikels<br />
◮ Faktoren:<br />
◮<br />
◮<br />
◮<br />
◮<br />
◮<br />
Topikalische Relevanz<br />
Autor<br />
Aktualität<br />
Zitierhäufigkeit<br />
Kosten und Zeit der Beschaffung<br />
◮ Finden neuer Informationsquellen oder gar Neuformulierung<br />
des Informationsbedürfnisses<br />
Browsing<br />
◮ Basiert auf Informationsquellen und gefundenen Dokumenten<br />
◮ semi-zielorientierte Suche durch Browsen in<br />
erfolgversprechenden Bereichen<br />
◮ Verfolgen von Inhaltsverzeichnissen, Listen von Titeln,<br />
Überschriften, Namen von Organisationen und Personen,<br />
Weblinks, usw.<br />
◮ Findet immer statt, wenn relevante Information<br />
zusammenhängend und zum Thema passend aufbereitet ist<br />
Kategorien des Suchverhaltens nach Ellis (3)<br />
Kategorien des Suchverhaltens nach Ellis (4)<br />
Monitoring<br />
◮ Sich auf dem neuesten Wissensstand halten<br />
◮ Entwicklungen in einem Gebiet verfolgen<br />
◮ Meist wenige ausgewählte Quellen (z.B. bestimmte Magazine,<br />
Mailinglisten, aber auch persönliche Kontake)<br />
Differentiating<br />
◮ Beurteilung von Informationsquellen nach ihrer Art, Qualität,<br />
Wichtigkeit, Brauchbarkeit<br />
◮ Dadurch Filterung der Information<br />
◮ Beispiel: Kommentar vs. Bericht
Kategorien des Suchverhaltens nach Ellis (5)<br />
Kategorien des Suchverhaltens nach Ellis (6)<br />
Extracting<br />
◮ Identifizierung relevanten Materials<br />
◮ Material: Dokumenten, neue Quellen, Passagen<br />
◮ Kognitive Erfassung der Information durch Benutzer<br />
◮ Hintergrundwissen des Benutzers wichtig<br />
Verifying<br />
Überprüfen der Information bzgl. Richtigkeit und Zuverlässigkeit<br />
Ending<br />
Abschluss der Suche, Verknüpfen der Information<br />
Prozessmodell<br />
Erweiterung nach Meho/Tibbo<br />
◮ Evaluation von Ellis wiederholt und neu analysiert (auch im<br />
Hinblick auf neue Technologien)<br />
◮ Grundsätzlich wird Ellis’ Modell bestätigt<br />
◮ Aber: Ergänzung um neue Kategorien<br />
◮ Nicht alle Aktivitäten sequentiell<br />
◮ Starting, Browsing, Chaining und Monitoring sind<br />
Suchprozeduren<br />
◮ Differentiating ist ein Filterungsprozess
Neue Kategorien<br />
Phasen im Suchverhalten<br />
Accessing<br />
◮ Zugriff auf Volltexte (statt Surrogaten)<br />
◮ Beschaffung der Inhalte auf unterschiedlichem Weg und mit<br />
unterschiedlichen Kosten<br />
Networking<br />
◮ Persönliche Kommunikation mit verschiedenen Personen<br />
◮ Diskussion über und Bewertung der gefundenen Information<br />
im Internet<br />
Information Managing<br />
◮ Ablage, Speicherung und Organisation der gesammelten oder<br />
verwendeten Informationen<br />
Konsequenzen für das Design von IR-Systemen<br />
Unterstützung des Suchverhaltens nach Ellis/Meho/Tibo<br />
◮ Systeme sollten alle Phasen des Information Seeking<br />
unterstützen<br />
◮ oder Schnittstellen zu Systemen für die anderen Phasen<br />
anbieten<br />
◮ aber: heutige Systeme beschränken sich auf Teilmenge der<br />
Phasen<br />
◮ → Forschungs- und Entwicklungsbedarf<br />
Starting Resource selection<br />
Unterstützung bei der Eingabe der Suchterme<br />
Browsing Sortieren der Ergebnismenge nach verschiedenen<br />
Kriterien<br />
Highlighting, auch benutzerdefiniert<br />
Chaining Verweise in den Ergebnisseiten<br />
Vergleich von Ergebnisseiten<br />
Monitoring Speicherung und peridische Ausführung von<br />
Anfragen<br />
Extracting Suche in der Ergebnisseite<br />
Inform. Mgmt. Ordnen der Ergebnisse (Collate)<br />
Annotieren der Ergebnisse (Interpret)
Starting: Resource Selection<br />
Starting: Search term suggestion<br />
Starting: Related Terms<br />
Browsing: Sortieren/Gruppieren nach verschiedenen<br />
Kriterien
Browsing: Aussagekräftige Surrogate<br />
Browsing: Highlighting in der Ergebnisliste<br />
Chaining: Klickbare Einträge in Antworten<br />
Chaining: Referenzen vorwärts/rückwärts
Forward Chaining bei der Websuche<br />
Chaining: Ähnliche Dokumente<br />
Chaining: Identifikation wichtiger Autoren<br />
’extract authors’ in ezdl<br />
Monitoring<br />
’Saved Searches’ bei PubMed
Monitoring<br />
Watchthatpage.com<br />
Differentiating: Vergleich von Ergebnisseiten<br />
Exracting: Highlighting in Ergebnisseiten<br />
Extracting: Suche in der Ergebnisseite
Information management: Ordnen und Annotieren der<br />
Ergebnisse<br />
Information management: Handbibliothek in Daffodil<br />
Klassisches Modell für den Suchprozess<br />
Information Searching<br />
Einfache Modelle für den Suchprozess<br />
Belkins Episodic Interaction Model<br />
Ingwersens Cognitive Model<br />
Marchioninis Suchaktivitäten<br />
Design-Muster für Suchmodi<br />
Taxonomien für Web-Suchen<br />
Klassifikation von Suchaktivitäten nach Belkin<br />
Ablauf:<br />
1. Beginn: Informationsbedürfnis<br />
2. Wähle ein System und eine Datenbasis<br />
3. formuliere eine Anfrage<br />
4. schicke die Frage an das System<br />
5. erhalte die Ergebnisse in Form einer Liste von Verweisen<br />
6. Durchschauen, Evaluieren und Interpretieren der Ergebnisse<br />
7. Stopp, oder<br />
8. Reformuliere die Anfrage und gehe zu Schritt 4
Klassisches Modell für den Suchprozess<br />
Empirische Studien<br />
◮ Informationssuche besteht aus einer Folge von<br />
zusammenhängenden, aber unterschiedlichen Suchen<br />
◮ Suchergebnis triggert weitere Suchen<br />
◮ Der Aufgabenkontext bleibt der Gleiche<br />
◮ Hauptaufgabe der Suche ist akkumuliertes Lernen und das<br />
Sammeln neuer Information während der Suche<br />
Berrypicking-Modell<br />
[Bates 90]<br />
◮ kontinuierlicher Verschiebung von Informationsbedürfnis und<br />
Anfragen während der Suchen<br />
◮ Informationsbedürfnis wird nicht durch eine einzige<br />
Antwortmenge befriedigt<br />
◮ stattdessen: Folge von Selektionen und Aufsammeln von<br />
Informationsbrocken während der Suche<br />
Anomalous State of Knowledge (ASK)(1)<br />
Klassische Suchsysteme: “best-match“-Prinzip<br />
◮ System liefert Dokumente zurück, die am besten zu einer<br />
Repräsentation des Informationsbedürfnisses (z.B. Anfrage)<br />
passen<br />
◮ Annahme: Benutzer kann das Informationsbedürfnis exakt<br />
spezifizieren
Anomalous State of Knowledge (ASK)(2)<br />
ASK-Hypothese<br />
◮ Informationbedürfnis entsteht durch Anomalie im<br />
Wissenszustand (state of knowledge) des Benutzers<br />
Anomalous State of Knowledge<br />
◮ Benutzer kann Informationsbedürfnis zur Beseitigung der<br />
Anomalie nicht spezifizieren<br />
◮ Besser: Erfassung des ASK statt Spezifikation des<br />
Informationsbedürfnisses<br />
◮ Erfassung kognitiver und situationsbedingter Aspekte nötig,<br />
um Anomalie aufzulösen<br />
Episodic Interaction Model<br />
◮ Episodic Interaction Modell dient der Erfassung und<br />
Überwindung des ASK<br />
◮ Unterscheidung einzelner Episoden im Suchverhalten<br />
◮ Benutzerinteraktionen mit IR-Systemen als Sequenz<br />
verschiedener Interaktionen innerhalb einer Episode der<br />
Informationssuche<br />
◮ Durchlaufen unterschiedlicher Formen der Interaktion und<br />
Suchstrategien, abhängig von Faktoren wie<br />
◮ Aufgabe, Ziele und Absichten<br />
◮ Suchhistorie<br />
◮ Arten von Informationsobjekten<br />
◮ nicht erfassbare andere Faktoren<br />
◮ Interaktionsformen unterstützen eine Reihe von Prozessen wie<br />
z.B. Suchen, Browsen, Interpretation, Modifikation und<br />
Beurteilung von Information<br />
◮ Nutzerschnittstelle sollte im Vordergrund stehen<br />
Episodic Interaction Model<br />
Beispielepisode<br />
1. Benutzer erinnert sich an Buch an bestimmter Stelle in<br />
Bibliothek<br />
2. System erlaubt, eine bestimmte Region virtuell abzusuchen<br />
3. Benutzer entdeckt dabei anderes interessantes Buch und<br />
möchte nun ähnliche Bücher finden, weiß aber nicht, wie dies<br />
erreicht werden kann<br />
4. System bietet mögliche Vorgehensweisen an<br />
5. Benutzer wählt Anzeige des Schlagwortkatalogs<br />
6. System zeigt Schlagwortkatalog<br />
7. Benutzer findet dort relevanten Suchbegriff und weist das<br />
System an, nach diesem Begriff zu suchen<br />
8. System führt Suche durch und zeigt zum Suchbegriff<br />
gefundene Dokumente an
Ingwersens Cognitive Model<br />
Ingwersen’s Cognitive Model<br />
◮ Globale Perspektive<br />
◮ Umfasst alle beeinflussenden Faktoren, mit denen der<br />
Benutzer interagiert<br />
◮ Soziales Umfeld<br />
◮ IR-System<br />
◮ Informationsobjekte<br />
◮ Benutzerschnittstelle<br />
◮ Benutzer<br />
◮ Befasst sich mit kognitiven Strukturen – Manifestationen der<br />
menschlichen Kognition, von Reflektionen oder Ideen<br />
Information<br />
objects<br />
IT: Engines<br />
Logics<br />
Algorithms<br />
Interface<br />
Cognitive<br />
Actor(s)<br />
(team)<br />
Cognitive transformations and influence<br />
Interactive communications of cognitive structures<br />
Organiz.<br />
Cultural<br />
Social<br />
Context<br />
Polyrepräsentation<br />
[Ingwersen 94]<br />
◮ Repräsentation eines Informationsobjekts in verschiedenen<br />
Formen<br />
◮ Repräsentation korreliert mit kognitiven Strukturen<br />
◮ Beispiel: Dokument kann repräsentiert werden durch<br />
◮ Titel (vom Autor gegeben)<br />
◮ Schlagwörter (vom Indexierer)<br />
◮ Andere Dokumente, die es zitieren (extern)<br />
◮ Annotationen (extern)<br />
◮ Retrievalsystem unterstützt mehrere Repräsentationen (und<br />
daher möglichst viele kognitive Strukturen)<br />
→ intentional redundancy<br />
◮ Gutes Suchergebnis, wenn viele Repräsentationen zum selben<br />
Dokument zeigen (Overlap)
Polyrepräsentation am Beispiel Amazon<br />
Polyrepräsentation am Beispiel CUIL<br />
Polyrepräsentation des kognitiven Raumes des Benutzers<br />
Globales Modell der Polyrepräsentation<br />
◮ Auch der kognitive Raum des Benutzer kann mittels<br />
Polyrepräsentation dargestellt werden<br />
◮ Einfachstes Beispiel ist die Polyrepräsentation des<br />
Informationsbedürfnisses mittels verschiedener Anfragen<br />
◮ Aber auch die Aufgabe (work task) kann formal repräsentiert<br />
werden
Beispiele für Unterstützung der verschiedenen Ebenen<br />
Repräsentation von Problemen und Work Tasks<br />
Beispiel: LibreOffice FAQ<br />
Anekdote: Benutzer will Reifen wechseln und fragt sich, mit<br />
welchem Drehmoment die Radmuttern angezogen werden müssen.<br />
Index des Handbuchs liefert keinen Eintrag unter ’Drehmoment’.<br />
Auch unter ’Räder’ gibt es keinen passenden Eintrag. Erst unter<br />
’Reifenwechsel’ gibt es einen Verweis auf den entsprechenden<br />
Abschnitt der technischen Daten.<br />
◮ request Standard-Textsuche<br />
◮ problem/goal: FAQs, Web-Suche nach Fehlermeldungen<br />
◮ work task/interest: HOWTOs, FAQs<br />
◮ How do I install the latest version of LibreOffice?<br />
◮ How to convert an odt to pdf?<br />
◮ How to maintain document compatibility between LibreOffice<br />
and other office suites?<br />
◮ LibreOffice Spell Checker doesn’t work?<br />
◮ Can’t open .xlsx file with LibreOffice<br />
◮ No page number in first page<br />
◮ LibreOffice missing certain Microsoft fonts<br />
Marchioninis Suchaktivitäten<br />
Such-Modi<br />
[Marchionini 1995]<br />
Lookup<br />
Learn<br />
Investigate<br />
◮ Locating<br />
◮ Verifying<br />
◮ Monitoring<br />
◮ Comparing<br />
◮ Comprehending<br />
◮ Exploring<br />
◮ Analyzing<br />
◮ Evaluating<br />
◮ Synthesizing
Design-Muster für Suchmodi<br />
Suchmodus: Lookup<br />
Unterstützung für Marchioninis Suchmodi<br />
Locate Finde ein spezifisches (mglw. bekanntes) Objekt<br />
Verify Bestätigung, dass ein Objekt bestimmte objektive<br />
Kriterien erfüllt<br />
Monitor Den Status eines Objektes laufend beobachten, zum<br />
Zwecke der Verwaltung oder der Überwachung<br />
Locating: Autocomplete<br />
Locating: Partial Matches
Verifying: Instant Results<br />
Verifying: Detail Overlay<br />
Suchmodus: Learn<br />
Comparing: Parallel Views<br />
Compare Ähnlichkeiten und Unterschiede innerhalb einer<br />
Menge von Objekten identifizieren<br />
Explore Ein Objekt oder einen Datensatz untersuchen zum<br />
Zwecke der Wissensentdeckung<br />
Comprehend Neue Einsichten gewinnen, indem die Muster in<br />
einem Datenbestand erkannt werden
Exploring: Autosuggest<br />
Exploring: faceted search<br />
Exploring: faceted search<br />
Comprehending: facet menus
Suchmodus: Investigate<br />
Analyzing: alternate views<br />
Analyze Ein Objekt oder einen Datensatz untersuchen, um<br />
Muster und Beziehzungen zu erkennen<br />
Evaluate Den Wert eines Objektes in Bezug Hinblick auf ein<br />
bestimmtes Ziel beurteilen<br />
Synthesize Ein neues oder zusammengesetztes Artefakt aus<br />
verschiedenen Quellen generieren<br />
Analyzing: data visualization<br />
Taxonomien für Web-Suchen<br />
[Broder 2002]<br />
[Russel et al. 2009] (Google)
Task taxonomy elements [Bailey 2012]<br />
◮ Download files<br />
◮ Compare products or services<br />
◮ Buy a product<br />
◮ Sell a product<br />
◮ Find a job<br />
◮ Learn how to perform a task<br />
◮ Monitor frequently updated<br />
◮ information<br />
◮ Keep tabs on recent events<br />
◮ Find an address or contact<br />
◮ information<br />
◮ Find facts about a person<br />
◮ Do education related tasks<br />
online<br />
◮ Discover leisure activities<br />
◮ Find a specific misc. fact<br />
◮ Discover more information<br />
about a specific topic<br />
◮ Find a date online<br />
◮ Find real estate<br />
◮ Browse a social network<br />
◮ Read or write on blog or forum<br />
◮ Plan travel<br />
◮ Plan event<br />
◮ Watch online videos for<br />
◮ entertainment<br />
◮ Play online games<br />
◮ Listen to online music<br />
◮ Manage personal accounts<br />
◮ Communicate with people<br />
online<br />
◮ Adult<br />
Nutzung von Frage-Klassifikationen<br />
Klassifikation von Suchaktivitäten nach Belkin<br />
1. Frage automatisch klassifizieren<br />
2. Klassenspezifisches Retrievalverfahren anwenden<br />
Beispiele:<br />
navigierend: Suche Homepages<br />
informationell: Suche Seite mit gewünschter Information<br />
transaktional: Suche Seite mit entsprechendem Formular<br />
[Cool & Belkin 2002]<br />
◮ Zugriff:<br />
◮ Methode: Scannen . . . Suchen<br />
◮ Modus: Erkennen . . . Spezifikation<br />
◮ Objekte, mit denen interagiert wird<br />
◮ Ebene: Information . . . Meta-Information<br />
◮ Medium: Text, Bilder, Sprache, Video, . . .<br />
◮ Quantität: 1 Objekt, Menge von Objekten, Datenbasis<br />
◮ Gemeinsame Dimensionen der Interaktion<br />
◮ Informationsobjekte: Teile . . . vollständige Objekte<br />
◮ Systematik: zufällig . . . systematisch<br />
◮ Grad: selektiv . . . erschöpfend<br />
◮ Interaktionskriterien<br />
(z.B. Genauigkeit, Autorität, Datum, Person)
Klassifikation von Suchaktivitäten – Beispiele<br />
◮ Methode und Modus<br />
◮<br />
◮<br />
◮<br />
Das IR-Buch von Schütze“<br />
”<br />
→ Modus=Spezifikation, Methode=Suchen<br />
Das Java-Buch, das ich gestern bei meinem Freund gesehen<br />
”<br />
habe“<br />
→ Modus=Erkennen, Methode=Scannen<br />
Das IR-Buch, mit einem deutschen Koautor“<br />
”<br />
→ Modus=Spezifikation, Methode=Scannen<br />
◮ Objekte, mit denen interagiert wird<br />
◮<br />
◮<br />
Ebene: Suche nach Büchern vs. Suche in Büchern<br />
Quantität: Suche nach einer Webseite vs. Suche nach Reviews<br />
eines neuen Handys vs. Auswahl einer Digitalen Bibliothek<br />
◮ Gemeinsame Dimensionen der Interaktion<br />
◮ Informationsobjekte: Suche nach relevanten<br />
Text/Film/Musik-Passagen vs. vollständige Objekte<br />
Strategische Unterstützung<br />
Information Seeking Behaviour & Information Searching<br />
Suchaktivitäten<br />
Ebenen der Systemunterstützung<br />
Proaktivität in IR-Systemen<br />
Information Seeking Behaviour & Information Searching<br />
◮ Suche nach Information findet in verschiedenen, aufeinander<br />
folgenden Phasen statt<br />
◮ Jede Phase sollte angemessen durch das System unterstützt<br />
werden<br />
◮ Interaktionsmöglichkeiten des Benutzers mit dem System<br />
dabei wichtiger Faktor<br />
◮ Ansatz: Arbeiten von Marcia Bates zur strategischen<br />
Unterstützung und Integration der genannten Modelle<br />
Abstraktionsebenen von Suchaktivitäten<br />
Move Elementare Aktionen oder identifizierbarer Gedanken.<br />
Typischerweise Kommandos, die vom System unterstützt<br />
werden, wie das Hinzufügen eines Suchbegriffs oder<br />
Verfolgen eines Verweises<br />
Taktik Zielorientierte Aktion zur Verbesserung des<br />
Suchergebnisses, umfasst mehrere Moves; Beispiel:<br />
Auswahl von Synonymen und Erweiterung der<br />
Suchanfrage, wenn zu wenig Ergebnisse gefunden wurden<br />
Stratagem Umfasst mehrere Taktiken, um Informationsstrukturen in<br />
einer Domäne auszunutzen. Beispiel: Navigieren in den<br />
Ausgaben einer Zeitschrift oder das Verfolgen von<br />
Referenzen und Fußnoten<br />
Strategie Umfassende Pläne, die Moves, Taktiken und Stratageme<br />
enthalten können. Beispiel: Suche nach Literatur zu einem<br />
Seminarthema: Inhaltsorientierte Suche – Identifizierung<br />
wichtiger Autoren und Konferenzen – Autorensuche –<br />
Inhaltsverzeichnisse der Konferenzen
Taktiken<br />
Monitoring Tactics<br />
Monitoring ”Tactics to keep the search on track and efficient”<br />
Strukturelle Taktiken auf der Menge der potenziellen Antworten<br />
Suchformulierung verbreitern/einengen, viele/wenige Terme<br />
Term-Taktiken Auswahl/Variation der Suchterme<br />
Ideen-Taktiken offene Suchmöglichkeiten/Variation<br />
CHECK<br />
WEIGH<br />
PATTERN<br />
CORRECT<br />
RECORD<br />
To review the original request and compare it to<br />
the current search topic to see that it is the same.<br />
To make a cost-benefit assessment, at one or more<br />
points of the search, of current or anticipated<br />
actions.<br />
To make oneself aware of a search pattern, examine<br />
it, and redesign it if not maximally efficient or if<br />
out of date<br />
To watch for and correct spelling and factual errors<br />
in one’s search topic.<br />
To keep track of followed and of desirable trails<br />
not followed or not completed.<br />
File Structure Tactics<br />
BIBBLE<br />
SELECT<br />
SURVEY<br />
CUT<br />
STRETCH<br />
SCAFFOLD<br />
CLEAVE<br />
To look for a bibliography already prepared, before launching<br />
oneself into the effect of preparing one; more generally, to check<br />
to see if the search work one plans has already been done in a<br />
usable form by someone else.<br />
To break down complex search queries into subproblems and<br />
work on one problem at a time.<br />
To review, at each decision point of the search, the available<br />
options before selection.<br />
When selecting among several ways to search a given query, to<br />
choose the option that cuts out the largest part of the search<br />
domain at once .<br />
To use a source for other than is intended purposes.<br />
To design an auxiliary, indirect route through the information<br />
files and resources to reach the desired information.<br />
To employ binary searching in locating an item in an ordered<br />
file.<br />
Search Formulation Tactics<br />
SPECIFY<br />
EXHAUST<br />
REDUCE<br />
PARALLEL<br />
PINPOINT<br />
BLOCK<br />
To search on terms that are as specific as the information desired<br />
To include most or all elements of the query in the initial search<br />
formulation; to add one or more of the query elements to an<br />
already-prepared search formulation.<br />
To minimize the number of the elements of the query in the<br />
initial search formulation; to subtract one or more of the query<br />
elements from an already-prepared search formulation.<br />
To make the search formulation broad (or broader) by including<br />
synonyms or otherwise conceptually parallel terms.<br />
To make the search formulation precise by minimizing (or reducing)<br />
the number of parallel terms, retaining the more perfectly<br />
descriptive terms.<br />
To reject, in the search formulation, items containing or indexed<br />
by certain term(s), even if it means losing some document sections<br />
of relevance
Term Tactics<br />
Idea Tactics<br />
SUPER<br />
SUB<br />
RELATE<br />
TRACE<br />
VARY<br />
REARRANGE<br />
CONTRARY<br />
RESPELL<br />
RESPACE<br />
NEIGHBOR<br />
FIX<br />
To move upward hierarchically to a broader (superordinate) term.<br />
To move downward hierarchically to a more specific (subordinate)<br />
term.<br />
To move sideways hierarchically to a coordinate term.<br />
To examine information already found in the search in order to find<br />
additional terms to be used in furthering the search.<br />
To alter or substitute one’s search terms in any of several ways. See<br />
remaining term tactics for some specific variations.<br />
To reverse or rearrange the words in search terms in any or reasonable<br />
orders.<br />
To search for the term logically opposite that describing the desired<br />
information.<br />
To search under a different spelling.<br />
To try spacing variants<br />
To seek additional search terms by looking at neighboring terms,<br />
whether proximate alphabetically, by subject similarity, or otherwise.<br />
To try alternative affixes, whether prefixes, suffixes, or infixes.<br />
RESCUE<br />
BREACH<br />
FOCUS<br />
In an otherwise unproductive approach, to check<br />
for possible productive paths still untried.<br />
To breach the boundaries of one’s region of search,<br />
to revise one’s concept of the limits of the intellectual<br />
or physical territory in which one searches<br />
to respond to a query.<br />
To look at the query more narrowly, in one or both<br />
of two senses: (1) to move from the whole query<br />
to a part of it or (2) to move from a broader to a<br />
narrower conceptualization of the query.<br />
Tactics for specific search situations<br />
Search situation<br />
Too many hits<br />
Too few hits<br />
Possible tactics<br />
SPECIFY<br />
EXHAUST<br />
PINPOINT<br />
BLOCK<br />
SUB<br />
NEIGHBOR<br />
TRACE<br />
PARALLEL<br />
FIX<br />
SUPER<br />
RELATE<br />
VARY<br />
Search situation<br />
No hits<br />
Need other terms<br />
or<br />
wrong terms<br />
Possible tactics<br />
RESPACE<br />
RESPELL<br />
REARRANGE<br />
CONTRARY<br />
SUPER<br />
RELATE<br />
NEIGHBOR<br />
TRACE<br />
NEIGHBOR<br />
TRACE<br />
SUPER<br />
SUB<br />
RELATE
Search situation<br />
Revise terms<br />
Revise search formulation<br />
Possible tactics<br />
SPACE<br />
RESPELL<br />
FIX<br />
REVERSE<br />
CONTRARY<br />
SUPER<br />
SUB<br />
RELATE<br />
SPECIFY<br />
EXHAUST<br />
REDUCE<br />
PARALLEL<br />
PINPOINT<br />
BLOCK<br />
Example stratagems<br />
Subject Search<br />
Journal Run Having identified a journal central to one’s topic of<br />
interest, one reads or browses through issues or<br />
volumes of the journal.<br />
Citation Search Using a citation index or database, one starts with<br />
a citation and determines what other works have<br />
cited it.<br />
Area Scan After locating a subject area of interest in a<br />
classification scheme, one browses materials in the<br />
same general area.<br />
Footnote Chase One follows up footnotes or references, moving<br />
backward in time to other related materials.<br />
Abstraktionsebenen von Suchaktivitäten<br />
Sichtweisen des Information Seeking & Searching<br />
◮ Suchaktivitäten stellen weitere Differenzierung des<br />
Suchprozesses dar (Information Seeking)<br />
◮ Implementierung von Taktiken ein erster Schritt<br />
◮ Moves, Tactics, Strategemes und Strategies als mögliche<br />
Interaktionsebenen (Information Searching)<br />
◮ Frage nach geeigneter Systemunterstützung, d.h. welche<br />
Dienste/Aktivitäten werden vom Informationssystem<br />
unterstützt?
Ebenen der Systemunterstützung nach Bates<br />
Überwachen, Vorschläge<br />
Ebene Name Eigenschaft<br />
0 Kein System Reine Benutzerebene;<br />
keine Vorschläge/Aktionen vom System<br />
1 Möglichkeiten (Handbuch) Vorschläge von Möglichkeiten auf Anfrage;<br />
auflisten keine Durchführung<br />
2 Aktionen auf (passiv, kontextfreie Hilfe) Kann Aktionen ausführen;<br />
Kommando kein Analysieren der Suche<br />
3 Überwachen,<br />
Vorschläge<br />
(kontextbezogenen Hilfe) Überwachen, Analysieren einer<br />
Suche, Vorschläge machen<br />
a<br />
- auf Benutzeranfrage<br />
b<br />
- bei Entdecken (proaktiv)<br />
4 Automatische Automatisches Ausführen<br />
Ausführung einer Aktion<br />
a<br />
- Information an den Benutzer<br />
b<br />
- Keine Information<br />
Ausführen + Information<br />
Ausführen ohne Benachrichtigung
Matrix aus Systemunterstützung und Suchaktivität<br />
Proaktive Taktiken in Daffodil<br />
Daffodil: Fortsetzung der Suche<br />
◮ Vorschläge basieren auf der automatischen Analyse des<br />
gegenwärtigen Suchergebnisses<br />
◮ Case-based reasoning<br />
◮ Verfügbarkeit wird durch Knopf am unteren Ende der<br />
Ergebnisliste angezeigt<br />
Daffodil: Fortsetzung der Suche<br />
◮ Vorschläge werden als<br />
Rangliste angezeigt<br />
◮ Beschreibender Titel,<br />
Erklärung und<br />
Erfolgsaussichten<br />
◮ Ausführen von einem oder<br />
mehreren Vorschlägen mit<br />
anschließender Bewertung<br />
◮ Icons zeigen den Status<br />
des Vorschlags an<br />
(ausführbar, benutzt,<br />
nützlich)
Evaluierung zur Suchfortsetzung<br />
◮ 24 Testpersonen, die Hälfte davon unterstützt<br />
◮ jeder bearbeitete 3 Aufgaben<br />
◮ Fallbasis enthielt 30 verschiedene Lösungsvorschläge<br />
Ergebnisse:<br />
unterstützte Benutzer<br />
◮ sind zufriedener mit dem Verlauf der Suche (p = 0, 067)<br />
◮ sind signifikant zufriedener mit dem Ergebnis<br />
◮ finden signifikant mehr relevante Dokumente<br />
◮ nutzen signifikant häufiger die fortgeschrittenen Werkzeuge<br />
von Daffodil<br />
(nicht unterstützte Benutzer beschränken sich i.w. aufs<br />
Reformulieren der Anfragen)<br />
Zusammenfassung und Ausblick<br />
Zusammenfassung<br />
Ausblick<br />
◮ Information seeking behavior vs. searching<br />
◮ kognitive Modelle:<br />
◮ iterativer Charakter der Suche<br />
◮ Vielfalt der Suchaufgaben<br />
◮ Zahlreiche Einflussfaktoren<br />
◮ Systeme:<br />
◮ Frage-/Task-Klassifikation + spezifische Retrievalverfahren<br />
◮ strategische Unterstützung durch höhere Suchfunktionen<br />
◮ proaktive Unterstützung<br />
◮ Benutzerexperimente sind aufwändig, aber sehr aufschlussreich<br />
◮ Interaktives Retrieval ist von großer praktischer Bedeutung<br />
◮ Aber es gibt relativ dazu nur wenige Forschungsergebnisse<br />
◮ Ergebnisse aus klassischen Experimenten nur bedingt<br />
übertragbar<br />
◮ Zahlreiche kognitive Modelle, aber konkrete Umsetzung in<br />
Systemdesign schwierig<br />
◮ Integration von kognitiven Modellen und Systementwicklung,<br />
validiert durch Benutzerexperimente notwendig