23.12.2013 Aufrufe

e p i l o g - Fakultät für Informatik, TU Wien

e p i l o g - Fakultät für Informatik, TU Wien

e p i l o g - Fakultät für Informatik, TU Wien

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

domain, meta-search engine has some inherent weaknesses. They can not<br />

find all routes from low-cost airlines and they don’t support the concept of<br />

mixing flights between airlines in different alliances. This thesis proposes a<br />

mashup solution for the problem. A mashup application uses data from<br />

other resources (called content provider) to create a new application with<br />

new feature and functionality that is not offered by any of the content<br />

provider. In the flight search system that we build, the data are originated<br />

from airline websites. Extracting data from the Web has several obstacles<br />

such as password-protected sites, cookies, JavaScript, Session IDs, Web<br />

forms iterations, deep Web navigation, and dynamic changes on websites.<br />

We use wrapper generation technology from Lixto to solve the obstacles<br />

and do the data extraction. Some data cleaning method is also performed to<br />

the wrapper output to clean unnecessary annotations. In the algorithm,<br />

flight search problem is regarded as graph search problem with airports as<br />

the nodes and pair of airports where exist direct flights between them as<br />

the edges. We introduce hub identification heuristic concept to ensure<br />

system’s scalability. Instead of analyzing and evaluating all possible routes to<br />

reach the destination, this heuristic only evaluates a fraction of all possible<br />

combinations that possibly contain the best routes.<br />

Markus Dorner<br />

Optimizations of structural join algorithms<br />

Studium: Masterstudium Software Engineering und Internet Computing<br />

BetreuerIn: Univ.Prof. Dr. Reinhard Pichler<br />

Abstrakt: Join Operationen spielen bei Datenbanksystemen eine<br />

entscheidende Rolle. Sie gehören zu den wichtigsten Operationen und<br />

beeinflussen stark die Leistung des gesamten Systems. Nahezu jeder<br />

namhafte Datenbankhersteller liefert seine Produkte mit XML Unterstützung<br />

aus und ermöglicht so Datenbankabfragen mit XPath oder XQuery. Somit<br />

sind strukturelle Joins sehr wichtig, um eine effiziente Abfrage zu<br />

ermöglichen. Im Laufe der Zeit wurden zahlreiche Algorithmen veröffentlicht,<br />

welche die verschiedensten Strategien haben, um möglichst effizient zu<br />

arbeiten. Die wichtigste Gemeinsamkeit ist die Nummerierung der Knoten.<br />

Dieser Index macht es möglich schnell und effizient die Beziehung zwischen<br />

zwei Knoten zu ermitteln.<br />

46

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!