e p i l o g - Fakultät für Informatik, TU Wien
e p i l o g - Fakultät für Informatik, TU Wien
e p i l o g - Fakultät für Informatik, TU Wien
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
domain, meta-search engine has some inherent weaknesses. They can not<br />
find all routes from low-cost airlines and they don’t support the concept of<br />
mixing flights between airlines in different alliances. This thesis proposes a<br />
mashup solution for the problem. A mashup application uses data from<br />
other resources (called content provider) to create a new application with<br />
new feature and functionality that is not offered by any of the content<br />
provider. In the flight search system that we build, the data are originated<br />
from airline websites. Extracting data from the Web has several obstacles<br />
such as password-protected sites, cookies, JavaScript, Session IDs, Web<br />
forms iterations, deep Web navigation, and dynamic changes on websites.<br />
We use wrapper generation technology from Lixto to solve the obstacles<br />
and do the data extraction. Some data cleaning method is also performed to<br />
the wrapper output to clean unnecessary annotations. In the algorithm,<br />
flight search problem is regarded as graph search problem with airports as<br />
the nodes and pair of airports where exist direct flights between them as<br />
the edges. We introduce hub identification heuristic concept to ensure<br />
system’s scalability. Instead of analyzing and evaluating all possible routes to<br />
reach the destination, this heuristic only evaluates a fraction of all possible<br />
combinations that possibly contain the best routes.<br />
Markus Dorner<br />
Optimizations of structural join algorithms<br />
Studium: Masterstudium Software Engineering und Internet Computing<br />
BetreuerIn: Univ.Prof. Dr. Reinhard Pichler<br />
Abstrakt: Join Operationen spielen bei Datenbanksystemen eine<br />
entscheidende Rolle. Sie gehören zu den wichtigsten Operationen und<br />
beeinflussen stark die Leistung des gesamten Systems. Nahezu jeder<br />
namhafte Datenbankhersteller liefert seine Produkte mit XML Unterstützung<br />
aus und ermöglicht so Datenbankabfragen mit XPath oder XQuery. Somit<br />
sind strukturelle Joins sehr wichtig, um eine effiziente Abfrage zu<br />
ermöglichen. Im Laufe der Zeit wurden zahlreiche Algorithmen veröffentlicht,<br />
welche die verschiedensten Strategien haben, um möglichst effizient zu<br />
arbeiten. Die wichtigste Gemeinsamkeit ist die Nummerierung der Knoten.<br />
Dieser Index macht es möglich schnell und effizient die Beziehung zwischen<br />
zwei Knoten zu ermitteln.<br />
46