Green-IT und Datenbanken - ODBMS
Green-IT und Datenbanken - ODBMS
Green-IT und Datenbanken - ODBMS
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
5.2 Entwurf<br />
gen mit eindeutigen Werten (DISTINCT-Prädikat) ausgeben, Abfragen mit Filtern<br />
(WHERE-Klauseln), Abfragen mit verknüpften Tabellen (JOIN-Operator), den Datenbestand<br />
verändernde Anweisungen (UPDATE-Anweisung), Sortierungen (SORT<br />
BY-Klausel), Gruppierungen (GROUP BY-Klausel) oder Aggregat-Funktionen<br />
(SUM-, AVG-, COUNT-Funktionen).<br />
Diese 30 SQL-Befehle wurden bei unterschiedlichen Systemkonfigurationen ausgeführt.<br />
Die Tabellengrößen, also die Zeilenanzahl <strong>und</strong> die tatsächlichen Größen auf<br />
dem Datenträger, sind genau bekannt, so dass diese als veränderliche Parameter in<br />
die Messungen miteinfließen konnten. Ein weiterer veränderlicher Parameter unserer<br />
Tests war die gesamte Datenbankgröße. Als Datenbankgrößen wurden 1 GB, 5 GB<br />
<strong>und</strong> 10 GB gewählt. Der Arbeitsspeicher, welcher dem Datenbankmanagementsystem<br />
(DBMS) zugewiesen wurde, wurde auf 256 MB beziehungsweise 3 GB eingestellt. Die<br />
Versuche wurden im sogenannten Kaltstart-Betrieb durchgeführt.<br />
Kaltstart-Betrieb bedeutet, dass der Inhalt des Arbeitsspeichers vor dem Abschicken<br />
einer neuen Abfrage geleert wird. Dies sichert die Vergleichbarkeit der Messergebnisse<br />
zu. Wird eine neue Abfrage an den Datenbankserver geschickt, kann das<br />
System also nicht auf bereits im Arbeitsspeicher vorhandene Daten zugreifen <strong>und</strong><br />
damit I/O vermeiden. Dem gegenüber steht der Warmstart-Betrieb.<br />
Im Warmstart-Betrieb können sich die Daten einer Tabelle, welche für eine Abfrage<br />
benötigt werden, bereits im Arbeitsspeicher befinden <strong>und</strong> sie müssten in diesem<br />
Fall nicht von der Festplatte eingelesen werden. Bei dieser Betriebsart lässt sich nicht<br />
immer ermitteln, welche Daten sich bereits im Arbeitsspeicher befinden, <strong>und</strong> eine<br />
Vergleichbarkeit von Messergebnissen ist deshalb nicht gewährleistet.<br />
5.2.1 Datenmodell<br />
Die Tests wurden mit drei unterschiedlichen Datenbankgrößen (1 GB, 5 GB <strong>und</strong><br />
10 GB) durchgeführt. Die Datensätze der Datenbank wurden mit dem Programm<br />
DBGEN, bereitgestellt vom Transaction Processing Performance Council (TPC) 1<br />
generiert. Über einen Skalierungsfaktor können über dieses Programm unterschiedlich<br />
große Datenbestände erzeugt werden. Die Namen der acht Relationen, welche<br />
durch das Programm erzeugt wurden, sind, absteigend nach Größe sortiert, lineitem,<br />
orders, partsup, customer, part, supplier, nation <strong>und</strong> region.<br />
Die mit DBGEN generierten Rohdaten erfüllen die Anforderungen der<br />
TPC-H-Spezifikation [TCP]. In einer Datums-Spalte muss beispielsweise ein gültiges<br />
Datum stehen <strong>und</strong> dieses Datum muss in einer von dem Programm vorgegebenen<br />
1 Das Transaction Processing Performance Council (TPC) wurde 1988 von verschiedenen weltweit<br />
führenden <strong>IT</strong>-Unternehmen gegründet. Ziel des TPC ist die Leistungsbewertung von Datenbankmanagementsystemen<br />
mithilfe standardisierter Benchmarks. Die Internetseite des Konsortiums<br />
ist http://www.tpc.org/.<br />
41