MySQL Cluster - Computer Architecture Group

MySQL Cluster 

Vortrag im Rahmen des Seminars 

„Ausgewählte Themen in Hardwareentwurf und Optik“ 

15.12.2008 Philipp Bachmann 1

1) Einführung 

2) System-Architektur 

3) Hohe Verfügbarkeit 

4) Performance 

5) Fazit 

Inhalt 


Motivation 

DB oft zentraler Bestandteil eines Software-Systems 

Verfügbarkeit der Daten wichtig 

z.B. bedeutet Ausfall bei Onlineshop: 

Imageschaden/Verärgerte Kunden 

Umsatzeinbußen 

Beispiel Neckermann: Session-Daten des Online-Shops 

500.000 Anfragen pro Tag 

MySQL Cluster erfüllt Anforderungen: 

Hohe Performance und Ausfallsicherheit bei 

geringen Kosten 


Von MySQL ... 

Relationale Datenbank 

Daten in Tabellen gespeichert 

Spalten/Attribute - ArtikelNr, ArtikelBez, 

Zeilen/Datensätze – ein Artikel 

Abfragesprache: Structured Query Language (SQL) 

SELECT * FROM tblArtikel WHERE ArtikelNr = 5 

Verknüpfung von Tabellen über gemeinsame Attribute 

SELECT * FROM Bestellung AS b INNER JOIN tblArtikel AS 

a WHERE a.ArtikelNr = b.ArtikelNr AND b.BestellNr = 42 

Primary Key: Eindeutige Identifizierung eines Datensatzes 

Client/Server Architektur 

ArtikelNr ArtikelBez 

… 

1 Auto … 

2 Wein ... 

5 DVD ... 

6 Buch ... 


… und Transaktionen ... 

Transaktion: Gruppe von SQL Anweisungen die als atomar 

angesehen werden 

Beispiel: Bestellung eines Artikels 

START TRANSACTION 

SELECT Anzahl FROM tblLager WHERE ArtikelNr = 5 

UPDATE tblLager SET Anzahl = Anzahl – 1 WHERE AritkelNr = 5 

COMMIT 

ACID-Transaktionen 

Atomicity – ganz oder gar nicht 

Consistency – der Daten vor und nach Transaktion 

Isolation – keine gegenseitige Beeinflussung 

Durability – erfolgreiche Transaktion ist dauerhaft 


Client 

PHP Skript 

Java Client 

MySQL Console 

… über Storage Engines ... 

SQL Query 

MySQL Server 

Tabellen in Storage Engines gespeichert 

MyISAM: disk based, schnell, keine Transaktionen 

Memory: memory based, sehr schnell 

InnoDB: disk based, ACID Unterstützung, mehr 

Overhead 

Abstraktionsschicht 

Parse Optimize 

MyISAM 

InnoDB 

15.12.2008 Philipp Bachmann 6 

Memory 

Retrieve/ 

Store 

NDB 

MySQL Database 

Management Level 

Storage Engine 

Level

… zu MySQL Cluster 

NDB (Network Database) 

Storage Engine von MySQL Cluster 

Einfache Migration 

Gleiche Client-Anwendungen nutzbar 

SQL: ALTER TABLE tblArtikel ENGINE=NDB 

Achtung bei Performance + besonderen Features 

MyISAM 

MySQL Server 

InnoDB 

Memory 

NDB 


??? 


MySQL Cluster - Features 

99,999% Verfügbarkeit 

Kein Single Point of Failure durch eine verteilte, 

fehlertolerante Architektur 

Automatischer, schneller Failover 

Kosteneffizient 

OpenSource, commodity off-the-shelf 

Hohe Performance 

In-memory Datenbank, Parallelisierung 

Skalierbar je nach benötigten Ressourcen 






5) Fazit 

Inhalt 


Allgemeines zur Architektur 

3 Knotentypen 

Data Node: Speichert 

und repliziert Daten 

Application Node: 

Verarbeitet Daten 

Management Node 

Shared Nothing Architektur 

Transporter: TCP/IP, SCI, 

Shared Memory 


NDB API 

NDB Storage Engine 


Management Node 

Nodes beziehen Cluster-Konfiguration vom MGM Node 

Nur beim Starten/Rekonfigurieren von Nodes benötigt 

Kein schneller Rechner nötig 

Arbiterfunktion im Fehlerfall 

Backup-MGM Nodes möglich 

Administration des Clusters über MGM-Konsole 

show status 

shutdown 

Config 

Config 


Data Node 

Speichert Datensätze in 

a) RAM 

b) RAM + HDD (mit Page Cache) 

Partitioning: Zeilen einer Tabelle auf Data Nodes verteilen 

per Hash-Funktion: MD5(Primary Key) 

Transaction Coordinator (TC) 

Tabellen 

Bearbeitet eine Transaktion eines SQL Nodes 

Wickelt COMMIT und ROLLBACK ab 

Data Req. 

Data 

Local Query Handler: Bearbeitet Anfragen von TCs 

Checkpoints zum Speichern der Daten auf HDD 

Verarbeitung 

der Daten 


Transaction Coordinator 

Erste Anfrage einer Transaktion bestimmt Position des TC 

Bei Zugriff über Primary Key 

Application Node berechnet MD5(Primary Key) 

Abbildungsfunktion liefert Data Node mit Daten 

TC auf diesem platziert 

Ansonsten: Round Robin Verfahren 

START TRANSACTION 

SELECT * FROM tblArtikel WHERE AritkelNr=23 

… 

COMMIT 

MD5(23) → Data Node 2 

Transaction 

Coordinator 

ArtikelNr … 

6 ... 

17 ... 

ArtikelNr 

… 

23 ... 

29 ... 


Application Node 

Normaler MySQL Server 

Standard SQL Interface 

Interner Zugriff auf NDB 

Storage Engine über NDB API 

Alternative: Zugriff über NDB API 

NDB Storage Engine 

Für C++ (NDB API) und Java (NDB/J) vorhanden 

Mehr als 3 mal so schnell, jedoch kein SQL 

Kombination sinnvoll 

Java 

Applikation 

SQL 

MySQL 

Server 

NDB API 

MySQL Server: Auswertungen und Wartung 

NDB API: Performance-kritische Anfragen 

NDB API 

Load Balancing (extern) bei mehreren Application Nodes 

Java 

Applikation 

NDB API 


PHP 

Skript 

1 

Transaction 

Coordinator 

Auto, Buch, DVD, Wein 

SELECT ArtikelBez 

FROM tblArtikel 

ORDER BY ArtikelBez 

Beispielanfrage 

Auswahl nach 

Round Robin 

5 

3 

6 

2 

Auto, Wein, 

DVD, Buch 

DVD, Buch 

tblArtikel: tblArtikel: 


ArtikelNr ArtikelBez … 

ArtikelNr ArtikelBez … 

1 Auto … 

5 DVD ... 

2 Wein ... 

6 Buch ... 


4 

Local 

Query 

Handler





5) Fazit 

Inhalt 


Ziel: 99.999% Verfügbarkeit 

Hohe Verfügbarkeit 

Problem: Ausfall von Knoten oder Netzwerkverbindungen 

Strategie 

Fehlerfall erkennen 

Betrieb aufrecht erhalten 

Bedingung: Kopie der Daten vorhanden 

a) Innerhalb des Clusters 

b) In anderem Ersatz-Cluster 

Normalbetrieb wiederherstellen 


Synchronous Replication 

Replik auf andere Data Nodes des Cluster 

Synchronous: Warte bis Daten auf anderen Data Node 

kopiert wurden 

Sehr kurze Failover Time: < 1s 

Erhöhte Response Zeit bei Anfragen 

Two Phase Commit Protocol (Update und Commit) 

0 bis 4 Repliken wählbar 

Node Group: Satz von Data Nodes, die alle die gleichen 

Daten speichern 


tblArtikel 

Auto 

Buch 

PC 

Mixer 


NumOfReplicas = 2 

Node Group 1 

tblArtikel 

Auto 

Buch 

PC 

Mixer 

Primäre Replik Sekundäre Replik 

tblArtikel 

DVD 

Wein 


tblArtikel 

DVD 

Wein 


tblArtikel 

Auto 

Buch 

PC 

Mixer 

Transaction 

Coordinator 

Update : 

Commit: 




tblArtikel 

Auto 

Buch 

PC 

Mixer 

2 


5 

tblArtikel 

DVD 

Wein 

CD 


tblArtikel 

DVD 

Wein 

CD 

6 

Local Query 

.... 

1 

Handlers 

INSERT INTO tblArtikel (ArtikelNr, AritkelBez, ...) VALUES (7, 'CD', …) 

COMMIT 


3 

4

tblArtikel 

Auto 

Buch 

PC 

Mixer 

Transaction 

Coordinator 

Update : 

Commit: 




tblArtikel 

Auto 

Buch 

PC 

Mixer 

4 

2a 


3a 

tblArtikel 

DVD 

Wein 

CD 


tblArtikel 

DVD 

Wein 

CD 

.... 

1 

INSERT INTO tblArtikel (ArtikelNr, AritkelBez, ...) VALUES (7, 'CD', …) 

COMMIT 


2b 

3b

Row-based Replication 

Repliziere Daten von einem MySQL Server/Cluster zu 

einem anderem MySQL Server/Cluster 

Anwendungen 

Hohe Verfügbarkeit 

MySQL Cluster → MySQL Cluster 

Für Wartungs- und Auswertungsarbeiten 

Testumgebung 

Geographische Replikation 

Entferntes Rechenzentrum 

Read/Write Scalability 



Row-based: Änderungen in einzelnen Zeilen werden 

repliziert 

Master/Slave Architektur 

Hierarchien möglich 

Asychronous: Keine Garantie, dass Slave schon 

Änderungen des Masters übernommen hat (z.B. Lag) 

Mehrere Replication Channel 

NDB binlog injector thread 

Läuft auf dem Replication Master (MySQL Server) 

Empfängt alle Änderungen von der NDB Storage- 

Engine und erzeugt binlog 


Quelle: [1] 



Verbindungsprobleme 

Fehlerdetektion 

Bemerkt von anderen Knoten 

Heartbeat Protocol: Hohe Auslastung, Speicherprobleme 

Anordnung der Data Nodes als Ring 

3 fehlende Heartbeats 

=> Node ausgefallen 

Andere Knoten werden über 

Ausfall informiert 


Network Partition Protocol 

Prüft ob Netzwerk in 2 Teile aufgespaltet wurde 

Ziel: Dateninkonsistenz vermeiden bei Split-Brain Szenario 

Teilnetz wird als Cluster angesehen falls: 

Mehr als Hälfte der Data Nodes im Teilnetz 

Bei genau der Hälfte entscheidet Arbiter 





Fehlerszenarien 

MGM Node: Bei Bedarf neu starten 

Application Node 

Data Node 

Applikation nutzt anderen Application Node 

Fehlerhafter Knoten verbindet sich neu zum Cluster 

Anfragen gehen an anderen Data Node der Node 

Group (Replika vorhanden) 

Laufende Transaktionen des Data Nodes werden 

abgebrochen und Applikation startet sie erneut 

Ausgefallener Knoten bezieht seine Partition von 

anderem Knoten der NodeGroup 






5) Fazit 

Inhalt 


Performance 

Operationen auf einzelnen Datensätzen sehr schnell 

z.B: INSERT INTO tblArtikel (51, 'CD', ...) 

Batching 

Parallele Ausführung 

Skaliert mit Anzahl Data und Application Nodes 

Latenz durch Replikation und Architektur 

Langsamer als andere Storage Engines 

SELECT * FROM tblArtikel WHERE ArtikelNr IN 

(1,2,3,4,5,6,7,8,9,10) 

Spart Latenz und Query Parsing/Optimization 

2-3 mal so schnell 


PHP 

Skript 

1 

Transaction 

Coordinator 

tblArtikel: 

Condition Pushdown 

CD, DVD 

SELECT ArtikelBez 

FROM tblArtikel 

WHERE TypNr = '42' 

Auswahl nach 

Round-Robin 

5 

3 

6 

2 

CD, DVD 

DVD 

Parallele 

Suche 



4 

Übernimmt 

Verarbeitung 

tblArtikel: 

ArtikelNr ArtikelBez TypNr … 

ArtikelNr ArtikelBez TypNr … 

1 Auto 87 … 

5 Mixer 2 … 

2 CD 42 ... 

34 DVD 42 ...

Join 

SELECT * FROM tblBestellung AS b INNER JOIN tblArtikel AS a 

WHERE a.ArtikelNr = b.ArtikelNr AND b.BestellNr = 42 

Join wird im MySQL Server berechnet 

Komplette Tabelle Artikel benötigt 

Erfordert hohe Bandbreite 

Extrem langsam 

➔ Joins wenn möglich vermeiden 

Verknüpfung 

der Tabellen 

Data Request 

tblBestellung 

mit Nr = 42 tblArtikel 

NDB 

STORAGE 

ENGINE 

tblArtikel 


3 Schichten der Skalierbarkeit 

Applikation Applikation Applikation 

NDB Cluster 

Applikationsschicht 

MySQL Schicht 

Data Node Schicht 


DBT2 Benchmark 

Freie Implementierung des TPC-C Tests 

Spezielle Version für MySQL Cluster 

Simuliert typische e-Commerce Anwendung 

Großhandel mit mehreren Warenlagern und 

Verkaufsgebieten 

Zufällige Auswahl von 5 Transaktionstypen 

New Order, Delivery, Order Status, Payment, 

Stock Level 

Je 10-20 SQL Anweisungen 

Ergebnis: New Order Transactions Per Minute (NOTPM) 


NOTPM 

20000 

18000 

16000 

14000 

12000 

10000 

8000 

6000 

4000 

2000 

0 

Benchmark Results 

NoOfReplicas 2 NoOfReplicas 4 

+90% 

+72% 

0 1 2 3 4 5 6 

MySQL Servers 

Avg. Resp. Time: 42 ms 

+64% 

Avg. Resp. Time: 50ms 

4 Data Nodes, 1 MGM Node, 1 Warenlager pro MySQL Server, 10 Terminals pro Warenlager 

Gigabit Ethernet, AMD Opteron Prozessor 2.2 Ghz, 4 GB RAM 


NOTPM 

30000 

25000 

20000 

15000 

10000 

5000 

Benchmark Results 

4 MySQL Server #MySQL=#Data Nodes 

+9% 

+83% 

0 

0 1 2 3 4 5 6 

Data Nodes 

NoOfReplicas 1, 1 MGM Node, 2 Warenlager pro MySQL Server, 10 Terminals pro Warenlager 

Gigabit Ethernet, AMD Opteron Prozessor 2.2 Ghz, 4 GB RAM 


Fazit 

Nicht geeignet für viele typische DB Anwendungen 

Komplexe Joins, Latenz 

Anpassung an Cluster-Architektur nötig 

Sehr hohe Verfügbarkeit 

Nach Anpassung: 

Gute Skalierbarkeit 

Gute Performance 

Eingesetzt von Neckermann, Nokia, Alcatel-Lucent, Italtel, Toto-Lotto Niedersachsen 


Quellen (1/2) 

[1] MySQL Cluster New Features - Updated for 6.2 and 6.3 

http://www.mysql.com/why-mysql/white-papers/mysql_wp_cluster63.php 

[2] MySQL Clustering 

Alex Davies, Harrison Fisk 

MySQL Press - 2006 

[3] High Performance MySQL: Optimization, Backups, Replication, and More 

Baron Schwartz, Peter Zaitsev, Vadim Tkachenko, and Jeremy Zawodny 

O'Reilly Media, Inc. - 2008 

[4] MySQL 5.1 Cluster DBA Certification Study Guide 

Jon Stephens, Mike Kruckenberg, Roland Bouman, Stewart Smith, Solomon Chang 

Lulu Enterprises - 2007 

[5] MySQL 5.1 Reference Manual 

http://dev.mysql.com/doc/refman/5.1/en/index.html 


Quellen (2/2) 

[6] MySQL Cluster Architecture Overview - High Availability Features of MySQL Cluster 

http://www.mysql.com/why-mysql/white-papers/cluster-technical.php 

[7] MySQL Cluster Evaluation Guide - Getting the most out of a MySQL Cluster evaluation 

http://www.mysql.com/why-mysql/white-papers/mysql_cluster_eval_guide.php 

[8] A Guide to High Availability Clustering - How MySQL Supports 99.999% Availability 

http://www.mysql.com/why-mysql/white-papers/cluster.php 

[9] Benchmarking Highly Scalable MySQL Clusters - Measuring the performance of highly scalable 

MySQL Clusters on Multi Core Intel Xeon servers with Dolphin Express interconnect 

http://www.mysql.com/why-mysql/white-papers/mysql_cge_benchmarks_wp_april2007.php 

[10] neckermann.de achieves cost-effective - database scalability with MySQL Cluster 

http://www.mysql.com/why-mysql/case-studies/mysql_cs_neckermann.pdf 

Alle Onlinequellen zuletzt besucht am 23.11.2008. 


Distribution Awareness 

Ziel: Latenz vermeiden 

Strategie: Datenlokalität ausnutzen 

Beispiel: Bestellungen eines Kunden auf selben Data Node 

PRIMARY KEY(BestellNr, KundenNr); 

PARTITION BY KEY (KundenNr); 

TC wird auf Data Node mit Daten platziert 

Keine Kommunikation mit anderen Data Nodes nötig 

Bei 4 Data Nodes um 30%, bei ≥ 8 100%-200% schneller

MySQL Cluster - Computer Architecture Group

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?