und Wohnungszählung (GWZ) - Publikationsservice von IT.NRW
und Wohnungszählung (GWZ) - Publikationsservice von IT.NRW
und Wohnungszählung (GWZ) - Publikationsservice von IT.NRW
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
te, die durch zwei zueinander diametrale<br />
Tabellenwerte so festgelegt<br />
ist, dass die Ausprägung jedes<br />
Gliederungsmerkmals dieser<br />
Tabellenwerte die eines der beiden<br />
Diametralwerte ist. Zwei Tabellenwerte<br />
heißen zueinander<br />
diametral, wenn sich die Ausprägungen<br />
der Gliederungsmerkmale<br />
dieser Werte in jeder Gliederung<br />
<strong>von</strong>einander unterscheiden.<br />
Da jede Gliederungsausprägung eines<br />
Quaderwertes somit einen <strong>von</strong><br />
zwei Werten annimmt, die Gliederungsausprägung<br />
eines der beiden<br />
Diametralwerte, umfasst ein n-dimensionaler<br />
Quader 2 n Tabellenwerte.<br />
Das entspricht genau der Erwartung,<br />
wenn man Tabellen betrachtet,<br />
die nach bis zu drei Merkmalen gegliedert<br />
sind:<br />
Im Falle einer eindimensionalen Tabelle<br />
wird nur ein Partnerwert zur Sicherung<br />
eines geheimen Wertes benötigt;<br />
der eindimensionale Sicherungsquader<br />
umfasst zwei = 2 1 Tabellenwerte.<br />
In zweidimensionalen Tabellen<br />
kommen zu jedem der beiden<br />
Werte, Pivot plus Partner zur Sicherung<br />
gegen Rückrechnung in der ersten<br />
Gliederung, noch zwei Werte zur<br />
Sicherung bezüglich des zweiten<br />
Gliederungsmerkmals hinzu; das Karree<br />
umfasst vier = 2 2 Tabellenwerte.<br />
Bei drei Gliederungsmerkmalen muss<br />
man das Karree in einer der zweidimensionalen<br />
Tabellen bezüglich der<br />
ersten beiden Gliederungen in eine<br />
andere nach den ersten beiden Gliederungsmerkmalen<br />
gegliederte Tabelle<br />
projizieren, deren drittes Gliederungsmerkmal<br />
sich <strong>von</strong> dem der<br />
erstgenannten Tabelle unterscheidet;<br />
es kommen also vier weitere Tabellenwerte<br />
hinzu. Der dreidimensionale<br />
Quader besteht demnach aus 8 = 2 3<br />
Tabellenwerten, was genau der Anschauung<br />
entspricht.<br />
Man erkennt daraus das bei fortlaufender<br />
Erhöhung der Tabellendimension<br />
wirkende Bildungsgesetz: Bei jeder<br />
Hinzunahme eines weiteren Gliederungsmerkmals<br />
verdoppelt sich die<br />
Anzahl der Quaderwerte, so dass bei<br />
Hinzufügen nur einer weiteren Gliederung<br />
zu einer n-dimensionalen Tabelle<br />
noch ein weiterer n-dimensio-<br />
30<br />
naler Quader aufgebaut werden<br />
muss, der sich vom ersten nur in der<br />
Indizierung durch das neu hinzugefügte<br />
Gliederungsmerkmal unterscheidet.<br />
Das ist zugleich auch die<br />
kleinste Anzahl <strong>von</strong> neu hinzuzunehmenden<br />
Tabellenwerten, weil für jeden<br />
Quaderwert der n-dimensionalen<br />
Tabelle mindestens ein weiterer geheimer<br />
Wert der n+1-dimensionalen<br />
Tabelle allein schon zum Schutz gegen<br />
Rückrechnung mit Hilfe der neu<br />
hinzugenommenen Gliederung aufgebracht<br />
werden muss. Der Quader der<br />
n+1-dimensionalen Tabelle umfasst<br />
daher 2 n + 2 n = 2 n+1 Quaderwerte.<br />
Da Sperrmuster mit Quaderstrukturen<br />
für geheime zu sichernde Tabellenwerte<br />
einen hinreichenden Schutz<br />
gegen zu genaues Rückrechnen bieten<br />
(vgl. „Wahrung der Geheimhaltung<br />
sensibler Daten in mehrdimensionalen<br />
Tabellen mit dem Quaderverfahren“,<br />
R. D. Repsilber, Statistische<br />
Analysen <strong>und</strong> Studien Nordrhein-<br />
Westfalen 3/2000), hat man mit der<br />
Quadersicherung zugleich auch nur<br />
die kleinste Anzahl <strong>von</strong> Partnerwerten<br />
auszuwählen, die als gesperrte<br />
Werte jeden zu schützenden geheimen<br />
Tabellenwert hinreichend sichern.<br />
Damit stellt sich das Quaderverfahren<br />
als das Sicherungsverfahren<br />
heraus, das <strong>von</strong> allen Verfahren<br />
zur sek<strong>und</strong>ären Geheimhaltung aufgr<strong>und</strong><br />
der kleinsten Anzahl auszuwählender<br />
Sicherungspartner das<br />
schnellste ist, d. h. dass das Quaderverfahren<br />
bereits prinzipiell die kürzeste<br />
Rechenzeit benötigt.<br />
Um noch die für die Festlegung eines<br />
n-dimensionalen Quaders ausschlaggebende<br />
Indizierung der Quaderwerte<br />
durch die Ausprägungen der Gliederungsmerkmale<br />
zueinander diametraler<br />
Tabellenwerte zu veranschaulichen,<br />
sei auf die Beispieltabelle<br />
der Abbildung 1 verwiesen: Darin<br />
ist ein zu schützendes Pivotelement<br />
durch die Gliederungsausprägungen<br />
Kreis 1 als Zeilenindex <strong>und</strong> die Wirtschaftsgruppe<br />
B als Spaltenindex festgelegt.<br />
Ein zu diesem Pivot diametraler<br />
Tabellenwert ist der ebenfalls primär<br />
geheime Wert 0,1, der durch<br />
Kreis 2 <strong>und</strong> Wirtschaftsgruppe D indiziert<br />
ist. Lt. obiger Definition erkennt<br />
man die Diametralität daran, dass<br />
sich sowohl die Gliederungsausprägung<br />
der Zeile als auch die der Spalte<br />
<strong>von</strong> den entsprechenden Gliederungssausprägungen<br />
des Pivots unterscheiden.<br />
Die Gesamtheit der Quaderwerte findet<br />
man nun, indem man alle 2 2<br />
Paare <strong>von</strong> Gliederungsausprägungen<br />
aufsucht, die bezüglich der beiden<br />
Tabellengliederungen entweder das<br />
primär geheime Pivot 100,0 oder den<br />
dazu diametralen Tabellenwert 0,1<br />
indizieren. Das sind genau die Tabellenwerte<br />
mit den Indexpaaren (Kreis 1;<br />
Wgr. B), (Kreis 2; Wgr. B), (Kreis 1;<br />
Wgr. D), (Kreis 2; Wgr. D), wie es<br />
auch die anschauliche Karree-Definition<br />
nahe legt.<br />
Mit der Definition eines n-dimensionalen<br />
Quaders ist es nunmehr möglich,<br />
das Sperrmuster zur Sicherung jedes<br />
einzelnen geheimen Wertes in einer<br />
n-dimensionalen, nicht durch Zwischensummen<br />
unterteilten Tabelle<br />
durch folgende Regelung festzulegen:<br />
Ein durch n Gliederungsmerkmale<br />
indizierter geheimer Tabellenwert<br />
wird gegen zu genaues<br />
Rückrechnen mit Hilfe der Tabellensummenbeziehungen<br />
<strong>und</strong><br />
beim Nutzer zu unterstellendem<br />
Vorwissen gesichert, indem ein ndimensionaler<br />
Quader ausgewählt<br />
wird mit folgenden Eigenschaften<br />
(siehe auch Anhang),<br />
– der zu sichernde Tabellenwert<br />
(Pivot) ist keine Einzelangabe<br />
einer Randsumme (solche Einzelangaben<br />
werden durch ihre<br />
Einzelangaben im Inneren der<br />
Tabelle mittels Quader geschützt);<br />
das Pivot ist einer der<br />
beiden diesen Quader fixierenden<br />
diametralen Werte;<br />
– die auf den Pivot-Wert bezogene<br />
Quader-Spannweite, ist größer<br />
als eine vorgegebene relative<br />
Mindestspannweite;<br />
– der Quader ohne Pivot umfasst,<br />
außer im Falle <strong>von</strong> Randsummenwerten,<br />
keine Einzelangaben<br />
oder es wird zu demselben<br />
Pivot noch ein zweiter Quader<br />
ausgewählt, der – mit Ausnahme<br />
des Pivots selbst – keine Einzelangaben<br />
des ersten enthält;<br />
Statistische Analysen <strong>und</strong> Studien <strong>NRW</strong> 1/2002