und Wohnungszählung (GWZ) - Publikationsservice von IT.NRW
und Wohnungszählung (GWZ) - Publikationsservice von IT.NRW
und Wohnungszählung (GWZ) - Publikationsservice von IT.NRW
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2. Zur primären<br />
Geheimhaltung<br />
Die primäre Geheimhaltung wird<br />
durch Regeln festgelegt, die angeben,<br />
welche Tabellenwerte primär<br />
geheim gehalten werden sollen, weil<br />
für die zu diesen Werten beitragenden<br />
Einzelangaben ein erhöhtes Risiko<br />
der Offenlegung oder der näherungsweisen<br />
Offenlegung besteht<br />
(vgl. „Statistische Geheimhaltung in<br />
Tabellen“, Sarah Giessing, Forum der<br />
B<strong>und</strong>esstatistik 31/1999). Demgemäß<br />
unterscheiden sich die Regeln zur primären<br />
Geheimhaltung zum einen<br />
durch das bei den Tabellennutzern zu<br />
unterstellende Vorwissen, zum anderen<br />
aber auch darin, ob eine exakte<br />
oder eine näherungsweise Offenlegung<br />
<strong>von</strong> Einzelangaben verhindert<br />
werden soll. Wenn im Rahmen der<br />
primären Geheimhaltung <strong>von</strong> der<br />
Vermeidung einer Offenlegung die<br />
Rede ist, so bezieht sich diese Aussage<br />
immer nur auf die Bestimmung<br />
<strong>von</strong> Einzelangaben durch die Kenntnis<br />
des jeweiligen Tabellenwertes<br />
<strong>und</strong> schließt die Zuhilfenahme anderer<br />
Werte der Tabelle aus.<br />
2.1 Vermeidung einer<br />
exakten Offenlegung<br />
<strong>von</strong> Einzelangaben<br />
Regeln, die eine exakte Offenlegung<br />
<strong>von</strong> Einzelangaben in Tabellenaggregaten<br />
verhindern sollen, sind als so<br />
genannte Fallzahlregeln eingeführt.<br />
Bezeichnet n die Anzahl der Berichtenden,<br />
die mit ihren Angaben zu einem<br />
Tabellenwert beitragen, so werden<br />
folgende Regeln in der amtlichen<br />
Statistik angewendet:<br />
n = 1: Es trägt nur ein Berichtender<br />
zum Tabellenwert bei; als Einzelangabe<br />
ist dieser Tabellenwert<br />
primär geheim zu halten.<br />
n = 2: Es tragen nur zwei Berichtende<br />
zum Tabellenwert bei, <strong>von</strong> denen<br />
jeder durch Subtraktion<br />
seines Wertes vom Tabellenwert<br />
den jeweils anderen Wert<br />
exakt berechnen kann; dieser<br />
Tabellenwert ist demgemäß<br />
ebenfalls primär geheim zu<br />
halten.<br />
n = m<br />
m > 2: Tabellenwerte mit weniger als<br />
m + 1 Meldeeinheiten müssen<br />
primär geheimgehalten werden,<br />
wenn unterstellt werden<br />
kann, dass ein Vorwissen über<br />
den exakten Summenwert <strong>von</strong><br />
m – 1 Meldeeinheiten besteht,<br />
mit dem die verbleibende Einzelangabe<br />
der m Berichtenden<br />
aufgedeckt werden kann.<br />
2.2 Vermeidung einer<br />
näherungsweisen<br />
Offenlegung<br />
<strong>von</strong> Einzelangaben<br />
Die Fallzahlregeln verhindern zwar,<br />
dass eine Einzelangabe aus ihrem Tabellenwert<br />
exakt berechnet werden<br />
kann, sie schützen aber nicht vor näherungsweiser<br />
Offenlegung <strong>von</strong> Einzelangaben<br />
mit Hilfe <strong>von</strong> Vorwissen.<br />
Verfügt der Tabellennutzer beispielsweise<br />
über das Vorwissen, dass n Einzelwerte<br />
eines aus mehr als n Einzelangaben<br />
aggregierten Tabellenwertes<br />
den weitaus größten Beitrag zu diesem<br />
Tabellenwert leisten, so kann er<br />
mit weiterem Vorwissen, der Kenntnis<br />
eines Summenwertes aus n – 1 dieser<br />
dominierenden Einzelangaben, den<br />
noch verbleibenden großen Einzelwert<br />
bis auf den aus den restlichen nicht dominierenden<br />
Einzelwerten bestehenden<br />
Summenwert genau abschätzen.<br />
Wenn z. B. eine <strong>von</strong> zwei dominierenden<br />
Einzelangaben bekannt ist – was<br />
man bei jedem Berichtenden eines der<br />
dominierenden Werte immer unterstellen<br />
muss –, so kann die andere<br />
dominierende Angabe aus dem Tabellenwert<br />
bis auf die Summe der restlichen<br />
nicht dominierenden Angaben<br />
genau berechnet werden.<br />
Das Dominanzproblem hat also seine<br />
Entsprechung im Fallzahlproblem, wobei<br />
der Unterschied zwischen beiden<br />
in der Restsumme aus den nicht dominierenden<br />
Einzelangaben liegt, die im<br />
Dominanzfall nur zu einer näherungsweisen<br />
Offenlegung führen kann. In<br />
der amtlichen Statistik werden die<br />
(n; k)-Dominanz-regel <strong>und</strong> die p%-Regel<br />
zur Vermeidung einer zu genauen<br />
Offenlegung <strong>von</strong> Einzelangaben angewendet.<br />
2.2.1 Die (n; k)-Dominanzregel<br />
Ein Tabellenwert aus mehr als n Einzelangaben<br />
ist primär geheim zu halten,<br />
wenn der Anteil der Summe der<br />
n größten Einzelwerte am Gesamttabellenwert<br />
größer ist als der vorgegebene<br />
Schrankenwert k. Diese Regel<br />
ist sinnvoll, wenn über n – 1 der dominierenden<br />
Einzelwerte ein Vorwissen<br />
über den exakten Wert ihrer<br />
Summe unterstellt werden kann. Von<br />
praktischer Bedeutung für die amtliche<br />
Statistik sind bisher die (1; k)<strong>und</strong><br />
die (2; k)-Regel mit k-Werten<br />
zwischen 50 % <strong>und</strong> 95 %, je nachdem,<br />
welche Sensibilität den zu<br />
schützenden Angaben zugedacht<br />
wird, wobei im (2; k)-Fall in der Regel<br />
eine höhere Schranke k gesetzt wird<br />
als bei der (1; k)-Regel.<br />
2.2.2 Die p%-Regel<br />
Ein Tabellenwert ist nach der p%-Regel<br />
primär geheim zu halten, wenn<br />
er nach Abzug des zweitgrößten Einzelbeitrages<br />
den größten um weniger<br />
als p% übersteigt, d. h. wenn das<br />
Restaggregat, der Tabellenwert abzüglich<br />
der beiden größten Einzelwerte,<br />
bezogen auf den größten Einzelwert<br />
kleiner als p% ausfällt.<br />
Die Intention dieser Regel besteht in<br />
erster Linie im Schutz der am stärksten<br />
gefährdeten größten Einzelangabe<br />
gegen zu genaue Offenlegung<br />
durch die zweitgrößte, während der<br />
zweite Teil der Formulierung auf einen<br />
gewissen Zusammenhang mit<br />
der (2; k)-Dominanzregel hindeutet.<br />
Man darf jedoch nicht verkennen,<br />
dass der Bezugswert in der p%-Regel<br />
der größte Einzelwert ist, in der<br />
Dominanzregel das schützende Restaggregat<br />
aber immer als Teil des Gesamtaggregates<br />
betrachtet wird.<br />
Die Anwendung der p%-Regel auf<br />
aggregierte Daten führt demgemäß<br />
auch zu anderen Ergebnissen als die<br />
(2; k)-Dominanzregel mit geeignet<br />
gewähltem Parameter k. Wie die<br />
Auswertungen einiger statistischer<br />
Landesämter unter Verwendung <strong>von</strong><br />
Realdaten aber gezeigt haben, sind<br />
die Unterschiede zwischen beiden Re-<br />
Statistische Analysen <strong>und</strong> Studien <strong>NRW</strong> 1/2002 25