20.01.2013 Aufrufe

und Wohnungszählung (GWZ) - Publikationsservice von IT.NRW

und Wohnungszählung (GWZ) - Publikationsservice von IT.NRW

und Wohnungszählung (GWZ) - Publikationsservice von IT.NRW

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2. Zur primären<br />

Geheimhaltung<br />

Die primäre Geheimhaltung wird<br />

durch Regeln festgelegt, die angeben,<br />

welche Tabellenwerte primär<br />

geheim gehalten werden sollen, weil<br />

für die zu diesen Werten beitragenden<br />

Einzelangaben ein erhöhtes Risiko<br />

der Offenlegung oder der näherungsweisen<br />

Offenlegung besteht<br />

(vgl. „Statistische Geheimhaltung in<br />

Tabellen“, Sarah Giessing, Forum der<br />

B<strong>und</strong>esstatistik 31/1999). Demgemäß<br />

unterscheiden sich die Regeln zur primären<br />

Geheimhaltung zum einen<br />

durch das bei den Tabellennutzern zu<br />

unterstellende Vorwissen, zum anderen<br />

aber auch darin, ob eine exakte<br />

oder eine näherungsweise Offenlegung<br />

<strong>von</strong> Einzelangaben verhindert<br />

werden soll. Wenn im Rahmen der<br />

primären Geheimhaltung <strong>von</strong> der<br />

Vermeidung einer Offenlegung die<br />

Rede ist, so bezieht sich diese Aussage<br />

immer nur auf die Bestimmung<br />

<strong>von</strong> Einzelangaben durch die Kenntnis<br />

des jeweiligen Tabellenwertes<br />

<strong>und</strong> schließt die Zuhilfenahme anderer<br />

Werte der Tabelle aus.<br />

2.1 Vermeidung einer<br />

exakten Offenlegung<br />

<strong>von</strong> Einzelangaben<br />

Regeln, die eine exakte Offenlegung<br />

<strong>von</strong> Einzelangaben in Tabellenaggregaten<br />

verhindern sollen, sind als so<br />

genannte Fallzahlregeln eingeführt.<br />

Bezeichnet n die Anzahl der Berichtenden,<br />

die mit ihren Angaben zu einem<br />

Tabellenwert beitragen, so werden<br />

folgende Regeln in der amtlichen<br />

Statistik angewendet:<br />

n = 1: Es trägt nur ein Berichtender<br />

zum Tabellenwert bei; als Einzelangabe<br />

ist dieser Tabellenwert<br />

primär geheim zu halten.<br />

n = 2: Es tragen nur zwei Berichtende<br />

zum Tabellenwert bei, <strong>von</strong> denen<br />

jeder durch Subtraktion<br />

seines Wertes vom Tabellenwert<br />

den jeweils anderen Wert<br />

exakt berechnen kann; dieser<br />

Tabellenwert ist demgemäß<br />

ebenfalls primär geheim zu<br />

halten.<br />

n = m<br />

m > 2: Tabellenwerte mit weniger als<br />

m + 1 Meldeeinheiten müssen<br />

primär geheimgehalten werden,<br />

wenn unterstellt werden<br />

kann, dass ein Vorwissen über<br />

den exakten Summenwert <strong>von</strong><br />

m – 1 Meldeeinheiten besteht,<br />

mit dem die verbleibende Einzelangabe<br />

der m Berichtenden<br />

aufgedeckt werden kann.<br />

2.2 Vermeidung einer<br />

näherungsweisen<br />

Offenlegung<br />

<strong>von</strong> Einzelangaben<br />

Die Fallzahlregeln verhindern zwar,<br />

dass eine Einzelangabe aus ihrem Tabellenwert<br />

exakt berechnet werden<br />

kann, sie schützen aber nicht vor näherungsweiser<br />

Offenlegung <strong>von</strong> Einzelangaben<br />

mit Hilfe <strong>von</strong> Vorwissen.<br />

Verfügt der Tabellennutzer beispielsweise<br />

über das Vorwissen, dass n Einzelwerte<br />

eines aus mehr als n Einzelangaben<br />

aggregierten Tabellenwertes<br />

den weitaus größten Beitrag zu diesem<br />

Tabellenwert leisten, so kann er<br />

mit weiterem Vorwissen, der Kenntnis<br />

eines Summenwertes aus n – 1 dieser<br />

dominierenden Einzelangaben, den<br />

noch verbleibenden großen Einzelwert<br />

bis auf den aus den restlichen nicht dominierenden<br />

Einzelwerten bestehenden<br />

Summenwert genau abschätzen.<br />

Wenn z. B. eine <strong>von</strong> zwei dominierenden<br />

Einzelangaben bekannt ist – was<br />

man bei jedem Berichtenden eines der<br />

dominierenden Werte immer unterstellen<br />

muss –, so kann die andere<br />

dominierende Angabe aus dem Tabellenwert<br />

bis auf die Summe der restlichen<br />

nicht dominierenden Angaben<br />

genau berechnet werden.<br />

Das Dominanzproblem hat also seine<br />

Entsprechung im Fallzahlproblem, wobei<br />

der Unterschied zwischen beiden<br />

in der Restsumme aus den nicht dominierenden<br />

Einzelangaben liegt, die im<br />

Dominanzfall nur zu einer näherungsweisen<br />

Offenlegung führen kann. In<br />

der amtlichen Statistik werden die<br />

(n; k)-Dominanz-regel <strong>und</strong> die p%-Regel<br />

zur Vermeidung einer zu genauen<br />

Offenlegung <strong>von</strong> Einzelangaben angewendet.<br />

2.2.1 Die (n; k)-Dominanzregel<br />

Ein Tabellenwert aus mehr als n Einzelangaben<br />

ist primär geheim zu halten,<br />

wenn der Anteil der Summe der<br />

n größten Einzelwerte am Gesamttabellenwert<br />

größer ist als der vorgegebene<br />

Schrankenwert k. Diese Regel<br />

ist sinnvoll, wenn über n – 1 der dominierenden<br />

Einzelwerte ein Vorwissen<br />

über den exakten Wert ihrer<br />

Summe unterstellt werden kann. Von<br />

praktischer Bedeutung für die amtliche<br />

Statistik sind bisher die (1; k)<strong>und</strong><br />

die (2; k)-Regel mit k-Werten<br />

zwischen 50 % <strong>und</strong> 95 %, je nachdem,<br />

welche Sensibilität den zu<br />

schützenden Angaben zugedacht<br />

wird, wobei im (2; k)-Fall in der Regel<br />

eine höhere Schranke k gesetzt wird<br />

als bei der (1; k)-Regel.<br />

2.2.2 Die p%-Regel<br />

Ein Tabellenwert ist nach der p%-Regel<br />

primär geheim zu halten, wenn<br />

er nach Abzug des zweitgrößten Einzelbeitrages<br />

den größten um weniger<br />

als p% übersteigt, d. h. wenn das<br />

Restaggregat, der Tabellenwert abzüglich<br />

der beiden größten Einzelwerte,<br />

bezogen auf den größten Einzelwert<br />

kleiner als p% ausfällt.<br />

Die Intention dieser Regel besteht in<br />

erster Linie im Schutz der am stärksten<br />

gefährdeten größten Einzelangabe<br />

gegen zu genaue Offenlegung<br />

durch die zweitgrößte, während der<br />

zweite Teil der Formulierung auf einen<br />

gewissen Zusammenhang mit<br />

der (2; k)-Dominanzregel hindeutet.<br />

Man darf jedoch nicht verkennen,<br />

dass der Bezugswert in der p%-Regel<br />

der größte Einzelwert ist, in der<br />

Dominanzregel das schützende Restaggregat<br />

aber immer als Teil des Gesamtaggregates<br />

betrachtet wird.<br />

Die Anwendung der p%-Regel auf<br />

aggregierte Daten führt demgemäß<br />

auch zu anderen Ergebnissen als die<br />

(2; k)-Dominanzregel mit geeignet<br />

gewähltem Parameter k. Wie die<br />

Auswertungen einiger statistischer<br />

Landesämter unter Verwendung <strong>von</strong><br />

Realdaten aber gezeigt haben, sind<br />

die Unterschiede zwischen beiden Re-<br />

Statistische Analysen <strong>und</strong> Studien <strong>NRW</strong> 1/2002 25

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!