Das Voynich-Manuskript - HU Berlin
Das Voynich-Manuskript - HU Berlin
Das Voynich-Manuskript - HU Berlin
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Eine neue Lösung für ein altes<br />
Problem: Was zum Teufel ist das<br />
<strong>Voynich</strong>-<strong>Manuskript</strong>?<br />
Ein interessanter Aspekt zu einem<br />
verblüffenden Rätsel: Was das<br />
<strong>Voynich</strong>-<strong>Manuskript</strong> wahrscheinlich<br />
nicht ist<br />
Felix Golcher -- felix.golcher@www.hu-berlin.de<br />
Humboldt Universität zu <strong>Berlin</strong><br />
8. Norddeutsches Linguistisches Kolloquium<br />
8. März 2008<br />
Felix Golcher -- felix.golcher@www.hu-berlin.de<br />
Humboldt Universität zu <strong>Berlin</strong><br />
8. Norddeutsches Linguistisches Kolloquium<br />
8. März 2008<br />
1/27<br />
2/27<br />
Inhalt<br />
1) <strong>Das</strong> <strong>Voynich</strong>-<strong>Manuskript</strong><br />
2) Suffixbäume und Wiederholungen in Texten<br />
3) Anwendung auf das <strong>Voynich</strong>-<strong>Manuskript</strong><br />
Erstens:<br />
<strong>Das</strong> <strong>Voynich</strong>-<strong>Manuskript</strong><br />
3/27<br />
4/27<br />
1
<strong>Das</strong> <strong>Voynich</strong>-<strong>Manuskript</strong><br />
geschrieben um etwa 1500<br />
<br />
<br />
<br />
<br />
<br />
unbekannte Sprache<br />
unbekannte Schrift<br />
unbekannter Autor<br />
unbekannter Inhalt<br />
lückenhafte Geschichte<br />
zieht Wahnsinnige aller Couleur an<br />
6/27<br />
5/27<br />
Geschichte des VM (Abriss)<br />
<br />
<br />
<br />
<br />
<br />
<strong>Das</strong> Buch taucht in Prag am Hof von Rudolf II.<br />
von Böhmen (1552-1612) auf.<br />
Irgendwann gelangt es nach Rom zum Jesuiten<br />
und Gelehrten Athanasius Kircher.<br />
200 Jahre Lücke, wahrscheinlich verschiedene<br />
Bibliotheken in der Nähe von Rom<br />
1912: Der polnische Revolutionär und<br />
Buchhändler Wilfrid <strong>Voynich</strong> kauft das Buch.<br />
Jetzt ist es in Yale.<br />
7/27 8/27<br />
2
Eine von vielen Theorien<br />
Die hier behandelte Frage<br />
<br />
<strong>Das</strong> <strong>Manuskript</strong> ist eine Fälschung, zum<br />
Beispiel um mit einem so geheimnisvollen Buch<br />
Geld zu machen. (Rugg 2004)<br />
Pro:<br />
<br />
<br />
König Rudolf II. hat tatsächlich sehr viel Geld bezahlt.<br />
Niemand konnte das <strong>Manuskript</strong> entschlüsseln.<br />
Contra:<br />
<br />
Eine derart perfekte Fälschung scheint nicht zeitgemäß.<br />
<br />
<br />
<br />
<br />
Ist die Fälschungstheorie plausibel?<br />
<strong>Das</strong> heißt:<br />
Nonsenstext oder echte natürliche Sprache?<br />
Ich stelle ein statistisches Merkmal vor, das<br />
charakteristisch ist für natürliche Sprache.<br />
Dies ergibt einen Test, ob das <strong>Voynich</strong>-<br />
<strong>Manuskript</strong> Nonsens ist oder eher nicht.<br />
Die hier vorgestellte Untersuchung!<br />
9/27<br />
10/27<br />
Begriffe<br />
Zweitens:<br />
Suffixbäume und<br />
Wiederholungen in<br />
Texten<br />
<br />
<br />
<br />
<br />
Ein Text ist eine Folge von Symbolen.<br />
Ein Suffix eines Textes ist einfach ein<br />
beliebiges Endstück dieser Folge.<br />
Beispiel: BRAX ist ein Suffix von ABRAKADABRAX.<br />
Der Suffixbaum eines Textes ist eine<br />
Baumstruktur, die genau alle seine Suffixe<br />
enthält.<br />
Was heißt das??<br />
11/27<br />
12/27<br />
3
BRA KADABRAX<br />
<br />
Knoten bedeuten<br />
Wiederholungen<br />
<br />
Lange Wiederholungen<br />
= Viele Knoten<br />
X<br />
KADABRAX<br />
DABRAX<br />
A<br />
X<br />
DABRAX<br />
BRA KADABRAX<br />
KADABRAX<br />
X<br />
Text: AAAAAX<br />
X<br />
X<br />
X<br />
A A<br />
X<br />
Extremfälle<br />
E<br />
Text: ABCDE<br />
DE<br />
CDE<br />
ABCDE<br />
BCDE<br />
X<br />
ABRAKADABRAX<br />
BRAKADABRAX<br />
RAKADABRAX<br />
AKADABRAX<br />
KADABRAX<br />
ADABRAX<br />
DABRAX<br />
ABRAX<br />
BRAX<br />
RAX<br />
AX<br />
X<br />
X<br />
RA KADABRAX<br />
13/27<br />
A A AX<br />
X<br />
Viele Wiederholungen<br />
=> Viele Knoten<br />
Keine Wiederholungen<br />
=> Keine Knoten<br />
Knotenzahl liegt immer zwischen 0 und N-2.<br />
(N ist die Zahl der Zeichen im Text.)<br />
14/27<br />
V <br />
Zahl der Knoten<br />
Zahl der Zeichen<br />
(immer zwischen 0 und 1)<br />
<br />
<br />
Graphische Darstellung<br />
Der Text wird Zeichen für Zeichen eingelesen.<br />
Wir sehen dem Suffixbaum beim Wachsen zu.<br />
Algorithmus: Ukonnen 1995<br />
1<br />
V misst Wiederholungen im Text<br />
y-Achse: V<br />
0<br />
15/27<br />
x-Achse: Zahl der bisher eingelesenen Zeichen<br />
16/27<br />
4
V für NICHT-natürliche Texte<br />
V für natürliche Texte<br />
17/27<br />
18/27<br />
Ausschnittsvergrößerung<br />
...NICHT-logarithmische Darstellung<br />
19/27<br />
20/27<br />
5
<strong>Das</strong> heißt?<br />
<br />
<br />
NICHT natürlichsprachige Texte können eine<br />
ziemlich beliebige V-Kurve haben.<br />
bei natürlichsprachigen Texten dagegen<br />
konvergiert V sehr schnell gegen 1/2.<br />
Drittens:<br />
Anwendung auf das<br />
<strong>Voynich</strong>-<strong>Manuskript</strong><br />
21/27<br />
22/27<br />
V-Kurve des <strong>Voynich</strong>-<strong>Manuskript</strong>s<br />
Vergleich mit drei Romanen<br />
23/27<br />
24/27<br />
6
Vergleich mit biblischen Texten<br />
Zusammenfassung<br />
<br />
<br />
<strong>Das</strong> <strong>Voynich</strong>-<strong>Manuskript</strong> hat eine V-Kurve, die<br />
denen natürlichsprachiger Texte sehr stark<br />
ähnelt (=konstante Wiederholungsrate).<br />
Nonsenstexte haben eine ganz andere Kurve.<br />
Sehr unwahrscheinlich, dass es sich um einen<br />
Nonsenstext handelt.<br />
<br />
Biblische Texte teilen die leicht erhöhte<br />
Wiederholungsrate des <strong>Voynich</strong>-<strong>Manuskript</strong>s.<br />
25/27<br />
26/27<br />
Literatur<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
27/27<br />
Bonus Trax<br />
28/27<br />
7
Eine von vielen Theorien<br />
Der Autor ist Roger Bacon (ca 1214 - 1294),<br />
Mönch, Wissenschaftler und Philosoph.<br />
Begründung: In einem Brief von 1665 sagt A,<br />
dass sein Freund B sagt, dass Kaiser C<br />
glaubte, dass Bacon der Autor sei.<br />
<br />
ABER:<br />
Etwa 200 Jahre zu früh<br />
“Experten” sagen, das sei nicht Bacons Stil.<br />
Eine besonders schöne Theorie<br />
Levitov (1987):<br />
<br />
Mischung aus mittelalterlichem Flämisch,<br />
Altfranzösisch und Althochdeutsch<br />
Anleitung zu einem Selbstmordritus<br />
Im Rahmen der Katharerbewegung<br />
Aber: Grobe sachliche Ungereimtheiten wie<br />
zum Beispiel ein viel zu hohes Alter.<br />
29/27<br />
30/27<br />
logarithmische Darstellung...<br />
Vergleich mit drei Romanen<br />
nicht-logarithmische Darstellung<br />
31/27<br />
32/27<br />
8
Was ist ein NICHT natürlicher Text?<br />
V für NICHT-natürliche Texte<br />
<br />
<br />
Natürliche Texte<br />
Bücher, Briefe, Zeitungen, etc<br />
Nicht natürliche Texte<br />
Zufallsgenerierter Text<br />
Computercode<br />
33/27<br />
34/27<br />
V für NICHT-natürliche Texte<br />
V für NICHT-natürliche Texte<br />
35/27<br />
36/27<br />
9