21.04.2015 Aufrufe

Das Voynich-Manuskript - HU Berlin

Das Voynich-Manuskript - HU Berlin

Das Voynich-Manuskript - HU Berlin

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Eine neue Lösung für ein altes<br />

Problem: Was zum Teufel ist das<br />

<strong>Voynich</strong>-<strong>Manuskript</strong>?<br />

Ein interessanter Aspekt zu einem<br />

verblüffenden Rätsel: Was das<br />

<strong>Voynich</strong>-<strong>Manuskript</strong> wahrscheinlich<br />

nicht ist<br />

Felix Golcher -- felix.golcher@www.hu-berlin.de<br />

Humboldt Universität zu <strong>Berlin</strong><br />

8. Norddeutsches Linguistisches Kolloquium<br />

8. März 2008<br />

Felix Golcher -- felix.golcher@www.hu-berlin.de<br />

Humboldt Universität zu <strong>Berlin</strong><br />

8. Norddeutsches Linguistisches Kolloquium<br />

8. März 2008<br />

1/27<br />

2/27<br />

Inhalt<br />

1) <strong>Das</strong> <strong>Voynich</strong>-<strong>Manuskript</strong><br />

2) Suffixbäume und Wiederholungen in Texten<br />

3) Anwendung auf das <strong>Voynich</strong>-<strong>Manuskript</strong><br />

Erstens:<br />

<strong>Das</strong> <strong>Voynich</strong>-<strong>Manuskript</strong><br />

3/27<br />

4/27<br />

1


<strong>Das</strong> <strong>Voynich</strong>-<strong>Manuskript</strong><br />

geschrieben um etwa 1500<br />

<br />

<br />

<br />

<br />

<br />

unbekannte Sprache<br />

unbekannte Schrift<br />

unbekannter Autor<br />

unbekannter Inhalt<br />

lückenhafte Geschichte<br />

zieht Wahnsinnige aller Couleur an<br />

6/27<br />

5/27<br />

Geschichte des VM (Abriss)<br />

<br />

<br />

<br />

<br />

<br />

<strong>Das</strong> Buch taucht in Prag am Hof von Rudolf II.<br />

von Böhmen (1552-1612) auf.<br />

Irgendwann gelangt es nach Rom zum Jesuiten<br />

und Gelehrten Athanasius Kircher.<br />

200 Jahre Lücke, wahrscheinlich verschiedene<br />

Bibliotheken in der Nähe von Rom<br />

1912: Der polnische Revolutionär und<br />

Buchhändler Wilfrid <strong>Voynich</strong> kauft das Buch.<br />

Jetzt ist es in Yale.<br />

7/27 8/27<br />

2


Eine von vielen Theorien<br />

Die hier behandelte Frage<br />

<br />

<strong>Das</strong> <strong>Manuskript</strong> ist eine Fälschung, zum<br />

Beispiel um mit einem so geheimnisvollen Buch<br />

Geld zu machen. (Rugg 2004)<br />

Pro:<br />

<br />

<br />

König Rudolf II. hat tatsächlich sehr viel Geld bezahlt.<br />

Niemand konnte das <strong>Manuskript</strong> entschlüsseln.<br />

Contra:<br />

<br />

Eine derart perfekte Fälschung scheint nicht zeitgemäß.<br />

<br />

<br />

<br />

<br />

Ist die Fälschungstheorie plausibel?<br />

<strong>Das</strong> heißt:<br />

Nonsenstext oder echte natürliche Sprache?<br />

Ich stelle ein statistisches Merkmal vor, das<br />

charakteristisch ist für natürliche Sprache.<br />

Dies ergibt einen Test, ob das <strong>Voynich</strong>-<br />

<strong>Manuskript</strong> Nonsens ist oder eher nicht.<br />

Die hier vorgestellte Untersuchung!<br />

9/27<br />

10/27<br />

Begriffe<br />

Zweitens:<br />

Suffixbäume und<br />

Wiederholungen in<br />

Texten<br />

<br />

<br />

<br />

<br />

Ein Text ist eine Folge von Symbolen.<br />

Ein Suffix eines Textes ist einfach ein<br />

beliebiges Endstück dieser Folge.<br />

Beispiel: BRAX ist ein Suffix von ABRAKADABRAX.<br />

Der Suffixbaum eines Textes ist eine<br />

Baumstruktur, die genau alle seine Suffixe<br />

enthält.<br />

Was heißt das??<br />

11/27<br />

12/27<br />

3


BRA KADABRAX<br />

<br />

Knoten bedeuten<br />

Wiederholungen<br />

<br />

Lange Wiederholungen<br />

= Viele Knoten<br />

X<br />

KADABRAX<br />

DABRAX<br />

A<br />

X<br />

DABRAX<br />

BRA KADABRAX<br />

KADABRAX<br />

X<br />

Text: AAAAAX<br />

X<br />

X<br />

X<br />

A A<br />

X<br />

Extremfälle<br />

E<br />

Text: ABCDE<br />

DE<br />

CDE<br />

ABCDE<br />

BCDE<br />

X<br />

ABRAKADABRAX<br />

BRAKADABRAX<br />

RAKADABRAX<br />

AKADABRAX<br />

KADABRAX<br />

ADABRAX<br />

DABRAX<br />

ABRAX<br />

BRAX<br />

RAX<br />

AX<br />

X<br />

X<br />

RA KADABRAX<br />

13/27<br />

A A AX<br />

X<br />

Viele Wiederholungen<br />

=> Viele Knoten<br />

Keine Wiederholungen<br />

=> Keine Knoten<br />

Knotenzahl liegt immer zwischen 0 und N-2.<br />

(N ist die Zahl der Zeichen im Text.)<br />

14/27<br />

V <br />

Zahl der Knoten<br />

Zahl der Zeichen<br />

(immer zwischen 0 und 1)<br />

<br />

<br />

Graphische Darstellung<br />

Der Text wird Zeichen für Zeichen eingelesen.<br />

Wir sehen dem Suffixbaum beim Wachsen zu.<br />

Algorithmus: Ukonnen 1995<br />

1<br />

V misst Wiederholungen im Text<br />

y-Achse: V<br />

0<br />

15/27<br />

x-Achse: Zahl der bisher eingelesenen Zeichen<br />

16/27<br />

4


V für NICHT-natürliche Texte<br />

V für natürliche Texte<br />

17/27<br />

18/27<br />

Ausschnittsvergrößerung<br />

...NICHT-logarithmische Darstellung<br />

19/27<br />

20/27<br />

5


<strong>Das</strong> heißt?<br />

<br />

<br />

NICHT natürlichsprachige Texte können eine<br />

ziemlich beliebige V-Kurve haben.<br />

bei natürlichsprachigen Texten dagegen<br />

konvergiert V sehr schnell gegen 1/2.<br />

Drittens:<br />

Anwendung auf das<br />

<strong>Voynich</strong>-<strong>Manuskript</strong><br />

21/27<br />

22/27<br />

V-Kurve des <strong>Voynich</strong>-<strong>Manuskript</strong>s<br />

Vergleich mit drei Romanen<br />

23/27<br />

24/27<br />

6


Vergleich mit biblischen Texten<br />

Zusammenfassung<br />

<br />

<br />

<strong>Das</strong> <strong>Voynich</strong>-<strong>Manuskript</strong> hat eine V-Kurve, die<br />

denen natürlichsprachiger Texte sehr stark<br />

ähnelt (=konstante Wiederholungsrate).<br />

Nonsenstexte haben eine ganz andere Kurve.<br />

Sehr unwahrscheinlich, dass es sich um einen<br />

Nonsenstext handelt.<br />

<br />

Biblische Texte teilen die leicht erhöhte<br />

Wiederholungsrate des <strong>Voynich</strong>-<strong>Manuskript</strong>s.<br />

25/27<br />

26/27<br />

Literatur<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

27/27<br />

Bonus Trax<br />

28/27<br />

7


Eine von vielen Theorien<br />

Der Autor ist Roger Bacon (ca 1214 - 1294),<br />

Mönch, Wissenschaftler und Philosoph.<br />

Begründung: In einem Brief von 1665 sagt A,<br />

dass sein Freund B sagt, dass Kaiser C<br />

glaubte, dass Bacon der Autor sei.<br />

<br />

ABER:<br />

Etwa 200 Jahre zu früh<br />

“Experten” sagen, das sei nicht Bacons Stil.<br />

Eine besonders schöne Theorie<br />

Levitov (1987):<br />

<br />

Mischung aus mittelalterlichem Flämisch,<br />

Altfranzösisch und Althochdeutsch<br />

Anleitung zu einem Selbstmordritus<br />

Im Rahmen der Katharerbewegung<br />

Aber: Grobe sachliche Ungereimtheiten wie<br />

zum Beispiel ein viel zu hohes Alter.<br />

29/27<br />

30/27<br />

logarithmische Darstellung...<br />

Vergleich mit drei Romanen<br />

nicht-logarithmische Darstellung<br />

31/27<br />

32/27<br />

8


Was ist ein NICHT natürlicher Text?<br />

V für NICHT-natürliche Texte<br />

<br />

<br />

Natürliche Texte<br />

Bücher, Briefe, Zeitungen, etc<br />

Nicht natürliche Texte<br />

Zufallsgenerierter Text<br />

Computercode<br />

33/27<br />

34/27<br />

V für NICHT-natürliche Texte<br />

V für NICHT-natürliche Texte<br />

35/27<br />

36/27<br />

9

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!