24.02.2013 Aufrufe

Einf ¨uhrung in UNIX - CIS

Einf ¨uhrung in UNIX - CIS

Einf ¨uhrung in UNIX - CIS

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

122 2 <strong>UNIX</strong><br />

en, der e<strong>in</strong>e Obermenge der bisherigen ist. So wird zur Zeit e<strong>in</strong> <strong>in</strong>ternationaler<br />

Zeichensatz entwickelt, der mit 16 Bits alle abendländischen Zeichen<br />

berücksichtigt. Dieser Intercode ist aber noch nicht weit verbreitet. Und<br />

da sich immer Leute f<strong>in</strong>den, die etwas besser machen, ist noch e<strong>in</strong> weltweiter<br />

Unicode nach ISO 10646 mit ähnlicher Zielsetzung <strong>in</strong> der Mache. Die<br />

Programmiersprache Java verwendet Unicode als Zeichensatz. Um den Gebrauch<br />

von Unicode <strong>in</strong> 8-Bit-Umgebungen zu erleichtern, wurde das Unicode<br />

Transformation Format UTF8 geschaffen. Die ASCII-Zeichen bleiben an<br />

den gewohnten Stellen, gleichzeitig kann jedoch der vollständige Unicode-<br />

Zeichensatz benutzt werden.<br />

Zur Umsetzung von Zeichen gibt es mehrere <strong>UNIX</strong>-Werkzeuge wie tr(1)<br />

und sed(1). Das erstere ist auch e<strong>in</strong> Nothelfer, wenn man e<strong>in</strong> Zeichen <strong>in</strong><br />

e<strong>in</strong>en Text e<strong>in</strong>bauen möchte, das man nicht auf der Tastatur f<strong>in</strong>det. Will man<br />

beispielsweise den Namen Citroën richtig schreiben und sieht ke<strong>in</strong>e Möglichkeit,<br />

das e mit dem Trema per Tastatur zu erzeugen, dann schreibt man CitroXn<br />

und schickt den Text durch:<br />

tr ’\130’ ’\315’ < text > text.neu<br />

Die Zahlen s<strong>in</strong>d die oktalen Positionen im Zeichensatz Roman8. E<strong>in</strong> C-<br />

Programm für diesen Zweck ist andererseits e<strong>in</strong>fach:<br />

/* Programm zum Umwandeln von bestimmten Zeichen e<strong>in</strong>es<br />

Zeichensatzes <strong>in</strong> Zeichen e<strong>in</strong>es anderen Zeichensatzes,<br />

hier ROMAN8 nach LaTeX. Als Filter (Pipe) e<strong>in</strong>fuegen.<br />

Zeichen werden durch ihre dezimale Nr. dargestellt. */<br />

#<strong>in</strong>clude <br />

<strong>in</strong>t ma<strong>in</strong>()<br />

{<br />

<strong>in</strong>t c;<br />

while ((c = getchar()) != EOF)<br />

switch (c) {<br />

case 189:<br />

putchar(92);<br />

putchar(83);<br />

break;<br />

case 204:<br />

putchar(34);<br />

putchar(97);<br />

break;<br />

.<br />

.<br />

.<br />

case 219:<br />

putchar(34);<br />

putchar(85);<br />

break;<br />

case 222:<br />

putchar(92);

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!