Chinese taalverwerking op de computer - B-t.asia
Chinese taalverwerking op de computer - B-t.asia
Chinese taalverwerking op de computer - B-t.asia
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Er wordt uitgegaan van <strong>de</strong> veron<strong>de</strong>rstelling dat er slechts GB 2312-80 en ASCII bestaat.<br />
GB bestaat uit twee bytes waarvan <strong>de</strong> eerste byte valt in het gebied 0x21 tot 0x77 en <strong>de</strong><br />
twee<strong>de</strong> byte in het gebied 0x21 tot 0x7E. Grafische ASCII karakters vallen in het gebied 0x21<br />
tot 0x7E en niet grafische ASCII karakters in het gebied 0x00 tot 0x20 en 0x7F. Aangezien<br />
het gebied van een GB byte overlapt met een byte van een grafisch ASCII karakter moet er<br />
dus versprongen wor<strong>de</strong>n van modus, dit gebeurt via een niet-grafisch ASCII karakter dat in<br />
bei<strong>de</strong> sets gelijk is (‘~’ staat <strong>op</strong> positie 0x7E en valt dus buiten het gebied van een eerste byte<br />
van een GB karakter). De standaard modus is ASCII en alles wordt behan<strong>de</strong>ld als ASCII tot<br />
dat er een til<strong>de</strong> (~) tegengekomen wordt. De til<strong>de</strong> moet gevolgd wor<strong>de</strong>n door een ~, een {,<br />
een } of een /n (nieuwe regel).<br />
Het gebruikt een ~{ om het begin aan te dui<strong>de</strong>n van een GB reeks, vanaf dan wor<strong>de</strong>n<br />
bytes per twee behan<strong>de</strong>ld tot er ~} wordt tegen gekomen dat aanduidt dat er terug naar ASCII<br />
mo<strong>de</strong> moet wor<strong>de</strong>n overgeschakeld. Om een til<strong>de</strong> in ASCII weer te geven moet het dubbel<br />
geco<strong>de</strong>erd wor<strong>de</strong>n (~~), willen we twee bytes behou<strong>de</strong>n terwijl we van lijn verspringen dan<br />
moet ~ (~/n) meegegeven wor<strong>de</strong>n. Een voorbeeld:<br />
Dit is ASCII, wat volgt is in GB .~{