08.01.2013 Views

Chinese taalverwerking op de computer - B-t.asia

Chinese taalverwerking op de computer - B-t.asia

Chinese taalverwerking op de computer - B-t.asia

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

f) GB/T 12345-90<br />

De officiële naam van <strong>de</strong>ze karakterset is Co<strong>de</strong> of <strong>Chinese</strong> I<strong>de</strong>ogram Set for Information<br />

Interchange Supplementary Set (信息交换用汉字编码字符集 - 辅助集, xìnxī jiāohuàn yòng<br />

hànzì biānmǎ zìfújí - fǔzhùjí) en werd <strong>op</strong> 13 juni 1990 uitgevaardigd door 中华人民共和国<br />

国家技术监督局 (zhōnghuárénmíngònghéguó guójiā jìshù jiāndūjú). Het ging <strong>op</strong> 1 <strong>de</strong>cember<br />

1990 van kracht. De T staat voor Tuijian (推荐 tuījiàn) en betekent aanvulling.<br />

Het is i<strong>de</strong>ntiek aan GB 2312-80 maar alle karakters zijn vervangen door hun traditionele<br />

variant, het bevat 7 709 karakters. Daarvan zijn er 843 niet <strong>Chinese</strong> karakters en 6 866<br />

<strong>Chinese</strong> karakters (3 755 vaak gebruikte karakters, 3 008 niet vaak gebruikte karakters en een<br />

supplement van 103 karakters). In totaal zijn er 2 180 karakters die door hun traditionele<br />

variant zijn vervangen. Deze karakterset bevat helaas ook fouten, het gaat om 2 printfouten.<br />

Tabel 17 GB/T 12345-90<br />

Range Aantal<br />

Symbolen Rij 1 94<br />

Numerals Rij 2 72<br />

Full width GB 1988-89 Rij 3 94<br />

Hiragana Rij 4 83<br />

Katakana Rij 5 86<br />

Grieks alfabet Rij 6 48<br />

Grieks (voor vertikaal gebruik) Rij 6 29<br />

Cyrillisch Rij 7 66<br />

Full width Pinyin Rij 8 32<br />

Zhuyin Rij 8 37<br />

Line drawing elements Rij 9 76<br />

Half width GB 1988-89 Rij 10 94<br />

Half width Pinyin Rij 11 32<br />

<strong>Chinese</strong> karakters Rij 16-55 3 755<br />

<strong>Chinese</strong> karakters Rij 56-87 3 008<br />

Extra <strong>Chinese</strong> karakters Rij 88-89 103<br />

Totaal 7 709<br />

g) GBK<br />

GBK is een superset van GB 2312-80, dat zowel vereenvoudig<strong>de</strong> als traditionele karakters<br />

bevat, maar het is tevens <strong>de</strong> subset van GB 13000.1-93 (zie infra).<br />

De afkorting GBK staat voor Exten<strong>de</strong>d National Standard (国家标准扩展, guójiā<br />

biāozhǔn kuòzhǎn- <strong>de</strong> officiële naam is <strong>Chinese</strong> Internal Co<strong>de</strong> Specification 汉字内码扩展规<br />

范, hànzì nèimǎ kuòzhǎn guīfàn). Het werd <strong>op</strong> 1 <strong>de</strong>cember 1995 door het CITS (中华人民共<br />

和国全国信息技术标准化技术委员会 zhōnghuárénmíngònghéguó quánguó xìnxí jìshù<br />

biāozhǔnhuà jìshù wěiyuánhuì) geformuleerd.<br />

Thesis Sébastien Bruggeman Pagina 34

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!