Chinese taalverwerking op de computer - B-t.asia
Chinese taalverwerking op de computer - B-t.asia
Chinese taalverwerking op de computer - B-t.asia
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
f) GB/T 12345-90<br />
De officiële naam van <strong>de</strong>ze karakterset is Co<strong>de</strong> of <strong>Chinese</strong> I<strong>de</strong>ogram Set for Information<br />
Interchange Supplementary Set (信息交换用汉字编码字符集 - 辅助集, xìnxī jiāohuàn yòng<br />
hànzì biānmǎ zìfújí - fǔzhùjí) en werd <strong>op</strong> 13 juni 1990 uitgevaardigd door 中华人民共和国<br />
国家技术监督局 (zhōnghuárénmíngònghéguó guójiā jìshù jiāndūjú). Het ging <strong>op</strong> 1 <strong>de</strong>cember<br />
1990 van kracht. De T staat voor Tuijian (推荐 tuījiàn) en betekent aanvulling.<br />
Het is i<strong>de</strong>ntiek aan GB 2312-80 maar alle karakters zijn vervangen door hun traditionele<br />
variant, het bevat 7 709 karakters. Daarvan zijn er 843 niet <strong>Chinese</strong> karakters en 6 866<br />
<strong>Chinese</strong> karakters (3 755 vaak gebruikte karakters, 3 008 niet vaak gebruikte karakters en een<br />
supplement van 103 karakters). In totaal zijn er 2 180 karakters die door hun traditionele<br />
variant zijn vervangen. Deze karakterset bevat helaas ook fouten, het gaat om 2 printfouten.<br />
Tabel 17 GB/T 12345-90<br />
Range Aantal<br />
Symbolen Rij 1 94<br />
Numerals Rij 2 72<br />
Full width GB 1988-89 Rij 3 94<br />
Hiragana Rij 4 83<br />
Katakana Rij 5 86<br />
Grieks alfabet Rij 6 48<br />
Grieks (voor vertikaal gebruik) Rij 6 29<br />
Cyrillisch Rij 7 66<br />
Full width Pinyin Rij 8 32<br />
Zhuyin Rij 8 37<br />
Line drawing elements Rij 9 76<br />
Half width GB 1988-89 Rij 10 94<br />
Half width Pinyin Rij 11 32<br />
<strong>Chinese</strong> karakters Rij 16-55 3 755<br />
<strong>Chinese</strong> karakters Rij 56-87 3 008<br />
Extra <strong>Chinese</strong> karakters Rij 88-89 103<br />
Totaal 7 709<br />
g) GBK<br />
GBK is een superset van GB 2312-80, dat zowel vereenvoudig<strong>de</strong> als traditionele karakters<br />
bevat, maar het is tevens <strong>de</strong> subset van GB 13000.1-93 (zie infra).<br />
De afkorting GBK staat voor Exten<strong>de</strong>d National Standard (国家标准扩展, guójiā<br />
biāozhǔn kuòzhǎn- <strong>de</strong> officiële naam is <strong>Chinese</strong> Internal Co<strong>de</strong> Specification 汉字内码扩展规<br />
范, hànzì nèimǎ kuòzhǎn guīfàn). Het werd <strong>op</strong> 1 <strong>de</strong>cember 1995 door het CITS (中华人民共<br />
和国全国信息技术标准化技术委员会 zhōnghuárénmíngònghéguó quánguó xìnxí jìshù<br />
biāozhǔnhuà jìshù wěiyuánhuì) geformuleerd.<br />
Thesis Sébastien Bruggeman Pagina 34