13.07.2015 Views

Lietuviškos kirčiuotos raidės: kodavimas ir įvedimas iš klaviatūros

Lietuviškos kirčiuotos raidės: kodavimas ir įvedimas iš klaviatūros

Lietuviškos kirčiuotos raidės: kodavimas ir įvedimas iš klaviatūros

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ISSN 1392-0561. INFORMACIJOS MOKSLAI. 2007 42–43Lietuviškos k<strong>ir</strong>čiuotos raidės:<strong>kodavimas</strong> <strong>ir</strong> įvedimas iš klaviatūrosVladas TumasonisVilniaus universiteto Matematikos <strong>ir</strong> informatikos fakultetoInformatikos katedros docentas, daktarasVilnius University, Dept. of Computer Science,Assoc. Prof., PhDNaugarduko g. 24, LT-03225 VilniusTel. (+370-5) 219 3074El. paštas: vladas.tumasonis@maf.vu.ltStraipsnyje pateikiama būtina <strong>ir</strong> pakankama informacija apie lietuviškų k<strong>ir</strong>čiuotų raidžių realų vartojimąkompiuteriniame tekste – jų <strong>kodavimas</strong> <strong>ir</strong> įvedimas standartine lietuviška klaviatūra. Pateikiamasneturinčių kodų k<strong>ir</strong>čiuotų raidžių <strong>kodavimas</strong> kompozicinėmis sekomis. Aprašomas vadinamasis tęstiesženklo (dead character) metodas, kuriuo galima praplėsti įvedamų ženklų rinkinį. Pasinaudodamasšiuo metodu (<strong>ir</strong> jį įgyvendinančia tvarkykle), kiekvienas kompiuterio naudotojas (kalbininkas, mokytojas,leidėjas, duomenų bazių kūrėjas <strong>ir</strong> t. t.) galės įvesti į savo kuriamus dokumentus lietuviškask<strong>ir</strong>čiuotas raides. Ir netgi prancūziškas, vokiškas <strong>ir</strong> kitų kalbų raides.Kaip žinoma, lietuvių kalba, be pagrindinėsabėcėlės, turi k<strong>ir</strong>čiuotas raides. Jos gali būti pavartotosžodynuose, enciklopedijose, vadovėliuose,tekstynuose, terminologinėse duomenųbazėse <strong>ir</strong> pan. K<strong>ir</strong>čiuotų raidžių nėra kompiuterioklaviatūroje, todėl kyla klausimas, kaip jasįvesti. Be to, dalis k<strong>ir</strong>čiuotų raidžių neturi kodų,o tai <strong>ir</strong>gi kelia nemažą sumaištį. Čia pateikiamibūdai minėtoms problemoms spręsti. Kiekvienaskompiuterio naudotojas galės įvesti į savo kuriamusdokumentus lietuviškas k<strong>ir</strong>čiuotas raides. Irnetgi prancūziškas, vokiškas, kitų kalbų raides.Svarbu pažymėti, kad pačiai klaviatūrai nereikiajokio papildomo grav<strong>ir</strong>avimo. Keičiasi tikklaviatūros išdėstymą įgyvendinanti programa –vadinamoji klaviatūros tvarkyklė.K<strong>ir</strong>čiuotų raidžių <strong>kodavimas</strong>Bendrinė lietuvių kalba turi 68 k<strong>ir</strong>čiuotasraides: 34 didžiąsias <strong>ir</strong> 34 mažąsias. Išjų 33 turi standartinius dviejų baitų kodus(Tumasonis, 1999; LST ISO/IEC 10646, 2005)(kartais sakoma Unikodo kodus), o 35 – neturi.Neturinčias kodų raides (o k<strong>ir</strong>čiuotos raidėsyra sudėtinės raidės, sudarytos iš pamatinėsraidės <strong>ir</strong> diakritinio ženklo) galima išreikšti vadinamąjakompozicine seka, kurią sudaro raidė(ji atstovauja pamatinei raidei) <strong>ir</strong> kombinacinisženklas (jis atstovauja diakritiniam ženklui –k<strong>ir</strong>čiui). Kombinaciniai ženklai (tiksliau – jųvaizdai) neturi pločio (jie piešiami v<strong>ir</strong>š raidėsarba po raide), todėl kartais vadinami nuliniopločio ženklais. Beje, sekomis galima išreikšti<strong>ir</strong> turinčias kodus raides.Kombinaciniai ženklai šio straipsnio tekstevaizduojami iš taškų sudarytu apskritimu,v<strong>ir</strong>š kurio yra reikiamas diakritinis ženklas.K<strong>ir</strong>čiuotoms raidėms koduoti vartojami kombinaciniaiženklai pateikiami 1 lentelėje.135


1 l e n t e l ė . Kombinaciniai ženklaiPavadinimasPavadinimas pagal LST ISO/IEC 10646̀ Kombinacinis ka<strong>ir</strong>inis k<strong>ir</strong>tis COMBINING GRAVE ACCENT 0300́ Kombinacinis dešininis k<strong>ir</strong>tis COMBINING ACUTE ACCENT 0301̃ Kombinacinis riestinis k<strong>ir</strong>tis COMBINING TILDE 0303̇ Kombinacinis taškas v<strong>ir</strong>šuje COMBINING DOT ABOVE 0307Visos k<strong>ir</strong>čiuotos raidės <strong>ir</strong> jų kodai pateikiami 2 lentelėje.2 l e n t e l ė . K<strong>ir</strong>čiuotos raidės <strong>ir</strong> jų kodaiŽenklasKodaspagal LSTISO/IEC10646ŽenklasKompozicinėženklųsekaKompozicinėkodų sekaŽenklasKodaspagal LSTISO/IEC10646Kodas pagalLST ISO/IEC 10646KompozicinėženklųsekaKompozicinėkodų sekaÀ 00C0 A ̀ 0041 0300 Ý 00DD Y ́ 0059 0301à 00E0 a ̀ 0061 0300 ý 00FD y ́ 0079 0301Á 00C1 A ́ 0041 0301 Ỹ 1EF8 Y ̃ 0059 0303á 00E1 a ́ 0061 0301 ỹ 1EF9 y ̃ 0079 0303Ã 00C3 A ̃ 0041 0303 J̃ J ̃ 004A 0303ã 00E3 a ̃ 0061 0303 j̇̃ j ̇ ̃ 006A 0307 0303 Ą ́ 0104 0301 L̃ L ̃ 004C 0303 ą ́ 0105 0301 l ̃ 006C 0303 Ą ̃ 0104 0303 M ̃ 004D 0303 a ̃ 0105 0303 m ̃ 006D 0303È 00C8 E ̀ 0045 0300 Ñ 00D1 N ̃ 004E 0303è 00E8 e ̀ 0065 0300 ñ 00F1 n ̃ 007E 0303É 00C9 E ́ 0045 0301 Ò 00D2 O ̀ 004F 0300é 00E9 e ́ 0065 0301 ò 00F2 o ̀ 006F 0300Ẽ 1EBC E ̃ 0045 0303 Ó 00D3 O ́ 004F 0301ẽ 1EBD e ̃ 0065 0303 ó 00F3 o ́ 006F 0301 Ę ́ 0118 0301 Õ 00D5 O ̃ 004F 0303 ę ́ 0119 0301 õ 00F5 o ̃ 006F 0303 Ę ̃ 0118 0303 R ̃ 0052 0303 ę ̃ 0119 0303 r ̃ 0072 0303 Ė ́ 0116 0301 Ù 00D9 U ̀ 0055 0300 ė ́ 0117 0301 ù 00F9 u ̀ 0075 0300 Ė ̃ 0116 0303 Ú 00DA U ́ 0055 0301 ė ̃ 0117 0303 ú 00FA u ́ 0075 0301Ì 00CC I ̀ 0049 0300 Ũ 0168 U ̃ 0055 0303 i ̇ ̀ 0069 0307 0300 ũ 0169 u ̃ 0075 0303Í 00CD I ́ 0049 0301 Ų ́ 0172 0301 i ̇ ́ 0069 0307 0301 ų ́ 0173 0301Ĩ 0128 I ̃ 0049 0303 Ų ̃ 0172 0303 i ̇ ̃ 0069 0307 0303 ų ̃ 0173 0303 Į ́ 012E 0301 Ū ́ 016A 0301į̇́ į ̇ ́ 012F 0307 0301 ū ́ 016B 0301 Į ̃ 012E 0303 Ū ̃ 016A 0303į̇̃ į ̇ ̃ 012F 0307 0303 ū ̃ 016B 0303136


K<strong>ir</strong>čiuotų raidžių su taškais ypatumai.Lietuviškos k<strong>ir</strong>čiuotos mažosios raidės , bei turi vieną ypatumą, susijusį su jų grafiniuvaizdu, t. y. simboliu. Vakarų Europos kalboseraidė su ka<strong>ir</strong>iniu k<strong>ir</strong>čiu <strong>ir</strong> kitais k<strong>ir</strong>čiaisvaizduojama be taško, o dabartinės lietuvių kalbostaisyklės reikalauja tašką išlaikyti, plg.: Vakarų Europos kalbose; lietuvių kalboje.Komponuojant pagal įprastas taisykles (mažoj<strong>ir</strong>aidė i <strong>ir</strong> ka<strong>ir</strong>inis k<strong>ir</strong>tis), gaunama raidė isu ka<strong>ir</strong>iniu k<strong>ir</strong>čiu be taško. Norint šios raidės sutašku, jį reikia uždėti specialiai. Toks ženklasUnikodo standarte egzistuoja – tai jau minėtaskombinacinis taškas v<strong>ir</strong>šuje, jo kodas 0307.Todėl mūsų tikslams mažoji raidė i su ka<strong>ir</strong>iniuk<strong>ir</strong>čiu išreiškiama taip: mažoji raidė i, kombinacinistaškas v<strong>ir</strong>šuje <strong>ir</strong> kombinacinis ka<strong>ir</strong>inisk<strong>ir</strong>tis, t. y. trijų ženklų seka . Kodų sekaatitinkamai tokia: 0069 0307 0300.K<strong>ir</strong>čiuotų raidžių įvedimas iš klaviatūrosLietuviška kompiuterio klaviatūra (pagalLietuvos standartą LST 1582). Klaviatūrayra gana svarbi priemonė ženklams įvesti įkompiuterį. Paprastai klaviatūra galima įvestitam tikrą ženklų rinkinį, kuriame yra visosnacionalinės raidės, ASCII ženklai <strong>ir</strong> dar keletasrašte vartojamų ženklų. Pavyzdžiui, lietuviškastandartine klaviatūra (LST 1582, 2000), kuripateikta paveiksle, galima surinkti:••visus ASCII ženklus;visas lietuviškos abėcėlės raides;•••kitus lietuviško rašto ženklus (kabutes,brūkšnį, paragrafo ženklą);dešininį k<strong>ir</strong>čio ženklą;jungiamąjį tarpą (gaunamas kartu paspaudustrečiojo lygio klavišą Lyg3 <strong>ir</strong>tarpo klavišą);euro ženklą.•Tai visavertė lietuviška klaviatūra, kuriojeyra visi reikalingi ženklai, todėl klaviatūros nereikiaperjunginėti.Klaviatūra yra trijų lygių. Ant klavišo galibūti 2 arba 3 ženklai. Pavyzdžiui, ant klavišo4; $yra trys ženklai. Jie renkami šitaip:paspaudus šį klavišą, gaunamaskabliataškis , t. y. ka<strong>ir</strong>ysis apatinis ženklas;nuspaudus ⇑ Lyg2 <strong>ir</strong> paspaudus šį klavišą, gaunamas, t. y. ka<strong>ir</strong>ysis v<strong>ir</strong>šutinis ženklas; nuspaudusLyg3 <strong>ir</strong> paspaudus šį klavišą, gaunamas, t. y. dešinysis ženklas.Taigi, klavišų grav<strong>ir</strong>avimas atitinka įvedamusženklus. Įgyvendintas principas „Ką matau, tągaunu“ (angl. WYSIWYG – What You See IsWhat You Get).Ši lietuviška klaviatūra sukurta laikantistarptautinio standarto (ISO/IEC 9995, 1994),reglamentuojančio bendriausius klaviatūrosženklų išdėstymo principus, nuostatų. Taitrys lygiai, skaitmenų išdėstymas v<strong>ir</strong>šutinėjeeilėje p<strong>ir</strong>mu arba antru lygiu, nacionaliniųraidžių nediskriminavimas, įvedamų ženklųrinkinio išsamumas, atitinkamas grav<strong>ir</strong>avimas.Nė vieno iš šių principų netenkina Lietuvojedar naudojama vadinamoji skaitmeninėklaviatūra.P a v . Lietuviška standartinė klaviatūra137


Įprastomis klaviatūromis, kaip buvo minėta,įvedamos nacionalinės raidės <strong>ir</strong> reikalingi ASCIIženklai. K<strong>ir</strong>čiuotos raidės į šį rinkinį nepatenka.Todėl reikia kokių nors metodų <strong>ir</strong> būdų įvedamųženklų rinkiniui išplėsti.Šiame straipsnyje teikiamas būdas, kurisremiasi tęsties ženklo (angl. dead character)naudojimu. Tęsties ženklas – tai klaviatūrosženklas, kurį surinkus nieko negaunama: jo veikimaspas<strong>ir</strong>eiškia surinkus kitą ženklą. Tai pakankamaižinomas tiesioginis klaviatūros galiosišplėtimas, p<strong>ir</strong>mą kartą sistemingai pritaikytaslietuviškoms k<strong>ir</strong>čiuotoms raidėms įvesti. Šisbūdas nereikalauja nei papildomų klaviatūrosfizinių klavišų, nei papildomo grav<strong>ir</strong>avimo, neikomplikuoto įsiminimo. Visiškai tinka ta patifizinė lietuviška klaviatūra. Būdas pakankamaiuniversalus, veikia visose terpėse.Turinčių kodą k<strong>ir</strong>čiuotų raidžių įvedimas.Iš viso yra trys tęsties ženklai. Tai ka<strong>ir</strong>inis,dešininis <strong>ir</strong> riestinis k<strong>ir</strong>čio ženklai. Šie ženklaituri savo vietas lietuviškoje standartinėje klaviatūroje(t. y. renkami įprasta tvarka). Lengvaiįsimenami, nes visi yra viename ka<strong>ir</strong>iajame v<strong>ir</strong>šutiniameklaviše, t. y. išdėstyti p<strong>ir</strong>mu, antru <strong>ir</strong>trečiu lygiu atitinkamai. K<strong>ir</strong>čiuota raidė (o ji yrasudėtinė raidė) gaunama surinkus atitinkamątęsties ženklą <strong>ir</strong> po to – reikiamą pamatinę raidę.Pavyzdžiui, raidė (t. y. a-ka<strong>ir</strong>inis) gaunamasurinkus ka<strong>ir</strong>inį k<strong>ir</strong>tį ( ` ) <strong>ir</strong> raidę a, raidė (a-riestinis) – surinkus riestinį k<strong>ir</strong>tį (tildę ~)<strong>ir</strong> raidę a, o raidė (a-dešininis) – surinkusdešininį k<strong>ir</strong>tį ( ´ ) <strong>ir</strong> raidę a. Tai galima užrašytitokiu formalizmu:` + a → à~ + a → ã´ + a → áSavaime suprantama, kad didžiosios raidėsrenkamos su didžiąja pamatine raide. Pvz.:` + A → ÀŠitaip (k<strong>ir</strong>tis + raidė) renkamos visos lietuviškosk<strong>ir</strong>čiuotos raidės, turinčios kodus (žr.2 lentelę). Priminsime, kad atmintyje šios raidėsbus vaizduojamos vienu savo kodu. Pvz., raidėà kodu 00E0.Tęsties ženklai šiek tiek „kainuoja“, nespatys yra užblokuojami (negali būti įvedamitradiciniu būdu, t. y. vienu klavišo paspaudimu).Todėl jie, kaip savarankiški ženklai, gaunamisurinkus po jų tarpą, t. y.:` + tarpas → ` (0060)~ + tarpas → ~ (007E)´ + tarpas → ´ (00B4)Neturinčių kodų k<strong>ir</strong>čiuotų raidžių įvedimas.Neturinčios kodų k<strong>ir</strong>čiuotos raidės išreiškiamosseka, kuri <strong>ir</strong> turi būti įvesta. Priminsime,kad seką sudaro pamatinė raidė <strong>ir</strong> kombinacinisženklas. Kombinacinių ženklų klaviatūrojenėra, todėl <strong>ir</strong> juos (kaip savarankiškus ženklus)siūloma įvesti pagal tą patį tęsties ženklometodą:` + ` → ̀~ + ` → ̃´ + ` → ́` + . → ̇Tai pakankamai asociatyvus pas<strong>ir</strong>inkimas,leidžiantis lengvai įsiminti reikiamus veiksmus.Tai yra kombinaciniai k<strong>ir</strong>čių ženklai įvedami,surinkus tokį patį atitinkamą paprastą k<strong>ir</strong>tį(kaip tęsties ženklą) <strong>ir</strong> paskui ka<strong>ir</strong>inį k<strong>ir</strong>tį. Tikkombinaciniam taškui taikoma išimtis: deklaravustašką tęsties ženklu, jis būtų užblokuotas.O taškas, sk<strong>ir</strong>tingai nuo k<strong>ir</strong>čio ženklų, yradažnesnis rašto ženklas.Iš principo asociatyvia prasme neblogas būtų<strong>ir</strong> toks variantas, kai kombinaciniai ženklai„užkabinami“ ant vieno <strong>ir</strong> to paties tęsties ženklo –ka<strong>ir</strong>inio k<strong>ir</strong>čio:` + ` → ̀` + ~ → ̃` + ´ → ́Bet kai kurios programos (pvz., Word) „nemėgsta“,kad antruoju ženklu būtų trečiojo lygioženklas (o dešininis k<strong>ir</strong>tis toks <strong>ir</strong> yra). Jis tokiuatveju tiesiog ignoruojamas. Todėl buvo pas<strong>ir</strong>inktasp<strong>ir</strong>masis variantas.Taigi, pavyzdžiui, kodo neturinti raidė yra išreiškiama kompozicine seka , kur<strong>ir</strong>enkama taip:ą + ~ + ` → ą ̃Gauta seka vizualizuojama kaip . Atmintyjebus abiejų sekos dėmenų kodai 0105 0303.O , kurią išreiškia trijų ženklų seka , renkama taip:138


komisijos tinklalapyje http://www.vlkk.lt/palemonas.html.Į paketą įeina tvarkyklės aprašas,diegimo <strong>ir</strong> naudojimo instrukcija. Ten pateikta<strong>ir</strong> tvarkyklė tam atvejui, kai neturinčios kodųlietuviškos k<strong>ir</strong>čiuotos raidės koduojamos vadinamojojePrivačiojoje srityje. Iš čia galimataip pat atsisiųsti <strong>ir</strong> Palemono šriftą.LITERATŪRAALEKNEVIČIENĖ, O.; GRUMADIENĖ, L.;GURSKAS, A.; SKIRMANTAS, P.; STROCKIS, M.;TUMASONIS, V. (2005) Lituanistinis šriftas Palemonas.Vilnius: Tautinių bendrijų namai. 302 p.ISO/IEC 9995 (1994) Information technology –Keyboard layouts for text and office systems.LST 1582 (2000) Informacijos technologija. Lietuviškakompiuterio klaviatūra. Ženklų išdėstymas.LST ISO/IEC 10646 (2005) Informacijos technologija.Universalus keliais baitais koduotų ženklųrinkinys (tapatus ISO/IEC 10646:2003).TUMASONIS V. (1999) Encoding of LithuanianAccented Letters. Iš Multilinguale Corpora: Encoding,Structuring, Analysis. Proceedings of the Conference,Frankfurt a/Main, p. 15–20.Lithuanian Accented Letters: encoding and input from the keyboardVladas TumasonisS u m m a r yIn standard modern Lithuanian there are three accent(stress) signs: grave ( ` ), acute ( ´ ), and c<strong>ir</strong>cumflex( ˜ ). All in all there are 68 (34 lower case and 34 uppercase) Lithuanian accented letters. Only 33 lettershave Unicode codes. Encoding of Lithuanian accentedletters and its input from the keyboard are presentedin this article. Codeless letters are expressed bycomposite sequences: base letter and combining accentcharacter (grave, acute, tilde and sometimes dotabove). Usual keyboards have no keys for accentedletters. The input extension method (dead charactermethod) for Lithuanian standard computer keyboardis proposed as well as the corresponding driver. Socomputer user (a linguist, a teacher, a publisher, adata base creator etc.) with Lithuanian standard keyboardwill be able in very suitable manner to enterLithuanian accented letters as well as French, Germanyand other languages letters.140

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!