Capitolul 3

CURS NR. 3 

Un limbaj folosit de calculator se construieşte pe baza unor elemente bine definite, care se 

pot grupa în conformitate cu nişte reguli foarte precise pentru a da naştere la componentele mai 

complicate ale limbajului. Pentru ca un program traducător să fie în stare să recunoască dacă 

porţiunea de text face parte din limbajul dat, şi în consecinţă să fie în stare să-l traducă, acesta 

trebuie să cunoască elementele din care este construit limbajul şi regulile pe baza cărora din 

aceste elemente se obţin structurile mai complexe. 

3.1.ELEMENTELE UNUI LIMBAJ 

[Exemplele vor fi din Limbajele BASIC, VisualBasic şi Python] 

1.CARACTERE 

- Literele din alafabet a, b, c, ....z, A, B, ..Z 

- Cifrele 1, 2, 3, ....0 

- Semne de punctuaţie .(punct), ,(virgulă) , !, ?, 

şi ajutătoare 

*, #, $, :, ;, etc 

- Delimitatoare (separatoare) , "Blanc", ,(virgula), :, ;, etc. 

[Virgula este separator între elementele unei liste, dar nu se foloseşte pentru separarea părţii 

întregi de cea zecimală. Aici se foloseşte punctul. Deci = 3.14 şi nu 3,14 !!]. 

2.TOKENURI 

O succesiune de caractere care luate în ansamblu au o semnificaţie. Ele pot fi: 

- Cuvinte cheie LET, PRINT, REM,... 

- Constante 

- Numerice 100, 4 , 3 , .... 

- De tip "Şir" "EU VA ZIC","Y are valoarea" , ... 

- Operatori + , - , * , / , \ , ^ 

[Aceste semne parțial diferǎ de cele învǎțate la matematicǎ, necesitǎ un timp pânǎ ce vǎ 

obişnuiți cu ele. Despre utilizarea acestor operatoare vezi exemplul predat la curs şi exercițiile 

de la laborator. Notați-vǎ formula matematicǎ pentru x_1 la ecuația de grad 2 şi echivalentul 

acesteia în limbajul BASIC: vezi_f_C ] 

Formula matematicǎ 

Formula într-un “limbaj de calculator” 

x 1 = X_1 = 

29

- Variabile 

- Numerice 

- întregi K%, copil% ‘[ În Visual Basic mai existǎ şi 

- întregi - lungi K&, copil& ‘variabila numericǎ: BYTE ] 

- Currency (monedǎ) k@, copil@ 

- reale simplă precizie X, Y, SUPRAF, (X!,Y!,SUPRAF!,..) 

- reale dublă precizie X#, Y#, SUPRAF#,.. 

- De tip "Şir" ("TEXT") 

. – Cu lungime variabilǎ A$, zi$,... 

- Cu lungime fixǎ Dim Oraş as String*10 

- Definite de utilizator (cu mai multe câmpuri) 

[ În VISUAL BASIC existǎ încǎ multe tipuri de variabile, ca Variant, Date, Boolean, Object etc.] 

[ În alte limbaje există şi variabile de tip : COMPLEX , POINTER etc.] 

[ Despre memorarea diferitelor tipuri de variabile ( întregi, de tip real, de tip şir, definite 

de utilizator etc. vezi_f_C şi IptN_ANEXA_1 ] 

3. EXPRESII 

Mai multe tokenuri, legate logic. Ex: 

4. ENUNŢURI 

-A + B , A * B , A / B , 4 * PI * RAZA ^ 2 , etc. 

Mai multe expresii şi tokenuri legate logic. Ele pot fi: 

- COMENZI: 

[Comenzile se execută imediat de către calculator 

Vezi în BASIC textele scrise în Fereastra imediatǎ] 

- LIST , RUN , PRINT 3*8 , .. 

- INSTRUCŢIUNI 

[ Instrucţiunile se memorează, ele se execută doar la 

comanda de lansare în execuţie : RUN ] 

-DECLARATIVE 

(NEEXECUTABILE) 

- REM, INTEGER ALFA 

-EXECUTIVE 

(EXECUTABILE ) - LET B=A*4 , PRINT B, A, ... 

30

5. BLOCURI (RUTINE, PROCEDURI) 

Mai multe instrucţiuni care rezolvă o subproblemă. 

[De ex: Porţiunea de program ce desenează o fereastră, 

în programul ce desenează o casă ] 

6. PROGRAM 

Totalitatea rutinelor şi a instrucţiunilor, care împreună rezolvă o problemă. 

3.2. ETAPELE TRADUCERII UNUI TEXT SCRIS ÎNTR-UN LIMBAJ DE NIVEL ÎNALT. 

Programele traducătoare (INTERPRETER, COMPILATOR) parcurg textul programului 

de tradus de mai multe ori, făcând verificări multiple şi inventariind tot ceea ce cuprinde textul 

programului. 

În decursul acestor parcurgeri de text ele execută: 

0. DELIMITAREA ŞI INVENTARIEREA TOKENURILOR EXISTENTE 

De exemplu, pentru instrucţiunea : 10 LET AX = ALFA + 4*CAL (3.1) 

obţinem: 

10 LET AX = ALFA + 4 * CAL 

Etichetă variabilă variabilă constantă variabilă 

Cuvînt cheie 

Semn pt. 

atribuire operator operator 

1. ANALIZA LEXICALĂ 

Verifică dacă tokenurile şi caracterele fac parte din cele permise de limbaj. Ex: 

- { , ~ , } nu sunt caractere admise, 

- PLINT nu este token (nu se găsesc pe lista celor corecte). 

2. ANALIZA SINTACTICĂ 

a) Verifică dacă tokenurile îşi au locul unde trebuie. Ex: 

Let X = A # B 

(Aici tokenurile sunt corecte , dar # nu este un operator !) 

b) Dacă totul e corect, construiesc arborele sintactic. 

(Acesta va indica succesiunea operaţiilor necesare pt. evaluarea expresiei.) 

31

În cazul instrucţiunii 

10 LET AX = ALFA + 4 * CAL 

va arăta ca un arbore [ vezi_f_C 

sau IptN_fig_3.1] 

[ Bineînţeles în calculator nu avem hârtie ca să desenăm pe el, acest desen va fi memorat 

altfel, aşa cum o să vedem mai târziu în cursul despre stucturile de date -vezi cap.8.1.7-] 

Dacă în decursul unei etape (analiza lexicală, analiza sintactică) programul traducător 

întâlneşte o eroare, el se opreşte din traducere şi trece la instrucţiunea următoare, doar după ce 

atenţionează utilizatorul cu un mesaj de eroare. 

[Detectarea erorilor este o sarcinǎ importantă a programelor de traducere!!] 

Dacă primele 2 etape au avut loc fără erori, se trece la etapa următoare: 

3. ANALIZA SEMANTICĂ (TRADUCEREA PRORIU ZISĂ). 

Această etapă ne dă răspunsul la întrebarea "Ce înseamnă ?" sau "Ce avem de făcut ?". 

Programul traducător se apucă de treabă şi folosind informaţiile acumulate din etapele 

anterioare (lista variabilelelor, arborele sintactic etc.) transformă instrucţiunea scrisă în L.N.I. 

într-o succesiune de instrucţiuni în cod maşină. (vezi în cap. 2 echivalentul instrucţiunii: 

LET Y = X + 4, în cod maşină - IptN_ Tabelul 2.5 - ) 

Dacă programul traducător e un INTERPRETER, rezultatul traducerii (codul executabil) 

este imediat executat, după care el este şters şi se trece la prelucrarea instrucţiunii următoare. 

Dacă programul traducător e un COMPILATOR, ceea ce rezultă e un cod intermediar ce 

se memorează, şi urmează în majoritatea cazurilor o etapă numită "optimizare de cod". 

Codul obţinut se numeşte "Program obiect", dar el încă nu e utilizabil în această formă. 

În orice program există operaţiuni ce se execută de mai multe ori (cel mai bun exemplu 

este afişarea unui text pe ecran, sau "citirea" unei taste apăsate pe tastatură, dar sunt multe alte 

exemple de acest gen). 

De fiecare dată când în program se cere de exemplu afişarea unui text, după ce se 

memorează textul de afişat şi se comunică calculatorului adresa textului, sarcina calculatorului 

este aceeaşi, deci secvenţa de instrucţiuni -în cod maşină - care execută acesta trebuie să fie 

identică. Pentru uşurarea traducerii, cei ce scriu COMPILATOARE alcătuesc o listă de asemenea 

"secvenţe" ("rutine") dinainte elaborate (ele sunt depuse într-o "bibliotecă") şi când programul 

traducător ajunge la o instrucţiune ce afişează ceva pe ecran, se înglobează doar o referire de 

genul: -aici sari la "secvenţa de afişare"- (fără a se specifica exact unde va fi locul acestei 

secvenţe, -el se va completa ulterior, după ce se termină traducerea). 

După ce se termină traducerea întregului text, se vor alipi la sfârşitul programului obiect 

"secvenţele" amintite şi trebuie specificat pentru instrucţiunile de salt menţionate (-aici sari la 

secvenţa de afişare-) unde va fi de fapt în memorie locul aceastor secvenţe. 

Completarea adreselor de salt pentru fiecare rutinǎ din bibliotecǎ se face de către un 

program numit EDITOR DE LEGĂTURI ( vezi_f_C şi IptN_fig.2.3 FAZA 1 b ), şi doar după 

aceastǎ etapǎ se obţine un program, care încărcat în memorie poate fi executat de la început până 

la sfârşit, adică un Program executabil. 

32

3.3. CERINŢE FAŢĂ DE UN COMPILATOR [ INTERPRETER ]: 

Programele traducătoare, sunt şi ele programe ce trebuie să funcţioneze corect , deci se 

aşteaptă de la ele următoarele: 

- Să dea mesaje de erori clare, (de preferinţă pentru 1 eroare să apară un singur mesaj 

CLAR !) , 

- Să nu dea mesaje de erori la programele corecte, 

- Să corecteze erorile simple (de ex. : lipsă de paranteze etc.). 

- Să lucreze repede, ocupând memorie puţină etc. 

Pentru ca în fazele Analizei lexicale şi a Analizei sintactice programul traducător să poată 

distinge între ce e corect şi ce este eronat, el trebuie să cunoască lista caracterelor şi a tokenurilor 

admise, şi regulile sintactice prin care din tokenuri se pot alcătui Expresiile şi Enunţurile. 

3.4. DEFINIREA SINTAXEI PENTRU UN LIMBAJ: 

Toate regulile prin care se construieşte un limbaj, plecând de la caractere pînă la 

construcţiile cele mai complicate [în cazul limbajelor de calculator: programele] sunt tratate de o 

disciplină nouă de matematică : TEORIA LIMBAJELOR FORMALE. Ea este o ştiinţă ce a 

apărut din studierea limbajelor naturale şi a limbajelor prin care omul comunică cu un calculator, 

observând că acestea din urmă trebuie să fie "Limbaje independent de context". (Aici nu se admit 

omonimele -cuvintele cu mai multe înţelesuri-de ex: "CER".), şi să satisfacă o serie de alte 

cerinţe exacte. 

Toate definiţiile pentru limbajele de calculator se dau foarte exact, precizând de preferinţă 

toate elementele ce se încadrează (de ex. la caractere sunt prezentate toate caracterele ce se pot 

folosi, în mod analog la Token-uri), iar dacă nu e posibil (fiind prea vast), prezentând regulile de 

"compoziţie" permise. 

Astfel instrucţiunea de atribuire LET din limbajul BASIC se va descrie astfel: 

LET = | LET = 

urmând ca în continuare să se precizeze sintaxa pentru 

, , , < şir> şi astfel: 

::= | < constantă şir> 

< constantă şir> ::= ,... 

::= a|b| ....X|Y|Z 

::= blanc| 

(Semnul ::= este prescurtarea textului "poate fi", semnul | înseamnă "sau" .....) 

Sintaxa unui limbaj se poate descrie prin multe metode, cea prezentată mai sus se numeşte 

forma BACKUS – NAUR [Detalii despre aceastǎ metodǎ de precizare a sintaxei vezi_f_C ] 

[ Sintaxa corectă a instrucţiunilor este afişată de interpretorul QUICK-BASIC, dacă 

poziţionând cursorul sub instrucţiunea care vă interesează apăsaţi tasta , tasta de HELP 

[Trad.Rom.: Ajutor], iar în VISUAL BASIC este afişat automat în timpul completării 

instrucţiunii] 

33

Capitolul 3

Create successful ePaper yourself

Delete template?

Save as template?