selezionare composizione occorre

Elaborazione SGML 2735 

semplificato e abbreviato dal file delle entità esterne utilizzato attualmente da ALtools (il sistema 

di composizione di Appunti Linux). 

 

 

 

 

 

 

... 

]]> 

Nella parte iniziale vengono dichiarate le entità parametriche ‘EntitaASCII8’, ‘EntitaLaTeX’ 

e ‘EntitaHTML’, tutte con la stringa ‘IGNORE’. In questo modo, in condizioni normali, nessuna 

delle istruzioni di definizioni delle entità generali verrebbe presa in considerazione. Per selezionare 

un gruppo soltanto, basterebbe che l’entità parametrica giusta contenesse la stringa ‘INCLUDE’. 

Per farlo si interviene direttamente nella riga di comando di ‘nsgmls’ (SP): 

cat file_sgml | nsgmls -c catalogo -ientità_parametrica | ... 

In pratica, con l’opzione ‘-i’ di ‘nsgmls’, si fa in modo di introdurre una dichiarazione del tipo 

 

e questa prende automaticamente il sopravvento su qualunque altra dichiarazione analoga (della 

stessa entità parametrica) in qualunque altra parte del DTD. 

Per tornare all’esempio mostrato del file delle entità generali, si potrebbero selezionare le entità 

riferite alla trasformazione in LaTeX con un comando simile a quello seguente: 

$ cat mio_file.sgml | nsgmls -c ./catalogo -iEntitaLaTeX | ... 

250.5.2 Insieme di caratteri 

Attraverso le entità generali che si definiscono, è possibile fare in modo che il sistema di composizione 

finale riceva i codici adatti per tutti i simboli «strani» che si vogliono poter inserire. 

Tuttavia, spesso si vorrebbe poter scrivere liberamente utilizzando il minor numero possibile di 

macro ‘&...;’. Per la precisione, il minimo in assoluto è quello che richiede l’SGML stesso: occorre 

proteggere i simboli ‘&’, ‘>’ e ‘

2736 Elaborazione SGML 

Per risolvere questo problema una volta per tutte, si utilizza una tecnica che impone una rielaborazione 

intermedia del risultato generato da SP dall’analisi del sorgente SGML. Questa 

tecnica si basa sull’uso di entità generali di tipo ‘SDATA’. Quando queste vengono sostituite 

dallo stesso analizzatore SGML, appaiono delimitate dalla sequenza ‘\|’, cosa che ne facilita 

l’individuazione da parte di un programma di rielaborazione. 

Figura 250.1. Passaggi per risolvere il problema dell’insieme dei caratteri. 

.-----------. .--------------. 

| file SGML |------------------>. .


caso di LaTeX, la stringa ‘\|[num ]\|’ viene sostituita con ‘\\#’. Nel risultato finale, 

LaTeX richiede solo la stringa ‘\#’, ma fino a che si resta nell’ambito del risultato generato 

da ‘nsgmls’, le barre oblique inverse devono essere raddoppiate. 

5. Attraverso ‘sgmlsasp’, oppure ‘sgmlspl’, si genera il risultato finale da passare al sistema 

di composizione. 

250.6 Organizzazione degli strumenti SGML in una 

distribuzione GNU/Linux 

È raro che una distribuzione GNU/Linux si occupi di organizzare gli strumenti SGML, mentre 

questo sarebbe molto importante per tutti gli sviluppatori di programmi riferiti a questo standard 

e a quelli derivati. A questo proposito, vale la pena di osservare la distribuzione Debian che mette 

in pratica alcune buone idee. 1 

Il problema fondamentale sta nello stabilire la collocazione dei DTD e dei file delle entità generali 

relative. Infine, si tratta di definire un catalogo unico per tutti questi DTD e per i file delle entità. 

I file dei DTD vengono collocati nella directory ‘/usr/share/sgml/dtd/’, mentre quelli delle 

entità si trovano nella directory ‘/usr/share/sgml/entities/’. A questo punto, per facilitare 

l’indicazione dei file nel catalogo, questo dovrebbe trovarsi opportunamente nella directory 

‘/etc/sgml/’, con il nome ‘catalog’; così il file del catalogo può essere aggiornato senza 

interferire con la gerarchia ‘/usr/’ che deve poter essere montata in sola lettura. 

Avendo organizzato tutto in questo modo, ogni volta che si installa un nuovo pacchetto di 

strumenti SGML, questo dovrebbe provvedere ad aggiungere nel catalogo standard tutte le 

dichiarazioni che lo riguardano. 

La base di questa struttura nella distribuzione Debian è costituita dai pacchetti 

‘sgml-base_ 

* .deb’ e ‘sgml-data_ * .deb’. 

250.7 perlSGML: analisi di un DTD 

Quando si realizza un DTD per qualche scopo, potrebbe essere importante disporre di strumenti 

adatti alla sua analisi, per verificare la sua coerenza con l’obiettivo che ci si pone. Sono importanti 

a questo proposito i programmi di servizio del pacchetto perlSGML. Qui ne vengono mostrati 

solo alcuni. 

In generale, per fare in modo che questi programmi di analisi funzionino correttamente, è 

opportuno che la directory corrente nel momento in cui si avviano corrisponda a quella in 

cui si trova il catalogo, in maniera tale che poi da lì, possa trovare le entità che fossero state 

collocate eventualmente in un file esterno. Se poi il file del catalogo non si chiama ‘catalog’, 

occorre usare l’opzione opportuna per indicare il nome corretto. 

250.7.1 $ dtd2html 

dtd2html [opzioni] file_dtd ... 

Il programma ‘dtd2html’ è il più appariscente nel pacchetto perlSGML. Genera un rapporto sui 

DTD elencati alla fine degli argomenti, in forma di ipertesto HTML. 

1 Apparentemente, anche la distribuzione Red Hat si sta preparando per questo. Per quanto riguarda la versione 

6.0, sono disponibili dei pacchetti RPM organizzati in modo simile a quelli della distribuzione Debian, nella raccolta 

«Powertools».

2738 Elaborazione SGML 

Alcune opzioni 

-help 

Emette un riepilogo dell’utilizzo del programma. 

-catalog catalogo 

Permette di indicare il nome del file contenente il catalogo SGML. In mancanza di questa 

opzione, viene cercato il file ‘catalog’ nella directory corrente. 

-outdir directory 

Permette di specificare una directory diversa da quella corrente, nella quale verranno 

generate le pagine HTML. 

-ents 

Fa in modo che venga aggiunta una pagina HTML con l’elenco delle entità dichiarate nel 

corpo principale del DTD. 

-tree 

Fa in modo che venga aggiunta una pagina HTML con l’albero degli elementi SGML 

collegati tra loro in base alle dipendenze relative. 

Esempi 

$ dtd2html dtd/mio.dtd 

Analizza il file ‘./dtd/mio.dtd’ utilizzando il catalogo ‘./catalog’ e generando i file 

HTML nella directory corrente. 

$ dtd2html -catalog catalogo dtd/mio.dtd 

Come nell’esempio precedente, specificando che il catalogo è contenuto nel file ‘./ 

catalogo’. 

$ dtd2html -catalog catalogo -outdir /tmp dtd/mio.dtd 

Come nell’esempio precedente, richiedendo che i file HTML siano creati nella directory 

‘/tmp/’. 

$ dtd2html -catalog catalogo -outdir /tmp -ents dtd/mio.dtd 

Come nell’esempio precedente, richiedendo anche la generazione di una pagina dedicata 

alle entità dichiarate nel DTD. 

$ dtd2html -catalog catalogo -outdir /tmp -ents -tree dtd/mio.dtd 

Come nell’esempio precedente, richiedendo anche la generazione di una pagina contenente 

l’albero degli elementi. 

250.7.2 $ dtddiff 

dtddiff [opzioni] file_dtd file_dtd 

Il programma ‘dtddiff’ permette di confrontare due DTD, per conoscere le differenze di 

contenuto tra i due. Il risultato viene emesso attraverso lo standard output. 


-help 

Emette un riepilogo dell’utilizzo del programma.


-catalog catalogo 

Permette di indicare il nome del file contenente il catalogo SGML. In mancanza di questa 

opzione, viene cercato il file ‘catalog’ nella directory corrente. 

Esempi 

$ dtddiff -catalog catalogo dtd/mio.dtd dtd2/mio.dtd 

Confronta i DTD ‘./dtd/mio.dtd’ e ‘./dtd/mio2.dtd’, utilizzando il catalogo ‘./ 

catalogo’. 

Appunti di informatica libera 2003.01.01 --- Copyright © 2000-2003 Daniele Giacomini -- daniele @ swlibero.org

Dichiarazione SGML 

Capitolo 251 

Fino a questo punto è stata ignorata la dichiarazione SGML, che in generale non dovrebbe essere 

un problema per l’utilizzatore, ma rappresenta pur sempre un elemento determinante per la 

comprensione della filosofia di questo linguaggio. 

La dichiarazione SGML è qualcosa che viene prima del DTD; serve a definire la forma del sorgente 

e alcune caratteristiche del linguaggio utilizzato. Attraverso la dichiarazione si possono 

modificare molti comportamenti convenzionali, facendo anche cambiare aspetto notevolmente 

al linguaggio stesso. Tutto quello che è stato descritto di SGML nei capitoli precedenti, fa affidamento 

sulla dichiarazione SGML raccomandata, ma volendo si potrebbero cambiare molte 

cose. Per fare un esempio pratico, XML può essere inteso come un modo di utilizzare SGML in 

base a una dichiarazione particolare, realizzata per le esigenze specifiche della pubblicazione di 

documentazione attraverso la rete. 

La dichiarazione SGML si fa generalmente in un file apposito; tutte le direttive sono contenute 

all’interno di un’istruzione sola del tipo seguente: 

 

In pratica, nel modello mostrato, le direttive occupano il posto dei puntini di sospensione. 

Si osservi che lo standard originale ISO prevedeva la definizione ‘8879-1986’, che successivamente 

è stata modificata nel modo mostrato, ovvero ‘8879:1986’. Lo stesso ragionamento 

vale per gli altri standard ISO che prevedono l’indicazione dell’anno. 

Esiste una variante recente allo standard ISO 8879:1996 e precisamente si tratta di cambiamenti 

pensati per facilitare la comunicazione attraverso la rete. La stringa che fa riferimento a questo 

standard esteso è: 

"ISO 8879:1986 (WWW)" 

La si ritrova in particolare nella dichiarazione dell’HTML 4. 

* e nell’XML. 

In questo capitolo vengono mostrate solo alcune direttive che possono essere utili per capire 

il senso della dichiarazione SGML. Per approfondire lo studio di questo linguaggio, bisogna 

procurarsi la documentazione originale ISO. 

251.1 Codifica 

La codifica dei caratteri utilizzata nel sorgente SGML non può essere ignorata, soprattutto perché 

alcuni codici hanno significati speciali che vanno oltre il carattere vero e proprio. Le direttive 

riferite alla codifica del sorgente iniziano con la parola chiave ‘CHARSET’ che delimita la sezione 

relativa: 

CHARSET 

definizione_riferita_all’insieme_di_caratteri 

... 

In generale, si inizia con la definizione di un insieme standard di riferimento, attraverso l’uso di 

un identificatore standard: 

BASESET insieme_di_caratteri 

2740

Dichiarazione SGML 2741 

L’identificatore che definisce lo standard è normalmente una stringa abbastanza dettagliata. 

L’esempio seguente definisce l’insieme di partenza corrispondente all’ISO 646:1983, ovvero 

all’ASCII tradizionale: 

BASESET 

"ISO 646:1983//CHARSET 

International Reference Version (IRV)//ESC 2/5 4/0" 

La direttiva appare su due righe, ma si tratta solo di una possibilità e non di una necessità, tanto 

che in alcuni casi la si può vedere anche distribuita su tre righe. Dopo la definizione dell’insieme 

di partenza, si può descrivere nel dettaglio l’utilizzo e la conversione dei codici corrispondenti ai 

caratteri: 

DESCSET 

inizio quantità {corrispondenza|UNUSED} 

... 

Si osservi l’esempio: 

DESCSET 

0 9 UNUSED 

9 2 9 

11 2 UNUSED 

13 1 13 

14 18 UNUSED 

32 95 32 

127 1 UNUSED 

Il primo numero indica il codice corrispondente al carattere iniziale di un raggruppamento composto 

da una sequenza di n caratteri; il secondo valore indica una quantità di caratteri che possono 

essere ignorati oppure anche trasformati, partendo dal codice rappresentato dal terzo valore. 

Nell’esempio, i codici che vanno da 0 a 8, in decimale, non sono utilizzati; inoltre i codici da 

9 a 10 vengono convertiti con il codice 9 e seguenti (in pratica non vengono convertiti affatto). 

In sostanza, ciò che mostra l’esempio non ha lo scopo di convertire alcunché, ma solo di filtrare 

codici inutili: vengono lasciati passare i caratteri grafici, a partire dallo spazio, oltre a , 

e . Volendo esprimere la cosa in modo più esplicito, si possono usare anche dei 

commenti descrittivi: 

DESCSET 

0 9 UNUSED 

9 1 9 -- HT -- 

10 1 10 -- LF -- 

11 2 UNUSED 

13 1 13 -- CR -- 

14 18 UNUSED 

32 95 32 -- SP e altri caratteri grafici -- 

127 1 UNUSED 

La sequenza di direttive ‘BASESET’ e ‘DESCSET’ può anche essere ripetuta, quando dopo l’ASCII 

normale, i primi 7 bit, si vuole fare riferimento a qualcosa di più. Per esempio, la dichiarazione 

relativa alla codifica dell’HTML 3.2, si presenta come si vede di seguito: 

CHARSET 

BASESET 

"ISO 646:1983//CHARSET 

International Reference Version 

(IRV)//ESC 2/5 4/0" 

DESCSET 0 9 UNUSED 

9 2 9 

11 2 UNUSED 

13 1 13 

14 18 UNUSED 

32 95 32 

127 1 UNUSED 

BASESET 

"ISO Registration Number 100//CHARSET 

ECMA-94 Right Part of

2742 Dichiarazione SGML 

Latin Alphabet Nr. 1//ESC 2/13 4/1" 

DESCSET 128 32 UNUSED 

160 96 32 

Rispetto a quanto già visto si aggiunge il riferimento allo standard ISO 8859-1 (Latin-1). Si può 

vedere che vengono esclusi i primi 32 codici a partire dal numero 128, che non contengono 

simboli grafici utili. 

251.2 Capacità 

Per qualche ragione storica, che ormai non avrebbe più motivo di sussistere, è prevista una sezione 

attraverso la quale si definisce la capacità elaborativa dell’analizzatore SGML. Si tratta di 

stabilire dei limiti di spazio per la gestione di una serie di informazioni. In generale, non dovrebbe 

essere determinante la dimensione da dare ai vari attributi riferiti a questa capacità; tuttavia, si 

tratta di un’indicazione che rimane, per la quale si fa riferimento allo standard, oppure si indica 

semplicemente che non ci sono limiti. Nel primo caso si indica, 

CAPACITY PUBLIC 

nel secondo soltanto 

CAPACITY NONE 

"ISO 8879:1986//CAPACITY Reference//EN" 

A titolo di esempio si mostra anche la direttiva relativa riferita all’HTML 3.2 e 4: 

CAPACITY 

SGMLREF 

TOTALCAP 150000 

GRPCAP 150000 

ENTCAP 150000 

Si osservi la parola chiave ‘SGMLREF’ che può essere usata anche altrove. Rappresenta il 

riferimento ai valori predefiniti SGML, prima di modificarli o integrarli con le richieste 

successive. 

251.3 Ambito 

La sintassi del linguaggio SGML può essere alterata in parte, attraverso una serie di direttive 

descritte nella prossima sezione. L’ambito della definizione della sintassi SGML può essere 

controllato attraverso la direttiva ‘SCOPE’: 

SCOPE DOCUMENT|INSTANCE 

La direttiva ‘SCOPE DOCUMENT’ indica che la sintassi si applica sia al DTD, sia al sorgente 

SGML; nell’altro caso, ‘SCOPE INSTANCE’ si riferisce solo al sorgente, mentre il DTD va 

interpretato in base alla sintassi standard predefinita (la sintassi concreta di riferimento ). 

Di solito si usa la direttiva ‘SCOPE DOCUMENT’. 

251.4 Sintassi concreta 

La sintassi concreta è ciò che definisce i delimitatori dei marcatori SGML, il ruolo dei codici di 

controllo e altri dettagli riferiti alla sintassi SGML. In particolare si parla di sintassi concreta di 

riferimento quando si vuole indicare quella predefinita, ovvero quella a cui si fa riferimento di 

solito. Le direttive che compongono la definizione della sintassi concreta sono introdotte dalla 

sezione ‘SYNTAX’, a cui spesso segue la stringa di un identificatore pubblico, per richiamare inizialmente 

una serie di caratteristiche standard che poi vengono alterate o integrate dalle direttive 

successive: 

SYNTAX PUBLIC "ISO 8879:1986//SYNTAX Reference//EN"


251.4.1 Caratteri da evitare 

La prima cosa che si specifica all’interno della dichiarazione della sintassi concreta è l’elenco 

dei numeri decimali corrispondenti ai codici, o caratteri, che non devono essere usati nel testo 

del sorgente. Questi non verranno passati all’applicazione successiva dall’analizzatore SGML. 

All’interno dei codici esclusi in questo modo ci possono essere comunque simboli o caratteri di 

controllo che servono in altri ambiti, come si vedrà in seguito. 

La codifica a cui si fa riferimento, non è quella ottenuta dopo la trasformazione con la direttiva 

‘DESCSET’ della sezione ‘CHARSET’, ma quella della stessa direttiva della sezione ‘SYNTAX’, 

come verrà descritto tra poco. 

La direttiva in questione è molto semplice; spesso, quando si tratta dell’ASCII, si utilizza 

direttamente l’esempio seguente: 

SHUNCHAR CONTROLS 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 

17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 127 

251.4.2 Codifica nell’ambito della sintassi concreta 

Nell’ambito della definizione della sintassi concreta, è necessario specificare nuovamente la codifica 

di partenza e la conversione eventuale. Tutto procede esattamente come è già stato visto in 

precedenza, nella sezione ‘CHARSET’, con la differenza che in generale si preferisce lasciare tutto 

come si trova: 

BASESET "ISO 646:1983//CHARSET 

International Reference Version 

(IRV)//ESC 2/5 4/0" 

DESCSET 0 128 0 

L’esempio si riferisce al caso in cui si utilizzi solo l’ASCII. Comunque, si può osservare che la 

direttiva ‘DESCSET’ non esclude alcunché e non trasforma alcun carattere. 

251.4.3 Codici con funzioni speciali 

Si possono definire alcuni codici con funzioni speciali, attribuendo loro un nome, a cui si accede 

con macro del tipo ‘&#nome ;’. Spesso si fa uso di queste macro nel DTD, precisamente nelle 

mappe di sostituzione. Si ricorderà che la macro ‘&RE;’ fa riferimento convenzionalmente alla 

fine del record. Si osservi l’esempio seguente: 

FUNCTION 

RE 13 

RS 10 

SPACE 32 

TAB SEPCHAR 9 

Si tratta della direttiva ‘FUNCTION’ a cui segue la dichiarazione di una serie di nomi, abbinati 

al codice relativo. Si può osservare il caso del nome ‘TAB’, a cui si aggiunge la parola chiave 

‘SEPCHAR’: si tratta effettivamente del carattere , che però, ai fini della sintassi concreta, 

viene tradotto con ciò che corrisponde a ‘&SPACE;’, cioè uno spazio normale. 

L’esempio mostra la definizione tipica di questa direttiva. Si può osservare che ‘RE’ è abbinato 

a , per cui si suppone che il file sorgente SGML sia organizzato in modo da avere 

dei codici di interruzione di riga pari a , come avviene in Dos. Dipende molto 

dall’analizzatore SGML come funziona la cosa. In pratica, l’analizzatore potrebbe convertire 

autonomamente il file in questo modo, oppure potrebbe fare altre considerazioni.


251.4.4 Nomi 

Attraverso la sottosezione ‘NAMING’ è possibile definire quali caratteri possono essere usati nei 

«nomi». In questo modo si intendono i nomi degli elementi, delle entità, degli attributi e di alcuni 

tipi di valori da associare agli attributi. 

In generale, si fa riferimento alle lettere latine dell’alfabeto inglese e alle cifre numeriche, tenendo 

conto che in generale è concesso solo di iniziare con una lettera. Per modificare questo assunto 

si interviene in direttive particolari, che limitano il primo carattere, oppure quelli restanti. 

• LCNMSTRT "caratteri_ulteriori" 

UCNMSTRT "caratteri_ulteriori" 

Lower case name start, Upper case name start 

Descrivono rispettivamente il primo carattere minuscolo e maiuscolo. In generale, si indica 

semplicemente la stringa nulla, ‘""’. 

• LCNMCHAR "caratteri_ulteriori" 

UCNMCHAR "caratteri_ulteriori" 

Lower case name characters, Upper case name characters 

Descrivono rispettivamente i caratteri successivi al primo, minuscoli e maiuscoli. In 

generale, si indica semplicemente la stringa nulla, ‘""’. 

• NAMESTRT elenco_codici 

NAMECHAR elenco_codici 

Name start, Name characters 

Descrivono rispettivamente i codici utilizzabili nel primo carattere e in quelli restanti. Si 

usano queste direttive particolarmente nella definizione di XML. 

• NAMECASE 

Si tratta di un’ulteriore sotto-sottosezione, con la quale si definisce la trasformazione o 

meno in maiuscolo: 

– GENERAL YES|NO 

in questo caso si controlla la conversione in maiuscolo di tutti i nomi, tranne le entità 

(nell’SGML tradizionale si attiva questa opzione); 

– ENTITY YES|NO 

si controlla la conversione in maiuscolo dei nomi di entità e dei loro riferimenti: le 

macro (nell’SGML tradizionale non si attiva questa opzione). 

Nell’SGML normale si utilizza abitualmente la sezione ‘NAMING’ nel modo seguente: 

NAMING 

LCNMSTRT "" 

UCNMSTRT "" 

LCNMCHAR "-." 

UCNMCHAR "-." 

NAMECASE 

GENERAL 

ENTITY 

YES 

NO 

In questo modo, si può osservare che i nomi possono contenere anche il trattino (‘-’) e il punto 

(‘.’), ma non possono iniziare così; inoltre, tutti i nomi, tranne quelli delle entità, vengono convertiti 

in maiuscolo (si parla di normalizzazione ), per cui non fa differenza in che modo sono 

stati scritti.


251.4.5 Delimitatori 

La sottosezione introdotta dalla parola chiave ‘DELIM’ può servire per intervenire nella definizione 

dei delimitatori. In generale non si modifica nulla e ci si limita a confermare lo standard di 

riferimento, attraverso la parola chiave ‘SGMLREF’: 

DELIM 

GENERAL 

SHORTREF 

SGMLREF 

SGMLREF 

A volte viene disabilitato l’uso delle mappe di sostituzione nel DTD, attraverso la direttiva 

‘SHORTREF NONE’, come avviene in XML. 

Nell’HTML 4 e in XML è stata aggiunta la possibilità di indicare delle macro carattere nella forma 

‘&xn;’, per rappresentare i caratteri attraverso cifre esadecimali. Per ottenere questo risultato, 

dopo la direttiva ‘GENERAL SGMLREF’, si aggiunge la dichiarazione di ‘HCRO’: 

DELIM 

GENERAL 

HCRO 

SHORTREF 

SGMLREF 

"&#x" 

SGMLREF 

Naturalmente, in XML ci sono poi altre aggiunte, che qui non vengono mostrate. 

251.4.6 Nomi riservati 

Alcune nomi che hanno significati speciali possono essere modificati nella sottosezione ‘NAMES’. 

In generale, queste cose non si fanno, per cui si abbina semplicemente la dichiarazione 

predefinita: ‘SGMLREF’: 

NAMES 

SGMLREF 

251.4.7 Quantità 

Nell’ambito della sintassi concreta è possibile definire il limite a una serie di quantità. Di solito 

non ci si preoccupa di queste cose, oppure si scrivono direttive per richiedere limiti molto elevati. 

Per fare riferimento allo standard, si utilizza la parola chiave ‘SGMLREF’ come al solito: 

QUANTITY SGMLREF 

Eventualmente si aggiungono le varianti che si ritiene necessario apportare. L’esempio seguente 

è tratto dalla configurazione predefinita di SP e appare evidente l’intenzione di estendere al 

massimo i limiti, anche senza spiegare nel dettaglio il significato di ogni parametro: 

QUANTITY SGMLREF 

ATTCNT 99999999 

ATTSPLEN 99999999 

DTEMPLEN 24000 

ENTLVL 99999999 

GRPCNT 99999999 

GRPGTCNT 99999999 

GRPLVL 99999999 

LITLEN 24000 

NAMELEN 99999999 

PILEN 24000 

TAGLEN 99999999 

TAGLVL 99999999 

Con XML, o comunque con la dichiarazione «Web SGML», ‘ISO 8879:1986 (WWW)’, è 

possibile usare una forma differente e più intuitiva per indicare che non si vogliono porre limiti: 

QUANTITY NONE


251.5 Proprietà 

L’ultima sezione della dichiarazione SGML serve a raccogliere la definizione delle proprietà: 

‘FEATURES’. Contiene in particolare tre sottosezioni intitolate rispettivamente ‘MINIMIZE’, 

‘LINK’ e ‘OTHER’. Non è il caso di approfondire queste definizioni, a parte qualche direttiva che 

può essere interessante. 

Per cominciare, conviene osservare la sezione ‘FEATURES’ dell’HTML 4: 

FEATURES 

MINIMIZE 

DATATAG NO 

OMITTAG YES 

RANK NO 

SHORTTAG YES 

LINK 

SIMPLE NO 

IMPLICIT NO 

EXPLICIT NO 

OTHER 

CONCUR NO 

SUBDOC NO 

FORMAL YES 

Nella sottosezione ‘MINIMIZE’ è importante tenere in considerazione l’opzione ‘DATATAG’, che 

in generale è bene sia disattivata come appare nell’esempio. Questa dovrebbe servire per specificare 

una stringa che nel testo deve essere presa in considerazione come una chiusura implicita di 

un elemento. L’opzione ‘OMITTAG’ consente di utilizzare le regole di minimizzazione nel DTD. 

La sottosezione ‘OTHER’ permette di definire delle caratteristiche interessanti riguardo all’organizzazione 

del DTD, del sorgente e dei cataloghi. L’opzione ‘CONCUR’ consente, se attivata, di 

gestire più DTD nello stesso documento. Ciò può servire quando è consentita l’aggregazione 

di più sorgenti che a loro volta utilizzano DTD differenti. Data la complessità che si creerebbe 

in questo modo, tale opzione viene disabilitata normalmente. L’opzione ‘SUBDOC’ permette, 

se abilitata, di aggregare più sorgenti SGML assieme (che di solito condividono lo stesso DTD 

implicitamente); se si abilita l’opzione occorre aggiungere l’indicazione del numero massimo di 

livelli di annidamento a cui si può arrivare. L’opzione ‘FORMAL’, se attivata, serve a richiedere 

l’uso corretto degli identificatori pubblici; se non è attivata, l’identificazione può avvenire in 

modo meno rigoroso. 

L’esempio seguente mostra l’impostazione tradizionale di un sistema SGML: 

FEATURES 

MINIMIZE 

DATATAG 

OMITTAG 

RANK 

SHORTTAG 

NO 

YES 

YES 

YES 

LINK 

SIMPLE YES 1000 

IMPLICIT YES 

EXPLICIT YES 1 

OTHER 

CONCUR NO 

SUBDOC YES 99999999 

FORMAL YES


251.6 Applicazione di una dichiarazione SGML in pratica 

La dichiarazione SGML può essere attribuita attraverso il catalogo, con la direttiva ‘SGMLDECL’: 

SGMLDECL "HTML4.dcl" 

L’esempio mostra il riferimento al file ‘HTML4.dcl’, contenente la dichiarazione SGML 

desiderata. 

Potrebbe essere impossibile selezionare tra più dichiarazioni alternative. In tal caso, diventa 

necessario predisporre più cataloghi, uno per ogni tipo di dichiarazione che si intende utilizzare. 

251.7 Esempio conclusivo 

Per concludere viene mostrato un esempio completo di una dichiarazione SGML realizzata per 

poter utilizzare nel sorgente la codifica ISO 8859-1, che potrebbe essere adatta alle situazioni 

più comuni (appare anche la sezione ‘APPINFO’ che non è stata descritta). Altri esempi possono 

essere ottenuti dal pacchetto SP sorgente, nel quale si può trovare anche la dichiarazione di XML. 


NAMECASE 

GENERAL 

ENTITY 

YES 

NO 

DELIM 

GENERAL 

HCRO 

SHORTREF 

SGMLREF 

"&#x" 

SGMLREF 

NAMES 

SGMLREF 

QUANTITY NONE 

FEATURES 

MINIMIZE 

DATATAG 

OMITTAG 

RANK 

SHORTTAG 

NO 

YES 

NO 

NO 

LINK 

SIMPLE YES 1000 

IMPLICIT YES 

EXPLICIT YES 1 

OTHER 

CONCUR NO 

SUBDOC YES 99999999 

FORMAL YES 

> 

APPINFO NONE 

251.8 Riferimenti 

• The SGML/XML Web Page 

 

• Wayne L. Wohler, SGML Declarations 

 

• The SGML Newsletter 

 


SGMLtools 1.0/LinuxDoc 

Capitolo 252 

Il sistema standard utilizzato per la documentazione di GNU/Linux è basato su SGMLtools. 

SGMLtools ha utilizzato inizialmente il DTD LinuxDoc e successivamente si è rivolto verso 

DocBook. In questo capitolo si intende mostrare solo il funzionamento essenziale delle versioni 

di SGMLtools 1.0. , cioè di quegli strumenti organizzati per il vecchio DTD LinuxDoc. 

* 

Dal momento che SGMLtools/LinuxDoc utilizza fondamentalmente LaTeX per produrre documenti 

stampati, è necessario avere a disposizione il sistema TeX/LaTeX, probabilmente attraverso 

il pacchetto teTeX. Inoltre, gli strumenti SGMLtools sono composti da una serie di programmi 

Perl, per cui è necessario tale interprete per la loro esecuzione. 

252.1 Struttura 

La struttura di un sorgente SGML secondo il DTD LinuxDoc è generalmente la seguente: 

 

 

 

Titolo del documento 

 

Pinco Pallino ppallino@dinkel.brot.dg 

 

29/02/1999 

 

Breve introduzione al documento. 

 

 

 

Prima sezione 

 

Contenuto della prima sezione, 

... 

... 

(eventuali altre sezioni) 

 

Con l’istruzione ‘’ si afferma di voler utilizzare il DTD 

‘linuxdoc’. Il documento è delimitato dall’elemento ‘article’ che rappresenta uno tra i diversi 

tipi di struttura possibile del documento. Il DTD LinuxDoc è derivato dal Qwertz che era 

strutturato in modo da imitare il comportamento di LaTeX. In questo modo, nel DTD originale 

erano previste diverse strutture, tutte riferite ad analoghi tipi di documento LaTeX. La tendenza 

generale è quella di utilizzare sempre solo la struttura ‘article’, soprattutto perché lo scopo di 

SGMLtools è quello di permettere la trasformazione del sorgente SGML in un grande numero di 

altri formati, non solo LaTeX. 

Dopo l’inserimento dell’elemento ‘title’ e di tutto ciò che deve contenere (titolo, autore, descrizione 

del documento), è possibile inserire il marcatore ‘’, con il quale si intende ottenere 

un indice generale. 

Dopo l’indice generale inizia il testo del documento, suddiviso in sezioni, il cui inizio è 

evidenziato dai marcatori: ‘’, ‘’, ‘’. 

2749

2750 SGMLtools 1.0/LinuxDoc 

252.1.1 Utilizzo sommario 

Attraverso SGMLtools, si ottiene un documento finale a partire da un sorgente SGML. Per 

questo, si elabora il sorgente come si fa con un linguaggio di programmazione durante la 

compilazione. La prima fase è il controllo di validità. 

sgmlcheck sorgente_sgml 

Una volta verificata la correttezza formale dal punto di vista del DTD, si può richiedere la trasformazione 

in un altro formato. Nell’elenco seguente vengono mostrati solo alcuni tipi di trasformazione, 

i più importanti. In effetti non tutto funziona nello stesso modo e alcuni tipi di conversioni 

sono difettosi. 

Quando si progetta di realizzare un documento attraverso SGMLtools/LinuxDoc, è importante 

decidere subito quali formati devono essere ottenuti necessariamente, in modo da poter controllare 

il loro funzionamento dall’inizio dell’opera. Per esempio, il fatto che si riesca a ottenere un 

formato PostScript corretto, non garantisce che gli altri formati generino un risultato altrettanto 

buono. 1 

Conversione in LaTeX 

La conversione in LaTeX si ottiene facilmente attraverso il comando seguente: 

sgml2latex --output=tex sorgente_sgml 

Viene generato un file con lo stesso nome del sorgente, terminante con l’estensione ‘.tex’. 

Questo file contiene riferimenti a stili addizionali che fanno parte del pacchetto SGMLtools. 

Questo fatto deve essere tenuto in considerazione se si vuole poi rielaborare questo file con 

LaTeX. 

Conversione in PostScript 

La composizione del documento in PostScript avviene attraverso l’elaborazione successiva 

da parte di LaTeX, richiamato automaticamente da SGMLtools. 

sgml2latex --output=ps sorgente_sgml 

Quello che si ottiene è un file con lo stesso nome del sorgente, terminante con l’estensione 

‘.ps’. 

Conversione in HTML 

La conversione in formato HTML viene gestita completamente all’interno di SGMLtools, 

attraverso il sistema di programmi in Perl che lo compongono. 

sgml2html sorgente_sgml 

Si ottengono una serie di file HTML collegati attraverso riferimenti ipertestuali. 

252.1.2 Supporto per altri SGML 

SGMLtools ha un supporto limitato per HTML. Precisamente, consente di verificare un file 

HTML attraverso il DTD HTML 3.2. Si può usare il comando seguente, che è lo stesso visto 

nel caso dei file SGML. 

sgmlcheck sorgente_html 

1 Per fare un esempio evidente, basta pensare all’inserzione di immagini e a ciò che si può ottenere in un formato 

finale puramente testuale: niente immagini.

SGMLtools 1.0/LinuxDoc 2751 

‘sgmlcheck’ determina da solo che si tratta di un file HTML. Comunque, un file HTML corretto 

dovrebbe iniziare con la dichiarazione seguente: 

 

Eventualmente, sono ammissibili anche altre forme, 

 

 

dove ‘Draft’ si riferisce in particolare alla prima stesura della versione 3.2. 

Si potrà osservare che un file HTML apparentemente corretto dato il risultato che si ottiene con 

il programma usato per visualizzarlo, può contenere un gran numero di errori formali secondo il 

suo DTD. 

252.2 LinuxDoc più in dettaglio 

Lo standard LinuxDoc, come suggerisce il nome, è quello che si è utilizzato originariamente 

per la documentazione di GNU/Linux. Del DTD relativo, ‘linuxdoc.dtd’, vengono sfruttate 

ufficialmente solo alcune delle caratteristiche. Per esempio, la definizione dell’incorporazione 

di immagini e le tabelle sono rimaste come eredità dallo standard Qwertz, ma il loro utilizzo 

andrebbe evitato, preferendo piuttosto l’uso di strumenti SGML basati su DocBook. 

252.2.1 Preambolo e definizione dello stile 

Come accennato all’inizio del capitolo, un documento LinuxDoc inizia con un preambolo che 

descrive il tipo di documento (‘linuxdoc’ appunto), lo stile (in questo caso ‘article’), il titolo, 

l’autore e altre informazioni eventuali. 

 

 

 

Il mio primo articolo 

Pinco Pallino, pincop@dinkel.brot.dg 

v0.01, 29 febbraio 1999 

 

Breve anticipazione del contenuto del documento. 

 

 

 

Prima sezione 

 

Contenuto della prima sezione. 

 

Dopo il preambolo può essere collocato un indice generale che viene costruito automaticamente 

attraverso l’elemento ‘toc’. Quindi si può iniziare il corpo del documento suddiviso in sezioni. 

Al termine, la chiusura dello stile dichiarato nel preambolo definisce la fine del documento. 

Lo stile ‘article’ è quello standard per i documenti LinuxDoc, ed è anche quello raccomandato. 

Consente la suddivisione del documento per sezioni e non per capitoli. Viene chiuso alla fine del 

documento.


252.2.2 Suddivisione del documento 

A seconda dello stile di documento utilizzato, la suddivisione del contenuto può avvenire in modi 

differenti. In pratica, utilizzando lo stile ‘article’, la suddivisione avviene solo per sezioni, 

identificate dall’elemento ‘sect’. 

1. ‘sect’ 

2. ‘sect1’ 

3. ‘sect2’ 

Ciò significa che una sezione ‘sect’ può scomporsi in sottosezioni ‘sect1’, che a loro volta si 

possono scomporre in altre sottosezioni di livello inferiore ‘sect2’, ecc. In generale, se possibile, 

è conveniente limitarsi soltanto a due livelli di suddivisione. 

 

 

 



v0.01, 29 febbraio 1999 

 


 

 

 

Prima sezione 

 


... 

Una sottosezione 

 

Contenuto della sottosezione. 

... 

Seconda sezione 

 

... 

... 

 

L’ambiente delimitato da una sezione di qualunque livello, non richiede l’indicazione esplicita 

della sua conclusione. È invece necessaria l’inserzione dell’indicazione dell’inizio di un paragrafo, 

subito dopo il titolo della sezione stessa. L’esempio mostrato sopra dovrebbe chiarirne il 

funzionamento. 

252.2.3 Paragrafi 

Il testo di un documento normale è suddiviso in paragrafi. L’indicazione dell’inizio o della conclusione 

di un paragrafo è facoltativa. È sufficiente staccare i paragrafi con almeno una riga bianca 

per dare questa informazione a LinuxDoc. Resta comunque possibile l’indicazione esplicita dei 

paragrafi attraverso l’elemento ‘p’. È obbligatoria l’indicazione dell’inizio del primo paragrafo 

di una sezione, perché non esiste altro modo per capire quando finisce il titolo (della sezione) e 

quando inizia il testo.


252.2.4 Elenchi 

Si hanno a disposizione tre tipi di elenchi: descrittivo (‘descrip’), puntato (‘itemize’) e 

numerato (‘enum’). 

L’elenco descrittivo è definito dall’elemento ‘descrip’. Le parti descrittive di questo elenco sono 

costituite da elementi ‘tag’. Ciò che è contenuto all’interno della sequenza ‘...’ 

appare evidenziato in un’unica riga e generalmente non può contenere simboli particolari 

(dipende dal tipo di trasformazione che si vuole ottenere). Per esempio: 

 

primoprimo elemento; 

secondosecondo elemento; 

terzoterzo elemento. 

 

genera l’elenco seguente: 

primo 

primo elemento; 

secondo 

secondo elemento; 

terzo 

terzo elemento. 

L’elenco puntato è costituito dall’elemento ‘itemize’ che si articola in elementi ‘item’, che in 

pratica costituiscono le varie voci dell’elenco. Per esempio: 

 




 

genera l’elenco puntato seguente: 

* primo elemento; 

* secondo elemento; 

* terzo elemento. 

L’elenco numerato è costituito dall’elemento ‘enum’ che si articola in elementi ‘item’, come nel 

caso dell’elenco puntato. Per esempio: 

 




 

genera l’elenco numerato seguente: 

1 primo elemento; 

2 secondo elemento; 

3 terzo elemento. 

Generalmente, se il tipo di conversione lo consente, gli elenchi possono essere annidati e 

contenere anche testo normale che viene rappresentato allineato opportunamente. 

 

primo 

Primo elemento descrittivo. 

Continuazione del primo elemento descrittivo. 

secondo


Secondo elemento descrittivo. 

 

Prima suddivisione. 

 

Ulteriore suddivisione. 

Ancora un altro punto. 

 

Seconda suddivisione. 

 

Ecco un sottoelenco puntato. 

Un secondo elemento dell’elenco puntato. 

 

Terza suddivisione. 

 

terzo 

Terzo elemento descrittivo. 

 

L’esempio sopra riportato si traduce in qualcosa che è simile a ciò che segue: 

primo 

Primo elemento descrittivo. 

Continuazione del primo elemento descrittivo. 

secondo 

Secondo elemento descrittivo. 

1 Prima suddivisione. 

a 

b 

Ulteriore suddivisione. 

Ancora un altro punto. 

2 Seconda suddivisione. 

* Ecco un sottoelenco puntato. 

* Un secondo elemento dell’elenco puntato. 

3 Terza suddivisione. 

terzo 

Terzo elemento descrittivo. 

252.2.5 Inclusione di testo letterale 

Si incontra spesso la necessità di includere in un documento del testo letterale. In generale si 

tratta di listati di programma o cose simili che possono contenere caratteri o simboli che di solito 

dovrebbero essere scritti utilizzando dei codici macro particolari. Per questo si utilizza l’elemento 

‘verb’. 

Al suo interno è consentito includere un testo che verrà riprodotto esattamente com’è, spazi e 

caratteri strani inclusi, utilizzando, quando possibile, lo stesso carattere usato per il testo normale. 

Per quanto riguarda la libertà di inclusione di simboli, esiste comunque una piccola limitazione: 

• il simbolo ‘&’ può essere inserito solo con un codice macro ‘&ero;’ (mentre nel testo 

normale si usa la macro ‘&’);


• la sequenza di simboli minore+barra obliqua (‘


252.2.8 Riferimenti incrociati 

Si tratta di riferimenti interni o esterni al documento. Generalmente, all’interno del documento 

si utilizza l’elemento ‘label’ come segnaposto e l’elemento ‘ref’ come puntatore. Per fare dei 

riferimenti all’esterno del documento, si fa uso dell’elemento ‘url’ oppure di ‘htmlurl’. 

Un’etichetta, definita attraverso l’elemento ‘label’, permette di marcare una posizione nel documento 

a cui si vuole poter fare riferimento. Si tratta di un elemento vuoto che contiene un 

attributo obbligatorio: ‘ID’. Questo attributo contiene il valore dell’etichetta che identifica quindi 

la posizione che si vuole marcare. 

Note personali 

 

bla bla bla bla... 

L’esempio mostra un possibile uso di ‘label’ per marcare l’inizio di una sezione. In linea di 

massima, un’etichetta di questo genere permette di fare riferimenti di due tipi: la pagina in cui si 

trova e il numero della sezione o dell’oggetto, in relazione al contesto in cui si trova. Un’etichetta 

può apparire nei contesti seguenti: 

• all’interno di testo normale, facendo riferimento al capitolo e alla sezione in cui si trova; 

• all’interno di un elemento ‘caption’ di una figura, facendo riferimento al numero della 

figura; 

• all’interno di un elemento ‘caption’ di una tabella, facendo riferimento al numero della 

tabella. 

È importante che queste etichette-segnaposto non contengano caratteri strani, altrimenti il 

programma di composizione potrebbe non gestirle correttamente. 

Un elemento ‘ref’ si comporta come puntatore o riferimento a un’etichetta definita attraverso 

l’elemento ‘label’. All’interno di un documento stampato genera un riferimento numerico 

che dipende dal contesto in cui si trova l’etichetta (il numero della sezione, della figura o della 

tabella), mentre in un documento HTML genera un riferimento ipertestuale (link). 

Si tratta di un elemento vuoto che contiene un attributo obbligatorio, ‘ID’, e uno opzionale, 

‘NAME’. L’attributo ‘ID’ contiene il nome dell’etichetta a cui si intende fare riferimento, l’attributo 

‘NAME’ viene inserito per dare un nome al riferimento che viene creato quando si genera un 

documento HTML. 

Vedere la sezione . 

Un elemento ‘pageref’ di comporta come puntatore o riferimento a un’etichetta. All’interno di 

un documento stampato genera un riferimento al numero della pagina che contiene l’etichetta. 2 

Si tratta di un elemento vuoto che contiene un attributo obbligatorio, ‘ID’, destinato a contenere 

il nome dell’etichetta a cui si intende fare riferimento. 

Un elemento ‘url’ si comporta come riferimento a un URI. All’interno di un documento stampato 

genera la rappresentazione di questo indirizzo URI, mentre in un documento HTML crea un 

riferimento ipertestuale vero e proprio. Un elemento ‘htmlurl’ si comporta in maniera analoga, 

ma non riporta l’indirizzo URI nel documento stampato. 3 

2 Non ha senso nella traduzione HTML. 

3 L’elemento ‘htmlurl’ crea qualche problema quando si vogliono indicare caratteri speciali nell’URI, come nel caso 

della tilde. Sotto questo aspetto, per evitare problemi, è meglio limitarsi all’uso di ‘url’.


Si tratta di elementi vuoti che contengono un attributo obbligatorio, ‘URL’, destinato a indicare 

l’indirizzo URI a cui si intende fare riferimento, e uno opzionale, ‘NAME’. Si osservi la differenza 

tra i due tipi di puntatori attraverso l’esempio seguente: 

 

è il progetto di documentazione di Linux in italiano. 

 

è il progetto di documentazione di Linux in italiano. 

Nel primo caso, assieme al valore dell’attributo ‘NAME’ viene visualizzato anche l’URI, mentre 

nel secondo viene mostrato solo il valore di ‘NAME’. 

L’elemento ‘footnote’ permette di inserire una nota che apparirà stampata a piede di pagina. 

Purtroppo, Non funziona in alcun modo nella conversione in HTML. 

LinuxDoc è una derivazione di 

QwertzIl nome della tastiera tedesca.. 

252.2.9 Indici 

Il sistema è in grado di generare automaticamente l’indice generale del documento e, unicamente 

per la conversione in LaTeX, un indice analitico. 

Per ottenere l’indice generale è sufficiente inserire l’elemento ‘toc’ (vuoto) subito dopo il 

preambolo. L’esempio seguente mostra in che modo si può inserire un indice di questo tipo. 

 

 

 



v0.01, 29 febbraio 1999 

 


 

 

 

Prima sezione 

 


 

Ogni tipo di conversione in un formato finale del documento SGML gestisce la generazione 

dell’indice generale a modo proprio. Generalmente, sono garantiti solo due livelli di titoli 

(sezioni). 

L’indice analitico è disponibile solo per la conversione attraverso LaTeX. Si ottiene marcando 

alcune porzioni di testo attraverso l’elemento ‘nidx’, oppure ‘ncdx’, come nell’esempio 

seguente: 

Pallini e sferepallinosfera 

 

Questa sezione tratta di pallini e sfere in generale, fino a giungere 

alla descrizione dei cuscinetti a sfera.cuscinetto a sfera 

... 

Quanto contenuto all’interno degli elementi ‘nidx’ e ‘ncdx’ non viene a fare parte del testo; 

tutte le conversioni che non possono farne uso lo trattano come un commento da ignorare. La


conversione in LaTeX genera corrispondentemente il comando LaTeX ‘\index{...}’, ma nel caso 

particolare di ‘ncdx’, vengono aggiunti dei codici di formattazione in modo tale che nell’indice 

la stringa corrispondente appaia evidenziata con un testo dattilografico. 

Per usare in pratica l’indice analitico, occorrono diverse fasi: 

• la generazione del documento finale attraverso LaTeX; 

• la generazione di un file indice, sempre attraverso LaTeX; 

• la rielaborazione del file indice; 

• la costruzione di un documento finale attraverso l’indice, in modo da poterlo abbinare al 

documento principale. 

La generazione del file indice avviene attraverso il comando seguente: 

sgml2latex --makeindex sorgente_sgml 

Si ottiene un file, il cui nome ha la stessa radice del sorgente SGML e l’aggiunta dell’estensione 

‘.idx’. Questo file deve essere rielaborato da ‘makeindex’ che è un programma abbinato alle 

distribuzioni comuni di LaTeX. 

makeindex < indice_generato 

> indice_rielaborato 

Il file dell’indice rielaborato potrebbe avere la fisionomia dell’esempio seguente: 

\begin{theindex} 

\item cuscinetto a sfera, 1 

\item cuscino, 15 

\indexspace 

\item pallino, 87 

\item pallone, 82 

\item pallottola, 54, 55 

\item pallottoliere, 50 

\indexspace 

\item {\tt sfera}, 30, 43 

\item steroide, 23 

\end{theindex} 

Per giungere a un risultato finale, cartaceo, occorre aggiungergli qualcosa in modo che diventi un 

documento LaTeX vero e proprio. Come nell’esempio seguente: 

\documentclass[a4paper]{article} 

\usepackage[italian]{babel} 

\usepackage[latin1]{inputenc} 

\usepackage[T1]{fontenc} 

\begin{document} 

\begin{theindex} 

\item cuscinetto a sfera, 1 

\item cuscino, 15 

\indexspace 

\item pallino, 87


\item pallone, 82 

\item pallottola, 54, 55 

\item pallottoliere, 50 

\indexspace 

\item {\tt sfera}, 30, 43 

\item steroide, 23 

\end{theindex} 

\end{document} 

In tal modo, attraverso LaTeX si può passare alla trasformazione in un documento finale DVI; 

successivamente, attraverso ‘dvips’, si può ottenere una trasformazione in PostScript. 

latex documento_latex 

dvips -o documento_ps documento_dvi 

252.2.10 Inclusione di immagini 

All’interno di un documento è possibile fare riferimento a immagini in formato EPS (Encapsulated 

PostScript), che vengono utilizzate nella trasformazione in PostScript attraverso LaTeX e 

‘dvips’. Parallelamente è possibile fare anche riferimento a immagini (di solito equivalenti) in 

formati diversi, adatti alla trasformazione in HTML. 

L’elemento ‘figure’ racchiude le informazioni necessarie per l’inserzione di un’immagine. All’interno 

del marcatore di apertura è possibile specificare la posizione prescelta dell’immagine, 

per la trasformazione attraverso LaTeX, utilizzando l’attributo ‘LOC’ (location). In pratica conviene 

quasi sempre utilizzare la stringa ‘htbp’ che dice a LaTeX di collocare l’immagine nel 

posto più adatto, cominciando dalla posizione di partenza (here), quindi nella parte superiore 

della pagina (top), poi ancora nella parte inferiore (bottom) e infine, se ogni tentativo fallisce, in 

una pagina dedicata (page). Il valore predefinito di questo attributo è ‘tbp’ con il significato che 

si può intuire. 

 

 

 

L’esempio indica di visualizzare l’immagine ‘esempio.ps’ collocata nella directory ‘figure/’ 

a partire dalla posizione corrente. 

L’elemento ‘eps’ serve all’interno di un elemento ‘figure’ per definisce il file da visualizzare 

utilizzando l’attributo ‘FILE’. Questo file verrà utilizzato nella composizione in PostScript attraverso 

LaTeX. Il nome del file che viene fornito non deve contenere l’estensione ‘.ps’ che è 

sottintesa e obbligatoria. Un altro attributo obbligatorio è ‘HEIGHT’, con cui si definisce l’altezza 

dell’immagine. L’esempio già mostrato in precedenza, specificava a questo proposito un’altezza 

di 5 cm. La larghezza viene regolata in proporzione. 

L’elemento ‘img’ serve invece a definire il file da visualizzare per la composizione in HTML. 

Anche in questo caso si utilizza l’attributo ‘FILE’. Al contrario del caso di ‘eps’, il nome del file 

che viene fornito deve essere indicato completo di estensione. 

 

 

 

 

L’esempio indica di includere l’immagine ‘esempio.ps’, per la composizione attraverso LaTeX, 

e ‘esempio.jpg’ per quella in HTML.


L’elemento ‘caption’ può essere usato all’interno della definizione di una figura per indicare la 

descrizione o il titolo della figura stessa. All’interno di questa descrizione si può inserire anche 

un’etichetta, l’elemento ‘label’, in modo da permettere un riferimento al numero della figura 

all’interno del testo. 

 

 

 

 

 

Immagine di esempio 

 

 

L’esempio inserisce la figura rappresentata dal file ‘esempio.ps’, nel caso di trasformazione in 

LaTeX, oppure ‘esempio.jpg’ in caso di trasformazione in HTML. Vi aggiunge una descrizione 

e un’etichetta per potervi fare riferimento. 

252.2.11 Tabelle 

All’interno di un documento è possibile inserire delle tabelle, ma questo solo se si intende trasformare 

il proprio documento in LaTeX. In HTML si riesce a ottenere qualcosa, ma decisamente 

scadente. Per questo motivo, l’uso delle tabelle deve essere riservato ai casi di effettiva necessità. 

Le tabelle sono composte essenzialmente da righe separate da un separatore di riga, dove ogni 

riga è suddivisa a sua volta in colonne attraverso un separatore di colonna. 

L’elemento ‘table’ delimita la zona di descrizione di una tabella. All’interno del marcatore di 

apertura è possibile specificare la posizione prescelta della tabella, utilizzando l’attributo ‘LOC’ 

(location), che si comporta nello stesso modo di quello utilizzato nell’elemento ‘figure’. 

L’elemento ‘tabular’, interno a ‘table’, definisce le caratteristiche di una tabella. All’interno 

del marcatore di apertura è necessario specificare l’allineamento orizzontale del contenuto delle 

celle e la separazione di queste attraverso linee verticali. l’attributo utilizzato per questo è ‘CA’ 

(Column alignment) e il suo valore consigliabile è una stringa composta da una serie di lettere 

‘l’, una per ogni colonna esistente nella tabella. 

Le righe della tabella sono concluse dall’elemento ‘rowsep’, mentre le colonne sono staccate 

l’una dall’altra attraverso l’elemento ‘colsep’. È possibile inserire una linea orizzontale di separazione 

utilizzando l’elemento ‘hline’. Tutti questi elementi di descrizione delle righe, sono 

vuoti. 

Si osservi questo esempio. Si suppone di voler rappresentare una tabella di quattro righe, più una 

di intestazione, divisa in due sole colonne, secondo lo schema seguente: 

----------------------------------------- 

Parametro LOC Posizione corrispondente 

----------------------------------------- 

h 

posizione attuale 

t 

superiore 

b 

inferiore 

p 

pagina 

----------------------------------------- 

Esempio di tabella. 

Il codice necessario è quello mostrato di seguito. 

 

 

 

Parametro loc Posizione corrispondente 


h posizione attuale 

t superiore 

b inferiore 

p pagina 

 

 

 

 

Esempio di tabella. 

 

 

252.2.12 Mappa dei caratteri 

Alcuni caratteri che all’interno di LinuxDoc hanno un significato speciale, oltre a quelli che sono 

al di fuori della codifica ASCII standard, possono essere inseriti nel testo finale utilizzando dei 

codici macro; precisamente si tratta delle entità standard. 4 

Questi codici macro sono preceduti dalla e-commerciale (‘&’) e seguiti da un punto e virgola. Nel 

capitolo 249 è già apparsa una tabella riferita alle entità standard di uso comune nell’SGML. Si 

tratta precisamente della tabella 249.1. 


• SGMLtools 

 

Appunti di informatica libera 2003.01.01 --- Copyright © 2000-2003 Daniele Giacomini -- daniele @ swlibero.org 

4 LinuxDoc cerca di privilegiare in qualche modo l’ambiente matematico di LaTeX. Per richiamarlo è sufficiente 

delimitarlo attraverso le parentesi quadre, che così non possono essere usate in modo letterale. Come nel caso di altri 

simboli speciali, anche le parentesi quadre vanno indicate con l’uso di macro.

DebianDoc 

Capitolo 253 

DebianDoc è un’altra variazione sul tema dell’ormai famoso DTD Qwertz. In altri termini, è 

una derivazione di SGMLtools/LinuxDoc, riorganizzato in modo da gestire solo quello che può 

essere rappresentato in tutte le forme di composizione che sono state pianificate. 

Sotto questo aspetto, DebianDoc è superiore a LinuxDoc quando l’obiettivo è la documentazione 

compatibile con lo spettro che va da una composizione in PostScript alla pagina di manuale pura 

e semplice. 

Come si può intuire, DebianDoc è un applicativo nato per la distribuzione GNU/Linux Debian. 

Tuttavia, con un po’ di prudenza, può essere convertito e installato anche in sistemi basati su 

altre distribuzioni. Eventualmente, si dovrà fare attenzione alle dipendenze: DebianDoc richiede 

la presenza di una serie di pacchetti che la distribuzione Debian organizza in funzione della 

gestione degli strumenti SGML. Un particolare interessante di DebianDoc è il fatto che utilizza 

Lout per la composizione in PostScript ed eventualmente anche PSUtils per generare dei libretti 

di dimensioni più comode rispetto al solito A4. 

253.1 Struttura 

La struttura di un sorgente SGML secondo il DTD DebianDoc ricalca quello che si può vedere 

dall’esempio seguente: 

 

 

 

 

Titolo del documento 

 

Pinco Pallino 

ppallino@dinkel.brot.dg 

 

29/02/1999 

 

Breve introduzione al documento. 

 

 

 

Copyright © 1999 Pinco Pallino 

 

This information is free; you can redistribute it 

and/or modify it under the terms of the GNU General 

Public License as published by the Free Software 

Foundation; either version 2 of the License, or (at your 

option) any later version. 

 

 

 

 

Primo capitolo 

Contenuto del primo capitolo, 

... 

... 

 

2762

DebianDoc 2763 

 

Prima sezione del primo capitolo 

Contenuto della prima sezione, 

... 

... 

 

 

... 

... 

 

... 

... 

 

Prima appendice 

... 

... 

 

 

... 

... 

 

 

Si può osservare una grande affinità con il DTD LinuxDoc, dove spicca in particolare il fatto che 

le etichette per la realizzazione di riferimenti incrociati sono inserite come attributi ‘ID’ degli 

elementi di suddivisione del testo: ‘chapt’, ‘sect’,... 

DebianDoc presume quindi che si tratti di un libro suddiviso in capitoli, gli elementi ‘chapt’, 

quindi in sezioni a vari livelli: ‘sect’, ‘sect1’, ‘sect2’, ‘sect3’ e ‘sect4’. 

È speciale anche l’elemento di dichiarazione dell’indice generale, ‘toc’, che prevede l’attributo 

‘DETAIL’, al quale si deve assegnare il nome del livello di suddivisione che si ritiene indispensabile 

includere nell’indice generale: nell’esempio mostrato vengono inclusi solo i capitoli e le 

sezioni del livello iniziale. 

253.1.1 Organizzazione del catalogo, del DTD e delle entità 

Dal punto di vista dell’SGML, DebianDoc è organizzato con un catalogo unico, che contiene le 

indicazioni seguenti: 

DOCTYPE debiandoc 

PUBLIC "-//DebianDoc//DTD DebianDoc//EN" 

ENTITY %general-chars 

dtd/debiandoc.dtd 

dtd/debiandoc.dtd 

entities/general 

Queste righe vengono aggiunte al catalogo del sistema, corrispondente a ‘/usr/share/sgml/ 

catalog’, che in pratica è un collegamento simbolico al file ‘/etc/sgml.catalog’. Leggendo 

le dichiarazioni del catalogo si intende che il DTD DebianDoc è costituito dal file ‘dtd/ 

debiandoc.dtd’, ovvero ‘/usr/share/sgml/dtd/debiandoc.dtd’; inoltre, si vede che 

viene usato un solo file di entità generali: ‘entities/general’, ovvero ‘/usr/share/sgml/ 

entities/general’.

2764 DebianDoc 

253.1.2 Utilizzo sommario 

Attraverso gli strumenti di DebianDoc, si ottiene un documento finale a partire da un sorgente 

SGML. Per questo, si elabora il sorgente come si fa con un linguaggio di programmazione 

durante la compilazione. 

debiandoc2dvi [-k] [-p formato_carta] file_sgml 

debiandoc2dvips [-k] [-p formato_carta] file_sgml 

debiandoc2html [-k] file_sgml 

debiandoc2info [-k] file_sgml 

debiandoc2latex2e [-k] [-O] [--] file_sgml 

debiandoc2lout [-k] [-O] [--] file_sgml 

debiandoc2ps [-k] [-O] [-1] [-p formato_carta] [--] file_sgml 

debiandoc2texinfo [-k] [-O] [--] file_sgml 

debiandoc2text [-k] [-O] [--] file_sgml 

debiandoc2textov [-k] [-O] [--] file_sgml 

Ognuno di questi comandi elencati rappresenta un modo differente di elaborare e convertire 

un sorgente SGML scritto secondo il DTD DebianDoc. Il significato dei nomi dovrebbe essere 

intuitivo: ‘debiandoc2html’ significa evidentemente «DebianDoc to HTML», ovvero, «da 

DebianDoc a HTML». Lo stesso vale, più o meno, per gli altri comandi. In breve: 

• ‘debiandoc2latex2e’ produce un file LaTeX; 

• ‘debiandoc2dvi’ produce un file DVI attraverso l’elaborazione con il sistema di 

composizione LaTeX; 

• ‘debiandoc2dvips’ produce un file PostScript attraverso l’elaborazione con il sistema di 

composizione LaTeX; 

• ‘debiandoc2html’ produce una trasformazione in HTML, distribuita su più file, collocati 

in una directory il cui nome corrisponde alla radice del file sorgente, e l’estensione ‘.html’; 

• ‘debiandoc2texinfo’ produce un file in formato Texinfo; 

• ‘debiandoc2info’ produce un file di documentazione Info, attraverso il sistema di 

composizione Texinfo; 

• ‘debiandoc2lout’ produce un file adatto per il sistema di composizione Lout; 

• ‘debiandoc2ps’ produce un file PostScript, attraverso l’elaborazione del sistema di composizione 

Lout, in cui le pagine sono ridotte e raddoppiate (ogni pagina A4 ne contiene due 

A5, a meno che venga utilizzata l’opzione ‘-1’); 

• ‘debiandoc2text’ produce un file di testo puro e semplice, con un’ampiezza di 79 

colonne; 

• ‘debiandoc2textov’ produce un file di testo con i codici di arretramento per ottenere gli 

effetti di evidenziamento e sottolineatura per la visualizzazione su schermo. 


-k


Fa in modo che i file intermedi, creati durante il procedimento di conversione, vengano 

conservati. 

-O 

Fa in modo che il risultato finale della trasformazione venga emesso attraverso lo standard 

output, quando di solito si crea invece un file con la stessa radice dell’origine e un’estensione 

opportuna. Se il sorgente è fornito attraverso lo standard input, questa opzione è 

implicita. 

-1 

Questa opzione riguarda espressamente ‘debiandoc2ps’, che senza di questa, genera un 

file PostScript in cui ogni pagina ne contiene due ridotte e affiancate (per mezzo di PSUtils). 

Con questa opzione, si ottengono pagine normali (singole). 

-p dimensione_pagina 

Questa opzione permette di specificare la dimensione della pagina, nelle trasformazioni in 

cui ciò può avere senso, facendo riferimento alla configurazione del pacchetto Papersize 

della distribuzione Debian. 

-- 

In caso di ambiguità, un trattino doppio serve a separare le opzioni dal nome del file 

sorgente. 

253.2 Guida rapida 

Dal momento che DebianDoc è molto simile a LinuxDoc e che la sua documentazione è abbastanza 

chiara, non è il caso di ripetere le stesse informazioni anche in questo capitolo. Eventualmente 

si può rileggere quello precedente. Qui vengono mostrati solo i prospetti riassuntivi degli 

elementi SGML principali di DebianDoc, attraverso delle tabelle. 

Tabella 253.1. Elementi della struttura generale di un documento DebianDoc. 

Elemento 

debiandoc 

book 

titlepag 

title 

author 

name 

email 

version 

abstract 

copyright 

copyrightsummary 

p 

toc 

chapt 

appendix 

Descrizione 

Il contenitore di un documento DebianDoc. 

Il sotto-contenitore di un documento DebianDoc. 

La definizione della pagina del titolo. 

Il titolo del documento. 

L’autore (scomposto ulteriormente). 

Il nome dell’autore. 

L’indirizzo di posta elettronica dell’autore. 

La versione del documento. 

Una descrizione breve del contenuto. 

Informazioni sul copyright. 

Il copyright, in breve. 

La descrizione della licenza. 

L’indice generale. 

Il contenitore di un capitolo. 

Il contenitore di un’appendice.

2766 DebianDoc 

Tabella 253.2. Elementi che rappresentano la suddivisione gerarchica del contenuto 

di un documento DebianDoc. 

Elemento Descrizione 

chapt Il contenitore di un capitolo. 

appendix Il contenitore di un’appendice (si articola come il capitolo). 

sect Sezione di un capitolo o di un’appendice. 

sect1 Sotto-sezione di primo livello. 

sect2 Sotto-sezione di secondo livello. 

sect3 Sotto-sezione di terzo livello. 

sect4 Sotto-sezione di quarto livello. 

heading Il titolo di: capitolo, appendice, sezione o sotto-sezione. 

Tabella 253.3. Elementi che si utilizzano nel corpo del testo per modificare l’aspetto 

del loro contenuto in base al significato che rappresentano. 

Elemento Descrizione 

em Enfasi normale (idealmente un corsivo). 

strong Enfasi più forte (idealmente un neretto). 

var Rappresentazione di una metavariabile (di uno schema sintattico). 

package Il nome di un pacchetto GNU/Linux. 

prgn Il nome di un programma o di un file ben conosciuto. 

file Il percorso di un file o di una directory. 

tt 

Una stringa letterale dattilografica. 

Tabella 253.4. Riferimenti. 

Elemento 

ref id="etichetta" 

manref name="nome " section="n_sezione " 

email 

ftpsite 

ftppath 

httpsite 

httppath 

url id="uri" name="nome " 

footnote 

Descrizione 

Riferimento a un’etichetta dichiarata altrove. 

Riferimento a una pagina di manuale. 

Contenitore di un indirizzo di posta elettronica. 

Il nome di dominio di un sito FTP. 

Il percorso riferito all’ultimo sito FTP indicato. 

Il nome di dominio di un sito HTTP. 

Il percorso riferito all’ultimo sito HTTP indicato. 

Indirizzo URI completo. 

Nota a piè pagina. 

Tabella 253.5. Elenchi. 

Elemento 

list 

item 

enumlist 

item 

taglist 

tag 

item 

Descrizione 

Elenco puntato. 

Voce di un elenco. 

Elenco numerato. 

Voce di un elenco. 

Elenco descrittivo. 

Elemento descrittivo. 

Voce di un elemento.



• Ian Jackson, Arno van Rangelrooij, Debiandoc-SGML Markup Manual 


DocBook: introduzione ai suoi strumenti 

Capitolo 254 

DocBook è un DTD abbastanza famoso, che come tale rappresenta uno standard importante. 

DocBook è nato con lo scopo di descrivere documenti di carattere tecnico; attualmente il suo 

sviluppo è mantenuto dal Davenport Group. 

Come è noto, il DTD è solo la prima fase di un processo molto lungo, che porta alla fine alla 

composizione tipografica. La fama di DocBook è tale per cui gli strumenti a disposizione sono 

molti e soprattutto differenti. Quando si installa un ipotetico pacchetto «DocBook» nel proprio 

sistema, ci si limita a collocare da qualche parte i file che compongono il DTD, eventualmente 

assieme alla sua documentazione, ma se mancano gli strumenti che sono in grado di utilizzarlo, 

si può fare poco o nulla. 

Il DTD DocBook è molto sofisticato e complesso. Qui non si vuole entrare nel dettaglio 

della spiegazione della sua organizzazione interna e nemmeno dell’uso dei suoi elementi 

SGML. Queste informazioni possono essere tratte dalla sua documentazione che dovrebbe 

accompagnarlo, disponibili comunque presso . 

254.1 Installazione del DTD 

È stato descritto in precedenza in che modo potrebbero distribuirsi i file di diversi DTD, assieme 

a quelli delle entità, e in che modo queste informazioni vadano raccolte nel catalogo SGML. 

L’installazione del DTD DocBook implica la collocazione dei file del DTD e l’annotazione nel 

catalogo. Si presume che prima siano stati installati i file delle entità standard (ISO 8879), che 

sono precisamente 19. 1 

Si veda eventualmente quanto è stato descritto nel capitolo 250, in particolare nella sezione 250.6. 

Ciò che va aggiunto al catalogo generale è contenuto normalmente nel file ‘docbook.cat’ e, 

come già è stato spiegato, dovrebbe essere lo stesso sistema di installazione dei pacchetti della 

propria distribuzione GNU/Linux a provvedere per questa sistemazione. Eventualmente, si può 

sempre fare a mano. 

254.2 Esperimenti con il DTD e convalida 

Per cominciare a fare qualche esperimento con il DTD DocBook, occorre almeno uno strumento 

di convalida, di solito il pacchetto SP di James Clark. Nella propria distribuzione GNU/Linux, 

questo pacchetto potrebbe essere disponibile da solo (come avviene nella distribuzione Debian), 

oppure assieme a Jade (come avviene nella distribuzione Red Hat). Quello che conta è, per 

iniziare, che sia disponibile l’eseguibile ‘nsgmls’. 

Senza entrare nel dettaglio dell’SGML di DocBook, si può prendere l’esempio seguente come 

base per gli esperimenti. 

 

 

 

 

Il mio primo libro con DocBook 

 

1 Di solito si tratta del pacchetto denominato «sgml-base», o qualcosa di simile. Questo pacchetto potrebbe contenere 

anche molti più file di quelli previsti dallo standard ISO 8879. 

2768

DocBook: introduzione ai suoi strumenti 2769 

 

Pallino 

Pinco 

 

 

 

Cai 

Caio 

 

 

 


This information is free; you can redistribute it and/or 

modify it under the terms of the GNU General Public License as 

published by the Free Software Foundation; either version 2 of the 

License, or (at your option) any later version. 

 

 

 

Primo capitolo 

Contenuto del primo capitolo, bla bla bla bla bla bla bla bla bla 

bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla. 

bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla 

bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla 

bla bla bla bla bla bla bla bla. 

 

Prima sezione del primo capitolo 

Contenuto della prima sezione, bla bla bla bla bla bla bla bla bla 

bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla. 




 

 

 

Prima appendice 

Contenuto della prima appendice, bla bla bla bla bla bla bla bla 

bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla. 




 

 

La verifica si fa nel modo già visto tante altre volte. Supponendo di voler fare riferimento al 

catalogo contenuto nel file ‘/usr/share/sgml/catalog’ e supponendo di avere chiamato il 

sorgente SGML ‘libro.sgml’: 

$ nsgmls -s -c /usr/share/sgml/catalog libro.sgml 

Eventualmente, se il pacchetto di programmi che conteneva SP è stato compilato in modo coerente 

con l’impostazione SGML della propria distribuzione, potrebbe non essere necessario indicare 

espressamente il file del catalogo:

2770 DocBook: introduzione ai suoi strumenti 

$ nsgmls -s libro.sgml 

A questo punto, disponendo di un analizzatore SGML che funziona correttamente con questo 

DTD, si potrebbero realizzare i propri strumenti per la trasformazione in un risultato adatto alla 

consultazione: cartacea o elettronica. Di solito, si fa affidamento per questo su Jade. 

254.3 Jade 

Jade è un applicativo in grado di elaborare i dati provenienti da SP; in particolare, trattandosi di un 

lavoro dello stesso autore, include solitamente anche SP. Lo scopo di Jade è quello di generare un 

risultato finale pronto per la lettura, oppure pronto per l’ultima fase di composizione elettronica. 

Per arrivare a questo, utilizza dei «fogli di stile», scritti secondo il linguaggio DSSSL. 

I fogli di stile necessari a Jade per poter elaborare un documento SGML redatto secondo il DTD 

DocBook, vengono installati normalmente attraverso un pacchetto apposito, il cui nome potrebbe 

essere «stylesheets», «docbook-stylesheets», o qualcosa di simile. In ogni caso, le dipendenze tra 

i pacchetti dovrebbero impedire di dimenticarsene. 

In generale, i fogli di stile non si toccano. 

Anche l’installazione di Jade richiede l’aggiornamento nel catalogo generale SGML. Dovrebbe 

trattarsi del file ‘dsssl.cat’, il cui contenuto viene aggiunto manualmente, o automaticamente, 

al catalogo generale del sistema SGML della propria distribuzione GNU/Linux. 

254.3.1 Utilizzo di Jade 

Si è accennato al fatto che Jade utilizza SP. Per la precisione, è Jade che avvia l’eseguibile 

‘nsgmls’ (cioè SP), passandogli tutti gli argomenti della riga di comando che lo riguardano. 

jade [opzioni] file_sgml 

L’eseguibile ‘jade’, per funzionare, ha bisogno di un foglio di stile iniziale, da abbinare al documento 

SGML, in base al tipo di trasformazione che si vuole ottenere. Se questa informazione 

non viene fornita (con l’opzione ‘-d’), ‘jade’ cerca un file con la stessa radice di quello SGML, 

con estensione ‘.dsl’. Di solito, dal momento che si utilizzano fogli di stile già pronti, se ne farà 

riferimento nella riga di comando. 

Alcune opzioni specifiche 

Oltre alle opzioni di SP, Jade riconosce in particolare le opzioni seguenti. 

-d file_delle_specifiche_dsssl 

Questa opzione permette di indicare il file contenente il foglio di stile DSSSL che si vuole 

sia utilizzato per l’elaborazione. Quando si utilizzano fogli di stile già pronti, l’uso di questa 

opzione è praticamente obbligatorio. 

-t tipo_di_trasformazione 

Questa opzione permette di definire il tipo di trasformazione che si intende ottenere; ciò 

attraverso una parola chiave che segue l’opzione come argomento. In particolare, meritano 

attenzione: 

• ‘rtf’ -- rappresenta una conversione in RTF che si adatta in particolare a MS-Word 

97;

DocBook: introduzione ai suoi strumenti 2771 

• ‘rtf-95’ -- è una variante RTF adatta in particolare a MS-Word 95; 

• ‘tex’ -- è una conversione in TeX, che poi deve essere rielaborato da JadeTeX; 

• ‘sgml’ -- converte in un altro formato SGML, per esempio in HTML. 

-o file_risultato 

Quando la trasformazione che si intende fare genera un solo file, questa opzione consente 

di definirne il nome, che altrimenti è lo stesso del sorgente, con l’estensione modificata 

opportunamente, in base al tipo di contenuto. 

Esempi 

$ jade -d /usr/share/sgml/stylesheets/cygnus-both.dsl -t rtf libro.sgml 

Viene avviata la trasformazione del file ‘libro.sgml’ in RTF, generando quindi il 

file ‘libro.rtf’, utilizzando il foglio di stile ‘/usr/share/sgml/stylesheets/ 

cygnus-both.dsl’, che rappresenta la scelta standard per DocBook. 

$ jade -d /usr/share/sgml/stylesheets/cygnus-both.dsl -t tex libro.sgml 

Come nell’esempio precedente, con la differenza che viene generato il file ‘libro.tex’ in 

formato TeX (adatto a JadeTeX). 

$ jade -d /usr/share/sgml/stylesheets/cygnus-both.dsl -t sgml -i html 

libro.sgml 

In questo caso si generano una serie di file HTML, i cui nomi sono standard, riconoscibili 

perché hanno l’estensione ‘.htm’. Si osservi l’utilizzo della conversione in SGML, con 

l’aggiunta dell’opzione ‘-i’. Questa viene passata direttamente a SP e serve per dichiarare 

l’entità parametrica denominata ‘html’, che viene riconosciuta poi nel foglio di stile. 

254.3.2 JadeTeX 

JadeTeX è un componente del sistema di composizione TeX. Di solito è separato in un pacchetto 

indipendente rispetto alla distribuzione TeX che si utilizza, ma quando lo si installa, è importante 

che si tratti di un pacchetto della stessa serie del tipo di TeX che si utilizza. In altri termini, a 

meno di essere degli esperti di TeX, non conviene installare un pacchetto JadeTeX preparato da 

una distribuzione GNU/Linux differente da quella che si utilizza effettivamente. 

Lo scopo di JadeTeX è quello di generare una composizione in formato DVI, o in PDF, partendo 

da un sorgente TeX ottenuto da Jade: 

jadetex sorgente_tex_generato_da_jade 

pdfjadetex sorgente_tex_generato_da_jade 

Evidentemente, nel primo caso si ottiene una composizione in DVI, mentre nel secondo in PDF. 2 

254.3.3 Script più comodi 

Jade dovrebbe essere accompagnato da alcuni script che semplificano il suo utilizzo per Doc- 

Book. Si tratta di ‘db2ps’, ‘db2pdf’, ‘db2rtf’, ‘db2html’ e altri. Il significato dei nomi è 

evidente: «da DocBook a»... La loro sintassi è molto semplice: 

db2ps file_sgml_docbook 

db2pdf file_sgml_docbook 

2 Nel momento in cui questo viene scritto, JadeTeX non ha ancora raggiunto un livello di sviluppo soddisfacente.

2772 DocBook: introduzione ai suoi strumenti 

db2rtf file_sgml_docbook 

db2html file_sgml_docbook 

Intuitivamente si comprende che ciò che si ottiene è, a seconda dei casi, un file in PostScript, 

PDF o RTF, dove la radice del nome è la stessa del sorgente, mentre l’estensione cambia di volta 

in volta. Nel caso della trasformazione in HTML, si ottiene una directory contenente una serie di 

file HTML. 


• Mark Galassi, DocBook intro 

 

• The DocBook DTD 

 

• SGMLtools 

 

• Paul Prescod, Introduction to DSSSL 

 

• DSSSL Documentation Project 

 


Parte xlvii 

Sgmltexi 

255 Sgmltexi: installazione e utilizzo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2774 

255.1 Installazione di Sgmltexi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2774 

255.2 Come si usa il programma frontale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2776 

255.3 Riferimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2779 

256 Sgmltexi: struttura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2780 

256.1 Struttura generale per un sorgente Sgmltexi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2780 

256.2 Scomposizione del documento, nodi e menù Info . . . . . . . . . . . . . . . . . . . . . . . . 2791 

256.3 Gestire più derivazioni di uno stesso progetto di documentazione . . . . . . . . . . 2793 

256.4 Codifica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2794 

257 Sgmltexi: contenuti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2796 

257.1 Paragrafi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2796 

257.2 Indici e riferimenti incrociati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2796 

257.3 Delimitazione di parole e di frasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2799 

257.4 Delimitazione di blocchi di testo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2799 

257.5 Elenchi e tabelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2801 

257.6 Inserzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2803 

257.7 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2804 

257.8 Codice condizionato e codice letterale in base alla composizione . . . . . . . . . . 2806 

258 Corrispondenza tra Texinfo e Sgmltexi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2810 

2773

Capitolo 255 

Sgmltexi: installazione e utilizzo 

Sgmltexi è un DTD e un sistema frontale per la composizione in Texinfo a partire da un formato 

SGML. L’idea alla base di Sgmltexi è quella di avere la possibilità di scrivere un documento 

Texinfo attraverso la semplificazione e la guida che può dare un sistema SGML. 

All’interno di Sgmltexi, la gestione dei nodi di Texinfo può avvenire in modo automatico e trasparente, 

generando un menù Info unico nel nodo ‘Top’. I nomi dei nodi, quando sono generati 

automaticamente, usano stringhe del tipo «cap 1», «app A»,... 

Sgmltexi ha uno schema preciso: ci possono essere una o più introduzioni iniziali; nella parte centrale 

c’è un corpo che può essere scomposto in vario modo; ci possono essere delle appendici; 

al termine possono apparire degli indici analitici. Il corpo è organizzato in capitoli, che possono 

essere raggruppati in parti ed eventualmente anche in tomi. In tal modo, si possono gestire 

facilmente anche documenti di grandi dimensioni. 

Sgmltexi è un lavoro derivato dall’esperienza fatta con ALtools e Alml, ovvero i sistemi di 

composizione di Appunti Linux e di Appunti di informatica libera. 

255.1 Installazione di Sgmltexi 

Sgmltexi è composto da due eseguibili Perl: ‘sgmltexi’ e ‘sgmltexi-sp2texi’. Questi due file 

devono essere collocati in una directory in cui possono essere avviati senza bisogno di indicare 

il percorso; in pratica in una directory elencata all’interno della variabile di ambiente ‘PATH’. 

Evidentemente, è necessario l’interprete Perl; precisamente questi programmi cercano il file 

‘/usr/bin/perl’. Se il proprio sistema operativo è organizzato diversamente, è necessario 

intervenire modificando la prima riga dei due eseguibili: 

#!/usr/bin/perl 

#... 

Sgmltexi si aspetta di trovare alcuni file: 

• ‘/etc/sgmltexi/sgmltexi.cat’ 

il catalogo SGML di Sgmltexi; 

• ‘/etc/sgmltexi/sgmltexi.dcl’ 

la dichiarazione SGML di Sgmltexi; 

• ‘/etc/sgmltexi/sgmltexi.dtd’ 

il DTD di Sgmltexi; 

• ‘/etc/sgmltexi/entities/’ 

la directory contenente i file delle entità SGML standard. 

Tutti questi file dovrebbero trovarsi esattamente dove previsto; in alternativa si devono realizzare 

almeno dei collegamenti per ricreare i percorsi stabiliti. 

2774

Sgmltexi: installazione e utilizzo 2775 

255.1.1 Gettext 

I messaggi di Sgmltexi possono essere tradotti. Per installare i file PO già esistenti è necessario 

compilarli come nell’esempio seguente: 

$ msgfmt -vvvv -o sgmltexi.mo it.po 

In questo esempio, il file ‘it.po’ viene compilato generando il file ‘sgmltexi.mo’. Questo file 

può essere collocato in ‘/usr/share/locale/it/LC_MESSAGES/’, o in un’altra posizione 

analoga in base agli standard del proprio sistema operativo. 

Se non è disponibile il modulo Perl-gettext, che serve a Sgmltexi per accedere alle traduzioni, è 

possibile eliminare il suo utilizzo e simulare la funzione di Gettext. In pratica si commentano le 

istruzioni seguenti: 

# Non si vuole usare gettext. 

#use POSIX; 

#use Locale::gettext; 

#setlocale (LC_MESSAGES, ""); 

#textdomain ("sgmltexi"); 

Inoltre, si tolgono i commenti dalla dichiarazione della funzione fittizia ‘gettext()’, come si 

vede qui: 

sub gettext 

{ 

return $_[0]; 

} 

255.1.2 Dipendenze 

È il caso di riepilogare le dipendenze di Sgmltexi da altri applicativi: 

• Perl 

dal momento che si tratta di un programma scritto in Perl, deve essere presente l’interprete 

relativo; 

• SP o Jade 

per l’analisi SGML occorre il programma ‘nsgmls’ che fa parte del pacchetto SP o anche 

del pacchetto Jade; 

• Perl-gettext 

per accedere ai messaggi tradotti del programma, è necessario il modulo Perl-gettext, salva 

la possibilità di escluderne l’utilizzo come è già stato mostrato; 

• TeX e Texinfo 

per arrivare a una composizione finale è necessario ovviamente disporre di Texinfo, che 

potrebbe già essere integrato nella propria distribuzione TeX (di solito si tratta di teTeX).

2776 Sgmltexi: installazione e utilizzo 

255.2 Come si usa il programma frontale 

Una volta preparato il sorgente in formato Sgmltexi, bisogna utilizzare il programma ‘sgmltexi’ 

per controllare l’elaborazione SGML e gli altri applicativi di composizione di Texinfo. 

255.2.1 Esempio iniziale 

Di solito, la cosa migliore per iniziare lo studio di un sistema di composizione, è partire da 

un esempio banale, funzionante, che consenta di apprendere l’uso elementare degli strumenti 

relativi. 

 

 

 

 

 

 

 

 

Esempio 

Un esempio per un documento in formato Sgmltexi 

 

Questo è solo un esempio di un documento scritto 

utilizzando Sgmltexi. 

 

Pinco Pallino <ppinco@dinkel.brot.dg> 

 


 

Permission is granted to copy, distribute and/or 

modify this document under the terms of the GNU Free 

Documentation License, Version 1.1 or any later version 

published by the Free Software Foundation; with no 

Invariant Sections, with no Front-Cover Texts, and with 

no Back-Cover Texts. A copy of the license is included 

in the section entitled "GNU Free Documentation 

License". 

 

 

 

 

 

 

Esempio generale 

Questo è l’esempio tipico di un capitolo di Sgmltexi... 

Non c’è molto da scrivere in questo caso... 

 

 

Supponendo di avere installato correttamente Sgmltexi (e anche Texinfo), supponendo inoltre 

che il file si chiami ‘prova.sgml’, si possono usare i comandi seguenti: 

• $ sgmltexi --sgml-check prova.sgml 

per verificare la correttezza formale dell’SGML; 

• $ sgmltexi --texi prova.sgml 

per ottenere semplicemente il file ‘prova.texinfo’, in formato Texinfo;


• $ sgmltexi --info prova.sgml 

per ottenere il file ‘prova.info’, in formato Info; 

• $ sgmltexi --dvi prova.sgml 

per ottenere il file ‘prova.dvi’, in formato DVI; 

• $ sgmltexi --ps prova.sgml 

per ottenere il file ‘prova.ps’, in formato PostScript; 

• $ sgmltexi --pdf prova.sgml 

per ottenere il file ‘prova.pdf’, in formato PDF; 

• $ sgmltexi --html prova.sgml 

per ottenere il file ‘prova.html’, in formato HTML. 

255.2.2 $ sgmltexi 

La sintassi di ‘sgmltexi’ è quella che si vede nello schema seguente: 

sgmltexi [opzioni] sorgente_sgml 

In generale, è bene che il nome del file sorgente in formato Sgmltexi abbia l’estensione standard 

‘.sgml’. 

Opzioni 

--help 

Mostra una guida sintetica e termina di funzionare. 

--version 

Mostra le informazioni sulla versione e termina di funzionare. 

--force 

Quando il contesto lo consente, forza le situazioni. Può essere utile in particolare per 

la composizione in formato Info e in formato HTML, per passare la stessa opzione al 

programma ‘makeinfo’. 

--number-sections 

Numera le sezioni quando ciò non è previsto in modo normale. 

--clean 

Elimina i file intermedi che non servono, abbinati al nome del sorgente. 

--verbose 

Mostra più informazioni durante l’elaborazione. 

--deriv=derivazione 

Definisce il nome della derivazione. In mancanza di questa indicazione si sottintende 

‘MAIN’. 

--input-encoding=codifica 

Stabilisce la codifica del file in ingresso, tenendo conto che sono ammissibili solo le parole 

chiave ‘ISO-8859-n’, dove n va da 1 a 10.

2778 Sgmltexi: installazione e utilizzo 

--sgml-include=entità_parametrica | --include=entità_parametrica 

Assegna la parola chiave ‘INCLUDE’ all’entità parametrica SGML indicata. Questo serve ad 

abilitare l’inclusione di porzioni di sorgente SGML che sono controllate in questo modo. 

--paper=formato_composizione 

Serve a definire in qualche modo il formato finale stampato di composizione. Sono 

disponibili le parole chiave seguenti: ‘letter’, ‘a4’, ‘a4wide’, ‘a4latex’ e ‘small’. 

--setchapternewpage={on|off|odd} 

Definisce l’inizio dei capitoli nella composizione per la stampa, ignorando il marcatore 

‘’ all’interno del sorgente del documento. 

--footnotestyle={end|separate} 

Definisce la collocazione delle note a piè pagina, ignorando il marcatore 

‘’ all’interno del sorgente. 

--headings={on|off|single|double|singleafter|doubleafter} 

Attiva o disattiva le intestazioni, specificando eventualmente l’uso di intestazioni uguali o 

distinte. Questa opzione fa ignorare il marcatore ‘’ all’interno 

del sorgente del documento. 

--sgml-syntax | --sgml-check 

Controlla la correttezza formale del sorgente SGML, mostrando gli errori trovati. 

--sp 

Genera un risultato «post-SP», nel senso che restituisce soltanto quanto ottenuto 

dall’analizzatore SGML, a scopo diagnostico. 

--texi | --texinfo 

Genera un sorgente Texinfo. 

--dvi 

Compone generando un risultato in formato DVI. 

--ps | --postscript 

Compone generando un formato in PostScript. 

--pdf 

Compone generando un formato PDF. 

--info 

Generate un risultato in formato Info. 

--text 

Genera un risultato in formato testo puro. 

--html 

Genera un risultato in formato HTML. 

Esempi 

$ sgmltexi --sgml-syntax prova.sgml 

Analizza la validità formale del sorgente ‘prova.sgml’. 

$ sgmltexi --ps prova.sgml 

Genera un risultato in formato PostScript attraverso l’aiuto di ‘texi2dvi’ e di ‘dvips’.



• Daniele Giacomini, Sgmltexi 

 

• Gaetano Paolone, Sgmltexi, pacchetto GNU/Linux Debian 

 

 


Sgmltexi: struttura 

Capitolo 256 

Sgmltexi impone uno schema preciso al documento, in base alle consuetudini dei documenti 

stampati. Questo capitolo descrive brevemente tale struttura. 

256.1 Struttura generale per un sorgente Sgmltexi 

Il sorgente Sgmltexi tipico inizia così: 

 

Naturalmente, potrebbe essere conveniente la definizione iniziale di alcune entità interne, come 

si vede nell’esempio seguente: 

 

[ 

 

... 

... 

]> 

Tutto il documento viene racchiuso all’interno dell’elemento ‘sgmltexi’, rispettando una certa 

struttura: deve esserci un elemento ‘head’, ci può essere un elemento ‘intro’, ci deve essere 

un elemento ‘body’, infine ci può essere un elemento ‘appendix’. Lo spazio successivo all’elemento 

‘appendix’ può essere occupato da alcuni indici analitici (cosa che verrà descritta meglio 

in seguito). 

 

 

... 

 

 

... 

 

 

... 

 

 

... 

 

 

L’elemento ‘sgmltexi’ ha tre attributi: ‘lang’, ‘charset’, ‘spacing’. Attraverso l’attributo 

‘lang’ si definisce il linguaggio in cui è scritto il documento, richiamando implicitamente una 

configurazione particolare all’interno di Texinfo. Questo linguaggio si indica assegnando una 

sigla corrispondente allo standard ISO 639 (sezione 543), come si vede nell’esempio seguente: 

 

L’attributo ‘charset’ permette di indicare il valore da assegnare al comando 

‘@documentencoding’ di Texinfo. L’uso di questo attributo viene oscurato dall’opzione 

‘--input-encoding’, se questa viene usata. Infatti, tale opzione implica un’elaborazione del 

sorgente per cui si genera un file Texinfo in formato ISO 646 (ASCII tradizionale), cosa che fa 

perdere di significato al comando ‘@documentencoding’. 1 

L’attributo ‘spacing’ dovrebbe essere superfluo, dal momento che serve a definire la spaziatura 

alla fine del punto fermo. Questo comportamento dovrebbe essere definito automaticamente 

1 La composizione di un sorgente Texinfo dà risultati differenti a seconda dei casi, per cui alle volte può essere conveniente 

scrivere usando comandi come ‘@‘a’ («à»), mentre altre volte conviene scrivere usando una codifica ISO 8859- 

n, annotando questo nel comando ‘@documentencoding’. Probabilmente, nelle prossime versioni di Texinfo questo 

problema verrà sistemato; per ora l’ambivalenza di Sgmltexi può aiutare in tal senso. 

2780

Sgmltexi: struttura 2781 

in base alla scelta del linguaggio. Questo attributo consente quindi di forzare la situazione, imponendo 

una spaziatura non conforme allo standard. I valori che si possono assegnare sono: 

‘normal’, ‘french’ e ‘uniform’. Assegnando ‘french’, oppure ‘uniform’, si ottiene in pratica 

la stessa cosa che si otterrebbe con il comando ‘@frenchspacing’ di Texinfo. L’esempio 

seguente rappresenta ciò che potrebbe essere conveniente in un testo italiano: 

 

Tabella 256.1. Elementi SGML che compongono la struttura generale: prima parte. 

Elemento o Aperturra 

Chiusu- 

attributo 

Contenuto Descrizione 

Contenitore del documento. 

lang -- -- Attributo Sigla ISO 639 del linguaggio. 

sgmltexi Sì Sì 

charset -- -- Codifica nella forma 

Attributo 

‘ISO-8859-n’. 

spacing -- -- Attributo ‘normal’, ‘french’ e ‘uniform’. 

head Sì Sì Intestazione del documento. 

admin Sì Sì Informazioni amministrative. 

Inserisce il comando 

setfilename Sì Vuoto 

‘@setfilename’. 

content -- -- 

Il nome del primo file Info da 

Attributo 

generare. 

settitle Sì Vuoto Inserisce il comando ‘@settitle’. 

content -- -- Attributo Titolo. 

setchapternewpage 


Sì 

Vuoto 

‘@setchapternewpage’. 

content -- -- Attributo 

Separazione dei capitoli: ‘on’, 

‘off’, ‘odd’. 

footnotestyle Sì Vuoto 


‘@footnotestyle’. 

content -- -- Attributo 

Piè pagina: ‘end’, ‘separate’, 

‘empty’. 

headings Sì Vuoto Inserisce il comando ‘@headings’. 

content -- -- Attributo Intestazioni: ‘on’, ‘off’, ‘single’, 

‘double’, ‘singleafter’, 

‘doubleafter’. 

defindex Sì Vuoto Inserisce il comando ‘@defindex’. 

name -- -- Sigla di due lettere dell’indice 

Attributo 

analitico. 


defcodeindex Sì Vuoto 

‘@defcodeindex’. 

name -- -- Sigla di due lettere dell’indice 

Attributo 

analitico. 

synindex Sì Vuoto Inserisce il comando ‘@synindex’. 

from -- -- Attributo 

to -- -- Attributo 

syncodeindex Sì Vuoto 

from -- -- Attributo 

to -- -- Attributo 

infodir Sì No Vuoto 

infodir Sì Sì #PCDATA 

L’indice di origine: una sigla di due 

lettere. 

L’indice di destinazione: una sigla 

di due lettere. 


‘@syncodeindex’. 

L’indice di origine: una sigla di due 

lettere. 

Destinazione in cui apparirà in 

dattilografico. 

Comando ‘@direntry’ in modo 

automatico. 

Comando ‘@direntry’ con un 

contenuto letterale.

2782 Sgmltexi: struttura 

Tabella 256.2. Elementi SGML che compongono la struttura generale: seconda parte. 


Chiusu- 

attributo 


titlepage Sì Sì Informazioni delle prime pagine. 

title Sì Sì %inline; Inserisce il comando ‘@title’. 

subtitle Sì Sì %inline; Inserisce il comando ‘@subtitle’. 

abstract Sì Sì %block; 

Descrizione del contenuto del documento. 

author Sì Sì %inline; Inserisce il comando ‘@author’. 

frontcovertext Sì Sì %block; Testo da inserire in copertina. 

tpextra 

Testo aggiuntivo nelle prime pagine. 

Sì Sì %block; 

Informazioni legali alla base della 

legal Sì Sì 

seconda pagina. 

copyright Sì Sì %inline; Una riga di copyright. 

publishnote 

Note da mostrare prima della 


licenza. 

Condizioni con cui è rilasciato il 

license Sì Sì %block; 

documento. 

Note sulla copertina, da mostrare 

coverart Sì Sì %block; 

dopo la licenza. 

dedications Sì Sì %block; Pagina delle dediche. 

contents Sì Vuoto Indice generale standard. 

shortcontents Sì Vuoto Indice generale ridotto. 

summarycon- 

Sì Vuoto Indice generale ridotto. 

menu Sì No Vuoto Inserisce un menù Info automatico. 

topnode Sì Vuoto Specifica il nodo iniziale. 

next -- -- Attributo Riferimento al nodo successivo. 

prev -- -- Attributo Riferimento al nodo precedente. 

up -- -- Attributo Riferimento al nodo superiore. 

menu Sì Sì Inserisce un menù Info manuale. 

detailmenu Sì Sì #PCDATA Dettaglio nel menù Info. 

Elemento o 

attributo 

Tabella 256.3. Elementi SGML che compongono la struttura generale: terza parte. 

tents 

Apertura 

Chiusura 

Contenuto 

Descrizione 

Delimita i capitoli che compongono 

l’introduzione. 

intro Sì Sì 

h1 Sì Sì Titolo di un capitolo introduttivo. 

h2 Sì Sì Titolo di una sezione introduttiva. 

Titolo di una sottosezione introduttiva. 

h3 Sì Sì 

Titolo di una sotto-sottosezione 

h4 Sì Sì 

introduttiva. 

body Sì Sì Delimita il corpo del documento. 

tomeheading Sì Sì Titolo di un tomo. 

partheading Sì Sì Titolo di una parte. 

h1 Sì Sì Titolo di un capitolo. 

h2 Sì Sì Titolo di una sezione. 

h3 Sì Sì Titolo di una sottosezione. 

h4 Sì Sì Titolo di una sotto-sottosezione. 

appendix Sì Sì 

Delimita i capitoli che compongono 

l’appendice. 

h1 Sì Sì Titolo di un’appendice. 

h2 Sì Sì Titolo di una sezione di appendice. 

h3 Sì Sì 

Titolo di una sottosezione di appendice.


Elemento o 

attributo 

Apertura 

Chiusura 

Contenuto 

Descrizione 

h4 Sì Sì 

Titolo di una sotto-sottosezione di 

appendice. 

indexheading Sì Sì Titolo di un indice analitico. 

Inserisce un indice analitico particolare. 

name -- -- Sigla dell’indice analitico da inserire. 

Attributo 

I titoli hanno degli attributi in 

comune. 

id -- -- Ancora per i riferimenti ipertestuali. 

Attributo 

node -- -- Attributo Definizione manuale del nodo. 

printindex Sì Vuoto 

titolo_generico Sì Sì 

menu -- -- Attributo Titolo che appare nel menù. 

next -- -- Definizione manuale del prossimo 

Attributo 

nodo. 

prev -- -- Definizione manuale del nodo precedente. 

Attributo 

up -- -- 

Definizione manuale del nodo superiore. 

Attributo 

titolo_h Sì Sì 

Dal capitolo in giù c’è un attributo 

aggiuntivo. 

type -- -- Attributo 

Numerato, non numerato o intestazione 

semplice: 

‘numbered’, ‘unnumbered’, 

‘heading’. 

256.1.1 Intestazione 

L’elemento ‘head’ è il più complicato. È necessario per definire molte informazioni che riguardano 

il documento. Segue un esempio abbastanza completo, che si riferisce alla documentazione 

ipotetica dello stesso Sgmltexi. 

 

 

 

 

 

 

 

 

 

 

Sgmltexi 

An alternative way to write Texinfo 

documentation 

This edition is for Sgmltexi 

&EDITION; (alpha) for Texinfo 4.0 

 

Sgmltexi is an SGML system (DTD and tools) to 

make Texinfo documentation using SGML... 

... 

 

Daniele Giacomini <daniele@swlibero.org> 

 

Copyright © 2000 ... 

 

Published by... 

 


Permission is granted to make and distribute 

verbatim copies of this manual... 

... 

 

 

Cover art by ... 

 

 

 

 

 

 

Guardando l’esempio, si possono riconoscere alcuni elementi importanti: ‘admin’, usato per 

alcune informazioni amministrative, e ‘titlepage’. 

256.1.2 Informazioni amministrative 

L’elemento ‘admin’ viene usato per indicare al suo interno alcune informazioni che vanno prevalentemente 

nell’intestazione del documento Texinfo finale, oppure subito dopo. I componenti 

di questo ambiente non hanno un ordine preciso, nel sorgente SGML, in quanto poi vengono 

riordinati prima della composizione in Texinfo. 

Nel seguito vengono elencati e descritti gli elementi che possono apparire all’interno di ‘admin’. 

• ‘setfilename’ 

Si tratta di un elemento vuoto, utilizzato per definire il nome del file Info finale, attraverso 

il comando ‘@setfilename’ di Texinfo. Si usa con l’attributo ‘content’ a cui si assegna 

il nome di questo file. 

 

L’esempio mostra il caso in cui si definisce il nome ‘sgmltexi.info’. Si può vedere che 

non serve il marcatore di chiusura. 

• ‘settitle’ 

Si tratta di un elemento vuoto, utilizzato per definire il titolo per la composizione in formato 

Info, attraverso il comando ‘@settitle’ di Texinfo. Si usa con l’attributo ‘content’ a cui 

si assegna questo titolo. 

 

L’esempio mostra il caso in cui si definisce il nome ‘Sgmltexi’. Si può vedere che non 

serve il marcatore di chiusura. 

• ‘setchapternewpage’ 

Si tratta di un elemento vuoto, non essenziale, utilizzato per definire il comando corrispondente 

di Texinfo: ‘@setchapternewpage’. Si assegna una parola chiave all’attributo 

‘content’, tra ‘on’, ‘off’ e ‘odd’. 

 

L’esempio mostra la richiesta esplicita di iniziare ogni capitolo in una pagina nuova. 

Il programma frontale di Sgmltexi, ‘sgmltexi’, accetta un’opzione con lo stesso nome 

(‘--setchapternewpage={on|off|odd}’) che prevale su quanto stabilito nel sorgente 

SGML in questo modo. 

• ‘footnotestyle’ 


di Texinfo: ‘@footnotestyle’. Si assegna una parola chiave all’attributo 

‘content’, che può essere ‘end’ o ‘separate’.


 

L’esempio mostra la richiesta esplicita di inserire i piè pagina alla fine della pagina a cui si 

riferiscono. 

Il programma frontale di Sgmltexi accetta un’opzione con lo stesso nome 

(‘--footnotestyle={end|separate}’) che prevale su quanto stabilito nel sorgente 

SGML in questo modo. 

• ‘headings’ 


di Texinfo: ‘@headings’. Si assegna una parola chiave all’attributo ‘content’, che 

può essere: ‘on’, ‘off’, ‘single’, ‘double’, ‘singleafter’, ‘doubleafter’. 

 

L’esempio mostra la richiesta esplicita di mostrare le intestazioni. 

Il programma frontale di Sgmltexi accetta un’opzione con lo stesso nome, a cui si assegnano 

le stesse parole chiave (‘--headings=impostazione ’), che prevale su quanto stabilito nel 

sorgente SGML in questo modo. 

• ‘defindex’, ‘defcodeindex’ 

Si tratta di elementi vuoti, non essenziali, utilizzati per definire i comandi corrispondenti di 

Texinfo: ‘@defindex’ e ‘@defcodeindex’. Si assegna un nome composto da due lettere 

all’attributo ‘name’, per definire un indice analitico aggiuntivo; in particolare, utilizzando 

l’elemento ‘defcodeindex’ si ottiene la creazione di un indice analitico composto da voci 

riprodotte in dattilografico. 

 

L’esempio mostra la definizione dell’indice analitico normale, identificato dalla sigla ‘sg’. 

Naturalmente, si possono inserire più elementi ‘defindex’ e ‘defcodeindex’, quanti 

sono gli indici specifici che si vogliono dichiarare. 

• ‘synindex’, ‘syncodeindex’ 

Questi due elementi vuoti, vengono usati per copiare le voci di un indice analitico all’interno 

di un altro, come fanno i comandi corrispondenti di Texinfo: ‘@synindex’ e 

‘@syncodeindex’. Questi due elementi richiedono l’indicazione di due attributi, ‘from’ 

e ‘to’, a cui si assegna rispettivamente la sigla dell’indice analitico di partenza e quella 

dell’indice di destinazione. Si osservi l’esempio: 

 

In questo caso, si trasferiscono tutte le voci dell’indice ‘fn’ (quello delle funzioni) nell’indice 

‘cp’ (l’indice analitico standard). In particolare, dal momento che si tratta di 

‘syncodeindex’, le voci che vengono trasferite saranno rese in modo dattilografico (con 

il comando ‘@code’). 

• ‘infodir’ 

Questo elemento viene usato per definire una voce da inserire nell’elenco principale Info, 

quando il file relativo viene installato con il comando ‘install-info’. L’elemento 

contiene l’attributo ‘cat’ a cui si assegna la categoria, come si fa con il comando 

‘@dircategory’ di Texinfo. 

 

L’elemento ‘infodir’ può essere vuoto, come appena mostrato nell’esempio, ottenendo 

così l’inserimento di una sola riga nel corpo del comando ‘@direntry’ di Texinfo, utilizzando 

le informazioni già conosciute: il nome del file Info e il titolo del documento. Se si 

vuole fare a mano, è possibile inserire queste informazioni all’interno dell’elemento, come 

nell’esempio seguente:


 

* Sgmltexi: (sgmltexi). Il mio bel manuale di Sgmltexi 

* Introduzione: (sgmltexi)Intro 1. Introduzione al sistema Sgmltexi 

 

256.1.3 Pagine iniziali 

L’elemento ‘titlepage’ viene utilizzato per circoscrivere le informazioni che appaiono nelle 

primissime pagine del documento. L’ordine degli elementi contenuti è importante e gli errori 

vengono segnalati dal sistema di analisi SGML. 

• ‘title’ 

L’elemento ‘title’ serve a contenere il titolo del documento nella sua forma stampata. Si 

traduce in Texinfo nel comando ‘@title’. Il suo utilizzo è molto semplice, come si vede 

dall’esempio seguente: 

Sgmltexi 

• ‘subtitle’ 

Questo elemento permette l’indicazione di un sottotitolo. Non è obbligatorio e può essere 

usato più volte per indicare più sottotitoli successivi. 

An alternate way to write Texinfo documentation 

• ‘abstract’ 

L’elemento ‘abstract’ è facoltativo e si può usare una volta sola. Serve a racchiudere 

dei blocchi di testo, per esempio elementi ‘p’, che descrivono in breve il contenuto 

del documento. Il contenuto di questo elemento viene utilizzato nella composizione Info, 

inserendolo nella parte iniziale del nodo ‘top’. 

 

Sgmltexi is an SGML system (DTD and tools) to 

make Texinfo documentation using SGML... 

... 

... 

 

• ‘author’ 

Questo elemento, che deve essere indicato almeno una volta e può ripetersi a piacere, serve 

a contenere il nominativo di uno degli autori del documento. In Texinfo si traduce nel 

comando ‘@author’. 

Tizio Tizi <tizio@dinkel.brot.dg> 

Caio Cai <caio@dinkel.brot.dg> 

L’esempio mostra anche l’inclusione dell’indirizzo di posta elettronica, che comunque non 

sarebbe necessario. 

• ‘frontcovertext’ 

Questo elemento facoltativo, permette di inserire dei blocchi di testo all’interno della 

copertina. 

• ‘tpextra’ 

Questo elemento facoltativo, può essere usato in diverse situazioni all’interno delle pagine 

iniziali. Il suo scopo è quello di delimitare dei blocchi di testo che non hanno trovato una 

classificazione specifica. 

Per la precisione, questo elemento può apparire subito prima e subito dopo dell’elemento 

‘legal’, inoltre, se viene usato l’elemento ‘dedications’, può essere aggiunto subito 

dopo di questo.


• ‘legal’ 

L’elemento ‘legal’ si articola a sua volta in altri elementi più dettagliati, allo scopo di 

descrivere tutto ciò che rappresenta gli aspetti legali del documento: il copyright, la nota 

sui diritti (concessi o esclusi), oltre ad altre informazioni amministrative legate all’edizione. 

– ‘copyright’ 

Questo elemento serve a contenere l’indicazione relativa ai diritti di autore. Se nel tempo 

si sono succeduti diversi proprietari, l’elemento ‘copyright’ può essere indicato 

più volte, in base alla necessità (in base a quanto concordato). Si osservi l’esempio 

seguente: 

Copyright © 1987-1999 Tizio Tizi 

Copyright © 2000 Caio Cai 

– ‘publishnote’ 

L’elemento ‘publishnote’, facoltativo, permette l’inclusione di blocchi di testo il 

cui scopo è quello di inserire informazioni relative alla pubblicazione. Si può usare in 

modo simile a quanto si vede nell’esempio seguente: 

 


... 

 

– ‘license’ 

L’elemento ‘license’ è fatto per contenere blocchi di testo che descrivono le condizioni 

con le quali è rilasciato il documento, che solitamente si rifanno a una licenza 

allegata da qualche parte (eventualmente in un’appendice). 

 

Permission is granted to copy, distribute and/or 

modify this document under the terms of the GNU Free 

Documentation License, Version 1.1 or any later version 

published by the Free Software Foundation; with no 

Invariant Sections, with no Front-Cover Texts, and with 

no Back-Cover Texts. A copy of the license is included 

in the section entitled "GNU Free Documentation 

License". 

 

– ‘coverart’ 

L’elemento ‘coverart’, facoltativo, consente di scrivere una nota su chi sia l’ideatore 

della copertina. In generale, se si usa Sgmltexi non ha senso preoccuparsi di una 

cosa del genere, dal momento che tutto viene guidato dallo schema SGML del DTD. 

Tuttavia, esiste la possibilità di fare questa annotazione ugualmente. 

 


 

L’elemento ‘legal’ può essere usato anche in modo più semplice, se la struttura prevista 

non soddisfa le esigenze reali. In pratica, al posto degli elementi appena descritti, può 

contenere dei semplici blocchi di testo, come nell’esempio seguente: 

 

Copyright © 2000 ... 


Permission is granted to make and distribute 

verbatim copies of this manual... 


 

• ‘dedications’


Dopo l’elemento ‘legal’, l’elemento ‘dedications’ consente di elencare le dediche del 

documento. Queste appaiono esclusivamente nella composizione stampata, in una pagina 

apposita. L’elemento ‘dedications’ è predisposto per l’inserimento di blocchi di testo di 

qualunque genere. 

 

Ad Anna,la mia amata. 

 

256.1.4 Indice generale 

Dopo l’elemento ‘titlepage’ è possibile collocare uno o più indici generali, più o meno 

dettagliati. 

• ‘contents’ 

L’elemento ‘content’, vuoto, richiede l’inserimento di un indice generale dettagliato. Si 

traduce in pratica nel comando ‘@content’ di Texinfo. 

• ‘shortcontents’, ‘summarycontents’ 

Questi due elementi, vuoti, servono a includere rispettivamente i comandi 

‘@shortcontent’ e ‘@summarycontent’ di Texinfo. Lo scopo è quello di ottenere 

un tipo di indice generale ridotto. Se si usa questo tipo di indice, si include solo uno dei 

due elementi in questione. 

256.1.5 Nodi e menù Info iniziale 

In mancanza di indicazioni, Sgmltexi gestisce da solo i collegamenti riferiti al nodo ‘Top’, oltre 

a un menù unico per Info, collocato nello stesso nodo iniziale. 

Volendo è possibile dichiarare espressamente il nodo ‘Top’, attraverso l’elemento ‘topnode’, che 

si usa vuoto con tre eventuali attributi: ‘next’, ‘prev’ e ‘up’. L’elemento ‘topnode’ si colloca, 

eventualmente, subito dopo gli indici generali. 

 

Dopo l’elemento ‘topnode’, è possibile specificare il menù iniziale in modo dettagliato, attraverso 

l’elemento ‘menu’. L’esempio seguente mostra un caso abbastanza articolato, benché 

abbreviato, in cui si vede anche l’inclusione dell’elemento ‘detailmenu’: 

 

* Copying:: Your rights. 

* Overview:: Texinfo in brief. 

... 

* Structuring:: How to create chapters, sections, subsections, 

appendices, and other parts. 

* Nodes:: How to write nodes. 

... 

 

--- The Detailed Node Listing --- 

Overview of Texinfo 

* Reporting Bugs:: Submitting effective bug reports. 

* Using Texinfo:: Create printed or online output. 

* Info Files:: What is an Info file?


... 

 

 

Naturalmente, non si tratta di elementi indispensabili, ma solo utili se si desidera avere il controllo 

della gestione dei nodi del documento che si ottiene. 

256.1.6 Introduzione 

Dopo l’elemento ‘head’ ci può essere l’elemento ‘intro’, il cui scopo è quello di definire uno 

spazio in cui i capitoli assumono il ruolo di sezioni introduttive, non numerate. Nell’ambito di 

questo spazio, i «capitoli» sono delimitati nello stesso modo utilizzato nel corpo del documento 

(l’elemento ‘body’) e nelle appendici (l’elemento ‘appendix’). 

 

Introduction to Sgmltexi 

Sgmltexi is a DTD with tools to get Texinfo... 

Sgmltexi manage Texinfo nodes automatically,... 

 

256.1.7 Corpo 

Il corpo del documento è contenuto nell’elemento ‘body’, che si colloca dopo l’elemento ‘head’ 

e dopo l’elemento ‘intro’ eventuale. 

Il corpo può essere suddiviso in capitoli, oppure in parti, o anche in tomi, a seconda della dimensione 

del progetto di documentazione che si intende avviare. Lo spazio del tomo, della parte, 

del capitolo, o di una classificazione inferiore, non è delimitato esplicitamente, in quanto appare 

soltanto la dichiarazione del titolo, all’interno di un elemento che cambia a seconda del livello 

gerarchico. In pratica, il titolo di un tomo è racchiuso nell’elemento ‘tomeheading’, mentre 

quello di una parte è inserito nell’elemento ‘partheading’. 

I capitoli e le classificazioni inferiori hanno titoli delimitati da elementi analoghi a quelli 

dell’HTML: ‘h1’, ‘h2’, ‘h3’ e ‘h4’. Questa classificazione, a partire da ‘h1’ in giù, riguarda 

nello stesso modo l’introduzione e l’appendice. 

 

Networking 

IP protocol history 

Bla bla bla... 


ISO-OSI model 



IPv4 and IPv6 


... 


Ogni elemento che racchiude un titolo consente l’inserimento dell’attributo ‘id’, il cui scopo 

è quello di definire una stringa di identificazione, da usare come obiettivo per i riferimenti 

incrociati. 


È importante rammentare che, a causa di una limitazione progettuale di Texinfo, queste 

etichette per i riferimenti ipertestuali non possono contenere la virgola. 

Ogni elemento che racchiude un titolo consente l’inserimento degli attributi ‘node’ e ‘menu’, 

con i quali è possibile stabilire il nome del nodo relativo e la descrizione che deve apparire nel 

menù (purché questo sia generato automaticamente). In mancanza di queste indicazioni, vengono 

generati dei nomi in modo automatico, mentre si usa il titolo come descrizione del nodo. 

Storia di IPv4 

Ogni elemento che racchiude un titolo consente l’inserimento dell’attributo ‘numbered’, a cui 

si possono assegnare esclusivamente le parole chiave ‘on’ oppure ‘off’. In condizioni normali, 

l’attributo contiene la parola chiave ‘on’, che implica la numerazione dei titoli, salvo il caso 

dell’introduzione. Assegnando esplicitamente la parola chiave ‘off’ si ottiene un titolo non 

numerato in un contesto che non lo prevederebbe. 

Riconoscimenti 

Ogni elemento che racchiude un titolo consente l’inserimento degli attributi ‘next’, ‘prev’ e 

‘up’. Con questi si può alterare la catena di scorrimento dei nodi, specificandoli manualmente. In 

generale dovrebbe essere preferibile lasciare fare a Sgmltexi. 

256.1.8 Appendice 

Dopo il corpo del documento, delimitato dall’elemento ‘body’, può apparire l’appendice, contenuta 

nell’elemento ‘appendix’. Al suo interno si possono inserire dei «capitoli», introdotti da un 

titolo contenuto in un elemento ‘h1’, che vengono trattati correttamente come appendici. Dopo i 

titoli delimitati da ‘h1’, sono ammissibili naturalmente anche segmenti di livello inferiore. 

 

GNU Free Documentation License 

GNU Free Documentation License 

Version 1.1, March 2000 

 

Copyright © 2000 Free Software Foundation, Inc. 

59 Temple Place, Suite 330, Boston, MA 02111-1307 USA 

Everyone is permitted to copy and distribute verbatim copies 

of this license document, but changing it is not allowed. 

 

... 

... 


256.1.9 Indici analitici 

Dopo il corpo e dopo il blocco delle appendici, è possibile inserire uno o più indici analitici. 

Questi si dichiarano con un titolo, attraverso l’elemento ‘indexheading’ e con il riferimento al 

tipo di indice che si vuole esattamente, con l’elemento vuoto ‘printindex’. Si osservi l’esempio 

seguente in cui si inseriscono due indici: quello delle funzioni (la sigla ‘fn’) e quello standard (la 

sigla ‘cp’). 

Index of functions 

 

Concept index 

 

Come si vede dall’esempio, l’elemento ‘printindex’ ha l’attributo ‘name’, a cui si assegna la 

sigla corrispondente all’indice che si vuole inserire. 

256.2 Scomposizione del documento, nodi e menù Info 

Per scrivere della documentazione di qualità, secondo i canoni di Texinfo, è necessario gestire 

direttamente i nodi e i menù. Con Sgmltexi si possono dimenticare i nodi e i menù, ma il risultato 

in formato Info potrebbe soffrirne. Tuttavia, come in parte è già stato mostrato, è possibile 

scegliere diversi livelli di automatismo in questa gestione. 

Gli elementi usati per delimitare le intestazioni, da ‘h1’ a ‘h4’, possono incorporare gli attributi 

‘node’ e ‘menu’. Ciò prende il sopravvento sulla determinazione automatica relativa. Si osservi 

l’esempio: 

 


In questo caso, si ottiene l’inserimento della riga seguente nel menù relativo: 

* history:: History of IP protocol 

I due attributi, ‘node’ e ‘menu’, possono essere usati in modo indipendente: l’attributo che non 

viene usato, viene sostituito in modo automatico. 

Avendo accesso ai nodi, è possibile farvi riferimento per dei riferimenti incrociati, senza 

bisogno di usare l’attributo ‘id’. 

Come già descritto in precedenza, Sgmltexi crea automaticamente il nodo ‘Top’ iniziale. Il menù 

relativo può essere definito esplicitamente e in tal caso tutti i nodi e tutte le descrizioni relative 

devono essere inseriti manualmente. 

Inserendo l’elemento ‘menu’ alla fine del testo di un capitolo, o di una sezione inferiore, si ottiene 

l’aggiunta di un menù Info in corrispondenza di quel punto. Si osservi l’esempio: 




 

ISO-OSI model 

Bla bla bla...



More information 


... 

In questo caso, si ottiene l’inserzione di un menù, gestito automaticamente, prima delle sezioni 

di livello ‘h2’. Volendo, si può indicare il menù in modo preciso, come si vede di seguito: 

 

* IP layer:: IP ISO-OSI layer model 

* more on IP:: More details on IP 

 

Quando un menù viene descritto in questo modo, i nomi dei nodi devono essere identici a quelli 

dichiarati negli elementi delle intestazioni. In pratica, scrivendo un menù in modo manuale, anche 

i nodi devono essere dichiarati esattamente, come si vede qui: 




 

* IP layer:: IP ISO-OSI layer model 

* more on IP:: More details on IP 

 

ISO-OSI model 



More information 


... 

È evidente, in questa situazione, che l’attributo ‘menu’, il cui scopo sarebbe quello di controllare 

la descrizione del nodo nel menù, non può essere preso in considerazione in questo caso. 

256.2.1 Numerazione o meno dei titoli 

Texinfo consente di inserire dei titoli riferiti a capitoli o sezioni inferiori, con o senza numerazione. 

Inoltre, consente anche di dichiarare dei titoli che non devono apparire nell’indice generale. 

Per controllare questa possibilità con Sgmltexi, si può utilizzare l’attributo ‘type’ che riguarda 

tutti gli elementi ‘hn’: 

titolo 

In mancanza dell’indicazione dell’attributo, è come se gli fosse stata assegnata la parola chiave 

‘numbered’, con la quale i titoli del corpo e delle appendici sono numerati (con numeri o lettere 

rispettivamente). Utilizzando la parola chiave ‘numbered’ si ottiene l’inserimento di un titolo 

non numerato (nel caso dell’introduzione è sempre senza numerazione); con la parola chiave 

‘heading’ si ottiene un titolo non numerato e anche non segnalato nell’indice generale (in questo 

senso può essere utile anche nell’introduzione).


256.3 Gestire più derivazioni di uno stesso progetto di 

documentazione 

Attraverso Sgmltexi è possibile gestire più derivazioni distinte di un progetto di documentazione 

unico. Per ottenere questo risultato, Prima di passare all’analisi SGML, il sorgente viene filtrato in 

base a dei comandi particolari che delimitano lo spazio di queste derivazioni. L’esempio seguente 

mostra i comandi che delimitano uno spazio relativo alla derivazione ‘PIPPO’: 

 

... 

... 

... 

 

Si può osservare che si tratta di un commento SGML speciale, che viene preso in considerazione 

da Sgmltexi prima dell’analisi SGML vera e propria. 

Questi comandi devono apparire da soli in una riga; in pratica, non è ammissibile circoscrivere 

uno spazio interno a una riga in questo modo. 

Il principio di funzionamento è molto semplice: vengono incluse le parti di sorgente delimitate 

in questo modo per la derivazione a cui si fa riferimento. Quindi, se si vuole un pezzo qui e uno 

lì, occorre ripetere l’inserimento di questi comandi. 

La derivazione predefinita è quella denominata ‘MAIN’, per cui è come se, in mancanza 

di altre indicazioni contrarie, il sorgente fosse racchiuso tra ‘’ e 

‘’: 

 

 

 

... 

... 

... 

 

 

Naturalmente, nulla vieta di usare esplicitamente queste dichiarazioni per la derivazione 

principale. 

Per selezionare la composizione di una derivazione diversa da quella principale (predefinita), 

si usa l’opzione ‘--deriv=derivazione’. Supponendo di voler eseguire la composizione in 

PostScript della derivazione ‘PIPPO’ del file ‘prova.sgml’, basta usare il comando seguente: 

$ sgmltexi --deriv=PIPPO --ps prova.sgml 

Questa forma di selezione può essere gestita anche all’interno di file secondari. Sgmltexi è organizzato 

a questo proposito per gestire solo file interni al sistema, che nel sorgente principale 

vengono gestiti come nell’esempio seguente: 

 

-- ... -- 

]> 

Come si vede, si tratta di dichiarazioni che si fanno nel preambolo SGML. Sgmltexi deve identificarle 

preventivamente, per poter attuare il filtro anche in tali file. Per questo motivo, è necessario 

che non ci sia più di un’istruzione del genere su una sola riga.


È importante sottolineare che questi comandi speciali riguardano il file in cui si trovano. Pertanto, 

se ci si trova in una situazione simile a quella che si vede nell’esempio sottostante, 

 

&INTRO; 

 

i comandi indicano semplicemente di includere l’istruzione SGML ‘&INTRO;’. Se poi si vuole 

includere effettivamente tutto o anche solo parte del file corrispondente (‘formalita/ 

introduzione.sgml’), bisognerà che al suo interno ci siano altre istruzioni del genere; 

diversamente sarebbe come includere un file completamente vuoto. 

256.4 Codifica 

Sgmltexi ha una gestione incompleta per le codifiche ISO 8859-n. È incompleta perché Texinfo 

non è in grado di riprodurre tutti i caratteri. Ci sono due modi per definire l’uso di una codifica 

particolare con Sgmltexi: l’opzione ‘--input-encoding’ e l’attributo ‘charset’ all’interno 

dell’elemento ‘sgmltexi’. 

La scelta genera risultati differenti. L’opzione ‘--input-encoding’ genera una trasformazione 

dei caratteri in entità SGML, che successivamente sono tradotte in codice Texinfo. In questo 

modo, il codice Texinfo che si ottiene è sicuramente in ASCII puro (ISO 646), dove le entità 

che non hanno alcuna corrispondenza in Texinfo. vengono mostrate come ‘[ETH ]’, tanto 

per fare un esempio. L’uso dell’attributo ‘charset’ si traduce semplicemente nel comando 

‘@documentencoding’; in certe situazioni, il risultato della composizione può essere buono o 

meno. A seconda del risultato migliore che si riesce a ottenere, si può scegliere un modo invece 

dell’altro. 

Una buona strategia può essere l’uso dell’attributo ‘charset’ in ogni caso, aggiungendo l’opzione 

‘--input-encoding’ quando Texinfo non genera una composizione piacevole (di solito 

quando si genera un formato per la stampa). 

256.4.1 Entità standard e non standard 

Il DTD di Sgmltexi include tutte le entità standard ISO 8879. Tuttavia, non tutte le entità sono 

gestibili da Texinfo; pertanto, quando si usa un’entità non gestibile, viene mostrata nella 

composizione finale come racchiusa tra parentesi quadre, per esempio come ‘[ETH ]’. 

Sgmltexi mette a disposizione qualche entità non standard, necessaria per mantenere la 

compatibilità con Texinfo. Queste entità speciali sono elencate nella tabella 256.4. 

Tabella 256.4. Entità non standard. 

Macro SGML Comando Texinfo Descrizione 

&dots; @dots{} Tre puntini. 

&enddots; @enddots{} Quattro puntini. 

&TeX; @TeX{} Il nome «TeX» 

&result; @result{} 

&expansion; @expansion{} 

&print; @print{} 

&error; @error{} 

&point; @point{} 

&today; @today{} 

&esexcl; @! Punto esclamativo alla fine di una frase. 

&esperiod; @. Punto fermo alla fine di una frase.


Macro SGML Comando Texinfo Descrizione 

&nes; @: Frase che non si conclude. 

&esquest; @? Punto interrogativo alla fine di una frase. 


Sgmltexi: contenuti 

Capitolo 257 

Dopo la struttura generale, il sorgente Sgmltexi si articola generalmente in elementi che possono 

essere classificati sommariamente in blocchi e in testo interno a un blocco. Nei DTD comuni si 

utilizzano frequentemente le entità parametriche ‘%block;’ e ‘%inline;’, per definire questi 

due grandi raggruppamenti. Nel DTD di Sgmltexi si usa la stessa convenzione e in questo senso 

vanno interpretate tali sigle nelle tabelle riassuntive. 

A titolo di esempio, un blocco è qualcosa di simile a un paragrafo, un elenco, una tabella; un 

elemento interno alla riga è fatto per contenere del testo, eventualmente assieme a delle enfatizzazioni 

di qualche genere. Di solito, anche se questo fatto non può valere in generale, un elemento 

interno alla riga è fatto per contenere testo o altri elementi dello stesso genere; al contrario, un 

elemento che costituisce un blocco, può contenere altri blocchi, oppure del testo interno alla riga. 

Il DTD di Sgmltexi non prevede elementi che possano contenere testo interno alla riga o blocchi 

a scelta, come accade invece nell’HTML. 

257.1 Paragrafi 

I blocchi di testo più comuni sono dei paragrafi, delimitati dall’elemento ‘p’, il quale può apparire 

con un rientro iniziale o meno, a seconda dell’uso dell’attributo ‘indent’. I paragrafi, compresi 

quelli centrati che si ottengono con l’elemento ‘center’, contengono testo o altri elementi interni 

alla riga. 

Tabella 257.1. Paragrafi con Sgmltexi. 


Texinfo 

Chiusu- 

Descrizione o corrispondenza con 

Contenuto 

attributo 

p Sì Sì %inline; 

Blocco di testo elementare, riconducibile 

al paragrafo. 

indent -- -- Attributo Rientro prima riga: ‘on’, ‘off’. 

center Sì Sì %inline; 

Blocco di testo centrato: 

‘@center’. 

257.2 Indici e riferimenti incrociati 

Sgmltexi mette a disposizione diversi elementi il cui scopo è quello di permettere delle inserzioni 

per generare degli indici o dei riferimenti incrociati, riproducendo i comandi equivalenti di 

Texinfo. 

Le voci degli indici analitici vengono inserite attraverso un gruppo di elementi vuoti: ‘cindex’, 

‘findex’, ‘vindex’, ‘kindex’, ‘pindex’, ‘tindex’ e ‘userindex’. Tutti questi elementi hanno 

lo stesso attributo ‘entry’, che serve a specificare la voce da inserire nell’indice relativo. In 

particolare, l’elemento ‘userindex’ ha in più l’attributo ‘name’ per specificare l’indice al quale 

si vuole fare riferimento. 

Questi elementi possono essere usati solo dopo la dichiarazione di una sezione (un titolo di 

qualunque tipo, dal tomo in giù), ma prima del testo normale che ne seguirebbe. Per esempio 

così: 


 

 


2796

Sgmltexi: contenuti 2797 

La tabella 257.2 riassume brevemente l’uso di questi elementi. 

Tabella 257.2. Voci degli indici analitici. 


Texinfo 

Chiusu- 


Contenuto 

attributo 

cindex Sì Vuoto Voce dell’indice analitico normale. 

entry -- -- Attributo Voce da inserire nell’indice. 

Voce dell’indice analitico delle 

findex Sì Vuoto 

funzioni. 


Voce dell’indice analitico delle 

vindex Sì Vuoto 

variabili. 


kindex Sì Vuoto 

Voce dell’indice analitico dei tasti 

premuti. 


pindex Sì Vuoto 

Voce dell’indice analitico dei programmi. 


Voce dell’indice analitico dei tipi di 

tindex Sì Vuoto 

dati. 


Voce di un indice analitico definito 

userindex Sì Vuoto 

dall’utilizzatore. 


name -- -- Sigla identificativa dell’indice definito 

dall’utente. 

Attributo 

Inserisce l’elenco delle voci dell’indice 

specificato. 

printindex Sì Vuoto 

name -- -- Attributo Sigla identificativa dell’indice. 

Ogni indice analitico si distingue in base a una sigla di due lettere. Gli indici analitici già previsti 

da Texinfo hanno una sigla fissa, mentre tutte le altre combinazioni possono essere usate per gli 

indici stabiliti dall’utilizzatore. La tabella 257.3 riassume le sigle degli indici standard, la cui 

conoscenza è necessaria per poter usare correttamente l’elemento ‘printindex’ allo scopo di 

riprodurre l’elenco dell’indice relativo. 

Tabella 257.3. Sigle identificative degli indici analitici standard. 

Sigla 

cp 

ky 

pg 

fn 

vr 

tp 

Descrizione 

Indice analitico normale. 

Indice analitico dell’uso della tastiera. 

Indice analitico dei programmi. 

Indice analitico delle funzioni. 

Indice analitico delle variabili. 

Indice analitico dei tipi di dati. 

Gli elementi utilizzati per realizzare dei riferimenti incrociati sono vuoti e sono sempre interni 

alla riga di testo. Tutte le informazioni necessarie sono passate attraverso attributi. Dal momento 

che questi elementi rispecchiano fedelmente i comandi equivalenti di Texinfo, viene mostrata 

solo la tabella 257.4, senza entrare nel dettaglio del significato di ognuno di loro.

2798 Sgmltexi: contenuti 

Tabella 257.4. Riferimenti incrociati. 


Texinfo 

Chiusu- 


Contenuto 

attributo 

anchor Sì Vuoto Comando ‘@anchor’ di Texinfo. 

id -- -- Attributo 

Stringa di identificazione dell’ancora. 

xref Sì Vuoto Comando ‘@xref’ di Texinfo. 

id -- -- Nodo o ancora a cui si fa riferimento. 

Attributo 

name -- -- Attributo Nome del riferimento. 

title -- -- Titolo o argomento a cui si fa 

Attributo 

riferimento. 

info -- -- Attributo Nome del file Info. 

ptitle -- -- Attributo Titolo dell’edizione stampata. 

ref Sì Vuoto Comando ‘@ref’ di Texinfo. 


Attributo 



Attributo 

riferimento. 



pxref Sì Vuoto Comando ‘@pxref’ di Texinfo. 


Nodo o ancora a cui si fa riferimento. 



Attributo 

riferimento. 



inforef Sì Vuoto Comando ‘@inforef’ di Texinfo. 


Attributo 



uref Sì Vuoto Comando ‘@uref’ di Texinfo. 

uri -- -- Attributo 

Indirizzo URI a cui si fa riferimento. 


replace -- -- Attributo Testo di rimpiazzo da mostrare. 

email Sì Vuoto Comando ‘@email’ di Texinfo. 

email -- -- Attributo Indirizzo di posta elettronica. 

name -- -- Attributo Titolo o descrizione dell’indirizzo. 

In particolare, è opportuno osservare che l’attributo ‘id’ degli elementi ‘hn’, ‘partheading’ 

e ‘tomeheading’, è un’ancora a cui possono puntare tutti i vari tipi di riferimenti incrociati 

disponibili (tranne ‘uref’ e ‘email’ che puntano a degli URI). 

L’esempio seguente mostra come usare l’elemento ‘pxref’ in modo molto semplice: 

Sgmltexi crea automaticamente il nodo Top. Come già spiegato in 

precedenza, (), il menù può essere...


257.3 Delimitazione di parole e di frasi 

Un certo numero di elementi serve a delimitare parole o frasi, per qualche motivo. Il DTD di 

Sgmltexi è molto permissivo, in modo tale che ogni elemento di questi può contenere qualunque 

altro elemento interno alla riga di testo. Ciò è stato fatto per assicurare la massima compatibilità 

con Texinfo, ma in futuro potrebbero essere poste delle piccole limitazioni. 

La tabella 257.5 elenca questi elementi, assieme a ‘kbdinputstyle’, che si usa per specificare 

lo stile di rappresentazione del contenuto dell’elemento ‘kbd’. 

Tabella 257.5. Delimitazione di parole e frasi. 


Texinfo 

Chiusu- 


Contenuto 

attributo 

code Sì Sì %inline; Comando ‘@code’ di Texinfo. 

kbd Sì Sì %inline; Comando ‘@kbd’ di Texinfo. 

kbdinputstyle 

Comando ‘@kbdinputstyle’ di 

Sì Vuoto 

Texinfo. 

style -- -- Stile: ‘code’, ‘example’, 

Attributo 

‘distinct’. 

key Sì Sì %inline; Comando ‘@key’ di Texinfo. 

samp Sì Sì %inline; Comando ‘@samp’ di Texinfo. 

var Sì Sì %inline; Comando ‘@var’ di Texinfo. 

env Sì Sì %inline; Comando ‘@env’ di Texinfo. 

file Sì Sì %inline; Comando ‘@file’ di Texinfo. 

command Sì Sì %inline; Comando ‘@command’ di Texinfo. 

option Sì Sì %inline; Comando ‘@option’ di Texinfo. 

dfn Sì Sì %inline; Comando ‘@dfn’ di Texinfo. 

cite Sì Sì %inline; Comando ‘@cite’ di Texinfo. 

acronym Sì Sì %inline; Comando ‘@acronym’ di Texinfo. 

url Sì Sì %inline; Comando ‘@url’ di Texinfo. 

emph Sì Sì %inline; Comando ‘@emph’ di Texinfo. 

strong Sì Sì %inline; Comando ‘@strong’ di Texinfo. 

sc Sì Sì %inline; Comando ‘@sc’ di Texinfo. 

roman Sì Sì %inline; Comando ‘@r’ di Texinfo. 

italic Sì Sì %inline; Comando ‘@i’ di Texinfo. 

bold Sì Sì %inline; Comando ‘@b’ di Texinfo. 

typewriter Sì Sì %inline; Comando ‘@t’ di Texinfo. 

Viene mostrato un esempio molto semplice dell’uso dell’elemento ‘strong’: 

Pinco Pallino è un uomo molto vecchio... 

Tizio Tizi ha studiato tecnologia delle 

comunicazioni... 

257.4 Delimitazione di blocchi di testo 

Alcuni elementi servono a delimitare blocchi di testo, o un tipo particolare di testo interno alle righe. 

Il DTD di Sgmltexi è molto permissivo per assicurare la massima compatibilità con Texinfo, 

ma in futuro potrebbero essere poste delle piccole limitazioni. 

La tabella 257.6 elenca questi elementi, assieme a ‘pre’, che permette di inserire del testo preformattato, 

e a ‘exdent’, utilizzato all’interno di ‘pre’ per ottenere delle righe che sporgono verso 

l’esterno.


Tabella 257.6. Delimitazione di blocchi di testo. 


Texinfo 

Chiusu- 


Contenuto 

attributo 

exdent Sì Sì %inline; Comando ‘@exdent’ di Texinfo. 

pre Sì Sì %inline; Testo preformattato. 

quotation 

Comando ‘@quotation’ di Texinfo. 


display Sì Sì %block; o ‘pre’ Comando ‘@display’ di Texinfo. 

smalldisplay 

Comando ‘@smalldisplay’ di 

Sì Sì %block; o ‘pre’ 

Texinfo. 

example Sì Sì %block; o ‘pre’ Comando ‘@example’ di Texinfo. 

smallexample 

Comando ‘@smallexample’ di 


Texinfo. 

Comando ‘@flushleft’ di Texinfo. 

flushleft Sì Sì %inline; 

flushright 

Comando ‘@flushright’ di Texinfo. 

Sì Sì %inline; 

lisp Sì Sì %block; o ‘pre’ Comando ‘@lisp’ di Texinfo. 

smalllisp 

Comando ‘@smalllisp’ di Texinfo. 


Comando ‘@cartouche’ di Texinfo. 

cartouche Sì Sì %block; o ‘pre’ 

format Sì Sì %block; o ‘pre’ Comando ‘@format’ di Texinfo. 

Comando ‘@smallformat’ di Texinfo. 

smallformat Sì Sì %block; o ‘pre’ 

texinfo Sì Sì Codice Texinfo incorporato. 

In generale, l’uso di questi elementi è molto semplice, come si può vedere in questo caso: 

 



 

L’esempio seguente, invece, mostra l’uso dell’elemento ‘pre’, allo scopo di incorporare del testo 

preformattato, pur continuando a espandere le macro SGML: 

 

 


while ($line = >STDIN>) 

{ 

chomp $line; 

print ("$line\r\n"); 

} 

 

 

In aggiunta, si può delimitare il contenuto dell’elemento ‘pre’ per poterlo scrivere in modo 

letterale: 

 

 

) 

{ 

chomp $line; 

print ("$line\r\n"); 

} 

]]> 

 


257.5 Elenchi e tabelle 

Elenchi e tabelle, sono blocchi di testo. La gestione di Texinfo per ciò che riguarda queste strutture, 

è abbastanza speciale. Qui viene riassunto tutto nella tabella 257.7, che però richiede la 

conoscenza dei comandi di Texinfo corrispondenti. 

Elemento o 

attributo 

Tabella 257.7. Elenchi e tabelle. 

itemize Sì Sì 

Apertura 

Chiusura 

Contenuto 

‘item’, ‘itemx’, 

%block; 

mark -- -- Attributo 

enumerate Sì Sì 


%block; 

start -- -- Attributo 


Texinfo 

Comando ‘@itemize’ di Texinfo. 

Segno usato al posto del pallino 

iniziale. 

Comando ‘@enumerate’ di Texinfo. 

Valore iniziale dell’elenco numerato. 

table Sì Sì 


%block; 

Comando ‘@table’ di Texinfo. 

emphasis -- -- Attributo Enfasi della colonna descrittiva: 

‘asis’, ‘code’, ‘samp’, ‘var’, 

‘kbd’, 

‘file’. 

vtable Sì Sì 


%block; 

Comando ‘@vtable’ di Texinfo. 

emphasis -- -- Attributo Enfasi della colonna delle variabili: 


‘kbd’, 

‘file’. 

ftable Sì Sì 


%block; 

Comando ‘@ftable’ di Texinfo. 

emphasis -- -- Attributo Enfasi della colonna delle funzioni: 


‘kbd’, 

‘file’. 

item Sì %inline; o vuoto. Comando ‘@item’ di Texinfo. 

itemx Sì %inline; o vuoto. Comando ‘@itemx’ di Texinfo. 

multitable Sì Sì 

columnfraction Sì Sì ‘.n’. 

columnexample Sì Sì Testo puro. 

Comando ‘@multitable’ di Texinfo. 

Colonna larga 0,n volte lo spazio 

totale. 

Colonna larga tanto quanto l’esempio. 

raw Sì Sì %inline;, ‘tab’. Riga di una tabella. 

tab Sì No Vuoto 

Separatore tra una colonna e la 

successiva. 

Vengono mostrati alcuni esempi, a cominciare da un elenco non numerato: 

 

 

Primo elemento dell’elenco. 

 

Secondo elemento. 

 

In questo caso, si ottiene un elenco puntato di due sole voci, dove al posto del pallino usuale, 

appare il simbolo ‘#’. Sostituendo l’elemento ‘itemize’ con ‘enumerate’, si ottiene un elenco 

numerato:


 

 

Primo elemento dell’elenco. 

 

Secondo elemento. 

 

In questo caso, si fa in modo che il primo dei due elementi abbia il numero tre. L’elenco descrittivo 

si ottiene attraverso l’elemento ‘table’, dove gli elementi ‘item’ contengono le voci relative. 

Si osservi l’esempio: 

 

ls 

dir 

Elenco del contenuto della directory. 

cd 

Cambia directory. 

 

Si intende così che l’elemento ‘itemx’ serve quando un elemento dell’elenco è composto da più 

di una voce. 

Le tabelle, intese come quelle a cui si è abituati di solito, sono gestite attraverso l’elemento 

‘multitable’. Questo, prima dell’indicazione delle righe che compongono la tabella, richiede 

di specificare quante sono le colonne e quanto larghe devono essere. Per questo, all’inizio occorre 

utilizzare una serie di elementi ‘columnfraction’, oppure ‘columnexample’, attraverso 

i quali si specificano proprio queste larghezze (in percentuale o attraverso un testo di esempio). 

L’esempio seguente mostra il caso di una tabella le cui colonne sono state definite in modo 

percentuale: 

 

.30 

.70 

Parametro LOC 

Posizione corrispondente 

 

h 


 

t 

superiore 

 

b 

inferiore 

 

p 

pagina 

 

 

In alternativa, dato che la larghezza delle colonne dipende proprio dai titoli, si poteva fare così: 

 

Parametro LOC 


Parametro LOC 


 

h 


 

t 

superiore 

 

b 

inferiore


 

p 

pagina 

 

 

In entrambi i casi, lo scopo era quello di ottenere uno specchietto simile a quello che segue. Si 

osservi che non ci sono didascalie e nemmeno esiste la possibilità di collocare dinamicamente la 

tabella. 

Parametro LOC 

h 

t 

b 

p 

257.6 Inserzioni 



superiore 

inferiore 

pagina 

Alcuni elementi sono difficilmente classificabili in gruppi particolari. Qui, vengono distinti in 

due raggruppamenti: quelli interni alle righe e quelli che rappresentano dei blocchi. A questi 

corrispondono le tabelle 257.8 e 257.9. 

Tabella 257.8. Inserzioni interne alle righe. 


Texinfo 

Chiusu- 


Contenuto 

attributo 

dmn Sì Sì #PCDATA Comando ‘@dmn’ di Texinfo. 

math Sì Sì #PCDATA Comando ‘@math’ di Texinfo. 

footnote Sì Sì %inline; Comando ‘@footnote’ di Texinfo. 

image Sì Vuoto Comando ‘@image’ di Texinfo. 

name -- -- Nome del file da inserire, senza 

Attributo 

estensione. 

width -- -- Attributo Ampiezza dell’immagine. 

height -- -- Attributo Altezza dell’immagine. 

whole Sì Sì %inline; 

Comando ‘@w’ (previene 

l’interruzione di riga). 

br Sì Vuoto 

Comando ‘@*’ (interruzione di 

riga). 

dh Sì Vuoto 

Comando ‘@-’ (separazione facoltativa). 

hyphenation 

Comando ‘@hyphenation’ di Texinfo. 

Sì Vuoto; 

words -- -- Attributo Elenco di parole separate in sillabe. 

Tabella 257.9. Inserzione di blocchi. 


Texinfo 

Chiusu- 


Contenuto 

attributo 

sp Sì Vuoto Comando ‘@sp’ di Texinfo. 

lines -- -- Attributo 

Quantità di righe da saltare (un 

numero intero). 

page Sì Vuoto Comando ‘@page’ di Texinfo. 

group Sì Sì %block; Comando ‘@group’ di Texinfo. 

need Sì Vuoto Comando ‘@need’ di Texinfo. 

mils -- -- Attributo Millesimi di pollice richiesti.


257.7 Definizioni 

Texinfo prevede un grande numero di comandi per la descrizione di definizioni di vario genere. 

Queste «definizioni» vanno intese generalmente come dei modelli sintattici. È un po’ difficile 

comprendere bene quando usare questa o quella forma di definizione; per cui occorre studiare la 

documentazione di Texinfo. 

Tutte le forme di definizione si dichiarano attraverso un elemento provvisto di diversi attributi. 

Questo elemento contiene generalmente la descrizione del modello, in una serie di blocchi di testo, 

ma in particolare potrebbe contenere la descrizione degli argomenti, all’interno dell’elemento 

‘args’, comune a tutte le definizioni che ne hanno. 

Tabella 257.10. Definizioni; prima parte. 


Texinfo 

Chiusu- 


Contenuto 

attributo 

args Sì Sì %inline; Argomenti di una definizione. 

deffn Sì Sì ‘args’, %block; Comando ‘@deffn’ di Texinfo. 

cat -- -- Attributo Categoria della funzione. 

name -- -- Attributo Nome della funzione. 

deffnx Sì Vuoto Comando ‘@deffnx’. 

Attributi come ‘deffn’. 

defun Sì Sì ‘args’, %block; Comando ‘@defun’ di Texinfo. 

name -- -- Attributo Nome della funzione. 

defunx Sì Vuoto Comando ‘@defunx’. 

Attributi come ‘defun’. 

defmac Sì Sì ‘args’, %block; Comando ‘@defmac’ di Texinfo. 

name -- -- Attributo Nome della macro. 

defmacx Sì Vuoto Comando ‘@defmacx’. 

Attributi come ‘defmac’. 

defspec Sì Sì ‘args’, %block; Comando ‘@defspec’ di Texinfo. 

name -- -- Attributo Nome di uno special form. 

defspecx Sì Vuoto Comando ‘@defspecx’. 

Attributi come ‘defspec’. 

defvr Sì Sì %block; Comando ‘@defvr’ di Texinfo. 

cat -- -- Attributo Categoria della variabile. 

name -- -- Attributo Nome della variabile. 

defvrx Sì Vuoto Comando ‘@defvrx’. 

Attributi come ‘defvr’. 

defvar Sì Sì %block; Comando ‘@defvar’ di Texinfo. 

name -- -- Attributo Nome della variabile. 

defvarx Sì Vuoto Comando ‘@defvarx’. 

Attributi come ‘defvar’. 

defopt Sì Sì %block; Comando ‘@defopt’ di Texinfo. 

name -- -- Attributo Nome dell’opzione. 

defoptx Sì Vuoto Comando ‘@defoptx’. 

Attributi come ‘defopt’. 

deftypefn 

Comando ‘@deftypefn’ di Texinfo. 

Sì Sì ‘args’, %block; 

cat -- -- Attributo Categoria. 

type -- -- Attributo Tipo di dati. 

name -- -- Attributo Nome. 

deftypefnx Sì Vuoto Comando ‘@deftypefnx’. 

Attributi come ‘deftypefn’. 

deftypefun 

Comando ‘@deftypefun’ di Texinfo. 




deftypefunx Sì Vuoto Comando ‘@deftypefunx’.


Elemento o 

attributo 

Apertura 

Chiusura 

Contenuto 


Texinfo 

Attributi come ‘deftypefun’. 

deftypevr 

Comando ‘@deftypevr’ di Texinfo. 





deftypevrx Sì Vuoto Comando ‘@deftypevrx’. 

Attributi come ‘deftypevr’. 

deftypevar 

Comando ‘@deftypevar’ di Texinfo. 




deftypevarx Sì Vuoto Comando ‘@deftypevarx’. 

Attributi come ‘deftypevar’. 

Tabella 257.11. Definizioni; seconda parte. 


Texinfo 

Chiusu- 


Contenuto 

attributo 

args Sì Sì %inline; Argomenti di una definizione. 

defcv Sì Sì %block; Comando ‘@defcv’ di Texinfo. 


class -- -- Attributo Classe. 


defcvx Sì Vuoto Comando ‘@defcvx’. 

Attributi come ‘defcv’. 

defivar Sì Sì %block; Comando ‘@defivar’ di Texinfo. 



defivarx Sì Vuoto Comando ‘@defivarx’. 

Attributi come ‘defivar’. 

deftypeivar 

Comando ‘@deftypeivar’ di Texinfo. 



type -- -- Attributo Tipo. 


deftypeivarx Sì Vuoto Comando ‘@deftypeivarx’. 

Attributi come ‘deftypeivar’. 

defop Sì Sì ‘args’, %block; Comando ‘@defop’ di Texinfo. 




defopx Sì Vuoto Comando ‘@defopx’. 

Attributi come ‘defop’. 

Comando ‘@defmethod’ di Texinfo. 

defmethod Sì Sì ‘args’, %block; 



defmethodx Sì Vuoto Comando ‘@defmethodx’. 

Attributi come ‘defmethod’. 

deftypemethod 

Comando ‘@deftypemethod’ di 


Texinfo. 


type -- -- Attributo Tipo. 


deftypemethodx Sì Vuoto Comando ‘@deftypemethodx’. 

Attributi come ‘deftypemethod’.


Ecco un esempio molto semplice: 

 

[options]... sgml_source 

This is the front-end for the SGML to Texinfo system. 

 

La composizione in formato Info genera il risultato seguente: 

- Command: sgmltexi [OPTIONS]... SGML_SOURCE 

This is the front-end for the SGML to Texinfo system. 

257.8 Codice condizionato e codice letterale in base alla 

composizione 

Texinfo ha la possibilità di selezionare del codice in dipendenza del tipo di composizione finale. 

In SGML si possono fare cose simili attraverso le sezioni marcate, ma non si tratta della stessa 

cosa. Per questa ragione, Sgmltexi include alcuni elementi speciali corrispondenti ai comandi 

che servono a Texinfo per selezionare il codice, consentendo anche di inserire pezzi di codice 

letterale. 

Tabella 257.12. Codice condizionato e codice letterale in base alla composizione. 


Texinfo 

Chiusu- 


Contenuto 

attributo 

deftp Sì Sì ‘args’, %block; Comando ‘@deftp’ di Texinfo. 



deftpx Sì Vuoto Comando ‘@deftpx’. 

Attributi come ‘deftp’. 


Texinfo 

Chiusu- 


Contenuto 

attributo 

ifinfo Sì Sì %inline; ‘@ifinfo’ ... ‘@end ifinfo’ 

ifinfoblock Sì Sì %block; ‘@ifinfo’ ... ‘@end ifinfo’ 

iftex Sì Sì %inline; ‘@iftex’ ... ‘@end iftex’ 

iftexblock Sì Sì %block; ‘@iftex’ ... ‘@end iftex’ 

ifhtml Sì Sì %inline; ‘@ifhtml’ ... ‘@end ifhtml’ 

ifhtmlblock Sì Sì %block; ‘@ifhtml’ ... ‘@end ifhtml’ 

‘@ifnotinfo’ ... 

ifnotinfo Sì Sì %inline; 

‘@end ifnotinfo’ 

‘@ifnotinfo’ ... 

ifnotinfoblock Sì Sì %block; 

‘@end ifnotinfo’ 

‘@ifnottex’ ... 

ifnottex Sì Sì %inline; 

‘@end ifnottex’ 

‘@ifnottex’ ... 

ifnottexblock Sì Sì %block; 

‘@end ifnottex’ 

‘@ifnothtml’ ... 

ifnothtml Sì Sì %inline; 

ifnothtmlblock Sì Sì %block; 

‘@end ifnothtml’ 

‘@ifnothtml’ ... 

‘@end ifnothtml’ 

tex Sì Sì #PCDATA ‘@tex’ ... ‘@end tex’ 

html Sì Sì #PCDATA ‘@html’ ... ‘@end html’ 

texinfo Sì Sì #PCDATA Codice Texinfo. 

È importante osservare che ‘ifinfo’, ‘iftex’, ‘ifhtml’, ‘ifnotinfo’, ‘ifnottex’ e


‘ifnothtml’, sono elementi interni alla riga di testo, che contengono lo stesso genere di 

cosa. Al contrario, ‘ifinfoblock’, ‘iftexblock’, ‘ifhtmlblock’, ‘ifnotinfoblock’, 

‘ifnottexblock’ e ‘ifnothtmlblock’, sono blocchi che contengono altri blocchi. Questa 

distinzione è necessaria per evitare problemi nella definizione del documento SGML (nel DTD). 

In particolare, gli elementi ‘tex’, ‘html’ e ‘texinfo’, sono fatti per contenere testo letterale 

solitamente racchiuso tra ‘’. 

L’elemento ‘texinfo’ non ha un comando equivalente in Texinfo, perché rappresenta del codice 

Texinfo. Si osservi l’esempio seguente: 

The letter @ubaraccent{o} is a special... 

Usando questo elemento, potrebbe essere necessario forzare l’interpretazione letterale anche da 

parte dell’SGML. In tal caso, il contenuto dell’elemento può essere racchiuso come si vede qui: 

The letter is a... 

Il caso particolare dell’esempio non mostra una situazione in cui sia indispensabile 

l’interpretazione SGML letterale, tuttavia questo è il modo quando succede tale circostanza. 

Viene mostrato un altro esempio nell’uso di codice letterale specifico per il tipo di composizione. 

L’intenzione è quella di mostrare un’espressione matematica molto semplice: 123 + 10 -1 . 

 

-1]]> 

123+10^-1 

= 12.3 

Si potrebbe notare una sorta di incoerenza nell’uso degli elementi letterali, assieme a 

‘ifinfo’, il cui scopo è solo quello di essere preso in considerazione quando la composizione 

produce il formato Info. Il fatto è che gli altri due elementi letterali, oltre che contenere codice 

letterale per il tipo rispettivo di composizione, sono implicitamente elementi condizionali. Dal 

momento che la composizione Info non può prevedere una codifica letterale speciale, l’unico 

modo per integrare le varie parti è quello di usare ‘ifinfo’ per rappresentare in qualche modo 

l’espressione, anche in questo caso. 

257.8.1 Problemi 

Texinfo, come TeX e *roff, distingue i blocchi di testo in quanto separati da una o più righe vuote. 

In tal modo, la distinzione tra blocchi di testo e testo interno alle righe, è solo una questione di 

spazio verticale. Per esempio, il pezzo seguente di un sorgente Texinfo, mostra tre ambienti del 

tipo ‘@ifcomposizione ’, che sono parte dello stesso blocco di testo, ovvero lo stesso paragrafo. 

La composizione attuale è 

@iftex 

TeX 

@end iftex 

@ifhtml 

HTML 

@end ifhtml 

@ifinfo 

Info 

@end ifinfo 

e si può vedere che... 

In una situazione differente, questi ambienti possono diventare blocchi isolati di testo, come si 

vede qui:


La composizione attuale è: 

@iftex 

TeX 

@end iftex 

@ifhtml 

HTML 

@end ifhtml 

@ifinfo 

Info 

@end ifinfo 

Si può vedere che... 

Con un sistema SGML, questa confusione di ruoli non è desiderabile, oltre che essere difficile 

da realizzare. Questo è il motivo per cui Sgmltexi distingue tra ‘@ifcomposizione ’ o 

‘@ifnotcomposizione ’, e ‘@ifcomposizione block’ o ‘@ifnotcomposizione block’. 

Sgmltexi cerca di mantenere le interruzioni di riga contenute all’interno del sorgente SGML, ma 

per questo ci sono delle conseguenze nell’uso degli ambienti condizionali, del tipo interno alle righe. 

Ciò dipende dal fatto che necessariamente occorre aggiungere delle interruzioni aggiuntive. 

Si supponga di voler scrivere qualcosa come ciò che segue: 

La composizione attuale 

è TeXHTMLInfo, per cui 

si sa cosa comporta questo fatto. 

Ci si aspetta che i marcatori di apertura e di chiusura vengano rimpiazzati aggiungendo anche le 

interruzioni di riga appropriate. Ma se fosse così, il risultato sarebbe quello seguente, in cui ciò 

che prima era testo interno alla riga, adesso diventa un blocco separato: 

La composizione attuale 

è 

@iftex 

TeX 

@end iftex 

@ifhtml 

HTML 

@end ifhtml 

@ifinfo 

Info 

@end ifinfo 

, per cui 

si sa cosa comporta questo fatto. 

Per risolvere il problema, questi elementi intesi come ambienti condizionali interni alle righe, 

non introducono alcuna interruzione iniziale o finale che sia; rimane compito dell’autore il preoccuparsi 

di questo problema. Per questo, il sorgente di Sgmltexi deve essere scritto come si vede 

nell’esempio seguente, considerando anche che non c’è alcun modo di mettere la virgola dopo il 

nome del tipo di composizione. 

La composizione attuale è 

TeX 

HTML 

Info 

per cui si sa cosa comporta questo fatto. 

Lo stesso problema appare con gli elementi ‘tex’ e ‘html’, ma in tal caso non c’è bisogno di 

qualificarne il contenuto, che si intende sempre come testo interno alle righe.


 

 

$$ \chi^2 = \sum_{i=1}^N 

\left (y_i - (a + b x_i) 

\over \sigma_i\right)^2 $$ 

 

 

Utilizzando un sistema SGML, l’inserzione di codice letterale per il tipo di composizione 

particolare che si utilizza, è da considerarsi come l’ultima risorsa. In altri termini, se sono 

necessari tali espedienti, è evidente che l’SGML è la scelta sbagliata per scrivere la propria 

documentazione. 


Capitolo 258 

Corrispondenza tra Texinfo e Sgmltexi 

In questo capitolo conclusivo della parte dedicata a Sgmltexi, si riepiloga brevemente l’uso di 

questo sistema di composizione, attraverso la comparazione con Texinfo. In questo modo, si può 

comprendere cosa di Texinfo non è disponibile con Sgmltexi. 

Si osservi che nei modelli sintattici, le parentesi graffe hanno significato letterale, facendo parte 

dei comandi di Texinfo. 

@spazio_bianco 

‘ ’ 

@! 

&esexcl; 

End sentence exclamation mark 

@"x 

@’x 

Per la rappresentazione di caratteri speciali, si possono utilizzare le entità standard 

SGML, oppure i caratteri della codifica ISO 8859-n selezionata con l’opzione 

‘--input-encoding’, o con l’attributo ‘charset’ dell’elemento ‘sgmltexi’. 

@* 

 

@,{x} 




@- 

@. 

@: 

 

&esperiod; 

End sentence period 

&nes; 

Not ending sentence 

@=x 

Non disponibile. 

@? 

@@ 

&esquest; 

End of sentence question mark 

@ 

@^ 

2810

Corrispondenza tra Texinfo e Sgmltexi 2811 

@‘ 

@{ 

@} 




{ 

} 

@~ 

@AA{} 

@aa{} 




@acronym{abbreviazione} 

@AE{} 

@ae{} 

abbreviazione 




@afourlatex 

@afourpaper 

@afourwide 

In sostituzione di questi comandi, si possono usare le opzioni della riga di comando: 

‘--paper=a4latex’, ‘--paper=a4paper’, ‘--paper=a4wide’. 

@alias nuovo =esistente 

Non disponibile. Probabilmente si può rimediare inserendo il comando all’interno 

dell’elemento ‘texinfo’. 

@anchor{nome } 

 

@appendix titolo 

@appendixsec titolo 

@appendixsection titolo 

@appendixsubsec titolo 

@appendixsubsection titolo 

@appendixsubsubsec titolo 

@appendixsubsubsection titolo 

Le appendici si ottengono nell’ambito dell’elemento ‘appendix’.

2812 Corrispondenza tra Texinfo e Sgmltexi 

@asis 

La parola ‘asis’ è usata come argomento dell’attributo ‘emphasis’ degli elementi 

‘table’, ‘vtable’ e ‘ftable’. 

@author autore 

autore 

@b{testo} 

testo 

@bullet{} 

@bye 

• 

 

@c commento 

@comment commento 

Non è disponibile un elemento equivalente, dal momento che l’SGML offre un suo sistema 

per annotare i commenti. Se necessario, questo comando può essere incluso all’interno di 

un elemento ‘texinfo’. 

@cartouche 

 

blocco_di_testo 

| 

| 

 

@center testo 

testo 

Non si può usare nel titolo del documento. 

@centerchap titolo 


@chapheading titolo 

titolo 

@chapter titolo 

titolo 

@cindex voce 

 

@cite{riferimento } 

riferimento 

@clear indicatore 

Non disponibile. Eventualmente può essere usato all’interno dell’elemento ‘texinfo’. 

@code{testo} 

sample


@command{nome_comando } 

nome_comando 

@contents 

 

@copyright{} 

© 

@defcodeindex nome_indice 

nome_indice 

@defcv categoria classe nome 

@defcvx categoria classe nome 

 

[] ... 

... 

... 

 

@deffn categoria nome argomento ... 

@deffnx categoria nome argomento ... 

 

argomento ... 

[ 

argomento ...] ... 

... 

... 

 

@defindex nome_indice 

nome_indice 

@definfoenclose nuovo_comando prima dopo 


@defivar classe nome_variabile_di_istanza 

@defivarx classe nome_variabile_di_istanza 

 

[] ... 

... 

... 

 

@defmac nome_macro argomento ... 

@defmacx nome_macro argomento ... 

 

argomento ... 

[ 


... 

... 

 

@defmethod classe nome_metodo argomento ...


@defmethodx classe nome_metodo argomento ... 

 

argomento ... 

[ 


... 

... 

 

@defop categoria classe nome argomento ... 

@defopx categoria classe nome argomento ... 

 

argomento ... 

[ 


... 

... 

 

@defopt nome_opzione 

@defoptx nome_opzione 

 

[] 

... 

... 

 

@defspec nome argomento ... 

@defspecx nome argomento ... 

 

argomento ... 

[ 


... 

... 

 

@deftp categoria nome attributo ... 

@deftpx categoria nome attributo ... 

 

attributo ... 

[ 

attributo ...] ... 

... 

... 

 

@deftypefn classificazione tipo_dati nome argomento ... 

@deftypefnx classificazione tipo_dati nome argomento ... 

 

argomento ... 

[ 


... 

... 

 

@deftypefun tipo_dati nome_funzione argomento ...


@deftypefunx tipo_dati nome_funzione argomento ... 

 

argomento ... 

[ 


... 

... 

 

@deftypeivar classe tipo_dati nome_variabile 

@deftypeivarx classe tipo_dati nome_variabile 

 

[] ... 

... 

... 

 

@deftypemethod classe tipo_dati nome_metodo argomento ... 

@deftypemethodx classe tipo_dati nome_metodo argomento ... 

 

argomento ... 

[ 


... 

... 

 

@deftypeop categioria classe tipo_dati nome argomento ... 

@deftypeopx categioria classe tipo_dati nome argomento ... 

 

argomento ... 

[ 


... 

... 

 

@deftypevar tipo_dati nome_variabile 

@deftypevarx tipo_dati nome_variabile 

 

[] ... 

... 

... 

 

@deftypevr classificazione tipo_dati nome_variabile 

@deftypevrx classificazione tipo_dati nome_variabile 

 

[] ... 

... 

... 

 

@defun nome_funzione argomento ...


@defunx nome_funzione argomento ... 

 

argomento ... 

[ 


... 

... 

 

@defvar nome_variabile 

@defvarx nome_variabile 

 

[] ... 

... 

... 

 

@defvr categoria nome_variabile 

@defvrx categoria nome_variabile 

 

[] ... 

... 

... 

 

@detailmenu 

 

... 

... 

 

... 

... 

 

 

@dfn{termine } 

termine 

@dircategory dirpart 

@direntry 

 

... 

... 

 

@display 

 


... 

... 

 

@dmn{dimensione } 

dimensione 

@documentencoding codifica 

 

Definisce la codifica del sorgente Texinfo che viene generato, stabilendo implicitamente 

che lo stesso sorgente SGML è realizzato nello stesso modo. Viene oscurato dall’opzione 

‘--input-encoding’, che prende la precedenza generando un sorgente Texinfo in 

formato ISO 646 puro (ASCII a 7 bit).


@documentlanguage cc 

 

@dotaccent{c} 




@dots{} 

&dots; 

@email{indirizzo, testo_mostrato} 

 

@emph{testo} 

testo 

@env{variabile_di_ambiente } 

variabile_di_ambiente 

@enddots{} 

&enddots; 

@enumerate [numero_o_lettera] 

 

 

... 

... 

 

... 

... 

 

@equiv{} 

&equiv; 

@error{} 

&error; 

@evenfooting 

@evenheading 

@everyfooting 

@everyheading 


@example 

 

bloco_di_testo 

... 

... 

 

Preformattato:


 

 

riga_di_testo 

... 

... 

 

 

Letterale: 

 

 

 

 

 

@exampleindent 


@exlamdown 

¡ 

@exdent 

 

... 

testo_sporgente 

... 

 

@expansion{} 

&expansion; 

@file{nome_file } 

nome_file 

@finalout 

Non gestibile, in quanto il sorgente Texinfo che viene generato contiene sempre questo 

comando. 

@findex voce 

 

@flushleft 

testo 

@flushright 

testo 

@footnote{testo_del_piè_pagina} 

testo_del_piè_pagina 

@footnotestyle stile 

 

In alternativa si può usare l’opzione ‘--footnotestyle=stile’ della riga di comando, che 

prende il sopravvento.


@format 

 

 

... 

... 

 

 

Letterale: 

 

 

 

 

 

@frenchspacing 

 

@ftable comando_di_formattazione 

@group 

@H{c} 

 

voce_descrittiva 

[voce_descrittiva] ... 

blocco_di_testo... 

... 

... 




... 

 





@heading titolo 

titolo 

@headings on 

@headings off 

@headings single 

@headings double 

 

 

 

 

In alternativa si può usare l’opzione ‘--headings’ della riga di comando, che prende il 

sopravvento: 

--headings=on 

--headings=off 

--headings=single 

--headings=double


@html 

codice_html 

@hyphenation{parole_separate_in_sillabe} 

 

@i{testo} 

testo 

@ifclear opzione 


@ifhtml 

Ci sono due possibilità: testo interno alle righe e blocchi di testo. 

testo_interno_alle_righe 

 


... 

 

L’SGML dà la possibilità di usare le sezioni marcate. Queste posso essere controllate da 

Sgmltexi attraverso l’opzione ‘--sgml-include’ della riga di comando. Per esempio, il 

sorgente SGML potrebbe essere simile al pezzo seguente: 

 

 

... 

... 

]> 

 

... 

... 

Here it is some text that is meant to appear only inside 

the HTML typesetting. 

]]> 

Here it is some other text that is meant to appear only 

inside the Info typesetting. 

]]> 

This text is meant to appear only inside the TeX 

typesetting. 

]]> 

... 

... 

 

Quindi, quando si genera la composizione in HTML, si deve utilizzare l’opzione 

‘--sgml-include=HTML’: 

$ sgmltexi --sgml-include=HTML --html mio_file.sgml 

Per la composizione nel formato Info, si deve usare l’opzione ‘--sgml-include=INFO’: 

$ sgmltexi --sgml-include=INFO --info mio_file.sgml 

Nello stesso modo, per la composizione attraverso TeX si deve usare l’opzione 

‘--sgml-include=TEX’: 

$ sgmltexi --sgml-include=TEX --tex mio_file.sgml


@ifinfo 



 


... 

 

L’SGML dà la possibilità di usare le sezioni marcate, come è già stato mostrato a proposito 

del comando ‘@ifhtml’. 

@ifnothtml 



 


... 

 

L’SGML dà la possibilità di usare le sezioni marcate. Queste posso essere controllate da 

Sgmltexi attraverso l’opzione ‘--sgml-include’ della riga di comando. Per esempio, il 

sorgente SGML potrebbe essere simile al pezzo seguente: 

 

 

... 

... 

]> 

 

... 

... 

Here it is some text that is meant to appear only outside 

the HTML typesetting. 

]]> 

Here it is some other text that is meant to appear only 

outside the Info typesetting. 

]]> 

This text is meant to appear only outside the TeX 

typesetting. 

]]> 

... 

... 

 

Quindi, quando si genera la composizione in HTML, si devono utilizzare le opzioni 

‘--sgml-include=NOTINFO’ e ‘--sgml-include=NOTTEX’: 

$ sgmltexi --sgml-include=NOTINFO --sgml-include=NOTTEX ←↪ 

↩→--html mio_file.sgml 

Per la composizione nel formato Info, si devono utilizzare le opzioni 

‘--sgml-include=NOTHTML’ e ‘--sgml-include=NOTTEX’: 

$ sgmltexi --sgml-include=NOTHTML --sgml-include=NOTTEX ←↪ 

↩→--info mio_file.sgml 

Nello stesso modo, per la composizione attraverso TeX si devono utilizzare le opzioni 

‘--sgml-include=NOTHTML’ e ‘--sgml-include=NOTINFO’: 

$ sgmltexi --sgml-include=NOTHTML --sgml-include=NOTINFO ←↪ 

↩→--tex mio_file.sgml


@ifnotinfo 



 


... 

 


del comando ‘@ifnothtml’. 

@ifnottex 



 


... 

 


del comando ‘@ifnothtml’. 

@ifset flag 

@iftex 




 


... 

 


del comando ‘@ifhtml’. 

@ignore 

Non disponibile. Eventualmente può essere usato all’interno dell’elemento ‘texinfo’. Se 

non è necessario inserire commenti nel file Texinfo che viene generato, si possono usare i 

commenti secondo l’SGML: 

 

... 

@image{nome_file , [ampiezza], [altezza]} 

 

@include 


L’SGML offre un meccanismo alternativo: 

 

... 

... 

]>


 

... 

... 

 

&GPL; 

&BSD; 

... 

... 

 

... 

 

come si può vedere dall’esempio, l’inserzione nel testo di ‘licenses/gpl.sgml’ e di 

‘licenses/bsd.sgml’ avviene attraverso l’uso delle macro SGML ‘&GPL;’ e ‘&BSD;’. 

Se è necessario includere un file Texinfo, si può fare come si vede nell’esempio seguente: 

 

@include example.texi 

 

]]> 

È necessario tenere a mente che l’elemento ‘texinfo’ è di tipo interno alle righe di testo. 

Ecco perché nell’esempio è contenuto in un elemento ‘p’. 

@inforef{nome_nodo , [voce], nome_file_info } 

 

\input file_macro 

@item 

Non è possibile inserire macro aggiuntive all’inizio del documento, oltre a quella predefinita 

che imposta la sintassi Texinfo. 

Questo comando di Texinfo viene usato in contesti molto diversi. All’interno di Sgmltexi 

non esiste un modo unico per utilizzarlo, per cui conviene vedere piuttosto la descrizione 

dei comandi ‘@table’, ‘@ftable’, ‘@vtable’, ‘@itemize’, ‘@enumerate’ e 

‘@multitable’. 

@itemize [marcatore_iniziale] 

 

 

... 

... 

 

... 

@itemx 

... 

 

Questo comando di Texinfo viene usato in contesti molto diversi. All’interno di Sgmltexi 

non esiste un modo unico per utilizzarlo, per cui conviene vedere piuttosto la descrizione 

dei comandi ‘@table’, ‘@ftable’ e ‘@vtable’. 

@kbd{tasti_premuti } 

tasti_premuti 

@kbdinputstyle stile 

 

@key{nome_tasto } 

nome_tasto


@kindex voce 

@L{} 

@l{} 

@lisp 

 

&Lstrok; 

&lstrok; 

 


... 

... 

 

Preformattato: 

 

 

riga_di_testo 

... 

... 

 

 

Letterale: 

 

 

 

 

 

@lowersections 


@macro nome_macro 

{parametri} 


@majorheading titolo 

Non disponibile attualmente. 

@math{espressione_matematica } 

@menu 

espressione_matematica 

[menù_info ] 

@minus{} 

−


@multitable larghezza_delle_colonne 

 

frazione_larghezza_complessiva ... 

cella[cella] ...... 

... 

 

 

testo_di_esempio... 

cella[cella] ...... 

... 

 

@need n 

 

@node nome , successivo, precedente, superiore 

La gestione manuale dei nodi di Texinfo avviene come si vede nello schema seguente, dove 

ci si limita a stabilire il nome del nodo in questione: 

titolo 

Se è necessario un controllo completo sui nodi, si possono stabilire anche gli altri dati, 

come nello schema seguente: 

titolo 

Sgmltexi non fa alcun controllo di validità per quanto riguarda l’inserzione manuale dei 

nodi. 

@noindent 

 

@novalidate 

O{} 

o{} 


Ø 

ø 

@oddfooting 

@oddheading 


@option{opzione} 

@page 

opzione 

 

@pagesizes [ampiezza][, altezza] 


@paragraphindent rientro 


@pindex voce 


@point{} 

&point; 

@pounds{} 

£ 

@print{} 

&print; 

@printindex nome_indice 

 

@pxref{nome_nodo , [voce], [argomento_o_titolo], [file_info], [manual]} 

 

@questiondown{} 

¿ 

@quotation 

 

testo_interno_alle_righe 

... 

... 

 

@r{testo} 

testo 

@raisesections 


@ref{nome_nodo , [voce], [argomento_o_titolo], [file_info], [manuale]} 

@refill 

 


@result{} 

&result; 

@ringaccent{c} 




@samp{testo} 

testo 

@sc{testo} 

testo 

@set flag string 

Non disponibile. Eventualmente può essere usato all’interno dell’elemento ‘texinfo’.


@setchapternewpage on 

@setchapternewpage off 

@setchapternewpage odd 

Si può usare l’elemento ‘setchapternewpage’, come negli schemi seguenti: 

 

 

 

In alternativa si può utilizzare l’opzione ‘--setchapternewpage’, nella riga di comando: 

--setchapternewpage=on 

--setchapternewpage=off 

--setchapternewpage=odd 

@setcontentsaftertitlepage 


@setfilename nome_file_info 

 

@setshortcontentsaftertitlepage 


@settitle titolo 

 

@shortcontents 

 

@shorttitlepage title 


@smallbook 

Si usa per questo l’opzione: ‘--paper=small’. 

@smalldisplay 

 


... 

... 

 

@smallexample 

 

bloco_di_testo 

... 

... 

 


 

 

riga_di_testo 

... 

... 

 

 

Letterale:


 

 

 

 

 

@smallformat 

 

 

... 

... 

 

 

Letterale: 

 

 

 

 

 

@smalllisp 

@sp n 

@ss{} 

 


... 

... 

 


 

 

riga_di_testo 

... 

... 

 

 

Letterale: 

 

 

 

 

 

 

ß 

@strong{testo} 

testo 

@subheading titolo 

titolo


@subsection titolo 

titolo 

@subsubheading titolo 

titolo 

@subsubsection titolo 

titolo 

@subtitle sottotitolo 

sottotitolo 

@summarycontents 

 

@syncodeindex indice_di_origine indice_di_destinazione 

 

@synindex indice_di_origine indice_di_destinazione 

 

@t{testo} 

@tab 

testo 

Si veda la descrizione di ‘@multitable’. 

@table comando_di_formattazione 

@TeX{} 

@tex 

 




... 

... 




... 

... 

 

&TeX; 

pezzo_di_sorgente_tex 

@thischapter 

@thischaptername 

@thisfile 

@thispage 

@thistitle 

Non disponibile. Eventualmente può essere usato all’interno dell’elemento ‘texinfo’.


@tieaccent{cc} 


@tindex voce 

 

@title titolo 

titolo 

@titlefont{testo} 


@titlepage 

Non disponibile. Si veda come è organizzata la struttura di Sgmltexi. 

@today 

&today; 

@top 

Viene generato automaticamente. 

@u{c} 

@ubaraccent{c} 

@udotaccent{c} 


@unnumbered titolo 

titolo 

@unnumberedsec titolo 

titolo 

@unnumberedsubsec titolo 

titolo 

@unnumberedsubsubsec titolo 

titolo 

@uref{url, [testo_mostrato], [rimpiazzo]} 

 

@url{url} 

url 

@v{c} 


@value{indicatore} 


@var{metavariabile} 

metavariabile


@vindex voce 

 

@vskip ammontare_dell’avanzamento 


@vtable comando_di_formattazione 

 




... 

... 




... 

... 

 

@w{testo} 

testo 

@xref{nome_nodo , [voce], [argomento_o_titolo], [file_info], [manuale]} 

 


2832 Corrispondenza tra Texinfo e Sgmltexi

Parte xlviii 

HTML 

259 URI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2835 

259.1 Trascrivibilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2835 

259.2 Sintassi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2835 

259.3 Limitazioni nell’uso dei caratteri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2839 

259.4 Verifica della validità nel tempo con Urichk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2840 

259.5 Verifica degli URI con Checkbot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2841 

259.6 Riferimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2841 

260 HTML: aspetti generali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2843 

260.1 HTML e SGML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2843 

260.2 Stili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2847 

260.3 Struttura di un documento HTML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2849 

260.4 Attributi comuni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2851 

260.5 Riferimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2854 

261 HTML: corpo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2855 

261.1 Delimitazione di blocchi e di testo normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2855 

261.2 Titoli e struttura implicita del testo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2855 

261.3 Testo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2856 

261.4 Elenchi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2859 

261.5 Tabelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2859 

261.6 Riferimenti ipertestuali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2861 

261.7 Inserzioni di oggetti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2863 

261.8 Riferimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2864 

262 CSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2865 

262.1 Logica del linguaggio CSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2865 

262.2 Proprietà . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2868 

262.3 Definizione della pagina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2871 

262.4 Riferimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2872 

263 HTML2ps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2873 

263.1 Configurazione di HTML2ps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2873 

263.2 Avvio di HTML2ps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2881 

263.3 Particolarità nell’HTML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2882 

263.4 Programma frontale per semplificare l’utilizzo di HTML2ps . . . . . . . . . . . . . . 2882 

263.5 Riferimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2883 

2833

264 Introduzione a Amaya . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2884 

264.1 Navigazione e composizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2885 

264.2 Configurazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2887 

264.3 Aggregazione di un documento composto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2887 

264.4 Riferimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2888 

265 HTMLDOC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2889 

265.1 Sorgente HTML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2889 

265.2 Funzionamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2890 

265.3 Programmazione della composizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2896 

266 Essere presenti su Internet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2899 

266.1 Motori di ricerca e robot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2899 

266.2 Riferimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2902 

2834

URI 

Capitolo 259 

Un URI (Uniform resource identifier) è un indirizzo espresso attraverso una stringa di caratteri 

per identificare una risorsa fisica o astratta. La risorsa in questione è un’entità e la sua collocazione 

non si trova necessariamente all’interno di una rete. In pratica, il concetto di URI incorpora i 

concetti di URL (Uniform resource locator) e di URN (Uniform resource name). 

Un URL identifica una risorsa rappresentando il metodo di accesso a questa; un URN identifica 

la risorsa attraverso un nome, che deve essere unico a livello globale e deve persistere anche 

quando la risorsa cessa di esistere o diventa inaccessibile. 

259.1 Trascrivibilità 

L’esigenza primaria degli indirizzi URI è la loro «trascrivibilità». Con questo termine si vuole 

fare riferimento alla facilità con la quale questi devono poter essere trascritti, sia a livello 

meccanico, sia a livello umano. In pratica: 

• un URI è composto da una sequenza di «caratteri» e non necessariamente da ottetti (byte); 

• un URI deve poter essere trascritto attraverso qualunque mezzo, come una pubblicazione 

stampata o un appunto fatto a mano, in tal senso non può utilizzare caratteri particolari che 

possono mancare in un contesto determinato; 

• un URI deve poter essere ricordato facilmente dalle persone, per cui è utile che la stringa 

che rappresenta un URI abbia un significato che ne faciliti la memorizzazione. 

Dal momento che ci deve essere la possibilità di rappresentare un URI all’interno di parentesi di 

qualsiasi tipo, i caratteri corrispondenti a queste parentesi non possono essere utilizzati letteralmente 

all’interno di un indirizzo del genere. Le parentesi in questione sono quelle tonde, quadre, 

graffe e angolari: ‘(’, ‘)’, ‘[’, ‘]’, ‘{’, ‘}’, ‘’. 

259.2 Sintassi 

La sintassi di un URI è piuttosto complessa, perché dipende molto dal contesto a cui si applica. 

Non è il caso si entrare troppo nel dettaglio; piuttosto è meglio apprendere la logica della cosa. 

schema :parte_successiva_dipendente_dallo_schema 

Quello che si vede è il modello di prima approssimazione di un indirizzo URI assoluto (verrà 

trattato in seguito il concetto di URI relativo). In questa prima fase si distinguono due parti, 

separate da due punti verticali (‘:’), dove prima appare un nome che definisce uno «schema» e 

poi continua con una stringa che va interpretata in base alle regole specifiche di quello schema. 

La sintassi di un URI non stabilisce a priori quale sia la forma che deve avere la stringa che segue 

i due punti; tuttavia, è frequente l’utilizzo di URI secondo i modelli seguenti: 

schema ://autorità[percorso[?interrogazione]] 

schema :/percorso 

Convenzionalmente, quando una risorsa viene individuata attraverso un URI che per sua natura 

contiene un’informazione gerarchica, la separazione tra i vari livelli di questa gerarchia avviene 

utilizzando una barra obliqua normale (‘/’). Si tratta evidentemente di una tecnica ereditata dal 

2835

2836 URI 

file system Unix; tuttavia, ciò resta indipendente dal fatto che la risorsa in questione risieda 

fisicamente all’interno di un file system o meno. 

La figura 259.1 mostra alcuni esempi a proposito di URI composti secondo i modelli più 

frequenti. 

Figura 259.1. Esempi di URI comuni. 

http://www.brot.dg/esempi/indice.html 

| | \_________________/ 

| | | 

schema autorità percorso 

file:///home/tizio/indice.html 

| \_____________________/ 

| | 

schema percorso 

urn:isbn:88-256-0223-5 

| | \___________/ 

| | | 

schema NID NSS 

Nella figura si vede anche un caso particolare, riferito a un URN di tipo ISBN (International 

standard book number). Lo schema di un URN è sempre ‘urn:’; a questo segue l’indicazione di 

un NID (Namespace identifier), ovvero un identificatore che qualifica l’informazione successiva; 

infine si inserisce l’informazione, definita NSS (Namespace specific string), ovvero ciò che va 

inteso nel contesto stabilito dal NID. L’esempio che appare nella figura fa riferimento al numero 

ISBN 88-256-0223-5, esprimendolo in forma di URN. 

259.2.1 Accesso a un servente attraverso la rete 

Quando l’indirizzo URI si riferisce a un servizio offerto attraverso la rete, la struttura di ciò che 

è stato definito come «autorità» si articola in modo particolare: 

[utente[:parola_d’ordine]@]host[:porta] 

In questo modo si può specificare il nominativo utente per l’accesso alla risorsa, eventualmente 

anche la parola d’ordine (benché ciò sia decisamente sconsigliabile per motivi di sicurezza), 

quindi il nodo che offre il servizio e infine la porta del servizio. 

Il nodo può essere indicato per nome, attraverso il nome di dominio, oppure attraverso il numero 

IPv4. Purtroppo non è stato definito un modo per indicare un numero IPv6, dal momento che la 

sua forma renderebbe impossibile l’interpretazione corretta dell’indirizzo. 

Se si omettono le informazioni riferite all’utente, vuol dire che queste non sono necessarie, oppure 

che esistono dei valori predefiniti per questo; per quanto riguarda la porta del servizio, se 

questa non viene indicata si fa riferimento sempre al suo valore predefinito. Naturalmente, è 

stabilito dal servente quali siano i valori predefiniti. 

259.2.2 Riferimento agli URI 

Per sua natura, l’indirizzo URI è un riferimento a una risorsa. In generale vanno considerate 

anche due circostanze particolari: il riferimento a un frammento della risorsa e l’indicazione di 

URI relativi. 

Un URI relativo è un indirizzo ridotto che parte da un punto di partenza conosciuto. Il principio 

deriva dal concetto di percorso relativo all’interno di un file system. In generale, un URI relativo 

può essere indicato omettendo tutta la parte iniziale che si possa determinare altrimenti.

URI 2837 

Di fronte a un URI che contenga un’informazione sul percorso in forma gerarchica, è abbastanza 

facile intendere cosa sia la base di riferimento per gli URI relativi: basta togliere dall’indirizzo 

attuale tutto quello che segue l’ultima barra obliqua. Per esempio, per il documento 

http://www.brot.dg/esempi/articolo.html 

l’URI di base è 

http://www.brot.dg/esempi/ 

per cui, il riferimento a ‘figure/foto.jpg’ richiama effettivamente l’URI 

http://www.brot.dg/esempi/figure/foto.jpg 

Il percorso di un URI relativo può essere indicato anche con una barra obliqua iniziale, ma 

in questo caso si farà riferimento a un percorso assoluto nell’ambito dell’URI. Continuando 

con l’esempio precedente, il riferimento a ‘/nuovo/documento.html’ richiama effettivamente 

l’URI 

http://www.brot.dg/nuovo/documento.html 

In presenza di un percorso relativo, è possibile utilizzare anche i simboli ‘.’ e ‘..’, con lo stesso 

significato che hanno nel file system Unix: il primo rappresenta la posizione corrente e il secondo 

quella precedente. 

È importante osservare che il riferimento alla stringa nulla indica implicitamente lo stesso URI 

iniziale. 

Il problema degli URI relativi non è così semplice come è stato descritto. In realtà vanno prese 

in considerazione altre cose, come per esempio la possibilità che il tipo di risorsa (di solito in 

un documento HTML) possa incorporare l’informazione esplicita di un URI di base. 

Quando il tipo di risorsa lo consente, è possibile aggiungere all’URI l’indicazione di un frammento 

particolare. Questa parte aggiuntiva la si riconosce perché è preceduta dal simbolo 

‘#’: 

http://www.brot.dg/esempi/articolo.html#commento 

L’esempio mostra il riferimento al frammento ‘#commento’ nell’ambito dell’URI ‘http:// 

www.brot.dg/esempi/articolo.html’. Dal momento che la stringa nulla fa riferimento alla 

risorsa attuale, i riferimenti interni alla stessa risorsa sono indicati facilmente attraverso il solo 

frammento: 

#commento 

L’esempio mostra un riferimento relativo al frammento ‘#commento’ della risorsa corrente. 

259.2.3 Esempi 

Frequentemente, il nome dello schema dell’indirizzo URI corrisponde al nome del protocollo 

necessario per raggiungere la risorsa relativa. I più comuni sono: 

• ‘http’ 

• ‘ftp’ 

• ‘gopher’ 

• ‘mailto’ 

• ‘wais’

2838 URI 

• ‘telnet’ 

• ‘tn3270’ 

• ‘news’ 

Quando si vuole fare riferimento a un file locale senza utilizzare alcun protocollo particolare, si 

può indicare anche lo schema ‘file’, ma in questo caso ci sono delle particolarità che verranno 

mostrate dagli esempi. 

• http://www.brot.dg:8080/esempi/indice.html 

– protocollo HTTP 

– nodo www.brot.dg 

– porta 8080 

Viene indicata la porta perché si vuole fare riferimento a un valore diverso dallo 

standard che per il protocollo HTTP è 80 

– risorsa ‘/esempi/indice.html’ 

• http://www.brot.dg/esempi/indice.html 

Come nell’esempio precedente, ma senza l’indicazione della porta che questa volta 

corrisponderà al valore predefinito, cioè 80. 

• http://192.168.1.1/esempi/indice.html 

Come nell’esempio precedente, ma l’indicazione del nodo avviene per mezzo del suo 

indirizzo IPv4 invece che attraverso il nome di dominio. 

• ftp://ftp.brot.dg/pub/archivi/esempio.tar.gz 

– protocollo FTP 

– nodo ftp.brot.dg 

– risorsa ‘/pub/archivi/esempio.tar.gz’ 

• ftp://tizio@ftp.brot.dg/pub/archivi/esempio.tar.gz 

Come nell’esempio precedente, con la differenza che si fa riferimento a un utente 

particolare. 

• ftp://tizio:segretissima@ftp.brot.dg/pub/archivi/esempio.tar.gz 

Come nell’esempio precedente, con la differenza che si aggiunge l’indicazione della parola 

d’ordine di accesso al servizio, cosa che in generale è bene non passare mai in questo modo. 

• file://localhost/home/daniele/indice.html 

In questo caso si vuole fare riferimento a un file locale. Precisamente si tratta del file 

‘/home/daniele/indice.html’ contenuto nell’elaboratore localhost. 

Questo tipo di indicazione è utile specialmente quando si vuole fare riferimento a una pagina 

indice o iniziale, caricata automaticamente all’atto dell’avvio di un programma cliente 

per la navigazione. 

• file:///home/daniele/indice.html 

Esattamente come nell’esempio precedente, con la differenza che si omette l’indicazione 

esplicita dell’elaboratore locale: localhost.

URI 2839 

• file:/home/daniele/indice.html 

Esattamente come nell’esempio precedente, con la differenza che si utilizza una sola barra 

obliqua dopo l’indicazione ‘file:’ (ma in generale è preferibile la forma precedente, con 

le tre barre oblique). 

• mailto:tizio@dinkel.brot.dg 

Si tratta di un indirizzo di posta elettronica, nel quale è essenziale fornire l’indicazione del 

nominativo utente. Dopo il nome del nodo di destinazione non appare un percorso, perché 

in questo caso non avrebbe significato. 

259.3 Limitazioni nell’uso dei caratteri 

Ogni componente di un URI ha delle regole proprie nell’uso dei caratteri, dal momento che alcuni 

di questi hanno significati speciali. Purtroppo le regole in questione sono tante e la cosa migliore 

che si può fare è quella di usare il buon senso, riservando la lettura della documentazione specifica 

ai casi in cui è indispensabile chiarire il problema nel dettaglio (RFC 2396). 

In generale non è ammissibile l’uso dello spazio. Infatti, considerato il principio di trascrivibilità 

degli URI, lo spazio dovrebbe essere inteso solo come una necessità legata al tipo di trascrizione 

utilizzata. Per il resto, se la propria lingua lo consente, sarebbe bene limitarsi all’uso delle lettere 

dell’alfabeto latino (maiuscole e minuscole, ma senza accenti), le cifre numeriche e alcuni simboli: 

‘@’, ‘*’, ‘_’, ‘-’ e il punto (‘.’). Gli altri simboli possono creare problemi di trascrivibilità o 

avere significati particolari (basta pensare alle barre oblique e ai due punti verticali). 

Quando un simbolo particolare non può essere utilizzato in modo letterale nel contesto in cui 

lo si vuole inserire, può essere indicato attraverso una notazione speciale: ‘%hh ’. La sigla hh 

rappresenta una coppia di cifre esadecimali. A questa regola fa eccezione lo spazio che viene 

codificato normalmente con il segno ‘+’, ma non in tutte le occasioni (di solito solo nelle stringhe 

di richiesta). 

Generalmente, per gli indirizzi URI normali non c’è la necessità di preoccuparsi di questo problema, 

anche la tilde può essere utilizzata letteralmente nell’indicazione dei percorsi. La tabella 

259.1 mostra l’elenco di alcune corrispondenze tra simboli particolari e la codifica alternativa 

utilizzabile negli URI. 

Tabella 259.1. Alcune corrispondenze tra simboli particolari e codifica alternativa 

utilizzabile negli URI. 

Carattere Codifica corrispondente 

% %25 

& %26 

+ %2B 

/ %2F 

= %3D 

In linea di principio, un URI dovrebbe essere realizzato in modo da non dover utilizzare questa 

tecnica di protezione per i caratteri «speciali». La situazione più probabile in cui è necessario 

utilizzare questo procedimento è riferito alle stringhe di interrogazione.

2840 URI 

259.4 Verifica della validità nel tempo con Urichk 

Un punto debole delle pubblicazioni ipertestuali è la rapidità con cui le informazioni vengono 

spostate o eliminate dalla rete. In questo senso, un riferimento a un URI è spesso qualcosa di 

provvisorio, che andrebbe verificato frequentemente. 

Per attenuare questo problema esiste Urichk, 1 ovvero un programma molto semplice che è in 

grado di verificare la validità di indirizzi HTTP e FTP contenuti in un documento. 

Il suo funzionamento è molto semplice: legge un file ed estrae da questo i riferimenti di tipo 

HTTP e FTP; quindi si avvale di altri programmi per la verifica di questi indirizzi. 

urichk --input-type=tipo file_da_analizzare rapporto_errori 

Come si vede dal modello sintattico, si deve definire il tipo del file in ingresso, per sapere come 

estrapolare l’informazione nel modo corretto; inoltre, dopo l’indicazione del file da scandire, si 

aggiunge il nome di un altro file che serve per annotare i riferimenti che sembrano non essere più 

validi. 

Il file che viene generato (l’ultimo argomento) è di tipo HTML, in modo da poter riprovare 

facilmente gli indirizzi che sembrano errati. Infatti, Urichk riporta gli errori, ma non è in grado 

di distinguere se la risorsa a cui si fa riferimento è realmente scomparsa o se si tratta si una 

situazione transitoria (come un servizio FTP sovraccarico). Evidentemente, la valutazione finale 

non può essere decisa automaticamente. 

Tabella 259.2. Parole chiave usate con l’opzione ‘--input-type’ per distinguere il tipo 

di file indicato in ingresso. 

Tipo 

standard 

html|sgml 

texi|texinfo 

Descrizione 

Si tratta di un file di testo normale. 

Si tratta di un file SGML tipico. 

Si tratta di un sorgente Texinfo. 

L’esempio seguente mostra il caso dell’analisi del file ‘prova.html’: 

$ urichk --input-type=html prova.html rapporto.html 

L’elaborazione richiede che sia disponibile l’accesso alla rete esterna (altrimenti tutti gli URI 

risulteranno errati) e anche molto tempo. Le varie richieste di connessione, eseguite per verificare 

gli indirizzi, avvengono in modo indipendente, attraverso degli eseguibili controllati da 

‘urichk’. In questo senso, il file del rapporto viene scritto in modo disgiunto da questi sottoprogrammi. 

In generale, quando termina di funzionare l’eseguibile principale, ‘urichk’, anche 

gli altri eseguibili dovrebbero avere terminato il loro lavoro. 

Urichk dipende dalla disponibilità di altri programmi: Wget per il controllo degli URI di tipo 

HTTP; ImageMagick, precisamente l’eseguibile ‘xtp’, per il controllo degli URI di tipo FTP. 2 

259.4.1 Installare Urichk 

Urichk si compone di tre programmi Perl: ‘urichk’ (il programma frontale), ‘urichk-ftp’ e 

‘urichk-http’. Se l’interprete Perl si trova in una posizione diversa da quella tipica per un 

sistema GNU/Linux, ovvero ‘/usr/bin/perl’, basta modificare la prima parte di questi file: 

1 Urichk GNU GPL 

2 Alcune edizioni di Urichk, al posto di utilizzare il programma ‘xtp’ di ImageMagick potrebbero avvalersi si Curl. 

Infatti, a volte crea degli strani problemi.

URI 2841 


#... 

Questi eseguibili devono poi essere collocati in una posizione conveniente, precisamente dove 

possono essere avviati senza bisogno di indicare il percorso. In pratica, in una delle directory 

previste nella variabile di ambiente ‘PATH’. 

Urichk utilizza Gettext, attraverso il modulo Perl-gettext. Per installare la traduzione italiana dei 

messaggi, occorre procedere nel modo seguente: 

$ msgfmt -vvvv -o urichk.mo it.po 

Il file ‘it.po’ è contenuto nel pacchetto di distribuzione di Urichk, mentre il file ‘urichk.mo’ 

deve essere creato come mostrato. Questo file, va poi installato nella directory adatta, che 

probabilmente è ‘/usr/share/locale/it/LC_MESSAGES/’. 

Infine, occorre ricordare che Urichk non è autonomo nella verifica degli indirizzi. Per questo 

dipende da Wget e ImageMagick come è già stato descritto. 

259.5 Verifica degli URI con Checkbot 

Checkbot 3 è un programma Perl molto semplice da utilizzare, per controllare la validità degli 

indirizzi contenuti in una pagina HTML locale o remota. Il suo utilizzo è molto semplice e il 

rapporto che si ottiene è molto dettagliato, consentendo una comprensione chiara del tipo di 

errore che impedisce di raggiungere qualche indirizzo URI. Tutto viene gestito attraverso un 

eseguibile unico denominato ‘checkbot’: 

checkbot [opzioni] [uri_iniziale ... ] 

Nella situazione più semplice, si utilizza Checkbot specificando un solo indirizzo URI iniziale da 

scandire: se si tratta di una pagina HTML, vengono analizzati tutti i riferimenti contenuti al suo 

interno. Per esempio così: 

$ checkbot file:///home/tizio/prova.html 

Come si vede, è opportuno indicare sempre il riferimento alla pagina da scandire utilizzando un 

URI, anche se si tratta di un file locale. 

Leggendo la pagina di manuale checkbot(1), si possono trovare tante opzioni per questo programma. 

Tuttavia, il suo funzionamento normale non richiede nulla, salvo forse la necessità di 

indicare un proxy indispensabile per raggiungere la rete esterna (con l’opzione ‘--proxy uri’). 

Se non si indica nulla di diverso attraverso le opzioni della riga di comando, la scansione genera 

il file ‘checkbot.html’ e un altro file il cui nome rispetta il modello ‘checkbot-nodo.html’. 

Il primo di questi due è un riepilogo dell’esito della scansione, mentre il secondo elenca dettagliatamente 

gli URI per i quali c’è stato qualche problema. Comunque, si raggiunge il secondo 

attraverso un riferimento ipertestuale presente nel primo. 


• T. Berners-Lee, R. Fielding, U.C. Irvine, L. Masinter, RFC 2396: Uniform Resource 

Identifiers (URI): General Syntax, 1998 

 

 

3 Checkbot stesse condizioni di Perl

2842 URI 

• Daniele Giacomini, Urichk 

 

• International ISBN agency, The ISBN Users’ Manual 

 


HTML: aspetti generali 

Capitolo 260 

HTML sta per Hypertext markup language e in pratica è un formato SGML per i documenti 

della rete che fa uso di un DTD particolare: HTML appunto. La formattazione di un documento 

HTML non può mai essere valutata perfettamente in anticipo, perché dipende da diversi fattori: 

• il programma utilizzato per visualizzare il documento; 

• la risoluzione utilizzata; 

• i tipi di carattere a disposizione; 

• la profondità di colori disponibili. 

Lo standard HTML è tale per cui tutti (o quasi) i programmi utilizzabili per la lettura di tali 

documenti sono in grado di cavarsela. Ma questo risultato minimo è ben lontano dall’esigenza 

di costruire qualcosa che tutti possano vedere più o meno nello stesso modo. Per questo, quando 

si costruisce un documento HTML, occorre pensare all’utenza a cui è destinato, in modo da 

decidere quali caratteristiche possono essere utilizzate e quali invece è meglio scartare per evitare 

inutili problemi di lettura. 

L’HTML nasce all’inizio degli anni 1990, abbinato in particolare al primo navigatore: Mosaic. 

Da quel momento a oggi il formato HTML ha subito diversi aggiornamenti; si ricorda in particolare 

la versione 2.0 del 1995 e la versione 3.2 del 1997. Allo stato attuale, lo sviluppo di questo 

standard è condotto da W3C (World wide web consortium) e in questo capitolo si fa riferimento 

alla versione 4. 

Si potrebbe dire che l’HTML abbia ricevuto un successo iniziale superiore alle sue possibilità tecniche, 

cosa che ha causato una proliferazione di varianti. In pratica, chi ha realizzato i programmi 

di navigazione, volendo offrire effetti speciali che non potevano essere ottenuti altrimenti, ha definito 

nel tempo una propria estensione allo standard di partenza (e anche a quelli successivi). 

Questo però ha creato e crea ancora oggi una grande confusione sul modo corretto di scrivere 

un documento in formato HTML. Questo problema si aggrava anche di più nel momento in cui 

questi navigatori non sono in grado di gestire correttamente gli standard indipendenti. 

Lo spirito alla base dello sviluppo dell’HTML da parte del W3C, come ente indipendente, è 

quello di ottenere un formato multimediale-ipertestuale completo, adatto per la lettura attraverso 

qualunque tipo di mezzo: dal terminale tattile braille al documento stampato. Le estensioni proprietarie 

di questo standard si sono rivolte principalmente all’aspetto visuale e scenografico di 

questo formato, trascurando le altre esigenze. Scrivere un documento «puro» in HTML è un’arte 

raffinata, che attualmente non è conosciuta abbastanza. In generale, maggiori sono i contenuti e 

le esigenze di divulgazione, minori devono essere le pretese estetiche. 

La documentazione di riferimento per tutto ciò che riguarda l’HTML è quella offerta dal W3C: 

, in particolare . 

260.1 HTML e SGML 

L’HTML è un linguaggio di composizione basato sull’SGML (si veda quando descritto a partire 

dal capitolo 249). Come tale, un documento HTML inizia sempre con la dichiarazione del DTD; 

poi tutto il documento viene racchiuso nell’elemento principale di questa struttura: 

 

 

2843

2844 HTML: aspetti generali 

... 

... 

... 

 

Purtroppo, la maggior parte dei programmi di navigazione o di composizione per il formato 

HTML non è in grado di comprendere tutte le regole dell’SGML, per cui occorre evitare di 

utilizzare alcune delle sue caratteristiche. In particolare bisogna evitare: 

• la creazione di entità interne per l’utilizzo di macro specifiche relative al testo; 

 

 

 

 

]> 

• le sezioni marcate per l’inclusione e l’esclusione del testo; 

 

... 

]]> 

... 

 

... 

]]> 

• le sezioni marcate per individuare un contenuto di tipo ‘CDATA’, allo scopo di proteggere il 

simbolo ‘

HTML: aspetti generali 2845 

PUBLIC "-//W3C//DTD HTML 4.01//EN" 

strict.dtd 

PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" loose.dtd 

PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" frameset.dtd 

PUBLIC "-//W3C//ENTITIES Latin1//EN//HTML" HTMLlat1.ent 

PUBLIC "-//W3C//ENTITIES Special//EN//HTML" HTMLspecial.ent 

PUBLIC "-//W3C//ENTITIES Symbols//EN//HTML" HTMLsymbol.ent 

Con questo catalogo, una copia dei file che sono stati elencati prima deve trovarsi nella directory 

corrente. Si noti l’istruzione iniziale, ‘OVERRIDE YES’, con la quale si vuole permettere la 

dichiarazione del DTD come è già stato mostrato: 

 

In questo modo, se è disponibile un collegamento con la rete esterna, si utilizza direttamente il 

DTD originale, presso www.w3.org, mentre se questa possibilità manca, si fa riferimento ai 

file locali attraverso le specifiche del catalogo. 

Nell’esempio seguente si utilizza il programma ‘nsgmls’ (del pacchetto SP) supponendo in particolare 

che il catalogo sia contenuto nel file ‘catalogo’; il file da verificare viene indicato 

come ‘mio_file.html’. Il catalogo e il file da controllare si intendono collocati nella directory 

corrente. 

$ cat mio_file.html | nsgmls -s -c catalogo 

È il caso di ricordare che alcune distribuzioni GNU/Linux, in particolare Debian, predispongono 

un pacchetto apposito contenente i DTD più comuni riferiti alle varie versioni dell’HTML, 

comprese le estensioni proprietarie, assieme alle relative entità standard. Naturalmente, il tutto 

è organizzato in un catalogo unico che va eventualmente ad aggiornare il catalogo di sistema 

(dovrebbe trattarsi del file ‘/etc/sgml.catalog’, oppure del file ‘/usr/share/sgml/ 

catalog’). Il nome di questo pacchetto potrebbe essere ‘sgml-data 

* ’. 

Oltre alla verifica in base al DTD sarebbe opportuno sapere leggere il contenuto del DTD stesso. 

A questo proposito è da notare il fatto che nel manuale che descrive le specifiche HTML di 

W3C, si fa spesso riferimento alle caratteristiche degli elementi attraverso lo schema offerto 

dalla dichiarazione relativa nel DTD. In effetti, ciò permette di rendere molto chiara e precisa la 

descrizione che ne viene fatta subito dopo. 

260.1.1 Attributi comuni attraverso le entità parametriche 

Il DTD dell’HTML 4.01 fa un uso massiccio di entità parametriche e questo può disorientare 

inizialmente. In generale basta ricordare che qualunque cosa nella forma ‘%nome ;’ è una macro 

che si espande in una stringa. La dichiarazione di queste entità parametriche avviene nella parte 

iniziale del DTD, attraverso istruzioni del tipo: 

 

È interessante notare l’utilizzo di entità parametriche per fare riferimento agli attributi degli elementi. 

Infatti, quasi tutti gli elementi dell’HTML 4.01 prevedono l’uso di attributi, per cui si 

è ritenuto opportuno classificarli all’interno di entità parametriche. In particolare è importante 

individuarne due molto importanti: 

 


"lang %LanguageCode; #IMPLIED -- language code -- 

dir (ltr|rtl) #IMPLIED -- direction for weak/neutral text --" 

> 

Si può osservare che anche la dichiarazione di queste entità è sottoposta all’interpretazione di 

altre macro; queste riguardano il tipo di contenuto relativo agli attributi. 

La macro ‘%coreattrs;’ serve a individuare un gruppo di attributi disponibili nella maggior 

parte degli elementi: 

• ‘id’ permette di attribuire una stringa di riconoscimento all’elemento, in modo da potervi 

fare riferimento; 

• ‘class’ permette di abbinare all’elemento una classe, definita attraverso un nome, in modo 

da potergli attribuire uno stile particolare; 

• ‘stile’ permette definire l’abbinamento con uno stile; 

• ‘title’ permette di attribuire un «titolo» all’elemento, cosa che si traduce in pratica in 

modo differente a seconda del contesto (ovvero, a seconda dell’elemento a cui si applica). 

La macro ‘%i18n;’ serve invece a definire ciò che riguarda la localizzazione: 

• ‘lang’ permette di indicare una sigla, secondo lo standard ISO 639 (sezione 543) e anche 

secondo altri standard, per attribuire all’elemento il linguaggio relativo; 

• ‘dir’ permette di stabilire il flusso del testo nel risultato finale, dove la parola chiave ‘ltr’ 

si riferisce a uno scorrimento da sinistra a destra (Left to right) e la parola chiave ‘rtl’ 

indica uno scorrimento opposto, da destra a sinistra (Right to left). 

Gli attributi a cui si fa riferimento attraverso le macro ‘%coreattrs;’ e ‘%i18n;’ sono così 

importanti che si trova un’altra entità parametrica che le raccoglie per comodità: 

 

La macro ‘%events;’ si riferisce a una serie di attributi legati a «eventi», ovvero azioni che si 

compiono con il mouse o con la tastiera. 

Si osservi, a titolo di esempio, la dichiarazione dell’elemento ‘P’, dove gli attributi sono tutti 

quelli più comuni, rappresentati dalla macro ‘%attrs;’, ovvero dalla somma di ‘%coreattrs;’, 

‘%i18n;’ e ‘%events;’: 

 

 

260.1.2 Classificazione fondamentale degli elementi 

All’interno di un documento HTML si distinguono due gruppi di elementi fondamentali: quelli 

che rappresentano dei blocchi e quelli che servono a inserire qualcosa all’interno di una riga 

di testo normale. Questa suddivisione corrisponde a due macro: ‘%block;’ e ‘%inline’ 

rispettivamente. 

Per fare un esempio, l’elemento ‘P’ (paragrafo) è un «blocco», mentre l’elemento ‘EM’ (enfasi) è 

un componente interno a una riga di testo.


Questa classificazione semplifica molto la dichiarazione degli elementi, come nel caso dell’elemento 

‘P’, già visto, il cui contenuto è semplicemente tutto ciò che va inserito nelle righe di 

testo: 

 

Alcuni elementi di un documento HTML sono ambigui, nel senso che possono contenere sia blocchi 

che testo. Questa ambiguità viene dichiarata attraverso la macro ‘%flow;’ che rappresenta la 

scelta alternativa tra un blocco o una riga di testo: 

 

A titolo di esempio si osservi la dichiarazione dell’elemento ‘LI’ che rappresenta la voce di un 

elenco puntato o numerato: 

 

260.2 Stili 

Le estensioni proprietarie dell’HTML hanno portato questo linguaggio di composizione a una 

proliferazione di dialetti, a causa dell’esigenza di trasferire anche le informazioni sull’aspetto 

finale della composizione, che in origine non erano state prese in considerazione. L’HTML 4. 

* 

standard cerca di porre rimedio a questa carenza, con l’uso di una serie di attributi che però 

non sono disponibili nella versione «ristretta», ciò proprio a indicare che si tratta di estensioni 

sconsigliate. 

La soluzione migliore per risolvere il problema sembra essere l’abbinamento di uno stile, che può 

essere dichiarato all’interno del file HTML stesso, attraverso l’elemento ‘STYLE’, attraverso l’attributo 

‘STYLE’, oppure in un file esterno, richiamandolo con l’elemento ‘LINK’ (verrà mostrato 

tra poco). 

L’HTML non presuppone il formato in cui può essere realizzato lo stile. È comune l’uso di stili 

in formato CSS (Cascading style sheet) e per farvi riferimento si indica il tipo ‘text/css’. 

Per il momento, non viene spiegato in che modo si scrivono le direttive in un foglio di stile CSS. 

Intuitivamente, il lettore può comprendere che la direttiva seguente serve a colorare in blu il 

contenuto degli elementi ‘H1’: 

H1 { color: blue } 

Inoltre, la direttiva seguente serve per fare in modo che il contenuto dell’elemento ‘P’ abbia il 

carattere di 12 punti e di colore rosso: 

P { font-size: 12pt; color: red } 

Si osservi che la stessa cosa avrebbe potuto essere scritta nel modo seguente: 

P { 

} 

font-size: 

color: 

12pt; 

red; 

Per definire questi stili all’interno di un documento HTML, senza fare uso di un file esterno, si 

potrebbe agire nel modo seguente, attraverso l’uso dell’elemento ‘STYLE’: 

 

 

 

Esempio 

 

H1 { color blue } 

P {


font-size: 

color: 

} 

 

 

 

... 

... 

... 

 

 

12pt; 

red; 

Si comprende che il testo contenuto nell’elemento ‘STYLE’ non deve interferire con l’HTML 

e quindi non può contenere simboli che possano risultare ambigui. Questo problema riguarda 

naturalmente il linguaggio con cui è realizzato lo stile; nel caso del formato CSS non dovrebbe 

porsi alcun problema. Tuttavia, qualche programma utilizzato per la navigazione, potrebbe non 

riconoscere l’elemento ‘STYLE’, arrivando a riprodurre il testo che rappresenta in realtà lo stile. 

Per evitare questo problema si può circoscrivere la cosa all’interno di un commento SGML: 

 

 

 

} 

Volendo agire direttamente in un elemento singolo, si può utilizzare l’attributo ‘STYLE’, ma in tal 

caso si possono usare esclusivamente direttive CSS. Nel caso di un elemento ‘P’ isolato che deve 

avere un carattere di 12 punti ed essere colorato in rosso, lo si può dichiarare nel modo seguente: 

Attenzione! 

Probabilmente, il modo più elegante di abbinare uno stile a un documento HTML è quello 

di aggiungere un file esterno. Nell’esempio seguente si include lo stile corrispondente al file 

‘stile.css’: 

 

 

 

Esempio 

 

... 

 

... 

 

È chiaro che dipende dal programma di navigazione la capacità o meno di conformarsi allo 

stile. In generale, lo standard CSS sembra essere quello che ha più probabilità di affermarsi.


260.3 Struttura di un documento HTML 

Il documento HTML è contenuto tutto nell’elemento omonimo: ‘HTML’. Nel caso della definizione 

«rigorosa» (il DTD ‘strict.dtd’) questo si scompone in due elementi fondamentali, ‘HEAD’ 

e ‘BODY’, che rappresentano rispettivamente l’intestazione e il corpo: 

 

 

 

Titolo della pagina 

 

 

... 

 

... 

 

 

In generale, è conveniente annotare la lingua principale del documento, attraverso l’attributo 

‘LANG’ da collocare nel marcatore di apertura dell’elemento ‘HTML’: 

 

Per la precisione, il codice che definisce il linguaggio viene indicato secondo la sintassi seguente: 

codice_principale[-codice_secondario] 

In pratica, la prima parte, quella che appare prima del trattino di separazione, indica la lingua, di 

solito attraverso il codice ISO 639 (sezione 543), mentre la seconda parte indica l’area nazionale, 

secondo lo standard ISO 3166 (sezione 544), che a sua volta può implicare delle varianti nel 

linguaggio. 

In generale, un documento di grandi dimensioni realizzato attraverso il formato HTML, richiede 

la scomposizione dello stesso in più file HTML collegati tra loro da riferimenti ipertestuali. 

Questa, purtroppo, è una necessità a causa delle limitazioni dei programmi di navigazione. 

260.3.1 Intestazione e informazioni supplementari 

L’intestazione è una parte del documento HTML che serve per annotare delle informazioni generali. 

Deve contenere almeno il titolo all’interno dell’elemento ‘TITLE’. Di solito, la riproduzione 

di un documento HTML non fa apparire il titolo nel testo del documento, che comunque viene 

usato per farvi riferimento (per esempio nel segnalibro del programma utilizzato per la sua 

visualizzazione). 

Nell’intestazione, prima o dopo il titolo, può essere conveniente collocare alcune «metainformazioni», 

attraverso alcuni elementi ‘META’. Si tratta di un elemento vuoto, per il quale 

si utilizza soltanto il marcatore di apertura con l’indicazione di attributi opportuni. In particolare, 

si possono utilizzare gli attributi seguenti: 

• ‘NAME’ per indicare un nome che qualifica il tipo di meta-informazione (si tratta di parole 

chiave più o meno standard, che però non sono state definite nel DTD); 

• ‘HTTP-EQUIV’ per indicare un campo di risposta nell’ambito del protocollo HTTP, tenendo 

conto che l’attributo ‘NAME’ è alternativo a ‘HTTP-EQUIV’. 

• ‘CONTENT’ (obbligatorio) per indicare il valore abbinato al nome indicato attraverso 

l’attributo ‘NAME’, oppure attraverso l’attributo ‘HTTP-EQUIV’;


Come si intuisce dall’elenco degli attributi più importanti, si può distinguere tra elementi ‘META’ 

che utilizzano l’attributo ‘NAME’ e altri che usano l’attributo ‘HTTP-EQUIV’. Le informazioni che 

si definiscono attraverso elementi ‘META’ con l’attributo ‘NAME’ permettono di indicare informazioni 

che qualificano il documento, soprattutto quando questo viene trattato automaticamente da 

un motore di ricerca; l’attributo ‘HTTP-EQUIV’ permette invece di intervenire a livello del protocollo 

HTTP (quando il documento viene ottenuto in questo modo), specificando le intestazioni 

HTTP relative. Si osservi l’esempio seguente: 

 

Titolo della pagina 

 

 

 

 

 

 

In particolare, ricevendo questo documento attraverso il protocollo HTTP, si otterrà anche 

l’intestazione HTTP seguente: 

Content-Type: text/html; charset=ISO-8859-1 

Si noti l’indicazione esplicita dell’insieme di caratteri: ISO 8859-1 

Un altro tipo di elemento speciale può apparire all’interno dell’intestazione di un documento 

HTML; si tratta di ‘LINK’. Anche questo è un elemento vuoto e serve solo per indicare degli 

attributi nel marcatore di apertura. Gli attributi più importanti sono: 

• ‘HREF’ per indicare un URI a cui si intende fare riferimento; 

• ‘REL’ per definire la relazione che c’è con questo tipo di collegamento; 

• ‘TYPE’ per specificare in anticipo il tipo dei dati contenuti nell’URI; 

• ‘MEDIA’ per specificare il mezzo attraverso cui viene letto il documento. 

Trattandosi di un elemento vuoto, collocato nell’intestazione HTML, non è pensato per essere 

rappresentato nella composizione. Tuttavia, abbinando le parole chiave opportune all’attributo 

‘REV’, si stabiliscono una serie di collegamenti utili per ricomporre un documento più grande 

costituito da più pagine HTML. In pratica, si può dichiarare in modo esplicito come è articolato, 

così che il programma di navigazione o composizione sappia regolarsi. La tabella 260.1 elenca 

alcune delle parole chiave che possono essere assegnate all’attributo ‘REV’. 

Tabella 260.1. Parole chiave tipiche da assegnare all’attributo ‘REV’ dell’elemento 

‘LINK’. 

Nome 

Alternate 

Stylesheet 

Start 

Next 

Prev 

Contents 

Index 

Glossary 

Copyright 

Chapter 

Section 

Subsection 

Appendix 

Help 

Descrizione 

Una versione alternativa dello stesso documento. 

Foglio di stile esterno. 

Il primo documento di una collezione. 

Il prossimo documento di una sequenza lineare. 

Il documento precedente di una sequenza lineare. 

Un documento che funge da indice generale. 

Un documento che funge da indice analitico. 

Un documento che funge da glossario. 

Un documento che contiene la dichiarazione del copyright. 

Un documento che funge da capitolo in una collezione. 

Un documento che funge da sezione in una collezione. 

Un documento che funge da sottosezione in una collezione. 

Un documento che funge da appendice in una collezione. 

Un documento che funge da guida.


L’esempio seguente mostra parte di un’intestazione di una pagina HTML in cui sono stati usati 

alcuni elementi ‘LINK’ per definire la relazione con altre pagine che compongono la stessa 

raccolta: 

 

... 

 

 

 

 

 

 

 

Merita un po’ di attenzione l’attributo ‘MEDIA’ che serve a stabilire il mezzo adatto per la lettura 

del documento relativo. Questo attributo si usa generalmente all’interno di un elemento ‘LINK’ 

che serve a indicare un foglio di stile esterno; inoltre può essere usato per lo stesso motivo all’interno 

di un elemento ‘STYLE’. In pratica, in questo modo, si stabilisce l’abbinamento tra stile e 

mezzo di lettura. La tabella 260.2 elenca i nomi che si possono assegnare a un attributo ‘MEDIA’. 

Tabella 260.2. Parole chiave tipiche da assegnare all’attributo ‘MEDIA’ dell’elemento 

‘LINK’ e dell’elemento ‘STYLE’. 

Nome 

screen 

tty 

tv 

projection 

handheld 

print 

braille 

aural 

all 

Descrizione 

Schermo per lo scorrimento continuo. 

Terminale a celle di caratteri o simile. 

Televisione (bassa risoluzione e altre limitazioni). 

Proiettore. 

Schermi portatili. 

Stampa e simili (composizione impaginata). 

Terminale a barra braille per i non vedenti. 

Lettore a sintesi vocale. 

Valido per tutti i tipi di dispositivo. 

L’esempio seguente mostra in che modo si potrebbero selezionare diversi fogli di stile in base al 

mezzo utilizzato per la lettura del documento: 

 

 

 

260.3.2 Corpo del documento 

Il corpo di un documento HTML è delimitato dall’elemento ‘BODY’ e il suo contenuto è ciò che 

alla fine viene mostrato nella composizione finale. 

La composizione del corpo viene descritta nel capitolo 261. 

260.4 Attributi comuni 

All’inizio del capitolo si è accennato al fatto che molti elementi condividano un insieme comune 

di attributi. Vale la pena di descrivere brevemente alcuni di questi.


260.4.1 Linguaggio 

Il linguaggio di un elemento viene definito esplicitamente attraverso l’attributo ‘LANG’, a cui 

viene assegnato solitamente un codice corrispondente allo standard ISO 639. La tabella 260.3 

riporta un elenco di questi codici ridotto ad alcune lingue occidentali. 

Tabella 260.3. Alcuni codici dello standard ISO 639 per la definizione della lingua 

attraverso una sigla di due soli caratteri. 

Codice 

fr 

it 

ro 

es 

ca 

co 

pt 

da 

nl 

en 

de 

is 

no 

sv 

fi 

Lingua 

Francese 

Italiano 

Rumeno 

Spagnolo 

Catalano 

Corso 

Portoghese 

Danese 

Olandese 

Inglese 

Tedesco 

Islandese 

Norvegese 

Svedese 

Finlandese 

In generale può essere conveniente l’utilizzo di questo attributo nell’elemento ‘HTML’, in modo 

da fissare il linguaggio di tutto il documento. Tuttavia, quando un elemento contiene un testo in 

un altro linguaggio, conviene annotarlo nello stesso modo. 

L’effetto più evidente che potrebbe risultare dalla distinzione in base al linguaggio, è la 

separazione delle parole in sillabe, per creare una composizione più gradevole. 

260.4.2 Codifica 

L’attributo ‘CHARSET’ permette di definire esplicitamente l’insieme di caratteri dell’elemento. 

Come è già stato mostrato, di solito lo si utilizza in un elemento ‘META’ introduttivo allo scopo 

di definire l’intestazione HTTP relativa: 

 

... 

 

 

 

La tabella 260.4 elenca alcuni codici comuni per la definizione dell’insieme dei caratteri. 

Tabella 260.4. Alcuni codici per definire l’insieme di caratteri. 

Codice 

ISO-8859-1 

ISO-8859-2 

ISO-8859-3 

ISO-8859-4 

ISO-8859-5 

ISO-8859-6 

ISO-8859-7 

ISO-8859-8 

ISO-8859-9 

Corrispondenza 

latin1 

latin2 

latin3 

latin4 

ciryllic 

arabic 

greek 

hebrew 

latin5


260.4.3 Direzione del testo 

Il testo di un documento HTML può scorrere da sinistra a destra o viceversa. Per controllare 

questo flusso si può utilizzare l’attributo ‘DIR’, a cui si possono abbinare esclusivamente le parole 

chiave ‘ltr’ o ‘rtl’: Left to right, da sinistra a destra; Right to left, da destra a sinistra. 

In generale, il flusso del testo avviene da sinistra a destra, come richiedono le lingue occidentali, 

per cui non è necessario usare questo attributo in condizioni «normali». 

È importante notare che il testo nel sorgente di un documento HTML segue sempre il flusso 

normale, da sinistra a destra, ammesso che si possa definire un flusso per un file sorgente. 

Non è disponibile la possibilità di ribaltare orizzontalmente i caratteri, quando il flusso del 

testo cambia direzione, come avviene nella scrittura geroglifica. 

260.4.4 Titolo 

Molti elementi dispongono di un attributo ‘TITLE’. Il suo scopo è quello di indicare un titolo, 

che viene preso in considerazione in modo differente in base al contesto. Questo attributo può 

essere molto utile negli elementi che comportano l’inclusione di un’immagine, dal momento che 

rappresenta un testo alternativo per chi non può visualizzarle. Anche un riferimento ipertestuale 

può avvantaggiarsi di questo attributo, perché si può visualizzare il testo corrispondente prima di 

raggiungere l’oggetto, in modo da avere una breve descrizione di ciò che si tratta (così da poter 

decidere se ne vale la pena). 

Tizio 

L’esempio mostra proprio il caso di un riferimento ipertestuale, ottenuto con l’elemento ‘A’, attraverso 

il quale si raggiunge un file che dovrebbe mostrare l’immagine di Tizio vestito in divisa. 

Se il navigatore permette di conoscere il titolo del riferimento prima di doverlo raggiungere, si 

può evitare di prelevare il file nel caso ciò non sia interessante. 

È ovvio che sta poi all’autore della pagina la scelta nello scrivere dei titoli utili o ingannevoli. 

Chi realizza una pagina pubblicitaria ha ovviamente degli interessi diversi da chi invece vuole 

realizzare un documento ordinato e facile da consultare. 

260.4.5 Identificazione di un elemento 

Molti elementi dispongono di un attributo ‘ID’ che permette di attribuire loro un’etichetta con la 

quale poi farvi riferimento. Il modo tradizionale per realizzare dei riferimenti incrociati in HTML 

è l’uso dell’elemento ‘A’, prima con l’attributo ‘NAME’ (l’etichetta), poi con l’attributo ‘HREF’ (il 

riferimento ipertestuale). 

L’attributo ‘ID’ permette di generalizzare il problema, dal momento che in tal modo gli elementi 

comuni hanno la possibilità di «identificarsi» in maniera univoca per qualunque scopo, non solo 

quello di definire un obiettivo per un riferimento. 

Questo è un paragrafo nominato in modo univoco. 

Anche questo è un altro paragrafo nominato in 

modo univoco. 

Si deve tenere presente che i nomi utilizzati per gli attributi ‘ID’ devono essere univoci. Questi 

nomi devono essere univoci anche nei confronti dell’attributo ‘NAME’ nell’elemento ‘A’.


260.4.6 Classificazione degli elementi 

A differenza dell’attributo ‘ID’, l’attributo ‘CLASS’ consente di abbinare a un gruppo di elementi 

una certa classe. Il meccanismo è lo stesso, con la differenza che si vogliono indicare dei 

raggruppamenti. Di solito, si attribuisce una classe per abbinarne le definizioni di un foglio di 

stile. 

la vita è fatta per essere vissuta 

L’esempio mostra la delimitazione di una parte di testo attraverso l’elemento ‘SPAN’, al quale 

viene attribuita la classe ‘nota’. In seguito, sarà possibile abbinare a tutti gli elementi di questa 

classe le stesse caratteristiche attraverso un foglio di stile. Utilizzando i fogli di stile CSS, si 

potrebbe applicare la regola seguente a tutti gli elementi ‘SPAN’ della classe ‘nota’: 

SPAN.nota { color: green } 


• W3C 

 

• W3C, Technical Reports and Publications 

 

• Character sets 

 


HTML: corpo 

Capitolo 261 

Il corpo di un documento HTML è contenuto normalmente nell’elemento ‘BODY’ a meno che si 

utilizzino le cornici (frame), nel qual caso si tratta dell’elemento ‘FRAMESET’. 

A sua volta, il contenuto dell’elemento ‘BODY’ è abbastanza «libero», nel senso che si possono 

inserire blocchi di testo di vario tipo, senza una struttura preordinata. 

261.1 Delimitazione di blocchi e di testo normale 

Per ovviare alla mancanza di una struttura prestabilita, è possibile raggruppare dei blocchi di 

testo o del testo normale attraverso gli elementi ‘DIV’ e ‘SPAN’ rispettivamente. 

Gli obiettivi che ci si possono prefiggere in questo modo possono essere molti. In generale si 

sfrutta la possibilità di attribuire a questi elementi degli attributi per qualche scopo. 

 

 

... 

... 

 

Questo esempio mostra una situazione in cui l’elemento ‘DAT’ viene utilizzato per delimitare 

una parte del corpo del documento, a cui viene attribuita la classe ‘capitolo’ e la stringa di 

identificazione ‘capitolo-1’. 

Il sig. Tizio Tizi è andato... 

In questo nuovo esempio, si usa l’elemento ‘SPAN’ per delimitare il testo che indica il nome di 

una certa persona. In questo modo viene anche attribuita l’appartenenza alla classe ‘nome’, cosa 

che può tornare utile per rendere i nomi in modo diverso attraverso un foglio di stile. 

261.2 Titoli e struttura implicita del testo 

Ciò che nel testo rappresenta un titolo di una sezione, si indica utilizzando gli elementi che vanno 

da ‘H1’ a ‘H6’. Intuitivamente, il primo rappresenta un titolo di importanza maggiore, mentre 

l’ultimo è quello di importanza minore. 

L’utilizzo corretto dei titoli attraverso questi elementi è molto importante perché può permettere 

a un sistema di visualizzazione o composizione di conoscerne la gerarchia e generare così un 

indice generale (se richiesto). In taluni casi si può arrivare anche a ottenere una numerazione di 

questi titoli in modo automatico. 

... 

Titolo principale 

... 

Titolo di livello inferiore 

... 

Altro titolo principale 

... 

Gli elementi che rappresentano dei titoli sono fatti per contenere testo normale ed elementi che 

non rappresentano blocchi separati. 

È importante ricordare che il titolo del documento HTML, quello che si indica nell’elemento 

‘TITLE’ nell’intestazione, ovvero all’interno dell’elemento ‘HEAD’, di norma non viene 

rappresentato. Per questo, spesso, il titolo del documento viene riproposto in un titolo ‘H1’. 

2855

2856 HTML: corpo 

L’esempio seguente mostra un pezzo di documento strutturato in capitoli e sezioni, delimitati 

formalmente attraverso l’elemento ‘DIV’: 

 

Trattato di bla bla bla 

Questo trattato tratta di aria fritta... 

 

Dettagli 

Questa è una sezione inutile di un trattato 

inutile... 

 

 

Lo scopo di ciò può essere quello di attribuire stili particolari alle varie parti gerarchie del documento. 

Inoltre, l’utilizzo dell’attributo ‘ID’ nell’elemento ‘DIV’ che introduce ogni blocco 

gerarchico può rappresentare un modo coerente per farvi riferimento. 

261.3 Testo 

Il testo normale è ciò che è contenuto in un «blocco» di testo. Il caso più comune di blocco di 

testo è rappresentato dall’elemento ‘P’, utilizzato per dividerlo idealmente in paragrafi. 

All’interno di un blocco, salvo casi particolari, il testo viene reso in modo da adattarsi alle dimensioni 

imposte dal sistema di visualizzazione o di composizione. In pratica, viene suddiviso 

in modo conveniente, ignorando le interruzioni di riga e le righe vuote aggiunte. 

È opportuno fare attenzione all’uso degli spazi all’interno degli elementi che contengono testo 

normale: si dovrebbe evitare di iniziare o concludere un elemento con uno spazio. In pratica, si 

deve evitare di scrivere qualcosa come: 

Bla bla bla evviva bla bla. 

Al suo posto bisogna invece limitarsi a scrivere: 

Bla bla bla evviva bla bla. 

261.3.1 Paragrafi e interruzioni 

Si è già accennato al fatto che le righe vuote vengono ignorate in HTML. In effetti, l’interruzione 

di un paragrafo deve essere segnalata sempre esplicitamente, almeno attraverso l’indicazione 

dell’inizio di questo. Si osservi l’esempio seguente; anche se appare ovvio che il testo successivo 

alla dichiarazione del titolo è un paragrafo, questo modo non è ammissibile. 

... 

Titolo principale 

Primo paragrafo che descrive qualcosa 

che non serve precisare oltre. 

Paragrafo successivo. 

Altro argomento 

... 

HTML ignora le righe bianche (possono contenere spazi e caratteri di tabulazione, oltre ai 

caratteri di conclusione della riga), per cui la separazione dei paragrafi attraverso l’inserzione 

di righe non serve a nulla.

HTML: corpo 2857 

Se si vuole ottenere l’interruzione della riga, in modo che il testo riprenda all’inizio, ma senza 

interrompere il paragrafo, potrebbe convenire l’utilizzo dell’elemento ‘BR’, come nell’esempio 

seguente: 

Paragrafo che descrive qualcosa: 

questa riga fa parte dello stesso paragrafo 

che inizia con la riga precedente. 

Se si vogliono evitare i problemi causati dalle differenze nella composizione del risultato 

da parte dei programmi di navigazione, conviene ridurre al minimo l’uso di questo tipo di 

interruzione di riga. 

Per separare il testo esiste anche la possibilità di utilizzare delle righe di separazione orizzontale: 

‘HR’ (Horizontal rule). Si tratta di elementi vuoti, per cui non si usa il marcatore di conclusione. 

261.3.2 Elementi tipici utilizzati all’interno delle frasi 

Nell’ambito del testo normale, si possono racchiudere alcune parti, per qualche motivo, all’interno 

di elementi specifici. Le situazioni tipiche riguardano l’evidenziamento, come nel caso degli 

elementi ‘EM’ e ‘STRONG’. 

... il codice di interruzione di riga è ciò 

che separa le righe ... 

La tabella 261.1 elenca gli elementi più comuni di questo tipo. 

Tabella 261.1. Elementi da usare all’interno delle frasi. 

Elemento 

EM 

STRONG 

CITE 

Q 

DFN 

CODE 

SAMP 

KBD 

VAR 

ABBR 

ACRONYM 

SUB 

SUP 

Significato 

Testo enfatizzato, di solito in corsivo. 

Testo evidenziato, di solito in neretto. 

Citazione, nel senso di chi o cosa viene citato. 

Testo citato. 

Definizione. 

Codice usato in elaborazione, di solito reso in carattere dattilografico. 

Testo risultato di un’elaborazione. 

Testo da inserire attraverso la tastiera. 

Variabile o argomento di un programma. 

Abbreviazione. 

Acronimo. 

Testo a pedice. 

Testo ad apice. 

Vale la pena di vedere come si può abbinare l’attributo ‘TITLE’ agli elementi ‘ABBR’ e 

‘ACRONYM’. In generale, questi due si possono intendere quasi come la stessa cosa: spesso l’acronimo 

è un’abbreviazione. A parte il problema di scegliere questo o quell’elemento, l’attributo 

‘TITLE’ diventa utile per specificare il modo in cui si traduce l’acronimo o l’abbreviazione: 

WWW 

A volte, un’abbreviazione o un acronimo diventano parole con un’identità propria; come tale 

acquisisce anche una pronuncia, che probabilmente si vuole preservare, specialmente quando il 

documento HTML viene letto attraverso un sistema vocale. Anche a questo scopo può essere 

usato l’attributo ‘TITLE’.


261.3.3 Citazioni 

Il testo che si riferisce a una citazione si può delimitare attraverso due elementi: ‘BLOCKQUOTE’ 

quando si tratta di blocchi di testo e ‘Q’ quando si tratta di qualcosa che viene inserito nel flusso 

del testo normale. 

 



bla bla bla. 

 

Dall’esempio si può osservare l’utilizzo dell’attributo ‘CITE’ con il quale si può indicare l’URI 

da dove ottenere il testo originale o il testo completo; inoltre è stato inserito anche l’attributo 

‘LANG’ allo scopo di specificare il linguaggio del testo citato (presumibilmente diverso da quello 

generale). 

Tizio Tizi ha detto: 

 



bla bla bla. 

Questo esempio ulteriore fa uso dell’elemento ‘Q’, ma in aggiunta si vede anche l’elemento 

‘CITE’ con il quale viene indicato l’autore del testo citato. 

261.3.4 Testo preformattato 

In un documento HTML, l’unico modo per preservare gli spazi orizzontali e le interruzioni 

di riga, è l’uso dell’elemento ‘PRE’. In generale, il risultato che si ottiene viene rappresentato 

utilizzando un carattere dattilografico. 

Il comando ls -l / genera un risultato simile a quello 

seguente: 

 

drwxr-xr-x 2 root root 2048 gen 6 18:38 bin 

drwxr-xr-x 3 root root 1024 dic 31 08:08 boot 

drwxr-xr-x 4 root root 18432 gen 24 14:23 dev 

drwxr-xr-x 68 root root 4096 gen 24 14:09 etc 

drwxr-sr-x 14 root root 1024 gen 3 19:32 home 

drwxr-xr-x 5 root root 4096 gen 6 16:32 lib 

drwxr-xr-x 19 root root 1024 ago 15 16:02 mnt 

drwxr-xr-x 5 root root 1024 nov 9 14:59 opt 

dr-xr-xr-x 88 root root 0 gen 24 14:07 proc 

drwxr-xr-x 18 root root 1024 dic 16 17:37 root 

drwxr-xr-x 3 root root 2048 gen 6 16:12 sbin 

drwxrwxrwt 6 root root 8192 gen 24 18:56 tmp 

drwxr-xr-x 16 root root 1024 gen 5 15:23 usr 

drwxr-xr-x 15 root root 1024 set 29 15:02 var 

 

Per essere sicuri del risultato finale, è bene evitare l’uso di caratteri di tabulazione, preferendo 

piuttosto gli spazi normali.


261.4 Elenchi 

In generale, esistono tre tipi di elenchi: puntati, numerati e descrittivi. L’elenco puntato viene 

definito utilizzando l’elemento ‘UL’ (Unordered list), quello numerato si ottiene con l’elemento 

‘OL’ (Ordered list), quello descrittivo si ottiene con l’elemento ‘DL’ (Definition list). Le voci 

degli elenchi puntati e numerati sono costituite da elementi ‘LI’ (List item), mentre nel caso 

dell’elenco descrittivo il contenuto si articola in elementi ‘DT’ (Definition term) e ‘DD’ (Definition 

description). 

 

prima voce di un elenco puntato; 

seconda voce di un elenco puntato; 

terza voce. 

 

 

prima voce di un elenco numerato; 

seconda voce di un elenco numerato; 

terza voce. 

 

 

Resistenza 

Resistore 

Componente resistivo utilizzato in elettronica 

Condensatore 

Componente capacitivo... 

 

Gli esempi mostrano un uso molto semplice di questi elenchi. Si può osservare in particolare 

che nel caso dell’elenco descrittivo, gli elementi che delimitano il termine da descrivere possono 

essere più di uno simultaneamente. 

Gli elementi ‘LI’ e ‘DT’ sono speciali, dal momento che possono contenere testo normale, come 

si vede negli esempi, oppure dei blocchi di testo. Questo, tra le altre cose, consente di realizzare 

degli elenchi più complessi. 

 

prima voce di un elenco numerato; 

seconda voce di un elenco numerato; 

 

terza voce che si articola ulteriormente: 

 

bla bla bla 

bla bla bla 

bla bla bla 

 

 

 

261.5 Tabelle 

Quando si iniziano a utilizzare le tabelle e si scoprono gli effetti che si riescono a ottenere, 

non se ne vorrebbe più fare a meno. In realtà, sarebbe bene utilizzare le tabelle il meno possibile, 

perché alcuni programmi per la visualizzazione di documenti HTML non sono in grado di gestirle 

in maniera ottimale. Qui viene data solo una spiegazione superficiale, che comunque dovrebbe 

essere sufficiente per l’uso normale. 

La tabella è definita dall’elemento ‘TABLE’; al suo interno può essere inclusa una didascalia 

rappresentata dall’elemento ‘CAPTION’, quindi il contenuto della tabella viene distinto in intestazione, 

piede e corpo, all’interno dei quali si inseriscono le righe della tabella stessa (figura 

261.1).


Figura 261.1. Esempio di una tabella. 

.-------------------------------------------. 

| Articolo | Descrizione | riga di intestazione 

|================|==========================| 

| 123xyz | Bicicletta uomo | \ 

|----------------|--------------------------| | 

| 125xyz | Bicicletta donna | > corpo 

|----------------|--------------------------| | 

| 121xyz | Bicicletta bambino | / 

|================|==========================| 

| Articolo | Descrizione | piede 

‘-------------------------------------------’ 

L’intestazione e il piede non sono obbligatori; in ogni caso, se si utilizzano vanno inseriti ordinatamente 

prima del corpo. Se non si indica l’intestazione o il piede, le righe che costituiscono 

il corpo non hanno bisogno di essere delimitate espressamente tra i marcatori che rappresentano 

l’elemento corrispondente. La tabella 261.2 riepiloga gli elementi utili nella realizzazione delle 

tabelle HTML. 

Tabella 261.2. Elementi da usare per la realizzazione delle tabelle HTML. 

Elemento 

TABLE 

CAPTION 

THEAD 

TFOOT 

TBODY 

TR 

TH 

TD 

Significato 

Delimita la tabella. 

Didascalia. 

Righe di intestazione. 

Righe del piede. 

Righe del corpo. 

Riga normale. 

Elemento evidenziato di una riga. 

Elemento di una riga. 

L’esempio seguente rappresenta una tabella molto banale, senza intestazione e senza piede: 

 

unodue 

trequattro 

cinquesei 

 

Il risultato è uno specchietto simile a quello che si vede di seguito: 

--------------------------------- 

uno 

due 

tre 

quattro 

cinque 

sei 

--------------------------------- 

Per aggiungere una riga di intestazione è necessario indicare in modo esplicito l’elemento 

‘TBODY’, che prima è stato sottinteso: 

 

 

PrimoSecondo 

 

 

unodue 

trequattro 

cinquesei 

 

 

--------------------------------- 

Primo 

Secondo 

--------------------------------- 

uno 

due


tre 

quattro 

cinque 

sei 

--------------------------------- 

L’esempio seguente aggiunge anche una didascalia molto breve: 

 

 

Tabella banale 

 

 

PrimoSecondo 

 

 

unodue 

trequattro 

cinquesei 

 

 

Tabella banale 

--------------------------------- 

Primo 

Secondo 

--------------------------------- 

uno 

due 

tre 

quattro 

cinque 

sei 

--------------------------------- 

Le tabelle HTML possono essere molto più complesse di quanto è stato mostrato qui. Vale la 

pena di sottolineare il fatto che gli elementi ‘TD’, ovvero le celle all’interno delle righe, possono 

contenere sia testo normale, sia blocchi di testo. Inoltre, è fondamentale l’attributo ‘BORDER’ 

dell’elemento ‘TABLE’, con il quale si definisce la grandezza del contorno della tabella: 

 

... 

... 

 

261.6 Riferimenti ipertestuali 

La sigla HTML fa riferimento esplicitamente a un sistema ipertestuale. Ci deve quindi essere un 

modo per creare questi collegamenti. 

Un riferimento può essere fatto a una pagina intera o a un punto particolare di una pagina. Il riferimento 

può essere assoluto, cioè provvisto dell’indicazione del nodo e del percorso necessario a 

raggiungere la pagina, oppure può essere relativo al nodo attuale. 

Per i riferimenti si utilizza l’elemento ‘A’ ed eventualmente l’attributo ‘ID’ di molti altri elementi. 

261.6.1 Riferimenti a una pagina intera 

Un riferimento a una pagina intera, con l’indicazione del percorso assoluto per raggiungerla, 

viene fatto come nell’esempio seguente: 

Pagina di prova 

Nell’esempio, la frase «Pagina di prova» serve come punto di riferimento del puntatore a 

‘http://www.brot.dg/prove/prova.html’. 

Quando di realizza un documento HTML composto da più pagine collegate tra loro, è preferibile 

utilizzare riferimenti relativi, in modo da non dover indicare il nome del nodo in cui si trovano e 

nemmeno il percorso assoluto delle directory da attraversare per raggiungerle.


Annotazioni varie 

Nell’esempio, si vede un riferimento al file ‘nota.html’ contenuto nella «directory» ‘varie/’ 

discendente dalla directory corrente. La directory corrente, in questi casi, è quella in cui si trova 

la pagina contenente il puntatore. 1 

Il vantaggio di utilizzare riferimenti relativi, sta nella facilità con cui il documento può essere 

spostato o copiato in altri punti nel file system dello stesso o di un altro elaboratore (si veda 

anche quanto già scritto nel capitolo 259). 

261.6.2 Riferimenti a una posizione di una pagina 

All’interno di una pagina è possibile collocare delle etichette che poi possono servire per fare dei 

riferimenti, sia a partire dalla stessa pagina che da altre. L’esempio seguente mostra un esempio 

di un’etichetta molto semplice. 

 

Si usa quindi lo stesso elemento che serve per creare un puntatore, ma con l’attributo ‘NAME’. 

L’argomento dell’attributo ‘NAME’ (in questo caso è la parola ‘introduzione’), identifica quel 

punto. 

Per fare riferimento a un’etichetta nella stessa pagina si può usare la forma dell’esempio seguente, 

con il quale si vuole puntare all’etichetta appena creata. 

Introduzione 

Si utilizza l’opzione ‘HREF’ come al solito, ma il suo argomento è il nome dell’etichetta preceduta 

dal simbolo ‘#’. Evidentemente, ciò è necessario per evitare di fare riferimento a un file con lo 

stesso nome. 

Se si vuole fare riferimento a un’etichetta di un certo file, si utilizza la notazione solita, 

aggiungendo l’indicazione dell’etichetta. 

Introduzione 

a GNU/Linux 

261.6.3 Collegamenti simmetrici 

Si può osservare che l’elemento ‘A’ serve sia per indicare un’etichetta, attraverso l’attributo 

‘NAME’, sia per definire un riferimento, attraverso l’attributo ‘HREF’ (senza contare la possibilità 

di usare anche l’attributo ‘ID’). Questo fatto consente di realizzare dei riferimenti simmetrici, 

dove un riferimento è anche etichetta della terminazione opposta: 

vai al punto due 

vai al punto uno 

L’esempio dovrebbe essere abbastanza chiaro: il primo puntatore punta al secondo, che a sua 

volta punta al primo. 

261.6.4 Utilizzo dell’attributo ID 

L’attributo ‘ID’ è una generalizzazione attraverso la quale si attribuisce un’identità a un elemento. 

Può essere usato come destinazione per un riferimento fatto attraverso l’elemento ‘A’ con 

l’attributo ‘HREF’, ma il suo scopo è più ampio. 

1 Qui viene usato il termine «directory», ma in pratica potrebbe anche non essere esattamente una directory vera e 

propria.


In generale, quando si realizzano dei riferimenti ipertestuali dovrebbe essere più conveniente l’indicazione 

di etichette attraverso l’attributo ‘NAME’, dal momento che ci possono essere ancora dei 

navigatori o altri sistemi di lettura di file HTML che non sono in grado di riconoscere l’attributo 

‘ID’. 

261.7 Inserzioni di oggetti 

Un documento HTML può contenere riferimenti a «oggetti» esterni. Nei casi più comuni si tratta 

di immagini o di applet, ma il concetto riguarda qualunque altra cosa che possa essere incorporata 

nel documento. Come si può supporre, l’elemento attraverso cui si includono gli oggetti è 

‘OBJECT’. La tabella 261.3 elenca alcuni degli attributi di questo elemento. 

Tabella 261.3. Alcuni attributi dell’elemento ‘OBJECT’. 

Attributo 

DATA 

TYPE 

STANDBY 

Significato 

Riferimento al file dell’oggetto. 

Tipo di oggetto. 

Messaggio di attesa durante il caricamento dell’oggetto. 

Come si può intuire, il minimo per importare un oggetto richiede almeno l’uso dell’attributo 

‘DATA’; inoltre, in generale è opportuno aggiungere anche l’attributo ‘TYPE’ per precisare subito 

il tipo di oggetto. 

L’elemento ‘OBJECT’ non può essere vuoto; ciò che racchiude è quello che deve essere mostrato 

nel caso non sia possibile raggiungere l’oggetto indicato, oppure non sia possibile gestire 

l’oggetto stesso. Di solito si tratta di testo normale, ma potrebbe trattarsi di altri oggetti alternativi. 


L’esempio mostra l’inclusione di un’immagine, ‘esempio.jpg’, che nel caso non possa essere 

raggiunta o visualizzata, viene rimpiazzata con la frase: «Immagine di esempio». L’esempio 

seguente, al contrario, tenta di visualizzare un’altra immagine in un formato alternativo; se poi 

anche quella non è accessibile o visualizzabile, si passa al testo di prima: 

 

 


 

 

261.7.1 Immagini 

Il tipo di immagine che può essere visualizzata dipende solo dalle limitazioni del programma di 

navigazione o di composizione. Generalmente si possono utilizzare solo i formati GIF, JPG e 

PNG (in pratica le estensioni ‘.gif’, ‘.jpg’ e ‘.png’). 2 

I riferimenti a file di immagine si fanno attraverso l’elemento ‘OBJECT’ oppure ‘IMG’. In generale, 

per ottenere un documento HTML adatto alla maggior parte di programmi per la navigazione, 

conviene ancora utilizzare il vecchio elemento ‘IMG’, come nell’esempio seguente: 

 

L’elemento ‘IMG’ è vuoto, pertanto non si usa il marcatore di conclusione. Come si vede dall’esempio, 

si utilizza l’attributo ‘SRC’ per definire la collocazione del file contenente l’immagine, 

2 Il formato PNG è accettato solo da alcuni programmi di navigazione, di conseguenza non è sempre consigliabile il 

suo utilizzo; inoltre, il formato GIF è brevettato e il suo utilizzo non è libero.


l’attributo ‘ALT’ per indicare una descrizione alternativa nel caso in cui l’immagine non possa 

essere visualizzata. La stessa cosa avrebbe potuto essere espressa con l’elemento ‘OBJECT’ nel 

modo seguente: 

 

Logo 

 

Generalmente, per evitare problemi di compatibilità con i vari programmi di navigazione, è meglio 

evitare di fare scorrere il testo a fianco delle immagini, per cui è bene staccare il testo normale 

racchiudendolo esplicitamente all’interno di un elemento ‘P’ (paragrafo). 

 

...testo che segue l’immagine... 

L’immagine può essere utilizzata anche come pulsante per un riferimento ipertestuale, quando 

è contenuta all’interno di questo ultimo. In tali casi è particolarmente importante ricordare di 

inserire l’attributo ‘ALT’, che diventa un’alternativa indispensabile nel caso in cui l’immagine 

non possa essere visualizzata. 

 

Naturalmente, se fosse necessario ricordarlo, non è obbligatorio che tutto si trovi sulla stessa riga, 

quindi l’esempio precedente può anche essere assemblato come indicato qui sotto: 

 

 

 


• W3C 

 


 

• W3C, HTML 4.01 Specification 

 


CSS 

Capitolo 262 

I fogli di stile CSS (Cascading style sheet) rappresentano un metodo semplice per consentire di 

dichiarare e abbinare degli stili di composizione ai documenti HTML e ad altri tipi di sistemi 

SGML. 

Attualmente il lavoro su CSS ha generato due «livelli», CSS1 e CSS2, intesi come la prima e 

la seconda versione del linguaggio di stile CSS. Teoricamente, il linguaggio CSS deve essere 

compatibile sia verso l’alto che verso il basso, nel senso che il primo livello CSS è compatibile 

con il secondo e il secondo è compatibile con il primo. In pratica, le estensioni fatte al linguaggio 

nel CSS2 sono tali per cui dovrebbero essere ignorate semplicemente dai programmi in grado di 

interpretare correttamente solo CSS1. 

In questo capitolo si introduce il linguaggio CSS affrontando solo parte delle caratteristiche del 

primo livello, con qualche annotazione eventuale sul secondo. Nella sezione 260.2 è già stato 

mostrato in quanti modi si può includere un foglio di stile CSS in un documento HTML, pertanto 

questo particolare non verrà riproposto. 

262.1 Logica del linguaggio CSS 

Nella documentazione di CSS, le sue istruzioni vengono definite «regole», che si esprimono 

sinteticamente secondo la forma seguente, dove le parentesi graffe fanno parte della dichiarazione 

della regola: 

selettore { dichiarazione } 

Il principio è molto semplice: il «selettore» rappresenta qualcosa all’interno del documento; la 

dichiarazione è ciò che si vuole ottenere su tale oggetto. All’interno di una regola si possono 

raggruppare più selettori, applicando così le stesse dichiarazioni; inoltre si possono indicare più 

dichiarazioni: i selettori si separano con la virgola; le dichiarazioni si separano con un punto e 

virgola: 

selettore[, selettore] ... { dichiarazione [; dichiarazione] ... } 

Le regole possono essere scritte anche utilizzando più righe di testo normale, per cui, la stessa 

sintassi appena mostrata potrebbe essere scritta anche come nel modo seguente (si osservi 

l’aggiunta di un punto e virgola ulteriore): 

selettore[, selettore] ... { 

dichiarazione ; 

[dichiarazione ;] 

... 

} 

Teoricamente, quando si scrivono le regole iniziando ogni dichiarazione in una riga separata, è 

possibile evitare l’aggiunta del punto e virgola finale, ma questa scorciatoia non è consigliabile 

in generale. 

Le dichiarazioni si scompongono a loro volta in proprietà e valori loro assegnati: 

selettore[, selettore] ... { 

proprietà: valore [valore_alternativo] ...; 

[proprietà: valore [valore_alternativo] ...; ] 

... 

} 

Come si vede, alle proprietà si possono assegnare più valori alternativi, in ordine di importanza. 

2865

2866 CSS 

Si osservi l’esempio seguente: attribuisce il colore blu al testo degli elementi ‘H1’ di un 

documento HTML: 


L’esempio successivo indica l’utilizzo di uno sfondo composto da un’immagine esterna per il corpo 

del documento, specificando che in mancanza dell’immagine, o in mancanza della possibilità 

di rappresentarla si può utilizzare uno sfondo bianco: 

BODY { background: url(fondale.jpg) white } 

Si intuisce che il nome del file contenente l’immagine è stato indicato come argomento di 

quello che sembra essere una funzione: ‘url()’. Si osservi comunque che questa funzione fa 

riferimento a un URI e non a un URL, come fa intendere erroneamente il suo nome. 

I commenti in un foglio di stile CSS si rappresentano in modo simile al linguaggio C, nella forma: 

/* testo_ignorato */ 

262.1.1 Ereditarietà e collegamento in cascata 

Una caratteristica fondamentale del linguaggio CSS è l’ereditarietà di talune caratteristiche 

in certe circostanze. Per comprendere il significato della cosa basta pensare alla struttura 

dell’HTML, o a un altro linguaggio SGML in generale: se si attribuisce una caratteristica stilistica 

a un elemento che per sua natura ne può contenere altri, ci si aspetta intuitivamente che 

questa si trasmetta anche ai livelli inferiori se applicabile, a meno che per tali elementi sia stato 

definito espressamente qualcosa di diverso. 

Volendo fare un esempio più pratico, si può immaginare una caratteristica riferita alla dimensione 

del carattere di un blocco di testo. Se questo blocco contiene delle porzioni di testo delimitate 

da altri elementi, che possono servire per ottenere un testo enfatizzato in qualche modo, è normale 

attendersi che per queste porzioni venga utilizzata la stessa dimensione del carattere, senza 

bisogno di dichiarare esplicitamente e dettagliatamente questa richiesta. 1 

In generale, per quanto riguarda l’HTML, è normale assegnare all’elemento ‘BODY’ le 

caratteristiche generali di tutto il documento, sfruttando il principio di ereditarietà. 

L’altra caratteristica fondamentale del linguaggio CSS è la possibilità di definire gli stili in cascata. 

Questo significa che si possono abbinare assieme più fogli di stile e che nel complesso che 

si crea, ci possono essere regole che si contraddicono a vicenda. Evidentemente, in questi casi 

viene applicato un criterio di scelta, che verrà descritto più avanti. 

262.1.2 Selettori 

Il selettore di una regola CSS è qualcosa che rappresenta una parte del testo a cui si vogliono 

applicare le dichiarazioni relative. Nella situazione più semplice, il selettore viene indicato con 

il nome dell’elemento a cui si attribuisce. In questo modo, le dichiarazioni si applicano a tutti gli 

elementi di quel tipo. Nell’esempio seguente, che è già stato usato in precedenza, si attribuisce il 

colore blu al testo che compone tutti gli elementi ‘H1’: 


Tutti gli elementi HTML che si possono utilizzare nel corpo di tale tipo di documento possono 

utilizzare l’attributo ‘CLASS’. Questo permette di attribuire loro una «classe», ovvero un gruppo, 

di solito nell’ambito di quel tipo di elemento. Per indicare un selettore che faccia riferimento a 

una classe specifica di un certo elemento, si usa la notazione seguente: 

1 In generale, il buon senso dovrebbe essere sufficiente per intendere quando una caratteristica viene ereditata e quando 

questo non può succedere.

CSS 2867 

[elemento].classe 

Come si vede, l’indicazione dell’elemento è facoltativa, in modo tale che, se non lo si indica, si 

faccia riferimento a tutti gli elementi che appartengono a quella stessa classe. L’esempio seguente 

mostra il caso degli elementi ‘P’ che appartengono alla classe ‘nota’, a cui viene abbinato il 

colore rosso per il testo: 

P.nota { color: red } 

L’esempio seguente mostra invece l’utilizzo di un selettore che fa riferimento a una classe di 

qualunque elemento: 

.calmante { color: green } 

Un selettore può essere anche più specifico e arrivare a individuare un elemento preciso nel 

documento HTML, attraverso il riferimento all’attributo ‘ID’: 

[elemento]#identificativo 

In questa situazione non è necessario indicare il nome dell’elemento, dato che la stringa di identificazione 

è già un dato univoco per conto proprio. Al contrario, se si sbaglia l’indicazione dell’elemento, 

si annulla la validità della regola relativa, perché non può essere applicata. L’esempio 

seguente attribuisce all’elemento ‘P’ identificato dalla stringa ‘xyz’ il colore blu: 

P#xyz { color: blu } 

La stessa cosa avrebbe potuto essere ottenuta all’interno dello stesso file HTML attraverso 

l’attributo ‘STYLE’ con una dichiarazione simile a quella seguente: 

bla bla bla 

Un selettore può essere composto in modo da definire la dipendenza da un contesto. In altri 

termini, si può definire un selettore che dipende da un altro: 

selettore sottoselettore [sotto_sottoselettore] ... 

Il primo selettore indica un ambito, all’interno del quale andrà cercata la corrispondenza per il 

secondo selettore, continuando eventualmente ad aumentare il dettaglio con altri selettori più 

specifici. Si osservi l’esempio seguente; serve a fare riferimento agli elementi ‘EM’ che si trovano 

all’interno di un elemento ‘H1’: 

H1 EM { color: green } 

È importante distinguere il raggruppamento di selettori dalla definizione di un contesto più dettagliato 

come in questo caso. Infatti, per raggruppare i selettori si utilizza la virgola. L’esempio 

seguente applica il colore verde a tutti gli elementi ‘EM’ contenuti all’interno di elementi ‘H1’ o 

‘H2’: 

H1 EM, H2 EM { color: green } 

Un selettore può anche individuare una pseudo-classe, ovvero una zona di testo che viene individuata 

dal programma che si occupa di interpretare il documento HTML, che non corrisponde a 

elementi e classi indicati espressamente: 

[elemento][.classe]:pseudo_classe 

Il caso tipico di una pseudo-classe è quella che delimita la prima lettera di un elemento: 

‘first-letter’. L’esempio seguente serve a ottenere una lettera iniziale più grande in tutti 

gli elementi ‘P’ di classe ‘primo’: 

P.primo:first-letter { 

font-size: 200%; 

float: left; 

}

2868 CSS 

262.1.3 Stili in cascata 

I fogli di stile CSS possono essere uniti assieme in cascata. Tra le altre cose, ciò permette la 

definizione di uno o più stili da parte dell’autore e di uno o più stili personalizzati da parte 

dell’utente che legge il documento. Un file contenente lo stile CSS può incorporare altri file 

attraverso la direttiva ‘@import’ che ha la sintassi seguente: 

@import url(uri_foglio_di_stile ); 

Come si vede, riappare la funzione ‘url()’ già mostrata in precedenza. In generale, le direttive 

di incorporazione dei fogli di stile esterni vanno collocate all’inizio del file, prima delle regole 

CSS. 

Si è accennato al fatto che, nell’ambito dello stile complessivo che si ottiene, si possono generare 

dei conflitti tra dichiarazioni riferite alla stessa porzione di documento. Per scegliere quale 

dichiarazione deve avere la meglio, è necessario stabilire un peso differente, che dipende dal contesto 

e può anche essere condizionato attraverso l’aggiunta della stringa ‘! important’ in coda 

alla dichiarazione: 

H1 { 

color: black ! important; 

background: white ! important; 

} 

L’esempio mostra il caso in cui si tenta di aumentare il peso delle dichiarazioni che definiscono 

il colore del testo e dello sfondo negli elementi ‘H1’. 

Viene descritta brevemente e in modo semplificato la sequenza attraverso cui vengono attribuite 

le caratteristiche dello stile. 

• Le dichiarazioni vengono applicate se c’è la corrispondenza con i selettori. Se non ci sono 

corrispondenze, si applicano i valori ereditati; se non è possibile ereditare alcunché, si usano 

i valori iniziali. 

• Le dichiarazioni vengono ordinate in base al loro peso, dove quelle marcate come 

«importanti» ricevono un peso maggiore rispetto a quelle normali. 

• Le dichiarazioni vengono ordinate in base alla loro origine: lo stile dell’autore ha la precedenza 

su quello personalizzato dell’utente, che a sua volta ha la precedenza su quello 

predefinito dal programma utilizzato. 

• Le dichiarazioni vengono ordinate in base alla precisione con cui individuano gli obiettivi. 

In pratica, le dichiarazioni più specifiche hanno la precedenza rispetto a quelle più generali. 

• Al termine, se due regole hanno lo stesso peso, ha la precedenza quella che appare per 

ultima. 

262.2 Proprietà 

Di seguito vengono mostrate una serie di tabelle che descrivono l’utilizzo di alcune proprietà 

comuni nel linguaggio CSS. Bisogna ricordare che ogni programma di lettura o di composizione 

dei documenti HTML può fare la propria scelta su quali siano le dichiarazioni da prendere in 

considerazione, ignorando tutto il resto. Pertanto, si tratta solo di un’indicazione e l’utilizzo degli 

stili CSS deve essere sempre valutato tenendo conto delle carenze che poi ci possono essere in 

fase di lettura.

CSS 2869 

Tabella 262.1. Proprietà riferite ai caratteri. 

Proprietà Valori Descrizione 

font-family tipo_di_carattere Tipo di carattere. 

font-style normal Forma normale. 

italic 

Corsivo. 

oblique 

Obliquo. 

font-variant normal Serie normale. 

small-caps Maiuscoletto. 

font-weight normal Tono normale. 

bold 

Nero. 

bolder 

Nerissimo. 

lighter 

Chiaro. 

font-size npt Dimensione in punti. 

ncm 

Dimensione in centimetri. 

nmm 

Dimensione in millimetri. 

nem 

Dimensione relativa in quadratoni. 

nex 

Dimensione relativa in Ex. 

n% Dimensione relativa percentuale. 

small 

Carattere piccolo. 

medium 

Carattere normale. 

large 

Carattere grande. 

Nella tabella 262.1 si fa riferimento in particolare alla proprietà ‘font-family’. A questa può 

essere attribuito il nome di una famiglia di caratteri, oppure il nome di una «famiglia generica», 

che in pratica identifica uno stile del carattere senza indicare esattamente quale tipo di carattere. 

Una famiglia di caratteri potrebbe essere ‘times’, mentre una famiglia generica potrebbe essere 

‘serif’, ovvero un carattere munito di grazie. Alla proprietà ‘font-family’ possono essere 

abbinati più tipi di caratteri, separati da una virgola, per indicare una sequenza alternativa da 

utilizzare in mancanza di altro: 

BODY { font-family: gill, helvetica, sans-serif } 

L’esempio mostra proprio questo: prima si tenta di utilizzare il carattere ‘gill’; quindi si prova 

con ‘helvetica’; infine ci si accontenta di un carattere senza grazie, ‘sans-serif’. 

Tabella 262.2. Proprietà riferite ai colori e allo sfondo. 


color colore Colore del carattere o di primo piano. 

background-color colore Colore dello sfondo. 

background-image url(uri) Immagine da usare per lo sfondo. 

Per quanto riguarda i colori (tabella 262.2), si possono indicare attraverso il nome che questi 

hanno in inglese, oppure attraverso la funzione ‘rgb()’, con la quale si specifica il valore RGB: 

rgb(livello_rosso, livello_verde, livello_blu) 

I numeri che esprimono i livelli dei colori fondamentali RGB vanno da 0 a 255.

2870 CSS 

Tabella 262.3. Proprietà riferite al testo. 


vertical-align baseline Testo al livello normale. 

middle Allinea al centro. 

sub Pedice. 

super Apice. 

text-transform none Nessuna trasformazione del testo. 

capitalize Rende maiuscola la prima lettera delle parole. 

uppercase Tutto maiuscolo. 

lowercase Tutto minuscolo. 

text-align left Allinea a sinistra. 

right Allinea a destra. 

center Centra. 

justify Allinea a sinistra e a destra. 

text-indent npt Rientro in punti. 

ncm Rientro in centimetri. 

nmm Rientro in millimetri. 

nem Rientro relativo in quadratoni. 

nex Rientro relativo in Ex. 

n% Rientro relativo in percentuale. 

line-height normal Altezza normale della riga. 

npt Altezza in punti. 

ncm Altezza in centimetri. 

nmm Altezza in millimetri. 

n% Altezza relativa in percentuale. 

Tabella 262.4. Proprietà riferite al testo racchiuso in blocchi rettangolari. 


margin-top auto Margine superiore automatico. 

npt Margine superiore in punti. 

ncm Margine superiore in centimetri. 

nmm Margine superiore in millimetri. 

n% Margine superiore relativo in percentuale. 

margin-bottom auto Margine inferiore automatico. 

npt Margine inferiore in punti. 

ncm Margine inferiore in centimetri. 

nmm Margine inferiore in millimetri. 

n% Margine inferiore relativo in percentuale. 

margin-left auto Margine sinistro automatico. 

npt Margine sinistro in punti. 

ncm Margine sinistro in centimetri. 

nmm Margine sinistro in millimetri. 

n% Margine sinistro relativo in percentuale. 

margin-right auto Margine destro automatico. 

npt Margine destro in punti. 

ncm Margine destro in centimetri. 

nmm Margine destro in millimetri. 

n% Margine destro relativo in percentuale. 

border-width thin Bordo sottile. 

medium Bordo medio. 

thick Bordo spesso. 

border-color colore Colore del bordo. 

border-style none Bordo non visibile. 

dotted Bordo puntato. 

dashed Bordo tratteggiato. 

solid Bordo continuo.

CSS 2871 


double Bordo continuo doppio. 

width auto Larghezza automatica. 

npt Larghezza in punti. 

ncm Larghezza in centimetri. 

nmm Larghezza in millimetri. 

n% Larghezza relativa in percentuale. 

height auto Altezza automatica. 

npt Altezza in punti. 

ncm Altezza in centimetri. 

nmm Altezza in millimetri. 

n% Altezza relativa in percentuale. 

float none Posizione fissa. 

left A sinistra con testo che scorre a destra. 

right A destra con testo che scorre a sinistra. 

clear none Scorre normalmente. 

left Salta un oggetto che si trova a sinistra. 

right Salta un oggetto che si trova a destra. 

both Salta qualunque oggetto fluttuante. 

262.3 Definizione della pagina 

Il secondo livello del linguaggio CSS, introduce una regola speciale, ‘@page’, per la definizione 

della pagina, nel momento in cui il documento dovesse essere stampato. Inoltre, sono disponibili 

delle proprietà specifiche per l’impaginazione da usarsi nelle regole normali. In generale, la regola 

‘@page’ viene usata per definire i margini ed eventualmente anche le dimensioni della pagina. 

L’esempio seguente dichiara una pagina A4 utilizzando margini tutti uguali di 2 cm: 

@page { 

size 210mm 297mm; 

margin-top: 2cm; 

margin-bottom: 2cm; 

margin-left: 2cm; 

margin-right: 2cm; 

} 

La stessa cosa si poteva ottenere in modo meno dettagliato come segue: 

@page { 

size 210mm 297mm; 

margin: 2cm; 

} 

La tabella 262.5 riepiloga le proprietà più importanti riferite a questa regola. 

Tabella 262.5. Proprietà riferite alla regola speciale ‘@page’. 


size x y Ampiezza e altezza della pagina (nelle varie unità di misura). 

size auto Definisce le dimensioni e l’orientamento in modo automatico. 

size landscape Orientamento orizzontale. 

size portrait Orientamento verticale. 

margin x Dimensione di tutti i margini. 

npt Dimensione in punti. 

ncm Dimensione in centimetri. 

nmm Dimensione in millimetri. 

n% Dimensione relativa in percentuale. 

margin-left x Dimensione del margine sinistro. 

margin-right x Dimensione del margine destro.

2872 CSS 


margin-top x Dimensione superiore. 

margin-bottom x Dimensione inferiore. 

La regola ‘@page’ può essere usata in modo da distinguere tra pagine destre e pagine sinistre. Si 

osservi a questo proposito l’esempio seguente: 

@page :left { 





} 

@page :right { 





} 

Come accennato sono disponibili delle proprietà specifiche per l’impaginazione da usarsi nelle 

regole normali. Con queste si intende controllare la suddivisione del testo in pagine, imponendo 

un salto pagina, oppure impedendolo nell’ambito dell’elemento coinvolto. Queste proprietà non 

vengono descritte qui, ma è utile almeno tenere in considerazione la loro esistenza. 


• W3C 

 


 

• W3C, Cascading Style Sheets, level 1 

 

• W3C, Cascading Style Sheets, level 2 

 


HTML2ps 

Capitolo 263 

HTML2ps 1 è un programma in grado di comporre uno o più file HTML, generando un risultato 

in PostScript. Questo si ottiene attraverso l’aiuto di altri programmi che devono essere installati, 

come per esempio TeX. 

Teoricamente, HTML2ps è in grado di ricomporre assieme un documento suddiviso su più file 

HTML, ma questa possibilità dipende molto dall’organizzazione di questi file, all’interno dei 

quali, i riferimenti ipertestuali devono essere molto semplici. In generale, è possibile l’acquisizione 

diretta dalla rete; tuttavia, sarebbe consigliabile prima la riproduzione locale, con l’ausilio di 

Wget (170.6), attraverso il quale si possono modificare automaticamente i riferimenti ipertestuali, 

rendendo omogeneo il tutto. 

HTML2ps si compone semplicemente dell’eseguibile ‘html2ps’ (un programma scritto in Perl) 

e di uno o più file di configurazione. È indispensabile almeno il file di configurazione generale, 

‘/etc/html2psrc’, che dovrebbe essere già predisposto in modo sufficientemente buono dal 

sistema di installazione. Eventualmente, gli utenti possono preparare una configurazione personalizzata 

nel file ‘~/.html2psrc’ e altri file specifici da richiamare con l’opzione ‘-f’, oltre 

all’aggiunta di stili ulteriori (opzione ‘-s’). 

263.1 Configurazione di HTML2ps 

Come accennato, la configurazione di HTML2ps è indispensabile. Di solito si predispone almeno 

il file di configurazione generale, ‘/etc/html2psrc’, mentre gli utenti hanno la possibilità di 

modificare o aggiungere qualcosa attraverso il file ‘~/.html2psrc’. La sintassi per la scrittura di 

questi file è la stessa dei fogli di stile CSS (capitolo 262), con l’aggiunta di un selettore specifico, 

‘@html2ps’, che serve a indicare gli aspetti particolari che riguardano HTML2ps e non possono 

appartenere ai fogli di stile CSS. 

Bisogna tenere presente che HTML2ps è in grado di riconoscere solo una parte limitata delle 

dichiarazioni CSS. 

HTML2ps riconosce anche i commenti CSS e le inclusioni di file di configurazione aggiuntivi, 

secondo la forma: 

@include file 

Per cominciare, è opportuno vedere un esempio abbastanza semplice di ciò che potrebbe contenere 

un file di configurazione, quando questo viene generato automaticamente dalla procedura di 

installazione. 

/* Configurazione globale per html2ps */ 

@html2ps { 

package { 

ImageMagick: 1; 

PerlMagick: 1; 

TeX: 1; 

Ghostscript: 1; 

check: weblint; 

libwww-perl: 1; 

path: "/usr/X11R6/bin:/usr/bin"; 

} 

paper { 

1 HTML2ps GNU GPL 

2873

2874 HTML2ps 

type: A4; 

} 

option { 

hyphenate: 0; 

} 

} 

Si può osservare che in questo esempio è stata dichiarata solo la regola corrispondente al selettore 

‘@html2ps’, all’interno della quale si trovano altre sottoregole. Generalmente, le regole tipiche 

di uno stile CSS si aggiungono sotto. La configurazione predefinita dello stile CSS è indicata 

nella pagina di manuale html2psrc(5) e da questa si intende quali siano le possibilità effettive di 

HTML2ps nel riconoscere le dichiarazioni CSS: 

BODY { 

font-family: Times; 

font-size: 11pt; 

text-align: left; 

background: white; 

} 

H1, H2, H3, H4, H5, H6 { 

font-weight: bold; 

margin-top: 0.8em; 

margin-bottom: 0.5em; 

} 

H1 { font-size: 19pt } 






P, OL, UL, DL, BLOCKQUOTE, PRE { 

margin-top: 1em; 

margin-bottom: 1em; 

} 

P { 

} 

line-height: 1.2em; 

text-indent: 0; 

OL, UL, DD { margin-left: 2em } 

TT, KBD, PRE { font-family: Courier } 

PRE { font-size: 9pt } 

BLOCKQUOTE { 

margin-left: 1em; 

margin-right: 1em; 

} 

ADDRESS { 


margin-bottom: 0.5em; 

} 

TABLE { 


margin-bottom: 1em; 

} 

DEL { text-decoration: line-through }

HTML2ps 2875 

A:link, HR { color: black } 

263.1.1 Configurazione della regola corrispondente al selettore 

speciale @html2ps 

La regola corrispondente al selettore ‘@html2ps’ si compone di dichiarazioni e di altre sottoregole 

per la configurazione di HTML2ps. Nelle sezioni seguenti vengono descritti i selettori 

specifici di queste sottoregole. 

Alcune proprietà hanno un significato booleano. A loro si assegna il valore zero per indicare 

Falso e il valore uno per indicare Vero. 

I valori che fanno riferimento a un’unità di misura, vanno indicati come avviene nei fogli di stile 

CSS: il numero seguito immediatamente dall’unità di misura. La tabella 263.1 elenca le unità 

di misura e le sigle corrispondenti che si possono utilizzare in questa circostanza. È importante 

osservare che l’unica dimensione relativa riconosciuta da HTML2ps è il quadratone e non sono 

previste misure percentuali come invece si può fare secondo le specifiche di W3C per i fogli di 

stile CSS. 

Tabella 263.1. Unità di misura secondo HTML2ps. 

Sigla 

cm 

mm 

pt 

pc 

em 

Unità di misura 

Centimetri. 

Millimetri. 

Punti tipografici. 

Pica. 

Quadratoni, corrispondente alla dimensione della lettera «M» maiuscola. 

• numberstyle: 0|1 

Permette di stabilire la numerazione delle pagine: zero richiede l’uso dei numeri arabi; uno 

corrisponde a numeri romani. Il valore predefinito per questa proprietà è il valore zero. 

• showurl: 0|1 

Attivando questa proprietà booleana, si ottiene l’inserimento nella composizione dell’indirizzo 

URI corrispondente ai riferimenti ipertestuali. In situazioni normali questo non 

avviene. 

• seq-number: 0|1 

Permette di abilitare la numerazione dei titoli ‘H1’, ‘H2’,... ‘H6’. In condizioni normali, 

questo non avviene. 

263.1.1.1 Sottoregola package 

La sottoregola ‘package’ serve a definire la disponibilità o meno di altri programmi di cui 

HTML2ps potrebbe avere bisogno. Di conseguenza si tratta di assegnamenti di valori booleani, 

dove zero rappresenta l’assenza del programma in questione e in generale è anche il valore 

predefinito. 

• PerlMagick: 0|1 

Indica la mancanza o la disponibilità di PerlMagick.

2876 HTML2ps 

• ImageMagick: 0|1 

Indica la mancanza o la disponibilità di ImageMagick. 

• Ghostscript: 0|1 

Indica la mancanza o la disponibilità di Ghostscript. 

• TeX: 0|1 

Indica la mancanza o la disponibilità di TeX. 

• dvips: 0|1 

Indica la mancanza o la disponibilità di ‘dvips’. 

• libwww-perl: 0|1 

Indica la mancanza o la disponibilità del modulo Perl Libwww-Perl. 

• path: percorsi_aggiuntivi 

Si tratta dell’indicazione di percorsi aggiuntivi per la ricerca degli eseguibili. Serve a garantire 

che i programmi utilizzati da HTML2ps siano raggiungibili per tutti gli utenti. 

In generale, in presenza di un sistema configurato bene, non dovrebbe essere necessaria 

l’indicazione di questa dichiarazione. 

263.1.1.2 Sottoregola paper 

La sottoregola ‘paper’ serve a definire le caratteristiche della carta. In generale si tratta solo 

delle dimensioni. 

• type: tipo_di_carta 

La direttiva serve a definire le dimensioni della carta, attraverso l’indicazione di un nome 

standard; per esempio: ‘A0’, ‘A1’, ... ‘A10’, ‘B0’, ‘B1’, ... ‘B10’, ‘letter’, ‘legal’, ecc. 

In alternativa, si possono indicare le dimensioni precise attraverso le proprietà ‘height’ e 

‘width’. 

• height: dimensione_assoluta 

Permette di definire l’altezza del foglio. 

• width: dimensione_assoluta 

Permette di definire la larghezza del foglio. 

263.1.1.3 Sottoregola option 

La sottoregola ‘option’ serve a definire l’utilizzo di alcune opzioni, a cui si può accedere anche 

attraverso la riga di comando. Vengono descritte prima le dichiarazioni da indicare nel file di 

configurazione e poi le opzioni corrispondenti della riga di comando. 

• twoup: 0|1 

-2 | --twoup 

Se attivato, fa in modo di ottenere un testo organizzato su due colonne verticali.

HTML2ps 2877 

• toc: {f|h|t}[b] 

-C {f|h|t}[b] 

Fa in modo che venga generato un indice generale, in base alle opzioni specificate da una o 

più lettere: 

– ‘b’ l’indice generale deve essere collocato all’inizio; 

– ‘f’ l’indice generale deve essere generato a partire dai riferimenti contenuti nel 

documento; 

– ‘h’ l’indice generale deve essere generato a partire dai titoli definiti dagli elementi 

HTML da ‘H1’ a ‘H6’; 

– ‘t’ l’indice generale deve essere generato a partire da elementi ‘LINK’ contenenti 

l’attributo ‘REV=TOC’. 

• DSC: 0|1 

-D | --DSC 

Se attivato, fa in modo di generare un file PostScript aderente alle specifiche DSC. In 

generale, per ottenere un file PostScript completo, è necessario attivare questa opzione. 

• encoding: codifica 

-e codifica | --encoding codifica 

Permette di definire la codifica in cui è realizzato il file HTML. Il valore predefinito è 

‘ISO-8859-1’, ma sono poche altre le possibilità (si deve consultare la pagina di manuale). 

• hyphenate: 0|1 

-H | --hyphenate 

Se attivato, fa in modo che il testo possa essere separato in sillabe, per facilitare 

l’impaginazione. 

• language: linguaggio 

-l linguaggio | --language linguaggio 

Permette di indicare un linguaggio diverso da quello che può essere stato dichiarato nell’elemento 

‘BODY’ con l’attributo ‘LANG’ di un documento HTML. La stringa che definisce il 

linguaggio va scelta in base a quanto già consentito dall’HTML (sezione 543). 

• landscape: 0|1 

-L | --landscape 

Se attivato, genera pagine orientate in modo orizzontale. 

• number: 0|1 

-n | --number 

Se attivato, fa in modo di aggiungere i numeri di pagina. 

• startno: n 

-N n | --startno n 

Specifica il numero iniziale delle pagine. Il valore predefinito è uno.

2878 HTML2ps 

• xref: 0|1 

-R | --xref 

Se attivato, fa in modo di aggiungere dei riferimenti visivi nel testo, in corrispondenza di 

quelli ipertestuali contenuti nel documento HTML. 

• scaledoc: scala_percentuale 

-s scala_percentuale | --scaledoc scala_percentuale 

Riduce o amplia la scala del documento: il valore unitario rappresenta la situazione normale, 

di una scala pari al 100 %; valori superiori indicano un ingrandimento, mentre valori 

inferiori indicano una riduzione (si usa il punto per separare la parte intera dalle cifre 

decimali). 

• web: {a|b|l|r|s}[p|L|n] 

-W {a|b|l|r|s}[p|L|n] 

-web {a|b|l|r|s}[p|L|n] 

Fa in modo che vengano utilizzati più file HTML che si ritiene facciano parte dello stesso 

documento. Il modo in cui vengono presi in considerazione questi file dipende dalla stringa 

composta nel modo mostrato dallo schema sintattico. 

– ‘a’ segue tutti i riferimenti ipertestuali; 

– ‘b’ segue soltanto i riferimenti ipertestuali che riguardano la stessa directory del file 

iniziale; 

– ‘l’ segue soltanto i riferimenti ipertestuali che contengono l’attributo ‘REL=NEXT’ 

all’interno dell’elemento ‘LINK’; 

– ‘r’ segue soltanto i riferimenti ipertestuali relativi; 

– ‘s’ segue solo i riferimenti allo stesso nodo del documento di partenza; 

– ‘p’ chiede conferma per ogni file HTML da aggiungere (ciò avviene in ogni caso 

quando si superano i 50 file); 

– ‘L’ riordina i documenti in base alla struttura gerarchica; 

– ‘n’ un numero indica il livello massimo di ricorsione, tenendo conto che il valore 

predefinito è di quattro livelli. 

263.1.1.4 Sottoregola margin 

La sottoregola ‘margin’ permette di definire esplicitamente i margini della pagina. 

Questa sottoregola è diventata obsoleta e viene sostituita dalla configurazione nel file di stile 

CSS, utilizzando la regola ‘@page’, introdotta dalle specifiche CSS2. 

• left margine_sinistro 

right margine_destro 

Indicano i margini sinistro e destro rispettivamente. Il valore predefinito è ‘2.5cm’, pari a 

2,5 cm.

HTML2ps 2879 

• top margine_superiore 

bottom margine_inferiore 

Indicano i margini superiore e inferiore rispettivamente. Il valore predefinito è ‘3cm’, pari a 

3 cm. 

• middle distanza_tra_colonne 

Indica la distanza orizzontale tra le colonne, quando si stampano due colonne per pagina. 

Il valore predefinito è ‘2cm’, pari a 2 cm. 

263.1.1.5 Sottoregola xref 

La sottoregola ‘xref’ permette di definire esplicitamente il modo in cui vengono indicati i 

riferimenti nel testo, quando questa funzionalità è stata abilitata. 

• text: modello 

Permette di definire il modello da utilizzare, tenendo conto che il simbolo ‘$N’ viene 

rimpiazzato con il numero della pagina. Il modello predefinito è ‘[p $N]’. 

• passes: n 

Permette di definire il numero di passaggi necessario per determinare in modo corretto i 

riferimenti incrociati. Il valore predefinito è il valore uno, ma l’inserzione del testo corrispondente 

al modello potrebbe cambiare la sequenza delle pagine, per cui si potrebbe 

rendere necessario un numero maggiore di passaggi. 

263.1.1.6 Sottoregola quote 

La sottoregola ‘quote’ permette di definire esplicitamente l’uso delle virgolette più appropriate 

in base al linguaggio. Queste virgolette vengono inserite nel testo in corrispondenza degli elementi 

‘Q’. In generale, i valori predefiniti per la lingua italiana sono già corretti. Viene mostrato 

solo un esempio per comprendere intuitivamente come si potrebbe adoperare questa sottoregola: 

quote { 

it { 

open: "«"; 

close: "»"; 

open2: "‘‘"; 

close2: "’’"; 

} 

} 

Si intende dall’esempio che sono disponibili solo due livelli di virgolette. 

263.1.1.7 Sottoregola toc 

La sottoregola ‘toc’ permette di definire alcune caratteristiche relative all’indice generale, quando 

la sua realizzazione è stata richiesta espressamente. In particolare si può utilizzare la proprietà 

‘level’ alla quale si assegna un numero, che sta a indicare i livelli da prendere in considerazione. 

Il valore predefinito è sei, che produce una voce per ogni tipo di titolo ‘Hn’ (da ‘H1’ a ‘H6’).

2880 HTML2ps 

263.1.1.8 Sottoregola hyphenation 

La sottoregola ‘hyphenation’ permette di definire la collocazione del file TeX contenente i 

modelli per la separazione in sillabe. La cosa si fa distinguendo tra diversi linguaggi. L’esempio 

seguente dovrebbe essere sufficiente a intendere intuitivamente la cosa: 

hyphenation { 

it { 

file: "/usr/share/texmf/tex/generic/hyphen/ithyph.tex"; 

} 

en { 

file: "/usr/share/texmf/tex/generic/hyphen/ushyph1.tex"; 

} 

} 

263.1.1.9 Sottoregole header e footer 

Le sottoregole ‘header’ e ‘footer’ permettono di definire l’intestazione e il fondo pagina, dove 

di solito si collocano alcune informazioni ricorrenti assieme al numero della pagina. Le proprietà 

di queste sottoregole sono praticamente le stesse; qui vengono elencate solo alcune di queste 

proprietà nella tabella 263.3. La tabella 263.2 elenca alcuni simboli che possono essere utilizzati 

per definire i modelli delle intestazioni e dei fondo pagina. 

Tabella 263.2. Simboli utilizzabili nelle intestazioni e nei fondo pagina. 

Simbolo Corrispondenza 

$T Titolo del documento. 

$A Autore, come specificato in ‘’. 

$U URI del documento. 

$N Numero di pagina. 

$H Titolo attuale (‘H1’...‘H3’). 

$D Data e orario attuale. 

\$ Dollaro. 

Tabella 263.3. Alcune proprietà utilizzabili nell’intestazione e nel fondo delle pagine. 

proprietà 

left 

center 

right 

odd-left 

odd-center 

odd-right 

even-left 

even-center 

even-right 

font-family 

font-size 

font-style 

font-weight 

Contenuto 

Intestazione allineata a sinistra. 

Intestazione al centro. 

Intestazione allineata a destra. 

Intestazione delle pagine dispari allineata a sinistra. 

Intestazione delle pagine dispari al centro. 

Intestazione delle pagine dispari allineata a destra. 

Intestazione delle pagine pari allineata a sinistra. 

Intestazione delle pagine pari al centro. 

Intestazione delle pagine pari allineata a destra. 

Tipo di carattere da usare (predefinito Helvetica). 

Dimensione del carattere (predefinito 8 punti). 

Forma del carattere (predefinita la forma normale). 

Spessore del carattere (predefinito lo spessore normale).

HTML2ps 2881 

263.1.2 Configurazione in cascata 

La configurazione di HTML2ps segue la logica dei fogli di stile CSS, anche per ciò che riguarda 

la sua definizione in cascata. In generale: il file ‘/etc/html2psrc’ contiene le indicazioni essenziali; 

il file ‘~/.html2psrc’ contiene la configurazione personalizzata; l’opzione ‘-f’ consente 

di aggiungere altra configurazione specifica; l’opzione ‘-S’ consente di aggiungere una stringa 

ulteriore allo stile. 

Quando si utilizza l’opzione ‘-f’, se si vuole evitare di eliminare la configurazione standard dei 

file ‘/etc/html2psrc’ e ‘~/.html2psrc’, si deve iniziare con i due punti (‘:’), come si vede 

nell’esempio seguente: 

$ html2ps -f :locale manuale.html > manuale.ps 

Si possono anche sommare assieme più configurazioni o stili CSS locali, come si vede 

nell’esempio seguente, dove si utilizzano i file ‘locale’, ‘A4’ e ‘numerato’: 

$ html2ps -f :locale:A4:numerato manuale.html > manuale.ps 

L’opzione ‘-S’ serve solo per aggiungere una regola al volo, indicandola direttamente nella riga 

di comando, come si vede nell’esempio seguente: 

$ html2ps -f :locale -S "H1 { color: blue }" manuale.html > manuale.ps 

263.2 Avvio di HTML2ps 

HTML2ps si utilizza attraverso l’eseguibile ‘html2ps’, con la sintassi seguente: 

html2ps opzioni [file_html] 

Il file da convertire può essere indicato nella riga di comando, dove in tal caso può trattarsi anche 

di un URI, oppure può essere fornito attraverso lo standard input. 

Quasi tutte le opzioni di questo programma sono richiamabili anche tramite una proprietà corrispondente 

nella sottoregola ‘option’, come è già stato descritto. Qui vengono riepilogate le 

opzioni più importanti nella tabella 263.4. In particolare, si può osservare che si può indicare il 

nome del file da generare attraverso l’opzione ‘-o’, oppure ‘--output’, altrimenti il risultato 

della conversione viene emesso attraverso lo standard output. 

Tabella 263.4. Riepilogo delle opzioni più comuni. 

Opzione 

Descrizione 

-2, --twoup Due colonne verticali. 

-D, --DSC Genera un file PostScript DSC (standard). 

-e, --encoding Stabilisce la codifica originale. 

-H, --hyphenate Abilita la separazione in sillabe. 

-L, --landscape Orientamento orizzontale. 

-n, --number Aggiunge i numeri alle pagine. 

-o, --output Specifica il file PostScript da generare. 

-R, --xref Mostra gli URI dei riferimenti ipertestuali. 

-s, --scaledoc Cambia la scala del documento. 

-W, --web Definisce come gestire più file HTML assieme. 

-f, --rcfile Specifica i file di configurazione aggiuntivi o alternativi. 

-S, --style Specifica una regola aggiuntiva al volo.

2882 HTML2ps 

Esempi 

$ html2ps -o documento.ps documento.html 

Converte il file ‘documento.html’ nel file ‘documento.ps’. 

$ html2ps -2 -o documento.ps documento.html 

Converte il file ‘documento.html’ nel file ‘documento.ps’, che risulterà organizzato in 

due colonne verticali. 

$ html2ps -R -o documento.ps documento.html 

Converte il file ‘documento.html’ nel file ‘documento.ps’, che conterrà dei riferimenti 

incrociati visibili. 

$ html2ps -2 -s 0.5 -o documento.ps documento.html 

Converte il file ‘documento.html’ nel file ‘documento.ps’, che risulterà organizzato in 

due colonne verticali, con la dimensione del carattere ridotta alla metà. 

$ html2ps -W b -o XFree86.ps XFree86-Video-Timings-HOWTO.html 

Converte i file HTML che iniziano da ‘XFree86-Video-Timings-HOWTO.html’ in un 

solo file PostScript, denominato ‘XFree86.ps’. In particolare viene richiesto di seguire 

solo i riferimenti ipertestuali rivolti alla stessa directory di partenza. 

263.3 Particolarità nell’HTML 

HTML2ps interpreta alcuni «comandi» speciali all’interno del file HTML. Si tratta di: 

• salto pagina incondizionato, che si ottiene con uno dei comandi seguenti: 

 

HTML2ps 2883 

Figura 263.1. Programma frontale per il controllo di HTML2ps. 

La figura mostra una versione imperfetta, in cui i bottoni non sono allineati con le descrizioni. 

Probabilmente questo problema sarà corretto nelle prossime versioni. 


• Jan Kärrman, Using html2ps 


Introduzione a Amaya 

Capitolo 264 

Amaya è un sistema visuale integrato di navigazione e composizione di documenti HTML e 

XHTML. È interessante notare che Amaya è già in grado di riconoscere e utilizzare i fogli di 

stile CSS. 

Trattandosi di un programma visuale, utilizza X; a questo proposito esistono due filoni nello 

sviluppo di Amaya: uno che utilizza le librerie proprietarie Motif e un altro che si avvale di 

GTK+. Lo sviluppo di Amaya su librerie GTK+ non è ancora maturo nel momento in cui si 

scrive questo capitolo e per ora si fa riferimento principalmente all’edizione «Motif». 

Amaya è disponibile anche per altri sistemi operativi. Probabilmente, questo fatto ha spinto gli 

sviluppatori del programma a costruire per lui un mondo a parte. In particolare, la tastiera viene 

gestita da Amaya in modo indipendente dal sistema sottostante. 

L’avvio di Amaya è molto semplice, attraverso l’eseguibile ‘amaya’, dal momento che gli 

argomenti sono tutti facoltativi: 

amaya [-display schermo] [file|uri] 

La figura 264.1 mostra come si presenta all’avvio, quando non si indica alcun file. 

Figura 264.1. Amaya. 

Amaya è un sistema di composizione HTML e XHTML, molto sofisticato e molto serio nel suo 

approccio a questi formati. Questo capitolo intende solo introdurre al suo utilizzo, tenendo conto 

che la documentazione originale, accessibile anche dal menù Help, è buona. 

2884

Introduzione a Amaya 2885 

264.1 Navigazione e composizione 

Amaya è sia un navigatore HTTP, sia un sistema di composizione in HTML. Questo fatto ha 

delle implicazioni nel suo utilizzo che a prima vista possono sembrare un po’ strane, benché 

siano assolutamente logiche. Per prima cosa è importante sapere che è possibile controllare la 

modalità di accesso al documento, attraverso la voce Editor Mode del menù Edit. Attivandola 

si abilita la modifica del documento; disattivandola si richiede espressamente di accedere in sola 

lettura. 

Quando Amaya accede in sola lettura, si comporta come un navigatore normale; quando è 

consentita la modifica, il documento può essere alterato e salvato successivamente. 

Quando si accede a un riferimento ipertestuale, come si fa di solito con i navigatori, il documento 

che si ottiene può occupare la stessa finestra di partenza, oppure può essere messo in un’altra. La 

scelta è abbastanza logica: se il documento di partenza non è stato alterato, si utilizza la stessa 

finestra iniziale. 

Per selezionare un riferimento ipertestuale, in condizioni normali serve un clic doppio con il 

primo tasto del mouse, perché con uno solo si posiziona semplicemente il cursore del testo. È 

possibile modificare la configurazione per fare in modo che basti un solo clic, ma in generale 

questa non è una buona idea, dal momento che diventerebbe difficile portare il cursore sopra un 

riferimento ipertestuale. 

264.1.1 Modifica del documento 

La modifica di un documento HTML può avvenire in modo visuale, diretto, attraverso la finestra 

che si usa anche per la sua lettura. La vera «forza» di Amaya sta nella possibilità di accedere 

al documento in una forma diversa, attraverso la sua struttura, in modo da avere una visione più 

chiara di ciò che si sta facendo. 

Dal menù Views si possono selezionare le voci Show structure e Show alternate. La prima 

apre una finestra separata contenente la struttura, come si vede nell’esempio di figura 264.2, 

la seconda mostra il documento in un modo alternativo, precisamente in forma testuale senza 

grafica. La modifica in una di queste finestre si ripercuote simultaneamente su tutte le altre.

2886 Introduzione a Amaya 

Figura 264.2. La visione della struttura. 

Dallo stesso menù è possibile selezionare la voce Show source per accedere a una finestra contenente 

il sorgente del documento. Anche se è possibile modificare il testo direttamente nel sorgente, 

le modifiche non si applicano istantaneamente alle altre finestre, a meno di utilizzare la 

voce Synchronize dal menù File. Tuttavia, lo svantaggio nell’accedere direttamente al sorgente 

sta nel fatto che Amaya ha difficoltà a correggere gli errori nell’uso dell’HTML da parte di un 

autore inesperto, mentre nelle altre finestre questo non può avvenire, perché la struttura è sotto il 

pieno controllo del programma. 

È interessante notare che alla base di ogni finestra utile per accedere alla modifica del documento 

appare l’indicazione sintetica della struttura del punto in cui si trova il cursore. Per esempio, la 

sequenza 

Text \ P \ BODY \ HTML 

indica che si tratta di testo contenuto in un elemento ‘P’, che è contenuto nell’elemento ‘BODY’, 

che a sua volta è parte dell’elemento ‘HTML’: 

 

 

... 

 

 

Oltre alle specificità di Amaya, il suo funzionamento è abbastanza intuitivo. Si comprende che 

per poter essere utilizzato in modo conveniente, è più importante conoscere bene le potenzialità 

dell’HTML e dei fogli di stile CSS, prima di cercare di approfondire l’uso di questo programma.

Introduzione a Amaya 2887 

264.2 Configurazione 

La maggior parte della configurazione di Amaya è accessibile attraverso una delle voci del 

sottomenù Preferences del menù Special. 

Nella directory personale dell’utente che utilizza il programma, Amaya crea la sottodirectory 

‘.amaya/’, in cui inserisce il file di configurazione generale ‘thot.rc’, la sottodirectory per la 

sua memoria cache, ‘libwww-cache/’ e i propri file temporanei. A parte la collocazione del file 

‘thot.rc’, il resto può essere spostato altrove attraverso la configurazione. 

264.3 Aggregazione di un documento composto 

Amaya è in grado di aggregare un documento composto da più «pagine» HTML in un solo file, 

attraverso la voce Make book del menù Special. 

Per ottenere questo risultato si parte da un file HTML composto da un titolo contenuto in un 

elemento ‘H1’, seguito da testo e da una serie di riferimenti. Questi riferimenti (l’elemento ‘A’ 

con l’attributo ‘HREF’) sono organizzati solitamente in un elenco puntato o numerato, ma a parte 

questo, tali riferimenti devono contenere anche l’attributo ‘REL’, a cui viene assegnato il valore 

‘chapter’ o ‘subdocument’. L’esempio seguente rappresenta bene questa struttura di partenza: 

 

 

 

Using Amaya 

BODY { background-color : #FFFFFF } 

 

 

 

Using Amaya 

 

Each following section gives a short description of how to use a 

specific Amaya functionality. 

 

Browsing with 

Amaya 

Selecting 

Searching and replacing 

text 

Displaying Views 

Creating new 

elements 

 

 

 

There is also a brief introduction which 

explains some of the different types that can be used in Amaya such as 

headings, lists, and quotations, and how to use them. 

 

Information types 

in HTML 

HTML Document 

Structure 

Headers 

 

 

 

 

 

2888 Introduzione a Amaya 

In particolare, l’elemento 

HTML Document Structure 

implica l’inclusione del corpo del file ‘HTML-elements/structure.html’ in quel punto, al 

posto del suo riferimento. 

Per la precisione, si possono distinguere questi casi: quando il riferimento è fatto a un documento 

completo, come appena visto, si ottiene l’inclusione del contenuto del suo elemento ‘BODY’; 

se invece il riferimento è fatto a un’etichetta di un certo elemento, viene incorporato solo il 

contenuto di quell’elemento. 

Nella realizzazione di un documento articolato in più file differenti, converrebbe avere l’accortezza 

di delimitare la parte sostanziale del testo di ogni file HTML in un elemento ‘DIV’ provvisto 

di etichetta a cui poter fare riferimento attraverso l’indice di partenza (l’attributo ‘ID’). In questo 

modo si potrebbero escludere dall’aggregazione una serie di informazioni che servono solo per 

la navigazione (pulsanti per avanzare, indietreggiare o raggiungere l’indice). 

Un indice di partenza può anche fare riferimento a file che contengono a loro volta dei sottoindici, 

realizzando quindi una struttura ad albero abbastanza articolata. Amaya continua ad aggregare i 

file finché trova elementi ‘A’ contenenti l’attributo ‘REL’ a cui sono assegnate le parole chiave già 

indicate. 


• Irène Vatton, Amaya documentation 

 

• Irène Vatton, Vincent Quint, José Kahan, Using Amaya 

 


HTMLDOC 

Capitolo 265 

HTMLDOC 1 è un sistema di composizione basato su HTML. In pratica, si parte da uno o più 

file HTML e si ottiene una composizione in PostScript, PDF e HTML. I file HTML di partenza 

devono avere una struttura ragionevolmente semplice, dove il testo sia strutturato in capitoli, inizianti 

con un’intestazione ‘H1’, suddivisi nel modo consueto, attraverso le intestazione di livello 

inferiore (‘H2’, ‘H3’,... ‘H7’). In questo modo, HTMLDOC è in grado di generare automaticamente 

un indice generale e diventa utile tutto il sistema anche quando l’obiettivo è la generazione di 

una composizione finale nello stesso formato HTML. 

HTMLDOC è disponibile sia su piattaforme Unix, sia su sistemi MS-Windows. In particolare, 

può funzionare in modo interattivo, attraverso l’interfaccia grafica, oppure in modo non 

interattivo utilizzando semplicemente opzioni della riga di comando. 

265.1 Sorgente HTML 

Il sorgente di un documento HTMLDOC può essere contenuto in un file singolo, oppure in più file 

HTML distinti. La prima cosa che dovrebbe apparire nel corpo del file HTML è un’intestazione 

di tipo ‘H1’. 

In questi file HTML non sono ammissibili le inserzioni di oggetti, a parte le immagini nel modo 

consueto, attraverso l’elemento ‘IMG’; non si possono usare le cornici (frame); vengono ignorati 

gli script e le applet. È possibile selezionare soltanto i tipi di carattere standard, corrispondenti 

a: Helvetica, Times e Courier. Dal momento che HTMLDOC è disponibile anche su piattaforma 

MS-Windows, il carattere Arial viene convertito automaticamente in Helvetica. Non sono gestiti 

i fogli di stile e le tabelle sono riconosciute solo al livello di HTML 3.2. 

Come estensione dello standard HTML viene riconosciuto il marcatore ‘’, allo 

scopo di ottenere un salto pagina. 

La documentazione di HTMLDOC è scritta in questo modo, per cui può essere osservata la 

tecnica utilizzata e il risultato che si ottiene. In generale, dopo l’elemento ‘HEAD’, all’interno dell’elemento 

‘BODY’ si comincia subito con un’intestazione ‘H1’. L’esempio seguente è un estratto 

del file ‘intro.html’, che è il primo del gruppo di file che compongono la documentazione di 

HTMLDOC: 

 

 

 

 

 

 

HTMLDOC 1.7 User’s Guide 

 

 

 

 

Introduction 

 

About This Software 

This document describes how to use the HTMLDOC software, version 

1.7. HTMLDOC is a HTML document processing program that generates 

indexed HTML, Adobe® PostScriptTM, and Adobe Portable Document 

1 HTMLDOC GNU GPL 

2889

2890 HTMLDOC 

Format (PDF 1.2) files suitable for printing or online viewing. 

No restrictions are placed upon the output produced by HTMLDOC. 

History 

Like many programs HTMLDOC was developed in response to a need 

my company had for generating high-quality documentation in printed and 

... 

... 

Why Just HTML? 

Some people have asked why this program only deals with HTML input files 

and is not able to read any Standard Generalized Markup Language (SGML) 

file. The reasons are numerous but basically boil down to: 

... 

... 

 

 

Eventualmente è possibile convertire un file HTML singolo che non sia conforme a questa struttura, 

utilizzando un’opzione apposita, ‘--webpage’, con la quale non si ottiene più l’indice generale, 

ma soprattutto non è possibile aggregare più file HTML assieme in un documento finale 

unico. 

HTMLDOC è progettato per gestire documenti di dimensioni molto grandi; tuttavia esistono 

dei limiti, fissati nel file ‘config.h’, che appartiene ai sorgenti del programma. Eventualmente 

si possono estendere tali limiti modificando questo file e ricompilando successivamente i 

sorgenti. 

265.2 Funzionamento 

HTMLDOC si compone dell’eseguibile ‘htmldoc’, che può essere avviato senza argomenti, per 

ottenere un funzionamento interattivo: 

htmldoc [opzioni file_html ... ] 

È prevista la presenza di un file di configurazione personale, dei singoli utenti. Si tratta del file 

‘~/.htmldocrc’. Questo file viene creato la prima volta dall’eseguibile ‘htmldoc’ e potrebbe 

essere utile modificare la direttiva di dichiarazione del programma usato per modificare i file 

HTML sorgenti: 

#HTMLDOCRC 1.7 

EDITOR=amaya %s 

In questo caso, si fa in modo di utilizzare Amaya per la modifica del sorgente HTML, quando 

questo tipo di programma viene richiamato da HTMLDOC. 

Purtroppo non è disponibile una documentazione sufficiente sulle direttive di questo file di 

configurazione. 

Nel seguito viene mostrato il funzionamento interattivo di HTMLDOC, abbinando anche la descrizione 

delle opzioni che possono servire per ottenere lo stesso risultato senza interazione con il 

programma. Intanto, nella figura 265.1 si può osservare come appare inizialmente, dopo l’avvio 

con il comando seguente: 

$ htmldoc[ Invio ]

HTMLDOC 2891 

Figura 265.1. Aspetto iniziale di HTMLDOC, quando viene avviato senza argomenti. 

Nella parte bassa del pannellino grafico, appaiono alcuni pulsanti grafici, che fanno riferimento 

alla possibilità di creare e salvare un file contenente tutte le informazioni sulla composizione che 

si vuole generare. Questo file può essere inteso come la configurazione del libro che si vuole 

comporre. 

• Il pulsante NE W 

serve a eliminare il lavoro in corso, per ricominciare con un altro nuovo. 

• Il pulsante OP E N permettere di accedere al file system per selezionare un file contenente le 

informazioni su una composizione già predisposta in precedenza. 

• I pulsanti SA V E e SA V E AS consentono di salvare l’impostazione attuale, eventualmente 

dando un nome nuovo alla cosa. 

• Il pulsante GE N E R A T E avvia la composizione in base alle informazioni indicate, generando 

uno o più file PostScript, PDF o HTML, a seconda di quanto specificato a questo proposito. 

• Il pulsante CL O S E 

termina il funzionamento di HTMLDOC. 

La parte centrale del pannello grafico di HTMLDOC cambia in funzione del lembo superiore 

selezionato. 

265.2.1 Definizione dei file sorgenti 

La prima fase per arrivare alla composizione è quella della selezione dei file HTML che compongono 

i sorgenti. Ciò si fa dalla finestra che si ottiene selezionando l’etichetta Input, che 

corrisponde alla situazione in cui si presenta HTMLDOC all’avvio. 

In alto, si può osservare la presenza di due pulsanti di selezione, dove si può specificare il tipo 

di sorgente che si utilizza. La voce BO O K indica l’intenzione di utilizzare uno o più file HTML 

per generare un documento unico, in forma di libro, mentre la voce WE B PA G E , corrispondente 

all’opzione ‘--webpage’, specifica che si tratta di un solo file HTML che non ha la struttura 

richiesta per realizzare un libro.

2892 HTMLDOC 

Il pulsante grafico laterale AD D FI L E consente di accedere al file system per selezionare i file 

HTML che compongono i sorgenti del documento che si vuole comporre. Nella figura 265.2 

appaiono selezionati i file ‘uno.html’, ‘due.html’ e ‘tre.html’. 

Figura 265.2. Sono stati selezionati tre file. 

Sul lato destro si possono osservare anche altri pulsanti grafici, che si abilitano solo quando si 

seleziona uno o più nomi nell’elenco di quelli che compongono l’insieme dei sorgenti del documento: 

ED I T FI L E permette di avviare automaticamente il programma per la modifica dei file 

HTML; DE L E T E FI L E elimina i nomi evidenziati dall’elenco, ma senza cancellarli dal file system; 

MO V E UP e MO V E DO W N consentono di spostare il nome selezionato in alto o in basso, 

cambiando l’ordine. 

Per completare l’estetica della composizione, è possibile specificare un’immagine da usare come 

logo e un’altra immagine da utilizzare nella copertina (ammesso che sia stata ablitata la sua generazione). 

Nel primo caso si può usare l’opzione ‘--logo file_immagine ’; nel secondo l’opzione 

‘--title file_immagine ’. 

265.2.2 Composizione 

L’etichetta Output consente di accedere alla definizione del file o dei file che si vogliono ottenere 

dalla composizione. Il risultato della composizione può essere un file oppure una directory, 

selezionando FI L E oppure DI R E C T O R Y , rispettivamente. Queste due voci corrispondono alle 

opzioni ‘--outfile file’ e ‘--outdir directory’. Il file o la directory in questione si indicano 

sotto, mentre più giù si specifica esattamente il tipo di composizione che si vuole generare: 

HTML , PS , PS2 e PDF (opzione ‘--format {ps1|ps2|pdf|html}’).

HTMLDOC 2893 

Figura 265.3. Definizione del risultato della composizione che si vuole ottenere. 

Il senso delle opzioni che appaiono nel resto della maschera è abbastanza intuitivo. Si può osservare 

il fatto che sia possibile cambiare il colore dello sfondo e anche utilizzare un’immagine per 

questo. 

Se si indica una directory, si intende generare un gruppo di file nella directory stessa. Ciò può 

essere utile nella composizione in HTML, ma funziona nello stesso modo anche per le altre forme 

di composizione. 

265.2.3 Formato e aspetto delle pagine 

L’etichetta Page consente di accedere alla definizione delle pagine, nel caso in cui la composizione 

richiesta serva a generare un formato PostScript o PDF. È possibile indicare il formato 

della pagina (corrispondente all’opzione ‘--size formato ’), se la stampa avviene su 

entrambi i lati del foglio (la voce DO U B L E-S I D E D , ovvero l’opzione ‘--duplex’), i margini 

(le opzioni ‘--left n{in|cm|mm}’, ‘--right n{in|cm|mm}’, ‘--top n{in|cm|mm}’, 

‘--bottom n{in|cm|mm}’), l’intestazione e il piè pagina (opzioni ‘--header xyz’ e 

‘--footer xyz’).

2894 HTMLDOC 

Figura 265.4. Definizione della pagina nel caso di composizione per la stampa. 

La selezione di intestazione e piè di pagina consente di definire ciò che deve apparire a sinistra, 

al centro e a destra di queste. 

265.2.4 Indice generale 

L’etichetta TOC consente di accedere alla definizione dell’indice generale, che in particolare 

prevede l’indicazione del livello di dettaglio che deve avere e consente la specificazione di 

intestazione e piè pagina differenti dal resto del documento. 

Figura 265.5. Definizione dell’indice generale e della numerazione delle sezioni.

HTMLDOC 2895 

Il livello di dettaglio dell’indice si definisce anche con l’opzione ‘--toclevels n’, l’intestazione 

e il piè di pagina si possono definire con le opzioni ‘--tocheader xyz’ e 

‘--tocfooter xyz’. Infine, nella maschera si può vedere la voce NU M B E R E D HE A D I N G S , corrispondente 

all’opzione ‘--numbered’, con cui si ottiene la numerazione delle sezioni (gli 

elementi ‘Hn’). 

265.2.5 Carattere da stampa 

Sempre nel caso di composizione per la stampa, l’etichetta Fonts consente di definire il tipo e 

la dimensione dei caratteri da usare per il corpo, le sezioni, l’intestazione e il piè pagina. Per 

la necessità di essere compatibili al massimo, sono disponibili solo i tipi Times, Helvetica e 

Courier. Si osservi che l’altezza delle righe viene espressa in rapporto rispetto all’altezza dei 

caratteri, dove per esempio ‘1.2’ rappresenta il 120 %. 

Figura 265.6. Definizione del carattere da stampa. 

Le opzioni corrispondenti sono: ‘--bodyfont carattere’, ‘--fontsize n’ e 

‘--fontspacing n’ per definire il carattere, la dimensione in punti e l’altezza delle righe nel 

testo normale; ‘--headfootfont carattere’ e ‘--headfootsize n’, per indicare il tipo di carattere 

e la dimensione in punti dell’intestazione e del piè di pagina; ‘--headingfont carattere’ 

per definire il tipo di carattere dei titoli delle sezioni. 

265.2.6 Altre opzioni 

L’ultima etichetta, Options, riguarda le opzioni rimanenti che non hanno trovato una collocazione 

migliore. In questo contesto viene definito in particolare il programma da utilizzare per la 

modifica dei file HTML del sorgente. Si può usare un programma per la modifica dei file di testo, 

oppure un applicativo più elaborato, specifico per i file HTML.

2896 HTMLDOC 

Figura 265.7. Definizione delle opzioni rimanenti. 

265.3 Programmazione della composizione 

HTMLDOC, quando funziona in modo interattivo, consente di conservare in un file l’impostazione, 

ovvero la configurazione di un documento, memorizzando tutte le opzioni selezionate. 

Quanto mostrato nelle figure di esempio, si tradurrebbe nel contenuto seguente: 

#HTMLDOC 1.7 

3 

uno.html 

due.html 

tre.html 

-t ps1 -f prova.ps --toclevels 3 --size a4 --left 3cm --right 3cm ←↪ 

↩→--top 3cm --bottom 3cm --header t.1 --footer h.. --tocheader .I. ←↪ 

↩→--tocfooter h.i --no-compression --fontsize 11.0 --fontspacing 1.2 ←↪ 

↩→--headingfont Courier --bodyfont Times --headfootsize 12.0 ←↪ 

↩→--headfootfont Helvetica 

Da htmldoc(1) si intuisce che l’autore suggerisca di usare l’estensione ‘.book’ per questi file; 

tuttavia HTMLDOC non propone alcunché. 

L’osservazione di questi file consente anche di capire meglio l’uso delle opzioni della riga di 

comando. In questo caso, volendo usare l’eseguibile ‘htmldoc’ in modo non interattivo per fare 

la stessa cosa, il comando avrebbe potuto essere quello seguente: 

$ htmldoc -t ps1 -f prova.ps --toclevels 3 --size a4 ←↪ 

↩→--left 3cm --right 3cm --top 3cm --bottom 3cm --header t.1 ←↪ 

↩→--footer h.. --tocheader .I. --tocfooter h.i ←↪ 

↩→--no-compression --fontsize 11.0 --fontspacing 1.2 ←↪ 

↩→--headingfont Courier --bodyfont Times --headfootsize 12.0 ←↪ 

↩→--headfootfont Helvetica uno.html due.html tre.html 

Eccezionalmente, l’eseguibile ‘htmldoc’ può ricevere come argomento il nome di uno di questi 

file ‘.book’, ottenendo un funzionamento interattivo, partendo dalla configurazione contenuta 

nel file stesso. Supponendo di avere salvato quella configurazione nel file ‘prova.book’, 

basterebbe riavviare nel modo seguente:

HTMLDOC 2897 

$ htmldoc prova.book 

Tabella 265.1. Riepilogo delle opzioni più comuni. 

Opzione 

Descrizione 

--webpage 

Il sorgente non è realizzato secondo la struttura di un libro. 

--format{ps1|ps2|pdf|html} 

Formato finale della composizione. 

-t{ps1|ps2|pdf|html} 

Come ‘--format’. 

--outfile file 

File da generare dalla composizione. 

-f file Come ‘--outfile’. 

--outdir directory 

Directory in cui inserire i file della composizione. 

-d directory Come ‘--outdir’. 

--top n{in|cm|mm} 

Margine superiore secondo l’unità di misura specificata. 

--bottom n{in|cm|mm} 

Margine inferiore secondo l’unità di misura specificata. 

--left n{in|cm|mm} 

Margine sinistro secondo l’unità di misura specificata. 

--right n{in|cm|mm} 

Margine destro secondo l’unità di misura specificata. 

--size letter|a4|universal 

Formato della carta in base a un nome. 

--size larghezzaxaltezza{in|cm|mm} Formato della carta espresso esattamente. 

--duplex 

Stampa su entrambi i lati del foglio. 

--header xyz 

Intestazione. 

--footer xyz 

Piè di pagina. 

--tocheader xyz 

Intestazione dell’indice generale. 

--tocfooter xyz 

Piè di pagina dell’indice generale. 

--headfootfont carattere 

Carattere da usare nell’intestazione e piè pagina. 

--headfootsize n 

Dimensione carattere di intestazione e piè pagina. 

--headingfont carattere 

Carattere dei titoli delle sezioni. 

--bodyfont carattere 

Carattere da usare nel corpo. 

--fontsize n 

Dimensione del carattere normale in punti. 

--fontspacing n 

Altezza riga rispetto alla dimensione del carattere. 

--logo file 

Definisce il file da usare come logo. 

--bodyimage file 

Definisce il file da usare come sfondo. 

--title file 

Immagine da usare nella copertina. 

--no-toc 

Non genera l’indice generale. 

--no-title 

Non genera la copertina. 

--toclevels n 

Definisce il numero di livelli dell’indice generale. 

La tabella 265.1 riassume le funzionalità delle opzioni principali di HTMLDOC quando viene 

usato in modo non interattivo. È importante tenere in considerazione alcune cose, che vengono 

descritte brevemente nel seguito. 

È possibile gestire solo immagini in formato GIF, JPG e PNG; in particolare, quando si ottiene 

una conversione in HTML, si usano le stesse immagini di partenza. 

La dimensione della carta può essere indicata per nome, oppure direttamente, fornendo larghezza 

e altezza, nella forma mxn, dove m rappresenta la larghezza e n l’altezza. Si osservi che questi 

due numeri vanno completati con l’indicazione finale dell’unità di misura (come si vede nella 

tabella), una volta sola per entrambi i valori. Il formato speciale denominato ‘universal’ si 

riferisce a un compromesso tra il formato A4 e il formato lettera (8,5 in × 11 in), in modo che 

possa essere stampato con entrambi i tipi di carta; in pratica si utilizza la larghezza del formato 

A4 e l’altezza del formato lettera. 

Le opzioni che definiscono il contenuto delle intestazioni e dei piè di pagina, utilizzano una 

simbologia speciale, in cui tre lettere indicano rispettivamente la parte sinistra, quella centrale e 

quella destra della riga. La tabella 265.2 riepiloga questi simboli.

2898 HTMLDOC 

Tabella 265.2. Simboli usati negli argomenti delle opzioni che definiscono il contenuto 

delle intestazioni e dei piè di pagina. 

Simbolo Descrizione 

. Vuoto. 

t Titolo del documento 

h Sezione attuale. 

c Capitolo attuale. 

l Logo. 

i Pagina in numero romano minuscolo. 

I Pagina in numero romano maiuscolo. 

1 Pagina in numero arabo normale. 

a Pagina in lettere minuscole. 

A Pagina in lettere maiuscole. 


Essere presenti su Internet 

Capitolo 266 

Una volta realizzato il proprio documento in HTML, quando questo deve essere pubblicato da 

qualche parte su Internet, si pongono due problemi essenziali: 

1. dove trovare il posto; 

2. come rendere di dominio pubblico la sua presenza. 

Spesso, il primo problema lo si può risolvere utilizzando un sito offerto gratuitamente; in alternativa 

si possono prendere accordi per affittare uno spazio da qualche parte, magari ottenendo 

anche un dominio virtuale conveniente. Per quanto riguarda il secondo, è necessario iscrivere il 

proprio documento presso i vari servizi che si occupano di creare gli indici pubblici. Dei due 

problemi, il secondo è il più delicato. 

266.1 Motori di ricerca e robot 

Più passa il tempo e più sono i documenti che vengono pubblicati su Internet. I motori di ricerca, 

ovvero i servizi che gestiscono gli indici delle pubblicazioni, sono sempre più sommersi di lavoro. 

In questa situazione, ognuno applica una propria politica di filtro dei documenti che vengono 

sottoposti per l’inclusione nel loro indice. In generale, non basta realizzare un documento HTML 

corretto, occorre pensare anche ai motori di ricerca. 

Il documento HTML, per poter essere preso in considerazione in modo corretto dai motori di 

ricerca, deve avere una serie di elementi ‘META’ nell’intestazione, contenenti alcune informazioni 

salienti. Ciò permette la classificazione del documento e la creazione di indici chiari per l’utente 

di quel servizio. Tuttavia, il problema è che non tutti i motori di ricerca utilizzano le stesse 

informazioni nello stesso modo; così, ci si affida generalmente all’esperienza degli altri per la 

compilazione di tali elementi. Qui si raccolgono solo alcune indicazioni, ritenute corrette, ma 

che potrebbero anche essere smentite nel futuro. 

266.1.1 Elementi META 

Gli elementi ‘META’ sono vuoti, nel senso che non delimitano alcun testo, e si collocano nell’intestazione 

del file HTML, ovvero nell’elemento ‘HEAD’. Nella maggior parte dei casi, l’elemento 

‘META’ si utilizza con l’attributo ‘NAME’ e l’attributo ‘CONTENT’, attraverso i quali si stabilisce un 

nome a cui viene assegnato un contenuto. 

Il DTD dell’HTML non stabilisce quali siano i nomi che si possono usare per l’attributo ‘NAME’ 

e da questo nascono tutti i problemi. In particolare, c’è da considerare che alle volte i nomi e i 

valori abbinati non fanno differenza tra maiuscole e minuscole, altre volte pare che la facciano. 

L’esempio seguente mostra un esempio tipico di utilizzo per un documento realizzato in italiano: 

 

 

 

 

 

 

 

 

 

2899

2900 Essere presenti su Internet 

 

Il significato di queste informazioni dovrebbe essere intuitivo, salvo qualche caso, ma in particolare 

è necessario osservare un problema: alcune cose sono espresse attraverso sigle o parole 

chiave che hanno significato per la lingua inglese, mentre potrebbero essere attese parole o definizioni 

diverse nel caso di un documento in italiano. Nell’esempio si può osservare che l’elemento 

‘HTML’ possiede l’attributo ‘LANG’ a cui è assegnato il valore ‘it’, allo scopo di indicare che 

tutto il documento è scritto in lingua italiana. Pertanto, per modificare questo assunto negli elementi 

‘META’ in cui il linguaggio può avere importanza, è stato aggiunto nuovamente l’attributo 

‘LANG’ con il valore ‘en’. Può darsi che questa precauzione non serva a nulla, ma potrebbe essere 

importante in futuro. 

Eventualmente, si potrebbe anche arrivare a duplicare alcune informazioni per diversi linguaggi. 

Per esempio, l’informazione denominata ‘description’ viene fornita due volte: prima in 

italiano e poi in inglese. 

L’elenco seguente descrive brevemente le informazioni più importanti che si possono dare in 

questo modo. 

• description|Description 

Si tratta di una descrizione breve del contenuto che potrebbe essere mostrato negli indici. 

A titolo indicativo, non dovrebbe superare le 25 parole, per essere certi che sia presa in 

considerazione integralmente. 

• keywords|Keywords 

Si tratta di un elenco di parole, o frasi brevi, separate da una virgola. Queste parole rappresentano 

gli argomenti principali del documento. Indicandole in questo modo, si cerca 

di farle risaltare (anche se nel documento vengono usate poco o non vengono usate affatto), 

in modo che vengano prese in considerazione in modo particolare. A titolo indicativo, 

l’elenco non dovrebbe superare le 25 parole, per essere certi che questo venga preso in considerazione. 

Si intuisce che le prime parole di questo elenco siano considerate come quelle 

più importanti. 

• distribution|Distribution 

Probabilmente si riferisce all’estensione che ha o può avere la diffusione del documento. 

Le parole che possono essere assegnate sono ‘Global’ e ‘Local’, con i significati che si 

possono intuire. 

• rating|Rating 

Probabilmente si riferisce al tipo di pubblico a cui si rivolge il documento. In generale viene 

assegnata solo la parola chiave ‘General’; qualcuno suggerisce anche l’uso di, ‘Mature’ 

e ‘Restricted’, ma il significato in pratica non è chiaro. 

• classification|Classification

Essere presenti su Internet 2901 

Si tratta della classificazione del contenuto del documento. È difficile fare un elenco 

dei termini che si possono usare, perché dipendono dal motore di ricerca. Probabilmente 

si può trattare di: ‘business’, ‘computers’, ‘entertainment’, ‘internet’, 

‘miscellaneous’, ‘personal’. 

• resource-type 

Si tratta della definizione che si dà al documento HTML. Da quanto si vede, si usa sempre 

solo la parola chiave ‘document’ (solo in minuscolo). 

• revisit-after 

Apparentemente, questa indicazione serve a richiedere al motore di ricerca di ripassare 

dopo un certo numero di giorni. Non è garantito il successo di questa richiesta, ma nulla 

vieta di provarci. 

• ROBOTS 

Questa informazione serve a chiedere esplicitamente o a vietare la scansione e l’indicizzazione. 

In generale si assegna la parola chiave ‘ALL’ perché venga preso in considerazione 

il documento a tutti gli effetti, assieme ai riferimenti a cui punta, mentre si usa la parola 

chiave ‘INDEX’ per richiedere la sola indicizzazione e ‘FOLLOW’ per seguire i riferimenti. 

Per evitare l’indicizzazione si usa ‘NOINDEX’, mentre per evitare di seguire i riferimenti si 

usa ‘NOFOLLOW’. Qualcuno suggerisce di utilizzare la stringa ‘ALL,INDEX,FOLLOW’ per 

ottenere il risultato migliore. 

• SPIDERS 

Apparentemente funziona nello stesso modo di ‘ROBOTS’ e probabilmente accetta gli stessi 

valori. 

266.1.2 Filtro iniziale alla scansione dei robot 

Nel momento in cui si è posto il problema dell’esistenza di tutta una serie di servizi di scansione 

della documentazione su Internet, si è pensato all’opportunità di bloccare, in certe circostanze, il 

lavoro di questi «robot». Gli amministratori dei servizi HTTP hanno la possibilità di realizzare il 

file ‘/robots.txt’, contenente l’indicazione dei percorsi che non devono essere scanditi. 

Anche se si tratta di un compito che riguarda gli amministratori, è opportuno sapere leggere le 

istruzioni di questo file, nel caso esista, per sapere se il proprio documento può essere raggiunto 

o meno dai motori di ricerca e da altri servizi simili. 

Il file in questione, collocato all’inizio della gerarchia del servizio HTTP a cui si riferisce, è un 

file di testo normale, in cui si indicano dei commenti, preceduti dal simbolo ‘#’, e una serie di 

campi nella forma: 

campo: valore 

Le informazioni di questo file sono suddivise in base al nome del programma robot che si vuole 

filtrare: 

User-agent: nome 

Uno o più campi del genere, posti di seguito, iniziano la definizione del filtro riferito ai programmi 

rispettivi. Se al posto del nome si indica un asterisco, si intendono simultaneamente tutti i 

programmi che non siano stati presi in considerazione diversamente. 

Disallow: [percorso]

2902 Essere presenti su Internet 

Il campo ‘Disallow’ serve a specificare un percorso da escludere dalla scansione dei robot presi 

in considerazione. 1 

# http://www.brot.dg/robots.txt 

User-agent: * 

Disallow /tmp/ 

Disallow /cgi-bin/ 

Disallow /prova.html 

Supponendo che l’esempio si riferisca al file ‘http://www.brot.dg/robots.txt’, si mostra 

il caso in cui si vogliono escludere tutti i robot dal contenuto di ‘http://www.brot.dg/tmp/’, 

‘http://www.brot.dg/cgi-bin/’ e dal file ‘http://www.brot.dg/prova.html’. 


User-agent: * 

Disallow 

In questo caso non si esclude alcunché. 


User-agent: * 

Disallow / 

Questo nuovo esempio esclude l’accesso a tutto il servizio. 


• IMC Search Engine Submit Form 

 

• Search Engine Registration - Submit Your Site to the Top Search Engines - Free! 

 

• TheFreeSite.com 

 

Appunti di informatica libera 2003.01.01 --- Copyright © 2000-2003 Daniele Giacomini -- daniele @ swlibero.org 

1 Non è possibile indicare caratteri jolly: non avrebbero significato, dal momento che si intendono tutti i percorsi che 

iniziano come indicato e proseguono poi in qualunque modo.

Parte xlix 

XML 

267 XML: cenni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2904 

267.1 Differenze significative tra SGML e XML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2904 

267.2 Convenzioni dell’XML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2907 

267.3 Correttezza formale e validità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2908 

267.4 Verifica della validità con SP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2908 

267.5 Riferimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2909 

268 XHTML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2910 

268.1 Caratteristiche generali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2910 

268.2 Scheletro di un file XHTML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2910 

268.3 Verifica della validità di un file XHTML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2911 

268.4 Riferimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2911 

2903

XML: cenni 

Capitolo 267 

XML è un linguaggio derivato dall’SGML, da intendersi come un sottoinsieme compatibile con 

questo; in particolare, il nome rappresenta l’acronimo di Extensible markup language. Il motivo 

per il quale è stata introdotta questa variante dell’SGML è dovuto all’esigenza di trovare un 

compromesso tra l’SGML originale e l’HTML, che è solo un’applicazione di SGML troppo limitata 

per la documentazione multimediale. In pratica, l’intento è stato ed è quello di semplificare 

leggermente l’SGML rendendo disponibili molte qualità dell’SGML che un’applicazione rigida 

come l’HTML non è in grado di offrire. 

In generale, un documento XML è un’applicazione di XML; nello stesso modo, l’HTML (come 

linguaggio) è un’applicazione SGML. 

È importante non illudersi: XML resta un sistema abbastanza complesso, anche se non quanto 

l’SGML tradizionale. Infatti, un documento realizzato in XML richiede la definizione di un 

DTD, esattamente come avveniva prima. 

267.1 Differenze significative tra SGML e XML 

L’SGML è già stato introdotto nel capitolo 249; in questo vengono affrontate solo le 

caratteristiche salienti di XML che lo distinguono sostanzialmente dal suo predecessore. 

267.1.1 Codifica 

La novità più importante di XML è l’utilizzo predefinito della codifica universale, prevalentemente 

attraverso la forma UTF-8 e UTF-16. Questo fatto ha delle implicazioni importanti, in 

quanto i riferimenti a macro del tipo ‘&n;’ e ‘&xn;’ si fanno ai punti di codifica dello standard 

ISO 10646 (nel primo caso il numero è espresso in decimale, mentre nel secondo si tratta di un 

numero esadecimale. 

XML non esclude a priori l’utilizzo di altri tipi di codifica; tuttavia, se non è possibile usare le 

codifiche UTF-n, per evitare ambiguità potrebbe essere conveniente limitarsi all’uso dell’ASCII 

tradizionale, dal momento che è perfettamente compatibile con la forma UTF-8. Eventualmente è 

possibile anche specificare il tipo di codifica attraverso un’istruzione apposita, che verrà mostrata 

in seguito. 

267.1.2 Commenti 

I commenti si indicano in linea di massima come in SGML, attraverso la forma: 

 

Come nell’SGML si deve evitare l’uso di due trattini in sequenza, ‘--’, ma in XML non è 

ammissibile il commento nullo nella forma ‘’. 

2904

XML: cenni 2905 

267.1.3 Marcatori ed elementi vuoti 

In XML, gli elementi devono essere aperti e chiusi correttamente attraverso i marcatori relativi; 

in pratica non è possibile più lasciare all’analizzatore XML il compito di determinare da solo la 

cosa in base al contesto. Questa limitazione è importante per facilitare il compito dei programmi 

che devono interpretare un documento XML e comunque si riflette positivamente nella struttura 

del sorgente del documento stesso. 

Gli elementi vuoti vanno indicati regolarmente con il marcatore di chiusura, oppure con un solo 

marcatore speciale, che ha la forma seguente: 

 

In pratica, alla fine del marcatore appare una barra obliqua prima del simbolo ‘>’. 

Di fatto, per problemi di compatibilità, si lascia uno spazio prima della barra finale. Per 

esempio: ‘’. 

L’assenza della possibilità di definire dei marcatori di apertura o di chiusura opzionali, fa sì che 

si semplifichi la dichiarazione di questi nel DTD: 

 

Nella figura 267.1 si vede un confronto tra la dichiarazione SGML e quella XML. Si vede 

chiaramente che in XML mancano le regole di minimizzazione. 

Tabella 265.2. Scomposizione delle varie parti della dichiarazione di un elemento 

SGML e XML. 

SGML: 

 

| | | ^^^ | | 

| | | | | delimitatore conclusivo 

| | nome | | dell’istruzione 

| | dell’elemento | | 

| | | modello del contenuto 

| dichiarazione | 

| di un elemento regole di minimizzazione 

| 

delimitatore di apertura dell’istruzione SGML 

XML: 

 

In XML, i nomi che si attribuiscono agli elementi e agli attributi sono sensibili alla differenza tra 

lettere maiuscole e minuscole; per esempio, l’elemento ‘testo’ è diverso dall’elemento ‘Testo’ 

e da tutte le altre varianti possibili. Per la precisione, i nomi devono sottostare alle regole seguenti: 

• devono iniziare con una lettera alfabetica, oppure con un trattino basso (‘_’, ovvero #x5F), 

e possono contenere anche cifre numeriche, il punto, il trattino basso e il trattino normale 

(#x2D); 

• non possono contenere spazi; 

• potrebbero eventualmente contenere i due punti (‘:’), ma questa possibilità viene riservata 

per situazioni particolari; 

• non possono iniziare con la sigla ‘xml’, o con qualunque altra variazione delle lettere minuscole 

e maiuscole, dal momento che questi potrebbero avere in seguito dei significati 

speciali.

2906 XML: cenni 

267.1.4 Entità predefinite 

Alcune entità standard essenziali sono predefinite e teoricamente non è necessario specificarle 

nel DTD. Si tratta di ‘amp’, ‘lt’, ‘gt’, ‘apos’ e ‘quot’. Le macro relative sono ‘&’, ‘<’, 

‘>’, ‘'’ e ‘"’. 

Si può osservare questo particolare nella dichiarazione SGML di XML: 

... 

SYNTAX 

... 

ENTITIES 

"amp" 38 

"lt" 60 

"gt" 62 

"quot" 34 

"apos" 39 

... 

267.1.5 Entità parametriche 

In XML, le entità parametriche possono essere utilizzate solo all’interno del DTD. Da ciò consegue 

logicamente che le sezioni marcate con le quali si può includere o escludere del testo in base 

al contenuto di un’entità parametrica, possono esistere solo nel DTD. 

 

 

 

]]> 

 

]]> 

L’esempio mostra un pezzo di un DTD ipotetico, in cui vengono dichiarate due entità parametriche, 

‘bozza’ e ‘finale’. In questo caso, la macro ‘%bozza;’ si traduce nella parola ‘INCLUDE’, 

mentre la macro ‘%finale;’ si traduce nella parola ‘IGNORE’. In questo modo, viene dichiarato 

l’elemento ‘libro’ nella prima modalità: quella che ammette la presenza dell’elemento 

‘commento’. 

267.1.6 Altre sezioni marcate 

XML ammette l’uso di un’altra sezione marcata soltanto, la sezione ‘CDATA’ per delimitare del 

testo letterale. 

serve per...]]> 

L’esempio mostra in che modo sia possibile utilizzare letteralmente i simboli ‘’ in una 

sezione ‘CDATA’. 

267.1.7 Istruzioni di elaborazione 

Le istruzioni di elaborazione sono una novità in XML. Servono in qualche modo per passare 

delle informazioni alle applicazioni. Si distinguono per avere la forma seguente: 


Il testo che compone l’istruzione dipende dall’applicazione a cui è diretto. È importante tenere 

presente che tutto ciò che inizia con la stringa ‘xml’, assieme a tutte le sue variazioni di lettere 

maiuscole e minuscole, è riservato. 

In generale, in base al significato che può avere l’istruzione di elaborazione, queste possono 

trovarsi in qualunque parte del sorgente XML. 

Normalmente si inizia sempre un sorgente XML con un’istruzione di elaborazione che dichiara 

la versione di XML a cui si fa riferimento, assieme alla codifica utilizzata: 

 

267.2 Convenzioni dell’XML 

Nella descrizione delle differenze tra XML e SGML sono già state presentate alcune convenzioni 

di XML che non sono esprimibili nella dichiarazione SGML relativa. In pratica, si tratta di regole 

che vanno tenute in considerazione quando si scrive un DTD per un documento XML. Vale la 

pena di raccogliere le convenzioni più importanti. 

• I nomi di elementi e degli attributi che iniziano per ‘xml’, con qualsiasi altra variante delle 

lettere maiuscole e minuscole, sono riservati. 

• Gli elementi che ne possono avere bisogno, devono poter disporre di un attributo denominato 

‘xml:space’, a cui possano essere assegnate le parole chiave ‘default’ o ‘preserve’. 

Il suo scopo è quello di definire il comportamento nei confronti degli spazi (di tutti i caratteri 

assimilabili a questo concetto). Assegnando la parola chiave ‘default’ si intende lasciare 

che gli spazi vengano gestiti come al solito, eliminando quelli superflui; con la parola chiave 

‘preserve’ si vuole richiedere di mantenere gli spazi come sono. La dichiarazione di 

questo attributo può avvenire nel DTD come nell’esempio seguente: 

 

In particolare, un elemento che per sua natura deve rispettare le spaziature originali, potrebbe 

essere definito nel modo seguente, dove si vede il caso dell’elemento ‘pre’ di 

XHTML: 

 

 

• Gli elementi che ne possono avere bisogno, devono poter disporre di un attributo denominato 

‘xml:lang’, a cui poter assegnare un codice identificativo del linguaggio contenuto. 

Si prevede l’uso di diversi tipi di codice: 

– un codice di linguaggio composto da due lettere, secondo lo standard ISO 639 (sezione 

543); 

– un codice di linguaggio registrato dall’autorità IANA (Internet assigned numbers 

authority), a cui va aggiunto comunque il prefisso ‘i-’, oppure ‘I-’; 

– un codice stabilito dall’utente o concordato tra le parti, a cui va aggiunto il prefisso 

‘x-’, oppure ‘X-’. 

La dichiarazione di questo attributo può avvenire nel DTD come nell’esempio seguente: 

 

Eventualmente si può anche specificare un linguaggio predefinito, come si vede 


2908 XML: cenni 

267.3 Correttezza formale e validità 

Possono esistere due livelli di approccio all’XML da parte dei programmi che lo utilizzano: il 

primo si limita a leggere il documento senza sapere nulla della sua struttura stabilita nel DTD; 

il secondo invece richiede la conoscenza di questa struttura. Nel primo caso è sufficiente che il 

documento XML sia stato scritto correttamente dal punto di vista formale, in senso generale; in 

questo modo si parla di well formed document. Nel secondo caso è importante che il documento, 

oltre che essere corretto dal punto di vista formale, sia anche valido in base alla definizione 

stabilita nel DTD. 

Il documento XML corretto dal punto di vista formale, ha le caratteristiche seguenti: 

• contiene un elemento principale unico, all’interno del quale vanno collocati tutti gli altri (si 

parla comunemente dell’elemento root); 

• tutti i marcatori degli elementi devono essere indicati in modo corretto, attraverso degli 

annidamenti ordinati; 

• tutti gli elementi devono essere delimitati correttamente, senza saltare dei marcatori, inoltre 

gli elementi vuoti vanno chiusi oppure vanno indicati con il marcatore speciale già 

mostrato; 

• devono essere rispettate le regole stabilite per i nomi degli elementi; 

• i valori associati agli attributi vanno delimitati sempre attraverso apici doppi oppure apici 

singoli; 

Il documento XML valido, oltre a essere corretto formalmente, deve anche essere conforme al 

DTD. Come nell’SGML normale, il DTD può essere indicato attraverso un riferimento, oppure 

può essere incorporato all’inizio del documento. 

267.4 Verifica della validità con SP 

Il pacchetto SP di James Clark può essere utilizzato anche per convalidare un documento XML, a 

partire dal suo DTD. Il procedimento è analogo a quanto già mostrato nel capitolo 250. Tuttavia, 

è necessario procurarsi la dichiarazione XML, che si può trovare nell’archivio dei sorgenti di SP 

stesso: ‘pubtext/xml.dcl’. 

Supponendo di disporre del file ‘xml.dcl’ nella directory corrente, si può realizzare un catalogo 

molto semplice come quello seguente: 

SGMLDECL "xml.dcl" 

Naturalmente, nel catalogo si possono aggiungere anche altre cose, in base alla necessità o meno 

di indicare il DTD e le entità generali. Per verificare il funzionamento della cosa, si può provare a 

eseguire la convalida dell’esempio seguente, che include il DTD nel preambolo e non ha bisogno 

di entità generali: 

 

 

Ciao a tutti! 

Si può osservare che si tratta di un documento elementare, in cui esiste solo l’elemento principale, 

denominato ‘esempio’.


Per la convalida, si può usare l’eseguibile ‘nsgmls’ nel modo seguente: 

$ nsgmls -c catalogo.xml -s esempio.xml 

Qui si sottintende che il file del catalogo sia ‘catalogo.xml’ e che il sorgente XML sia contenuto 

nel file ‘esempio.xml’. Se oltre alla convalida si vuole avere il risultato pre-elaborato, si 

toglie l’opzione ‘-s’, ottenendo quanto segue: 

?xml version="1.0" encoding="ISO-8859-1" 

(esempio 

-Ciao a tutti! 

)esempio 

C 


• W3C, Extensible Markup Language (XML) 1.0 

 

• James Clark, Comparison of SGML and XML 

 

• XML Frequently Asked Questions 

 

• Norman Walsh, A Technical Introduction to XML 

 


XHTML 

Capitolo 268 

XHTML è una rivisitazione dell’HTML in forma di applicazione XML. Allo stato attuale, 

XHTML 1.0 è progettato in modo da essere molto simile all’HTML 4. ; ciò dovrebbe permettere 

anche ai programmi di navigazione che non conoscono l’XML di poterlo interpretare 

* 

correttamente. Evidentemente, XHTML è proprio la premessa all’introduzione pratica dell’XML 

nella documentazione in rete. 

268.1 Caratteristiche generali 

Come accennato, XHTML è qualcosa di molto simile all’HTML tradizionale, con alcune 

differenze importanti, dovute all’XML e alle scelte progettuali di questo formato. In particolare: 

• gli elementi devono essere delimitati correttamente con i marcatori di apertura e chiusura; 

• non ci possono più essere elementi vuoti indicati con il solo marcatore di apertura, dal 

momento che al loro posto si possono solo usare i marcatori speciali nella forma ‘’; 1 

• i nomi degli elementi e degli attributi vanno scritti utilizzando solo lettere minuscole; 

• gli attributi devono essere assegnati correttamente (non si possono usare più degli attributi 

booleani) e il valore assegnato deve essere delimitato da apici doppi o singoli; 

• l’attributo ‘lang’, se utilizzato, deve essere abbinato anche all’attributo ‘xml:lang’, in 

base alle convenzioni dell’XML; 

• se non si può evitare l’uso dell’attributo ‘name’, questo deve essere abbinato anche 

all’attributo ‘id’; 

• se il valore assegnato a un attributo deve contenere una e-commerciale (‘&’), occorre 

indicarla nella forma ‘&’, anche se si tratta di un URI; 

• se il valore assegnato a un attributo deve contenere una e-commerciale (‘&’), occorre 

indicarla nella forma ‘&’, anche quando si tratta di un URI; 

• se per qualche ragione non si dichiara la codifica utilizzata, deve trattarsi della forma UTF-8 

oppure UTF-16; 

• l’elemento ‘isindex’ è obsoleto e si preferisce usare l’elemento ‘input’. 

268.2 Scheletro di un file XHTML 

Trattandosi di un’applicazione XML, l’inizio dovrebbe essere scontato: si deve specificare che si 

tratta di un file XML, quindi si passa a indicare il DTD a cui si fa riferimento: 

 

 

 

 

Esempio XHTML 

 

 

1 Per motivi di compatibilità con i vecchi navigatori, i marcatori di questo genere vanno indicati avendo l’accortezza 

di lasciare uno spazio prima della barra finale; per esempio: ‘’. 

2910

XHTML 2911 

 

Ciao mondo! 

 

 

L’esempio mostra un file XHTML completo, anche se molto breve. Si può osservare che il marcatore 

di apertura, oltre agli attributi ‘xml:lang’ e ‘lang’, contiene l’attributo ‘xmlns’, a cui 

viene assegnato un URI prestabilito. 

In XML, l’insieme di caratteri codificato è quello della codifica universale. Di conseguenza, 

per la migliore compatibilità con il passato, la forma codificata del carattere predefinita è UTF- 

8. Se il file utilizza l’ASCII tradizionale, senza estensioni, tutto va bene e non occorre altro; 

diversamente vanno usate preferibilmente le codifiche UTF-8 oppure UTF-16, come prevede in 

generale l’XML. L’esempio seguente mostra in che modo va modificata l’istruzione iniziale per 

indicare espressamente la codifica: 

 

268.3 Verifica della validità di un file XHTML 

Volendo verificare la validità di un file XHTML attraverso il suo DTD, si può agire in modo 

simile a quanto si fa in generale con l’SGML. Questo è già stato descritto nel capitolo 250; 

tuttavia occorre ricordare che la definizione SGML da utilizzare è quella specifica per l’XML. 

Il DTD di XHTML, assieme alla definizione delle entità standard, possono essere ottenuti a partire 

da ‘http://www.w3.org/TR/xhtml1/DTD/’ (ma probabilmente la directory non è leggibile), 

mentre la dichiarazione SGML si può trovare tra i sorgenti del pacchetto SP di James Clark. 

Si veda a questo proposito quanto già descritto nel capitolo 267. 


• W3C, XHTML 1.0: The Extensible HyperText Markup Language 

 


2912 XHTML

Parte l 

Controllo dell’ortografia e dello 

stile 

269 Analisi lessicale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2914 

269.1 Ispell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2914 

270 Analisi sintattica e stilistica con Textchk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2921 

270.1 Principio di funzionamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2921 

270.2 Configurazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2922 

270.3 Come si usa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2925 

270.4 Come si installa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2926 

270.5 Riferimenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2927 

2913

Analisi lessicale 

Capitolo 269 

Gli errori che si possono fare scrivendo un testo sono di vario tipo, ma quelli puramente lessicali, 

ovvero ciò che potrebbe essere classificato come errore di battitura, rappresentano i meno 

importanti. Tuttavia, si tratta pur sempre di una buona percentuale nell’insieme globale di errori 

che può contenere un testo. 

Un programma banale che sia in grado di mostrare le parole che risultano semplicemente 

sconosciute, è già un buon aiuto verso l’obiettivo dello scrivere in modo corretto. 

Un programma di analisi lessicale è utile quando si può gestire un dizionario personale, perché 

non si possono escludere le eccezioni da un testo: il nome o il cognome di una persona, un indirizzo, 

una sigla particolare,... In presenza di documenti di grandi dimensioni, diventa necessario 

gestire un dizionario specifico per ognuno di questi, in modo da non interferire con l’analisi di 

altri in cui certi termini, ammissibili da una parte, non possono esistere dall’altra. 

269.1 Ispell 

Ispell è un programma di scansione lessicale che permette la realizzazione di dizionari contenenti 

anche indicazioni sulle possibili aggregazioni di parole (si pensi alla lingua tedesca in cui le 

parole sono generate spesso dall’unione di altre). 

Lo studio di questa caratteristica di Ispell riguarda chi vuole realizzare un dizionario standard per 

un linguaggio particolare: generico o specifico di un certo settore. Qui si intende mostrare un uso 

semplificato di questo programma, in cui si utilizzano dizionari standard e si generano i propri 

dizionari personali specifici per ciò che si fa. 

269.1.1 Dizionari 

Generalmente, il pacchetto di distribuzione di Ispell contiene un dizionario standard per la lingua 

inglese. Dovrebbe trattarsi del file ‘/usr/lib/ispell/english.hash’. Nella stessa directory 

vanno collocati altri file per altre lingue, o per linguaggi specifici. Questi file, terminanti con l’estensione 

‘.hash’, sono ottenuti a partire da una coppia di file di testo, attraverso la compilazione 

con ‘buildhash’, ogni volta che si cambia piattaforma. 

È disponibile un pacchetto contenente un dizionario generico per la lingua italiana. Lo si dovrebbe 

trovare presso e si tratta di un file denominato secondo 

il modello ‘italiano-versione.tgz’. 

Il dizionario italiano si compone di due file sorgenti: ‘italiano.aff’ e ‘italiano.sml’. Il 

primo dei due contiene la tabella affix, che in pratica rappresenta una serie di regole sull’insieme 

dei caratteri ammissibili e sulla possibile unione di parti di parole, mentre il secondo è l’elenco 

di parole vero e proprio. Queste parole elencate, contengono a volte dei riferimenti aggiuntivi 

indicati dopo una barra obliqua (‘/’) che hanno valore in base alle definizioni della tabella affix. 

L’approfondimento sulla sintassi del file affix è utile solo se si vuole realizzare un dizionario hash 

specifico, mentre l’utilizzatore normale può ignorare questo problema. La compilazione dei file 

sorgenti in modo da ottenere un dizionario hash si ottiene con il comando seguente: 

$ buildhash italiano.sml italiano.aff italiano.hash 

Si otterrà il file ‘italiano.hash’, da collocare nella directory ‘/usr/lib/ispell/’. Se si 

intende utilizzare sistematicamente questo dizionario, si può predisporre la variabile di ambiente 

‘DICTIONARY’, assegnandovi il nome del file: ‘italiano.hash’. In alternativa, si può usare 

2914

Analisi lessicale 2915 

‘ispell’ con l’opzione ‘-d’, come nell’esempio seguente (l’estensione ‘.hash’ è predefinita e 

può essere omessa). 

$ ispell -d italiano documento.txt 

I dizionari personali sono invece una cosa diversa: si tratta di un elenco di termini, scritto con le 

stesse modalità di un sorgente, senza un file affix a fianco (o meglio, utilizzando quello del dizionario 

hash a cui si fa riferimento). Normalmente, tali file personali sono aggiornati da Ispell, 

quando questo viene usato in modo interattivo. Il nome predefinito del dizionario personale è ‘~/ 

.ispell_linguaggio ’. Per esempio, se si utilizza il dizionario standard predefinito, viene generato 

e utilizzato il file ‘~/.ispell_english’ (nella directory personale), a meno di specificare 

un nome diverso con le opzioni. 

In aggiunta ai file personali ci possono essere dei file più specifici, legati alla directory corrente: 

‘./.ispell_linguaggio ’. Inoltre, in mancanza dell’indicazione del linguaggio, i dizionari 

personali e quelli specifici hanno i nomi: ‘~/.ispell_default’ e ‘./.ispell_default’. 

269.1.2 Avvio e opzioni fondamentali 

ispell [opzioni] file_da_analizzare 

Quella che si vede rappresenta una semplificazione estrema della sintassi dell’eseguibile 

‘ispell’, però, prima di apprendere il funzionamento delle particolarità di questo programma, 

è meglio comprendere le sue possibilità fondamentali. 

Ispell può funzionare in modo interattivo, oppure no. In teoria, è possibile anche realizzare un 

programma che sfrutti le funzionalità di Ispell attraverso una pipeline; in pratica, si tratta in 

questo caso dell’utilizzo meno importante che si può fare di Ispell. 


-d dizionario_hash 

Permette di specificare un file dizionario differente da quello predefinito (che di solito è 

‘english.hash’). Il nome del file viene indicato generalmente senza estensione e senza 

percorso, facendo implicitamente riferimento alla directory ‘/usr/lib/ispell/’ e a file 

con estensione ‘.hash’. 

-p dizionario_personale 

Permette di specificare un dizionario personale differente da quello predefinito (che di solito 

è ‘~/.ispell_...’). 

-W n_caratteri 

Specifica la lunghezza delle parole che non devono essere prese in considerazione. In 

pratica, da quel numero di caratteri in giù, si considerano tutte valide. 

-x 

Evita la creazione di una copia di sicurezza. Senza indicare questa opzione, dovrebbe essere 

salvata una copia del file originale aggiungendo al suo nome l’estensione ‘.bak’. 

-b 

Si tratta dell’opzione opposta a ‘-x’, in quanto permette di forzare la richiesta di creazione 

di una copia di sicurezza. 

-t 

Fa in modo che il testo da analizzare sia considerato un sorgente TeX, o LaTeX, per il quale 

si devono ignorare i codici di formattazione e possibilmente anche alcune indicazioni che

2916 Analisi lessicale 

sono solo funzionali a TeX, dal momento che non riguardano il contenuto del testo. Questa 

dovrebbe essere la modalità predefinita di funzionamento. 

In generale, questa modalità va bene anche per il testo puro e semplice, purché non ci siano 

barre oblique inverse che possano essere confuse con comandi di TeX. 

-n 

Fa in modo che il testo da analizzare sia considerato un sorgente Nroff o Troff, per il quale 

si devono ignorare i codici di formattazione. 1 

269.1.3 Funzionamento interattivo 

Il funzionamento normale di Ispell è interattivo. Generalmente viene fatta una copia di sicurezza 

del file analizzato, con un nome che termina con l’aggiunta dell’estensione ‘.bak’, quindi Ispell 

permette di modificare il contenuto del file originale, in base alle scelte dell’utente. 

Figura 269.1. Funzionamento interattivo di Ispell. 

stai 

File: lettera 

Ciao come stai? 

00: stab 09: st-AI 

01: stag 

02: staid 

03: stain 

04: stair 

05: Stan 

06: star 

07: stay 

08: st AI 

[SP] R)epl A)ccept I)nsert L)ookup U)ncap Q)uit e(X)it or ? for help 

La figura 269.1 mostra il caso di un file, denominato ‘lettera’, che contiene una frase normalissima, 

in cui la parola «stai» non viene riconosciuta. In effetti, si suppone di avere utilizzato il 

dizionario hash predefinito, ovvero quello inglese. 

La parola ‘stai’ viene evidenziata se le caratteristiche del terminale lo consentono; in ogni caso, 

viene indicata a parte, all’inizio (come si vede dall’esempio). Se possibile, Ispell elenca una 

serie di alternative possibili, in base alle affinità che può avere il termine sconosciuto con altre 

parole contenute nel dizionario. Questo elenco è numerato, in modo da permetterne la selezione. 

Nella parte bassa dello schermo appare un menù riepilogativo degli altri comandi a disposizione; 

comandi che si richiamano prevalentemente con la semplice pressione di tasti o combinazioni di 

tasti mnemonici. 

Alcuni comandi 

[ Spazio ] 

Fa in modo che Ispell accetti la parola temporaneamente. Se ne troverà ancora, Ispell le 

segnalerà nuovamente. 

[ R ] | [ r ] 

Richiede la sostituzione della parola errata con un’altra che deve essere inserita subito dopo. 

Se anche la nuova parola non sembra valida, questa viene segnalata ugualmente da 

1 La possibilità di distinguere i codici di formattazione di TeX, *roff, o altro, dipende anche dal file affix del dizionario 

utilizzato.


Ispell. La sostituzione riguarda solo quell’occorrenza particolare; se verrà ritrovato ancora 

lo stesso errore, Ispell continuerà a segnalarlo. 

[ A ] | [ a ] 

Fa sì che Ispell ignori la parola per tutto il resto del documento. 

[ I ] | [ i ] 

Fa sì che Ispell accetti la parola e la inserisca nel dizionario personale, esattamente com’è, 

rispettando maiuscole e minuscole. 

[ U ] | [ u ] 

Fa sì che Ispell accetti la parola e la inserisca nel dizionario personale, senza distinguere tra 

maiuscole e minuscole. 

[ 0 ] | [ 1 ] | ... | [ 0 ][ 0 ] | [ 0 ][ 1 ] | ... 

La selezione di un numero fa riferimento alle voci proposte come parole alternative a quella 

errata. Con questa selezione di intende ottenere la sostituzione delle parole. È importante 

osservare che, se l’elenco supera le nove unità, la selezione avviene con due cifre numeriche. 

L’esempio che appare nella figura mostra questo caso: per indicare la parola ‘stag’, 

occorre la sequenza [ 0 ][ 1 ]. 

[ X ] | [ x ] 

Conclude il lavoro completando la scrittura del file e ignorando altri errori eventuali. Chiude 

anche il file del dizionario personale, mantenendo le voci aggiunte fino a quel punto. 

[ Q ] | [ q ] 

Termina immediatamente, lasciando inalterato il file, senza conservare i termini 

eventualmente annotati per l’aggiunta nel dizionario personale. 

[ Ctrl+l ] | [ Ctrl+L ] 

Ripulisce lo schermo. 


Per quanto riguarda il funzionamento interattivo di Ispell, sono importanti due opzioni. 

-M 

Richiede espressamente la visualizzazione del menù riassuntivo dei comandi interattivi. Di 

solito, tale menù appare in modo predefinito, a meno di avere compilato Ispell con opzioni 

particolari. 

-N 

Fa in modo che il menù riepilogativo dei comandi non venga visualizzato. 

Alcuni esempi 

$ ispell -d italiano lettera 

Analizza il file ‘lettera’ utilizzando il dizionario hash ‘italiano’, ovvero, il file ‘/usr/ 

lib/ispell/italiano.hash’. 

$ ispell -d italiano -p mio lettera 

Come nell’esempio precedente, ma in questo caso si utilizza il dizionario personale rappresentato 

dal file ‘./mio’. Nell’esempio precedente, si faceva riferimento al dizionario 

personale predefinito: ‘~/.ispell_italiano’.


269.1.4 Funzionamento non interattivo 

Quando Ispell funziona in modo non interattivo, si limita a generare un elenco di termini, anche 

ripetuti, che risultano sconosciuti in base al dizionario. Ispell può anche essere utilizzato 

attraverso un altro programma, quando si indica l’opzione ‘-a’, ma si tratta di un modo un po’ 

complicato, che qui non viene descritto. 

Per ottenere l’elenco dei termini sconosciuti, si utilizza l’opzione ‘-l’. Per esempio, questa 

possibilità di Ispell può essere sfruttata per produrre rapidamente un dizionario personale. 

Se si dispone di un testo della cui esattezza si è certi, si può ottenere da Ispell l’elenco dei termini 

da lui sconosciuti, generando poi un dizionario personale con tutte queste eccezioni. Si procede 

nel modo seguente: 

$ ispell -d italiano -l < romanzo > mio_dizionario 

In questo modo, tutti i termini contenuti nel file ‘./romanzo’ che non risultano dal dizionario 

hash ‘italiano’, vengono emessi attraverso lo standard output e diretti nel file ‘./ 

mio_dizionario’. 

$ sort -f < mio_dizionario > dizionario1 

In questo modo si riordina l’elenco di parole ottenuto, generando il file ‘./dizionario1’, dove 

l’opzione ‘-f’ serve a non distinguere tra lettere minuscole e maiuscole, anche se restano i doppioni. 

Con questo elenco si vuole generare un dizionario personale, eliminando questi doppioni 

ed eventualmente generando altre semplificazioni. 

$ munchlist -s italiano -l italiano.aff dizionario1 > dizionario2 

In questo modo, si ottiene il compattamento del file ‘./dizionario1’, in base a quanto già 

contenuto del dizionario hash ‘italiano’ e secondo le regole del file affix ‘./italiano.aff’, 

generando il file ‘./dizionario2’, che finalmente può essere utilizzato come dizionario 

personale. 

In alternativa, si può anche tentare di dare in pasto a Ispell il file senza ottenuto dopo 

l’ordinamento, senza filtrarlo attraverso ‘munchlist’. Sarà Ispell stesso che eliminerà i 

doppioni. 

269.1.5 Programmi di servizio di contorno a Ispell 

Ispell si compone di diversi file binari. Il più importante è ‘ispell’, come si è visto, ma altri 

sono necessari per la gestione dei file di dizionario. Si è già accennato a ‘buildhash’ e a 

‘munchlist’, il cui utilizzo è il caso di riepilogare. 

buildhash dizionario_sorgente file_affix dizionario_hash 

munchlist [-l file_affix] [-s dizionario_hash] [elenco_da_ridurre] > elenco_ridotto 

Quelle mostrate sono le sintassi semplificate di questi due programmi. Di più può essere appreso 

dalla lettura di ispell(1). 

Alcuni esempi 

$ munchlist mio_dizionario > dizionario 

Utilizza il dizionario hash e il file affix standard per ridurre l’elenco contenuto nel file ‘./ 

mio_dizionario’, generando il file ‘./dizionario’.


$ munchlist -s italiano -l ./italiano.aff mio_dizionario > dizionario 

Utilizza il dizionario hash ‘italiano’ (‘/usr/lib/ispell/italiano.hash’) e il file 

affix ‘./italiano.aff’ per ridurre l’elenco contenuto nel file ‘./mio_dizionario’, 

generando il file ‘./dizionario’. 

$ buildhash italiano.sml italiano.aff italiano.hash 

Genera il dizionario hash ‘./italiano.hash’, a partire dall’elenco ‘./italiano.sml’ 

e dal file affix ‘./italian.aff’. 

269.1.6 Gestione dei dizionari personali 

L’utilizzo occasionale di Ispell richiede la presenza di un dizionario hash e probabilmente di uno 

personale predefinito, che quasi sicuramente sarà ‘~/.ispell_italiano’. Ma la correzione 

ortografica basata esclusivamente su un dizionario è tanto più efficace quanto minore è il numero 

delle parole previste, ovvero, quanto più specifico è il dizionario utilizzato. 

Di fronte alla realizzazione di un documento di un certo impegno, o di una serie di documenti 

che trattano dello stesso genere di cose, potrebbe essere conveniente utilizzare un dizionario 

personale specifico per quel progetto, eventualmente partendo da un dizionario hash praticamente 

vuoto. 2 

Per realizzare un dizionario «vuoto», adatto a qualunque linguaggio che utilizzi la codifica ISO 

8859-1, si potrebbe partire dal file affix che contiene solo le righe seguenti, il cui unico scopo è 

quello di ammettere l’uso di tutte le lettere accentate e speciali. 3 

# minimo.aff 

# Accetta qualunque carattere accentato e speciale di ISO 8859-1 

wordchars [a-z] [A-Z] 

wordchars [à-\376] [À-\336] 

wordchars [\337] 

wordchars [\377] 

prefixes 

suffixes 

Le parole chiave ‘prefixes’ e ‘suffixes’ sono obbligatorie, ma il file è ancora incompleto 

(viene segnalato dai programmi come ‘buildhash’ e ‘munchlist’), anche se funziona 

ugualmente per lo scopo che ci si prefigge qui. 

Volendo esagerare, se le cifre numeriche possono avere un ruolo nella composizione delle parole 

che si vogliono controllare, si può aggiungere anche la riga seguente, tenendo conto che però poi 

‘munchlist’ non funziona tanto bene. 4 

wordchars [0-9] 

A fianco di questo si deve creare un elenco di parole che ne contenga almeno una, come 


Linux 

2 Quando si ha a che fare con documentazione tecnica, in cui l’uso di termini in inglese è frequente, si potrebbe 

addirittura valutare la possibilità di basare l’analisi sul dizionario standard (‘english.hash’), affiancando il dizionario 

personale specifico per il documento, solo che in tal caso si avrebbero difficoltà con le lettere accentate, dal momento che 

queste non sono previste nel file affix inglese. 

3 Le lettere ‘ÿ’ e ‘ß’, corrispondenti ai codici ‘\377’ e ‘\337’, sono minuscole e non hanno un equivalente maiuscolo 

nella codifica ISO 8859-1. 

4 In pratica, ‘munchlist’ elimina queste parole ritenute estranee. Se si dispone di un elaboratore ben equipaggiato, si 

può dare in pasto a Ispell il file ottenuto dopo il riordino; sarà poi lui a eliminare i doppioni.


Si suppone che il file affix sia stato nominato ‘minimo.aff’ e che l’elenco sia ‘minimo.sml’. 

Per creare il file hash, si procede come è già stato presentato più volte. 

$ buildhash minimo.sml minimo.aff minimo.hash 

Pur con una segnalazione di errore, dovuta all’estrema semplicità del file affix, si ottiene il file 

‘minimo.hash’ nella directory corrente. Questo file hash può essere usato solo per testi normali, 

senza codici di formattazione di alcun tipo, dal momento che il file affix mostrato non è stato 

predisposto per questo. 

Se si dispone di un documento ritenuto sicuro, si può generare il dizionario personale relativo. 

$ ispell -d ./minimo.hash -l < documento.txt > elenco 

In questo modo si ottiene l’elenco delle parole usate nel file ‘documento.txt’, che sono 

praticamente tutte sconosciute. Questo elenco deve essere riordinato e ridotto. 

$ sort -f < elenco > elenco1 

$ munchlist -l minimo.aff -s minimo.hash elenco1 > dizionario 

Dopo la riduzione si ottiene finalmente il dizionario personale specifico del documento; successivamente 

si potranno eseguire le verifiche sullo stesso documento di origine (a seguito di aggiunte 

o di modifiche), con il comando seguente: 

$ ispell -d ./minimo.hash -p ./dizionario documento.txt 


Analisi sintattica e stilistica con Textchk 

Capitolo 270 

L’analisi sintattica di un testo è un problema ben più complicato della semplice verifica delle 

parole con un dizionario. Esistono però alcuni tipi di errori sintattici, o stilistici, che si possono 

identificare con l’aiuto di espressioni regolari (regular expression). 

La lingua italiana consente spesso l’utilizzo di forme espressive differenti, per le quali dovrebbe 

esserci almeno uniformità all’interno di uno stesso documento. Per esempio, occorre decidere se 

si vuole scrivere: «una aula» oppure «un’aula», «ed anche» oppure «e anche»,... 

In questo capitolo si vuole mostrare un programma Perl che può aiutare a definire delle regole 

rappresentate in forma di espressioni regolari, per segnalare degli errori sintattici o stilistici. Con 

questo programma è possibile indicare anche delle regole di eccezione e delle particolarità riferite 

a un solo documento. Il programma in questione è Textchk, 1 che è derivato dagli strumenti 

preparati originariamente per la composizione di questo documento (ALtools e Alml). 

Textchk dovrebbe trovarsi assieme alla distribuzione di questa opera; tuttavia, il suo riferimento 

principale è . 

270.1 Principio di funzionamento 

Textchk scandisce un file di partenza generando un altro file contenente le parti di testo che 

risulterebbero errate (oltre a un file diagnostico contenente la registrazione del procedimento 

di verifica). Prima di iniziare a leggere il file da esaminare, vengono caricati dei modelli che 

esprimono degli errori, espressi in forma di espressione regolare, seguiti eventualmente da dei 

modelli di eccezione. Infine, vengono caricate anche delle particolarità riferite al testo che si 

elabora, trattate in forma letterale e non più secondo il modello di un’espressione regolare. 

Figura 270.1. Schema di funzionamento di Textchk. 

.------------------. .-------------. 

| regexp | | brani | 

| errori+eccezioni | | particolari | 

‘------------------’ ‘-------------’ 

| | 

‘------. .----------’ 

| | 

V V 

.-----------. .-----------------. .---------. 

| documento | | | | errori | 

| da |------>| Textchk |---------------->| trovati | 

| esaminare | | | ‘---------’ 

‘-----------’ ‘-----------------’ 

| 

| .-------------. 

‘------------>| registro | 

| diagnostico | 

‘-------------’ 

Gli errori che si possono ricercare attraverso delle espressioni regolari, riguardano la vicinanza 

di parole che hanno caratteristiche determinate, come l’uso o meno di articoli apostrofati. Sotto 

questo aspetto, diventa importante che, nel file di testo originale, ogni paragrafo si trovi su una 

sola riga, cioè non sia interrotto su più righe. 

A fianco di questo problema, si aggiunge il fatto che il file sorgente che si vuole esaminare 

potrebbe contenere dei codici di controllo, come nel caso di TeX (o LaTeX) e di HTML. In tutte 

queste situazioni, prima di passare all’analisi vera e propria, occorre ripulire e riadattare il testo, 

in modo da avere a che fare con un file di testo puro, in cui ogni paragrafo si trovi su una sola 

1 Textchk GNU GPL 

2921

2922 Analisi sintattica e stilistica con Textchk 

riga. Al limite, può essere sufficiente che ogni periodo, cioè ogni frase completa che termina con 

un punto, si trovi su una sola riga. 

270.1.1 Espressioni regolari 

Textchk è scritto in Perl, pertanto le espressioni regolari che possono essere gestite sono quelle 

di questo linguaggio di programmazione. 

La ricerca della corrispondenza con le espressioni regolari che esprimono un errore, viene fatta 

in modo da circoscrivere, se possibile, tre parole prima e dopo della zona dell’errore. Per questa 

ragione, non ha senso tentare di identificare l’inizio e la fine di una riga (con i simboli ‘^’ e ‘$’), 

inoltre non è possibile utilizzare le parentesi tonde. 

A titolo di esempio, si propone il problema della «d» eufonica, per la precisione il caso di «ad». 

Supponendo di volerla utilizzare solo quando la parola successiva inizia con la vocale «a», escludendo 

il caso in cui la parola continui con un’altra «d» (per esempio: «ad amare», ma non «ad 

adattare»), si possono usare le espressioni regolari seguenti per individuare gli errori. 

\ba\s+a[^d]\w*\b 

\bad\s+ad\w*\b 

\bad\s+[â]\w*\b 

Per intendere meglio il significato di ciò che è scritto, la prima riga significa: 

• ‘\b’ 

• ‘a’ 

• ‘\s+’ 

lo spazio vuoto prima della parola; 

la lettera «a»; 

uno o più spazi orizzontali; 

• ‘a[^d]’ la lettera «a» seguita immediatamente da qualunque cosa che sia diversa dalla 

lettera «d»; 

• ‘\w*’ 

• ‘\b’ 

zero o più caratteri alfabetici; 

lo spazio vuoto dopo la parola; 

Nello stesso tempo, però, si può decidere di accettare un’eccezione: «ad esempio», che secondo 

quando stabilito con l’ultima delle espressioni regolari appena mostrate, dovrebbe essere un 

errore. Si può usare quindi l’espressione regolare seguente, tra le eccezioni. 

\bad\s+esempio\b 

270.2 Configurazione 

La configurazione di Textchk serve a definire gli errori sintattici che si ricercano. In generale è 

importante definire una configurazione specifica per ogni singolo progetto di documentazione, 

ma resta la possibilità di stabilire regole personali, legate all’utente, oltre che regole generali 

legate al sistema (per quanto questo possa avere un valore relativo). 

La configurazione avviene attraverso un file di testo normale, in cui le righe bianche, quelle 

vuote e quelle che iniziano con il simbolo ‘#’ vengono ignorate. Le altre righe sono dei record 

che possono avere una delle due forme seguenti: 

DBL____regola_di_errore[____testo_esplicativo] 

ERR____regola_di_errore[____testo_esplicativo] 

EXC____regola_di_eccezione

Analisi sintattica e stilistica con Textchk 2923 

Nel primo caso si identifica una parola che si ritiene possa essere stata scritta due volte, in modo 

erroneo; il secondo indica un modello di errore, mentre nel terzo si tratta di un’eccezione. I 

record che descrivono le regole di eccezione si riferiscono sempre all’ultima regola di errore (di 

tipo ‘DBL’ o ‘ERR’) che sia stata incontrata fino a quel punto. 

La forma di questi record è un po’ strana, nel senso che la separazione dei campi avviene attraverso 

una sequenza di quattro trattini bassi (‘____’). Ciò serve per evitare di creare problemi alla 

realizzazione delle espressioni regolari che descrivono gli errori e le eccezioni. 

#----------------------------------------------------------------------- 

# d eufonica 

# a|e|o prendono una «d» eufonica se sono seguite da una parola che 

# inizia con la stessa vocale, a meno che ci sia subito dopo un’altra 

# «d». 

#----------------------------------------------------------------------- 

ERR____\ba\s+a[^d]\w*\b____a --> ad 

EXC____\bda\s+a\s+a\b 

ERR____\bad\s+ad\w*\b____ad --> a 

ERR____\bad\s+[âA]\w*\b____ad --> a 

EXC____\bad\s+esempio\b 

EXC____\bad\s+ora\b 

ERR____\be\s+e[^d]\w*\b____e --> ed 

ERR____\bed\s+[eE]d\w*\b____ed --> e 

ERR____\bed\s+[êèE]\w*\b____ed --> e 

ERR____\bo\s+[oO][^d]\w*\b____o --> od 

ERR____\bod\s+[oO]d\w*\b____od --> o 

ERR____\bod\s+[ôO]\w*\b____od --> o 

L’esempio mostra una serie di istruzioni con le quali si cerca di definire l’uso della «d» eufonica. 

Vale la pena di analizzare cosa succede di fronte a una situazione precisa. Si suppone di avere 

scritto un testo nel quale è stata inserita la frase seguente: 

Purtroppo, fino ad ora il colore dell’auto non è stato scelto dal cliente. 

Concentrando l’attenzione sui record di configurazione seguenti, si può simulare ciò che succede. 

ERR____\bad\s+[âA]\w*\b____ad --> a 

EXC____\bad\s+esempio\b 

EXC____\bad\s+ora\b 

Per cominciare, viene individuato un errore in via preliminare in corrispondenza di «ad ora», 

perché la parola che segue «ad» non inizia con una lettera «a». Textchk preleva una stringa di 

tre parole prima e tre parole dopo questo errore: «Purtroppo, fino ad ora il colore dell’auto». In 

questo caso, le parole precedenti sono solo due, perché non è stato possibile ottenere di più. 

Su questa stringa estratta viene condotto il controllo per le eccezioni successive; così, dal momento 

che si ottiene una corrispondenza (sempre con «ad ora»), l’errore si rivela infondato (in 

base ai presupposti stabiliti). 

L’ultimo campo dei record che descrivono gli errori serve per indicare una spiegazione per 

ciò che viene identificato come un errore. Questa spiegazione viene mostrata da Textchk nel 

momento in cui l’errore relativo viene mostrato, secondo lo schema seguente: 

testo_esplicativo 

tre_parole_precedenti>>errore’ e ‘


270.2.1 Gerarchia della configurazione 

Textchk è stato pensato originariamente per avere una configurazione specifica per ogni progetto 

di documentazione che ogni autore possa gestire. Tuttavia, è possibile definire anche una 

configurazione personale e una di sistema. Si tratta dei file seguenti: 

• ‘./.textchk.rules’ contiene la configurazione corrente, che viene letta prima delle 

altre; 

• ‘~/.textchk.rules’ contiene la configurazione personale, letta subito dopo quella 

corrente; 

• ‘/etc/textchk.rules’ contiene la configurazione di sistema, che viene letta alla fine. 

In generale non è opportuno stabilire una configurazione generale di sistema. Tuttavia, se c’è la 

necessità di annullare l’effetto di una regola di errore stabilita a livello generale, si può dichiarare 

la stessa regola nella configurazione personale o in quella corrente, facendola seguire immediatamente 

da un’eccezione identica. In pratica, supponendo di avere definito a livello di sistema 

la regola seguente, che richiede l’uso della «d» eufonica ogni volta che la parola seguente inizia 

con una vocale, 

ERR____\b[aeo]\s+[aeiouAEIOU]\w*\b____a/e/o --> ad/ed/od 

per annullarne l’effetto completamente, basta aggiungere la stessa regola in qualità di eccezione, 

subito dopo: 

# Regola di sistema che qui viene annullata. 

ERR____\b[aeo]\s+[aeiouAEIOU]\w*\b____a/e/o --> ad/ed/od 

EXC____\b[aeo]\s+[aeiouAEIOU]\w*\b 

270.2.2 Casi particolari 

Alle volte non conviene indicare troppe eccezioni, oppure non è materialmente possibile. Per 

esempio, si può immaginare il caso in cui si vuole mostrare veramente un modo sbagliato di 

scrivere per qualche ragione. Per queste situazioni viene in aiuto un file di configurazione aggiuntivo, 

che però può essere associato esclusivamente a un solo progetto di documentazione. Si 

tratta del file ‘./.textchk.special’, in cui si possono inserire integralmente alcune stringhe 

che Textchk ha indicato precedentemente come errate. 

Per questa parte della configurazione non c’è molto da fare: basta utilizzare un programma per 

la creazione e la modifica dei file di testo ricopiando ciò che serve dal file che viene generato 

da Textchk per registrare gli errori trovati. L’esempio seguente mostra un estratto di quello che 

potrebbe contenere questo file. Si osservi il fatto che si tratta di esempi di errori scritti così di 

proposito. 

oppure «un’aula», «ed anche» oppure «e 

vuole scrivere: «una aula» oppure «un’aula», 

ma non «ad adattare»), si possono 

270.2.3 L’indicazione di parole doppie 

Un errore frequente nella scrittura di un testo consiste nella ripetizione di una parola per due volte 

di seguito, mentre l’intenzione era quella di scriverla una volta sola. Per intercettare questo tipo 

di situazione si utilizza il record ‘DBL’. Nel campo dell’espressione che indica l’errore, si fa riferimento 

implicitamente a una parola intera. Infatti, nella comparazione reale, vengono aggiunto 

il simbolo ‘\b’ all’inizio e alla fine, a sottolineare che la parola deve essere completa. Si osservi 

l’esempio seguente:


#----------------------------------------------------------------------- 

# Parole doppie. 

#----------------------------------------------------------------------- 

DBL____\w\w+____Due parole identiche 

EXC____\bciao\s+ciao\b 

L’intenzione è di individuare qualunque parola (‘\w+’), composta almeno da due caratteri, che si 

ripete immediatamente. Viene posta una sola eccezione alla coppia «ciao ciao». 

270.3 Come si usa 

Textchk si compone di un eseguibile unico, ‘textchk’, che si utilizza secondo lo schema 

sintattico seguente: 

textchk --input-type=tipo_di_file file_da_analizzare [errori_risultanti [file_diagnostico]] 

textchk --help 

textchk --version 

Oltre alle opzioni standard, ‘--help’ e ‘--version’, l’opzione ‘--input-type’ serve a stabilire 

il tipo di file che si fornisce in ingresso, in modo che Textchk sappia come fare per gestirlo 

opportunamente, attraverso un argomento: 

• ‘standard’ 

si riferisce a un file di testo in cui ogni capoverso occupa esattamente una riga e non richiede 

altri adattamenti; 

• ‘man’ 

si riferisce a un file Troff delle pagine di manuale, che come tale richiede una rielaborazione 

in modo da ottenere un file di testo, simulando uno schermo di ampiezza orizzontale 

smisurata; 

• ‘texinfo’, ‘texi’ 

si riferisce a un sorgente Texinfo; 

• ‘html’ 

si riferisce a un file HTML che può essere trasformato in un file di testo attraverso Lynx. 

Il secondo argomento della riga di comando è il nome del file da analizzare, secondo il tipo indicato 

precedentemente. Il terzo argomento serve a definire il nome del file che viene creato per 

annotare le stringhe errate che vengono individuate; se non viene fornito espressamente il suo 

nome, viene creato un file con lo stesso nome di quello in ingresso, con l’aggiunta dell’estensione 

‘.err’ (‘file_da_analizzare .err’). Il quarto argomento serve a specificare il nome del file 

diagnostico, nel quale vengono registrate tutte le fasi di individuazione di errori e di eccezioni. 

Anche l’indicazione di questo file può essere omessa; in tal caso viene usato il nome del file degli 

errori con l’aggiunta dell’estensione ‘.diag’, oppure il file in ingresso con la stessa aggiunta 

(‘errori_risultanti .diag’ oppure ‘file_da_analizzare .diag’). 

Per esempio, il comando 

$ textchk --input-type=man bash.1 

genera i file ‘bash.1.err’ e ‘bash.1.diag’.


270.3.1 Come vengono mostrati gli errori e i dati diagnostici 

Durante il suo lavoro, Textchk mostra sullo schermo ciò che trova, delimitando gli errori tra i 

delimitatori ‘>>’ e ‘ a 

Pertanto, andando >>ad elevare a 

contrario, riuscendo così >>ad esplorare>ad elevare>ad elevare>ad esplorare>ad esplorare>ad esempioad esempioad emettere


Dopo la soluzione di questo problema, c’è solo bisogno di predisporre un file di regole, 

‘./.textchk.rules’, poi, mano a mano che il lavoro procede, potrà essere conveniente 

predisporre anche il file ‘./.textchk.special’. 


I messaggi che può mostrare Texinfo possono essere tradotti, dal momento che viene usato il 

modulo Perl-gettext. Nel pacchetto del sorgente è presente un file di messaggi per la lingua 

italiana, che però deve essere compilato e installato: 

$ msgfmt -o textchk.mo it.po 

In questo modo, si genera il file ‘textchk.mo’, che probabilmente va collocato nella directory 

‘/usr/share/locale/it/LC_MESSAGES/’. 

270.4.2 Dipendenze 

Per funzionare, Textchk richiede l’interprete Perl e la presenza di un modulo speciale: Perlgettext. 

Inoltre, per poter gestire correttamente i diversi tipi di file per cui è stato predisposto, 

richiede in particolare Groff, Lynx e Texinfo. 


• Daniele Giacomini, Textchk 

 


2928 Analisi sintattica e stilistica con Textchk

Parte li 

Alml 

271 Alml: preparazione e visione generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2930 

271.1 Installazione di Alml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2930 

271.2 Esempio iniziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2931 

271.3 Cosa si genera con la composizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2933 

271.4 Sintassi nell’uso del programma frontale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2934 

271.5 Organizzare un file-make . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2937 

271.6 Particolarità del sistema Alml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2938 

271.7 Usare Textchk, Checkbot e Ispell con Alml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2939 

271.8 Espandere le potenzialità elaborative di TeX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2939 

272 Il documento secondo Alml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2946 

272.1 Organizzazione generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2946 

272.2 Dalla copertina all’indice generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2947 

272.3 Contenuto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2951 

272.4 Documento multilingua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2954 

272.5 Blocchi di testo ed elementi inseriti all’interno delle righe . . . . . . . . . . . . . . . . .2954 

272.6 Tracciamento di informazioni particolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2973 

272.7 Inserimento letterale di codice TeX e HTML, con eventuale inserimento 

condizionato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2976 

272.8 Definizione alternativa della suddivisione del documento . . . . . . . . . . . . . . . . . 2979 

272.9 Riferimento alla larghezza del testo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2980 

273 Entità ISO gestite da Alml . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2981 

274 Stile di scrittura del sorgente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2986 

274.1 Blocchi di testo e rientri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2986 

274.2 Figure e tabelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2988 

274.3 Sezioni marcate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2989 

2929

Alml: preparazione e visione generale 

Capitolo 271 

Alml 1 è il sistema di composizione SGML di questo documento, Appunti di informatica libera. 

Si tratta di un programma Perl, ‘alml’, che controlla l’analizzatore SGML e altri programmi 

necessari per arrivare alla composizione finale del documento. 2 

Alml, con il suo DTD, continuerà a evolversi assieme all’opera Appunti di informatica libera. 

Chi desidera utilizzare questo sistema di composizione deve tenere in considerazione tale dinamicità; 

pertanto, prima di passare a un eventuale aggiornamento, deve valutare l’opportunità 

del cambiamento. 

Alml si avvale di altri programmi per l’analisi SGML e per la generazione di alcuni formati 

finali. In particolare, è necessario disporre di ‘nsgmls’ che fa parte generalmente del pacchetto 

SP (anche se la propria distribuzione GNU/Linux potrebbe nominarlo in modo differente); inoltre 

è fondamentale la presenza di LaTeX per generare la composizione da stampa. La tabella 271.1 

riepiloga gli applicativi da cui dipende il buon funzionamento di Alml. 

Applicativo 

Perl 

Perl-gettext 

SP 

LaTeX 

PSUtils 

Dvipdfm 

Uuencode 

Tabella 271.1. Applicativi da cui dipende Alml. 

ImageMagick 

Ghostscript 

HTML2ps 

Links 

Compito 

Alml è scritto in Perl. 

Modulo Perl per l’utilizzo di Gettext. 

Verifica la validità SGML e genera una prima conversione. 

Compone in un formato finale per la stampa. 

Riorganizza, ingrandisce e riduce un file PostScript. 

Consente una conversione in PDF a partire dal file DVI. 

Estrae le immagini incorporate in file esterni. 

Converte i file delle immagini nei formati appropriati, 

adattando le dimensioni. 

Serve a ImageMagick per la conversione di file PostScript in 

altri formati. 

Consente l’importazione di codice HTML con LaTeX e con 

pdfLaTeX. 

Converte un file HTML in testo puro. 

271.1 Installazione di Alml 

Alml viene fornito solo attraverso archivi tradizionali di tipo tar+gzip, in file con nomi del tipo: 

alml-versione.tar.gz 

Estraendo il contenuto dell’archivio, si dovrebbero ottenere in particolare i file e le sottodirectory 

elencati nella tabella 271.2, che rappresentano l’essenziale. 

Tabella 271.2. Contenuto essenziale dell’archivio di distribuzione di Alml. 

File o directory 

man/ 

* 

doc/ 

* 

Descrizione 

Pagine di manuale relative agli eseguibili. 

Esempi e documentazione eventuale. 

1 Alml GNU GPL 

2 Questo capitolo e i successivi descrivono il sistema di composizione Alml. Tuttavia, per poter comprendere quanto 

esposto, è necessario prima conoscere ciò che è stato descritto a proposito dell’SGML, di TeX e dei sistemi comuni di 

composizione basati sull’SGML. 

2930

Alml: preparazione e visione generale 2931 

File o directory 

share/ 

* 

bin/ 

* 

etc/alml-tex.sty 

Descrizione 

File e directory da collocare in ‘/usr/share/alml/’. 

File eseguibili. 

File di configurazione da copiare nella directory ‘/etc/’. 

Gli eseguibili, che nel pacchetto di distribuzione si trovano nella directory ‘bin/’, devono essere 

raggiungibili attraverso il percorso di ricerca del sistema, rappresentato dalla variabile di ambiente 

‘PATH’. Pertanto vanno collocati opportunamente, oppure vanno predisposti dei collegamenti 

adeguati. 

Quanto contenuto nella directory ‘share/’, va collocato nella directory ‘/usr/share/alml/’, 

oppure vanno realizzati dei collegamenti equivalenti. 


I messaggi di Alml possono essere tradotti. Se si dispone del file PO relativo alla lingua preferita, 

è necessario compilarlo come nell’esempio seguente: 

$ msgfmt -vvvv -o alml.mo it.po 

In questo esempio, il file ‘it.po’ viene compilato generando il file ‘alml.mo’. Trattandosi evidentemente 

della traduzione italiana, questo file può essere collocato in ‘/usr/share/locale/ 

it/LC_MESSAGES/’, o in un’altra posizione analoga in base agli standard del proprio sistema 

operativo. 

Se non è disponibile il modulo Perl-gettext, 3 che serve a Alml per accedere alle traduzioni, 

è possibile eliminare il suo utilizzo e simulare la funzione di Gettext. In pratica si commentano 

le istruzioni seguenti all’inizio dei programmi ‘alml’, ‘alml-sp2sp’, ‘alml-sp2be’ e 

‘alml-extra’: 

# We *don’t* want to use gettext. 

#use POSIX; 

#use Locale::gettext; 

#setlocale (LC_MESSAGES, ""); 

#textdomain ("alml"); 

Inoltre, si tolgono i commenti dalla dichiarazione della funzione fittizia ‘gettext()’, come si 

vede qui: 

sub gettext 

{ 

return $_[0]; 

} 

271.2 Esempio iniziale 

Un esempio iniziale può servire per comprendere il funzionamento generale di Alml. 

 

 

 

 

Un esempio per l’utilizzo del sistema Alml 

3 Nelle distribuzioni Debian si tratta del pacchetto ‘liblocale-gettext-perl’.

2932 Alml: preparazione e visione generale 

SGML, XML, HTML, Alml 

 

Esempio di utilizzo di Alml 

Pinco Pallino <pinco.pallino@brot.dg> 

2011.11.11 

 

Copyright © Pinco Pallino, <pinco.pallino@brot.dg> 

Permission is granted to copy, distribute and/or modify this 

document under the terms of the GNU Free Documentation License, 

Version 1.1 or any later version published by the Free Software 

Foundation; with no Invariant Sections, with no Front-Cover 

Texts, and with no Back-Cover Texts. A copy of the license is 

included in the section entitled "GNU Free Documentation 

License". 

 

Indice generale 

 

 

 

Introduzione al documento 

 

Questo documento è scritto per... bla bla bla bla bla bla bla bla bla 

bla bla bla bla bla bla bla bla bla bla bla bla bla... 

Bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla bla 

bla bla bla bla bla... 

 

 

 

Lavorando con bla bla bla... 

lavorare con bla bla 

bla bla 

 

Lavorare con bla bla è molto semplice... bla bla bla bla bla bla bla 

bla bla bla bla bla bla... 



 

Fare di meglio 

 

C’è anche un modo migliore per... bla bla bla bla bla bla bla bla bla 




 

Non dover lavorare più 

relaxing 

 

Se non si lavora ci si può riposare, ma questo si può fare solo se si 

dispone già di una certa disponibilità economica... bla bla bla bla bla 

bla bla bla bla bla bla bla bla bla bla... 




 

 

Alcune note 

 





 

 

 

Index 

 

 

 

 

Se tutto viene copiato correttamente nel file ipotetico ‘esempio.sgml’, con il comando seguente 

si ottiene la composizione in PostScript, attraverso LaTeX e Dvips: 

$ alml --ps esempio.sgml 

Con il comando seguente, si ottiene la composizione in HTML, su più file distinti: 

$ alml --html esempio.sgml 

271.3 Cosa si genera con la composizione 

L’utilizzo di Alml può generare file differenti a seconda del tipo di operazione che viene richiesta. 

La tabella 271.3 riepiloga questi file. 

Tabella 271.3. File generati dall’utilizzo di Alml. I file ‘nome .sgml’ e ‘nome .css’ devono 

essere già presenti. 

File 

nome .sgml 

nome .css 

nome .X2V.ps 

nome .X3V.ps 

nome .X3H.ps 

nome .X4H.ps 

nome .X1T.ps 

nome .aux 

nome .diag 

nome .pageref 

nome .dvi 

nome .log 

nome .pdf 

nome .ps 

nome .tex 

nome .html 

nomen .html 

n.jpg 

Descrizione 

Il sorgente SGML principale da cui hanno origine gli altri file. 

Foglio di stile CSS necessario per la composizione HTML. 

Composizione in PostScript con l’opzione ‘--long’. 

Composizione in PostScript con l’opzione ‘--extralong’. 

Composizione in PostScript con l’opzione ‘--large’. 

Composizione in PostScript con l’opzione ‘--extralarge’. 

Composizione in PostScript con l’opzione ‘--thin’. 

File ausiliario e temporaneo della composizione attraverso 

LaTeX. 

File diagnostico generato da ‘alml’. 

File temporaneo con i riferimenti alle pagine nella composizione 

con LaTeX. 

Composizione in DVI, finale o transitoria. 

File diagnostico generato da LaTeX. 

Composizione in PDF. 

Composizione in PostScript. 

Composizione transitoria in formato LaTeX. 

Primo file della composizione in HTML. 

n-esimo file della composizione in HTML. 

n-esimo file delle immagini relativo alla composizione in 

HTML.


File 

Descrizione 

n.ps 

n-esimo file delle immagini relativo alla composizione in 

PostScript. 

* ~ File temporaneo non meglio precisato. 

È bene sottolineare che i file indicati come ‘nome .sgml’ e ‘nome .css’ devono essere già presenti 

perché si possa usare Alml; inoltre, il sorgente SGML principale potrebbe a sua volta incorporare 

altri file SGML. 

Se il sorgente SGML fa riferimento a immagini collocate in file esterni, è necessario che queste 

siano in formato PNG. 4 In generale, conviene prevedere una directory apposita per questi file, 

in modo da non essere intralciati quando la composizione in HTML, o in PostScript, genera la 

copia delle immagini richieste nella directory corrente, utilizzano i nomi nella forma ‘n.jpg’ o 

‘n.ps’. 

Alle volte si possono incontrare problemi inspiegabili nell’inserimento di immagini, che si 

possono manifestare nelle conversioni o l’inserimento nella composizione in PDF. Spesso si 

superano questi problemi usando ImageMagick e facendo un passaggio intermedio nel formato 

JPG. Per esempio, disponendo del file ‘pippo.png’ che risulta corretto e perfettamente 

visibile con gli strumenti normali, ma che si comporta in modo strano nella composizione 

PDF, può convenire il passaggio seguente: 

$ convert pippo.png pippo.jpg 

$ convert pippo.jpg pippo.png 

Al termine, il file ‘pippo.jpg’ può essere eliminato. 

271.4 Sintassi nell’uso del programma frontale 

Il programma frontale attraverso cui si gestisce il sistema di composizione Alml è ‘alml’: 

alml opzioni sorgente_sgml 

alml --help 

alml --version 

Come si vede dal modello sintattico, a parte i casi delle opzioni ‘--help’ e ‘--version’, è 

sempre richiesta l’indicazione di un file sorgente SGML, a cui applicare un qualche tipo di 

elaborazione. 

Opzioni 

--help 

Mostra la guida rapida interna e conclude il funzionamento. 

--version 

Mostra le informazioni sulla versione e conclude il funzionamento. 

--paper={a4|letter} 

Permette di specificare le dimensioni della carta in base a un nome standard. Il formato 

predefinito è A4, che corrispondente alla parola chiave ‘a4’. 

4 A seconda del tipo di composizione finale, può darsi che sia necessario convertire le immagini in un altro formato. 

In questi casi, viene usato ImageMagick per generare automaticamente ciò che serve. Per la precisione, il formato PNG 

di partenza è ciò che serve per la composizione in PDF; per la composizione in PostScript servono immagini EPS; per la 

composizione HTML vengono generati file in formato JPG.


--paper-orientation={normal|inverted} 

Permette di specificare l’orientamento della carta. Si osservi che non vengono usate le 

definizioni tipiche, corrispondenti a portrait e landscape, perché qui il contesto è un po’ 

diverso. A ogni modo, se si seleziona il formato di carta A4 e poi si aggiunge l’opzione 

‘--paper-orientation=inverted’, si intende arrivare a una composizione in 

orizzontale. 

--draft 

Quando il contesto lo permette, serve per ottenere una composizione particolare, con più 

informazioni utili alla correzione o alla revisione del testo. A differenza di quanto si potrebbe 

essere portati a pensare, in questo modo l’elaborazione è più complessa del normale, 

proprio per portare in risalto tali informazioni. 

--compact 

Quando il contesto lo permette, serve per ottenere una composizione compatta, 

risparmiando spazio. 

--long 

Quando si usa in abbinamento all’opzione ‘--ps’, cioè quando si vuole ottenere un risultato 

in formato PostScript, permette di ottenere una composizione speciale, a due colonne con 

il testo ridotto della metà. Di solito si abbina a questa anche l’opzione ‘--compact’. 

Le opzioni ‘--long’, ‘--extralong’, ‘--large’, ‘--extralarge’ e ‘--thin’, sono 

delle estensioni al formato selezionato con ‘--paper’, che possono essere disponibili 

solo con pochi formati di partenza. Oltre a questo, va considerato il fatto che si possono 

utilizzare solo quando l’orientamento richiesto è di tipo «normale», tenendo conto che il 

risultato finale potrebbe essere orizzontale o verticale, in base al tipo di estensione. 

--extralong 

Come ‘--long’, su tre colonne verticali, molto rimpicciolite. 

--large 

Come ‘--long’, su tre colonne in orizzontale. 

--extralarge 

Come ‘--large’, su quattro colonne in orizzontale, molto rimpicciolite. 

--thin 

Un formato ridotto che si traduce in pratica in un A7x4, ovvero mezzo A4 diviso in 

verticale. 

--clean 

Rimuove alcuni file temporanei abbinati al file sorgente indicato. Si tratta per la precisione 

di ‘nome .pageref’, ‘nome .diag’, ‘nome .aux’ e ‘nome .log’. 

--verbose 

Segnala il procedere dell’elaborazione con informazioni dettagliate. In generale tali informazioni 

sono ottenibili dal file ‘nome .diag’; tuttavia, in presenza di file sorgenti di grandi 

dimensioni, può servire per sapere a che punto è l’elaborazione. 

--sgml-include=entità_parametrica 

Attraverso questa opzione, che può essere usata anche più volte, è possibile «includere» delle 

entità parametriche. Per la precisione, è come se nel sorgente venisse dichiarata un’entità 

parametrica corrispondente, assegnandole la parola chiave ‘INCLUDE’. Ciò viene usato per 

controllare l’inclusione di porzioni di sorgente, secondo le convenzioni dell’SGML.


--page-numbering={plain|default} 

Questa opzione permette di definire in che modo gestire la numerazione delle pagine nei 

formati di composizione cartacei. In condizioni normali, la numerazione è realizzata attraverso 

sequenze differenti: una per la parte iniziale fino alla fine dell’introduzione, una per 

il corpo (comprese le appendici) e una finale per gli indici analitici. Assegnando la parola 

chiave ‘plain’ si fa in modo che la numerazione sia unica, cosa che potrebbe essere 

conveniente per il formato PDF. 

--sgml-syntax | --sgml-check 

Una qualunque di queste due opzioni permette di ottenere la verifica formale del sorgente, 

in base al DTD. 

--sp 

Con questa opzione si vuole raggiungere solo un formato intermedio per il controllo 

diagnostico del funzionamento di Alml. 

--tex | --latex 

Con questa opzione si vuole raggiungere solo un formato intermedio in LaTeX per il 

controllo diagnostico del funzionamento di Alml. 

--dvi 

Genera un risultato in formato DVI. L’elaborazione crea una serie di file EPS per le 

immagini, secondo il modello ‘n.ps’. 

--ps | --postscript 

Genera un risultato in formato PostScript. L’elaborazione crea una serie di file EPS per le 

immagini, secondo il modello ‘n.ps’; una volta ottenuto il file PostScript finale, questi file 

non servono più. 

--pdf 

Genera un risultato in formato PDF. 

--html 

Genera un risultato in formato HTML, articolato in più file, dove il primo è ‘nome .html’ e 

gli altri sono ‘nomen .html’. Inoltre, viene fatta una copia dei file delle immagini, secondo 

il modello ‘n.jpg’ (le due numerazioni sono indipendenti). 

--html-text 

Genera un risultato in formato HTML speciale, in un file unico, senza riferimenti a immagini 

esterne e con tabelle testuali. Il file ottenuto può essere consultato con Links e con 

questo può essere convertito in un testo puro e semplice, attraverso il comando: 

links -dump nome .html > nome .txt 

--html-check | --html401-check 

Se sono stati installati i file necessari, consente la verifica formale di un file HTML secondo 

le specifiche della versione 4.01. 

--html320-check 

Se sono stati installati i file necessari, consente la verifica formale di un file HTML secondo 

le specifiche della versione 3.2. 

--xml 

Se sono stati installati i file necessari, consente la verifica formale di un file XML secondo 

le specifiche del DTD relativo (attualmente solo XHTML).


271.5 Organizzare un file-make 

Un file-make opportuno può facilitare l’uso di Alml. Viene proposto un esempio elementare, 

riferito al file ‘example.sgml’, in cui si può vedere anche l’utilizzo proposto di ‘alml’. 

# file name prefix. 

DOC_PREFIX=example 

# Notice that "text" generates an HTML file with the same name 

# for the first HTML page. This is why it is before the standard 

# HTML typesetting. 

# 

all: \ 

clean \ 

text \ 

html \ 

ps \ 

longps \ 

extralongps \ 

largeps \ 

extralargeps \ 

pdf 

clean: 

check: 

dvi: 

ps: 

longps: 

@echo "Cleaning..." ; \ 

find . -name core -exec rm -f \{\} \; ; \ 

rm -f $(DOC_PREFIX)*.tex ; \ 

rm -f $(DOC_PREFIX)*.dvi ; \ 

rm -f $(DOC_PREFIX)*.sp ; \ 

rm -f $(DOC_PREFIX)*.sp2 ; \ 

rm -f $(DOC_PREFIX)*.ps ; \ 

rm -f $(DOC_PREFIX)*.pdf ; \ 

rm -f $(DOC_PREFIX)*.txt ; \ 

rm -f $(DOC_PREFIX)*.log ; \ 

rm -f $(DOC_PREFIX)*.aux ; \ 

rm -f $(DOC_PREFIX)*.tmp ; \ 

rm -f $(DOC_PREFIX)*.diag ; \ 

rm -f $(DOC_PREFIX)*.pageref ; \ 

rm -f $(DOC_PREFIX)*.pageloc ; \ 

rm -f *.html ; \ 

rm -f *.bak ; \ 

rm -f *.jpg ; \ 

rm -f *.ps ; \ 

rm -f *\~ 

@alml --sgml-check \ 

--verbose \ 

$(DOC_PREFIX).sgml 

@alml --dvi \ 

--verbose \ 


@alml --ps \ 

--verbose \ 


@alml --ps \ 

--verbose \ 

--compact \


--long \ 

--page-numbering=plain \ 


extralongps: 

@alml --ps \ 

--verbose \ 

--compact \ 

--extralong \ 



largeps: 

@alml --ps \ 

--verbose \ 

--compact \ 

--large \ 



extralargeps: 

@alml --ps \ 

--verbose \ 

--compact \ 

--extralarge \ 



pdf: 

html: 

text: 

@alml --pdf \ 

--verbose \ 



@alml --html \ 

--verbose \ 


@alml --html-text \ 

--verbose \ 

$(DOC_PREFIX).sgml ; \ 

links -dump \ 

$(DOC_PREFIX).html \ 

> $(DOC_PREFIX).txt 

Si può osservare in particolare l’obiettivo ‘clean’ che elimina tutti i file non indispensabili e in 

particolare tutti i file il cui nome termina per ‘.html’ e per ‘.ps’. 

Se per esempio si utilizza il comando ‘make ps’, si otterrà la composizione in PostScript, 

generando in particolare il file ‘example.ps’. 

271.6 Particolarità del sistema Alml 

Recentemente, Alml è stato modificato e alcune sue funzionalità particolari, non sono più 

disponibili. 

Non esiste più la gestione delle derivazioni, pertanto, non si possono più usare strutture come 

quelle seguenti:


 

... 

... 

 

Gli elementi ‘verbatimpre’, ‘asciiart’ e ‘uri’, vanno usati assieme a una sezione marcata 

di tipo CDATA: 

 

 

 

 

 

 

 

271.7 Usare Textchk, Checkbot e Ispell con Alml 

Textchk e Checkbot, descritti rispettivamente nel capitolo 270 e nella sezione 259.5, possono 

essere usati facilmente con Alml. In generale, si passa per una composizione in formato 

HTML singolo, quindi si utilizzano questi programmi. Supponendo di avere generato il file 

‘mio_file.html’: 

$ textchk --input-type=html mio_file.html mio_file.tchk mio_file.tdiag 

$ checkbot --url file://‘pwd‘/mio_file.html 

Per usare Ispell, è conveniente generare prima una versione del documento in formato testo puro. 

Per questo si potrebbe usare Lynx o Links, ma all’interno del pacchetto di Alml è disponibile un 

programma di supporto speciale, in grado di convertire opportunamente un file HTML per questo 

scopo. Si tratta di ‘alml-extra’ che va usato con l’opzione ‘--html-to-text-for-spell’: 

alml-extra --html-to-text-for-spell < file_html 

> file_testo_non_formattato 

In particolare, per evitare problemi con Ispell, nel file che si ottiene sono eliminate la barre 

oblique inverse (‘\’). 

Naturalmente, usando poi Ispell nel file generato in questo modo, non ha senso fare delle 

correzioni, che invece vanno applicate al sorgente originale, in modo manuale. 

271.8 Espandere le potenzialità elaborative di TeX 

Il file LaTeX generato da Alml tende a richiedere risorse impreviste a TeX. È molto probabile che 

per documenti di dimensioni medie, sia necessario espandere i limiti posti dalla configurazione 

di TeX. 

In generale, si dovrebbe disporre di una distribuzione teTeX, per la quale si interviene nel 

file ‘texmf/web2c/texmf.cnf’ (eventualmente potrebbe trattarsi meglio di ‘/etc/texmf/ 

texmf.cnf’, o simile).


Per la composizione di Appunti di informatica libera si è resa necessaria la modifica di alcune 

variabili; quello che si vede sotto sono i valori minimi da assegnare alle variabili rispettive: 

main_memory = 2000000 

font_mem_size = 800000 

pool_size = 250000 

hash_extra = 10000 

buf_size = 100000 

save_size = 40000 

Si può tenere in considerazione l’abbinamento seguente, tra il rapporto generato da TeX e il file 

di configurazione ‘texmf.cnf’, tenendo conto che in situazioni particolari il programma può 

segnalare la mancanza di una risorsa differente da quelle comuni: 

Here is how much of TeX’s memory you used: 

• 42853 strings out of 55918 

Dipende dalla variabile ‘max_string’. In questo caso gli era stato assegnato il valore 

60000. 

• 510063 string characters out of 647843 

Dipende dalla variabile ‘pool_size’. In questo caso gli era stato assegnato il valore 

700000. 

• 200381 words of memory out of 1000001 

Dipende dalla variabile ‘main_memory’. In questo caso gli era stato assegnato il valore 

1000000. 

• 44744 multiletter control sequences out of 10000+40000 

Il valore finale che si somma a 10000, dipende dalla variabile ‘hash_extra’, a cui era 

stato assegnato il valore 40000. 

• 221835 words of font info for 188 fonts, out of 400000 for 1000 

I due valori finali dipendono rispettivamente da ‘font_mem_size’ e da ‘font_max’. 

• 14 hyphenation exceptions out of 1000 

Dipende dalla variabile ‘hiph_size’ a cui corrisponde esattamente il valore finale. 

Al termine delle modifiche a questo file, occorre ricordare di lanciare il comando 

‘texconfig init’, con i privilegi dell’utente ‘root’: 5 

# texconfig init 

Nel caso particolare della distribuzione Debian, il file di configurazione ‘/etc/texmf/ 

texmf.cnf’ è ottenuto attraverso la fusione di file differenti, contenuti nella directory ‘/etc/ 

texmf/texmf.d/’. In tal caso, per modificare le voci descritte in precedenza, occorre intervenire 

probabilmente nel file ‘/etc/texmf/texmf.d/95NonPath’; successivamente occorre 

eseguire il comando ‘update-texmf’, il quale ricostruisce un file ‘/etc/texmf/texmf.cnf’ 

nuovo; infine si deve eseguire ‘texconfig init’. 

271.8.1 Limiti strutturali di TeX 

Le distribuzioni normali di TeX potrebbero non essere in grado di gestire un gran numero di 

comandi ‘\label’, anche se si tenta di intervenire nella configurazione. Questo si traduce in 

pratica in un limite insuperabile per ciò che nella configurazione viene mostrato come la variabile 

‘save_size’. 

5 Non tutte le modifiche che si apportano a questo file richiedono l’esecuzione di ‘texconfig init’; tuttavia è 

meglio ripeterlo, anche per quelle situazioni in cui non serve.


I comandi ‘\label’ generano delle annotazioni in un file con estensione ‘.aux’, simili 

all’esempio seguente: 

\newlabel{anchor7}{{}{25}} 

In questo caso si afferma che l’etichetta ‘anchor7’ corrisponde alla pagina 25. 

Generalmente, la composizione con i programmi ‘ tex’ 

* 

viene ripetuta per tre volte, allo scopo 

di acquisire le informazioni contenute in questo file: la prima volta viene costruito da zero, la 

seconda volta il testo viene reimpaginato utilizzando queste informazioni, rigenerandole nuovamente; 

infine, la terza volta non ci dovrebbero essere ulteriori spostamenti nell’impaginazione 

e il procedimento termina. Pertanto, la seconda e la terza volta viene letto il file con estensione 

‘.aux’. 

Sia i comandi ‘\label’, sia i comandi ‘\newlabel’ contenuti nel file ausiliario che viene incluso 

automaticamente, vanno a ridurre la memoria definita dalla variabile ‘save_size’. Così succede 

normalmente che si riesca a completare la prima elaborazione del file, mentre nella successiva, 

caricando anche il file ausiliario la memoria non basta più. La segnalazione di errore tipica è la 

seguente: 

! TeX capacity exceeded, sorry [save size=40000]. 

Di fatto, questa variabile non può superare il valore 65535, anche se si tenta di modificare i 

sorgenti di teTeX intervenendo nel file ‘texk/web2c/tex.ch’. Dovrebbe esserci una riga simile 

a quella seguente: 

@!inf_save_size = 600; 

@!sup_save_size = 40000; 

Si può anche provare, aumentando il valore assegnato a ‘sup_save_size’, per esempio come 

nel caso seguente, ma in pratica, il limite massimo che si riesce a raggiungere resta quello di 

65535: 6 

@!inf_save_size = 600; 

@!sup_save_size = 100000; 

271.8.2 Soluzione attuata da Alml 

Alml è un sistema di composizione pensato per la realizzazione di opere molto grandi, con indici 

generali e analitici gestiti autonomamente. In questo modo, la composizione tradizionale attraverso 

TeX genererebbe un file ‘.aux’ con una quantità di voci molto grande. Per evitare di saturare 

il limite di TeX, questi riferimenti vengono inseriti in un altro file, con estensione ‘.pageref’ e 

gestiti esternamente a TeX. 

In breve, Alml gestisce le cose nel modo seguente. 

1. Viene creato un file TeX in cui le etichette (le ancore) usano il comando ‘\AlmlLabel’ 

\AlmlLabel{etichetta} 

e i riferimenti alle pagine si fanno con comandi del tipo 

\AlmlPageRef{0}{000}{etichetta} 

2. Viene avviato TeX che elabora il file e genera un file ‘.pageref’ in base ai comandi 

‘\AlmlLabel’. 

6 Il limite strutturale sembra dipendere da un’organizzazione del programma pensata per l’elaborazione su architetture 

a 16 bit.


3. Viene letto il file ‘.pageref’ e con quelle informazioni, il file TeX viene modificato 

intervenendo sui riferimenti alle pagine, che diventano: 

\AlmlPageRef{1}{pagina}{etichetta} 

4. Si riavvia TeX che genera un nuovo file ‘.pageref’. 

5. Viene letto il file ‘.pageref’ e con quelle informazioni, il file TeX viene modificato 

intervenendo sui riferimenti alle pagine, che diventano: 

\AlmlPageRef{2}{pagina}{etichetta} 

6. Si riavvia TeX per l’ultima volta. 

271.8.3 Suddivisione automatica in tomi e parti della composizione 

finale PostScript 

Per facilitare la suddivisione della composizione PostScript in file contenenti solo un tomo o solo 

una parte, vengono inserite nel sorgente TeX delle istruzioni per creare un file con estensione 

‘.pageloc’, contenente le informazioni necessarie: 

BOF 

tome{1}pageoffset{12}relativepage{1} 

part{1}pageoffset{12}relativepage{7} 













tome{2}pageoffset{12}relativepage{541} 


eof{}pageoffset{12}relativepage{552} 

EOF 

Il significato dovrebbe essere intuitivo. Per esempio, il primo tomo inizia dalla 13-esima pagina 

(ottenuta sommando 12 a 1) e termina all’inizio del tomo successivo, ovvero alla 552-esima 

pagina (541+12-1). L’ultima pagina è la 564-esima. 

In questo esempio, il valore 12 ricorrente rappresenta le pagine che precedono il contenuto vero 

e proprio del documento, in cui ci possono essere indici generali e introduzioni. Questo valore, 

definito qui come page offset, viene semplicemente sommato a quello finale. 

271.8.4 Programma di supporto 

Alml dispone di un programma di supporto, costituito dall’eseguibile ‘alml-extra’, che consente 

di facilitare lo svolgimento di funzioni accessorie, in particolare per la riorganizzazione dei 

file PostScript. 

alml-extra opzione [argomento] 

A seconda dell’opzione utilizzata, può essere richiesto un argomento o meno, che fa riferimento 

a un file.


Dal momento che le opzioni che riguardano la conversione di file PostScript sono piuttosto 

difficili da ricordare, è disponibile anche uno script molto semplice che ne facilita l’uso: 

alml-extra-menu file_ps 

Le opzioni che vengono descritte nel seguito si riferiscono a ‘alml-extra’, usato direttamente. 

Opzioni 

--help 

Mostra la guida rapida interna e conclude il funzionamento. 

--version 

Mostra le informazioni sulla versione e conclude il funzionamento. 

--ps-group-pages=n_pagine 

Prevede che l’argomento finale sia un file PostScript, in cui vengono modificate le stringhe 

di definizione delle pagine, in modo che si possano individuare raggruppamenti di n pagine, 

di solito per facilitare la rilegatura. In pratica, in questo modo, si individuano più facilmente 

le pagine che compongono una segnatura. 

--ps-renumber-pages 

Prevede che l’argomento finale sia un file PostScript, in cui vengono modificate le stringhe 

di definizione delle pagine, in modo che la sequenza sia rinumerata a partire da uno. 

--alml-ps-split-tome=file_posizione_pagine 

Prevede che l’argomento finale sia un file PostScript, generato attraverso Alml, per il quale 

sia disponibile un file contenente la posizione di inizio dei vari tomi (dovrebbe trattarsi di 

un file con estensione ‘.pageloc’), che va indicato come argomento dell’opzione stessa. 

Quello che si ottiene sono diversi file PostScript, con estensione ‘.n.ps’, dove in particolare 

‘.0.ps’ contiene le pagine precedenti al primo tomo effettivo, con la presenza eventuale 

di file con estensione ‘.app.ps’ e ‘ndx.ps’, per le pagine delle appendici e degli indici 

analitici rispettivamente. 

--alml-ps-split-part=file_posizione_pagine 

Prevede che l’argomento finale sia un file PostScript, generato attraverso Alml, per il quale 

sia disponibile un file contenente la posizione di inizio dei vari tomi (dovrebbe trattarsi di 

un file con estensione ‘.pageloc’), che va indicato come argomento dell’opzione stessa. 

Quello che si ottiene sono diversi file PostScript, con estensione ‘.n.ps’, dove in particolare 

‘.0.ps’ contiene le pagine precedenti alla prima parte effettiva, con la presenza 

eventuale di file con estensione ‘.app.ps’ e ‘ndx.ps’, per le pagine delle appendici e 

degli indici analitici rispettivamente. 

Se il documento che si va a suddividere prevede una suddivisione in tomi, la scomposizione 

che si ottiene non è perfetta, perché la fine di una parte che precede un tomo, si trova a 

includere le pagine che rappresentano l’inizio del tomo stesso, fino alla pagina che precede 

la parte successiva. 

--html-index=directory 

Genera, attraverso lo standard output, un file HTML che potrebbe essere utilizzato come 

file ‘index.html’, contenente un elenco molto semplice dei file contenuti nella directory 

indicata. 

--html-index-basic=directory 

Come ‘--html-index’, senza mostrare le date dei file. 

--html-index-basic-recursive


Genera una serie di file ‘index.html’, a partire dalla directory corrente e in tutte le 

sottodirectory. 

--html-to-text-for-spell 

Legge lo standard input, che dovrebbe essere costituito da un file HTML, filtrandolo allo 

scopo di generare un file di testo puro, utilizzabile per un controllo ortografico di qualche 

tipo. Il file che si ottiene viene emesso attraverso lo standard output. 

--perl-to-gettext 

Legge lo standard input, che dovrebbe essere costituito da un file sorgente Perl, filtrandolo 

allo scopo di generare un file di testo, adatto all’analisi da parte di Gettext, che solitamente 

riconosce bene solo le stringhe del linguaggio C. Il file che si ottiene viene emesso 

attraverso lo standard output. 

--a4-to-a5-2-a4 

Prevede che l’argomento finale sia un file PostScript, in formato A4, che viene rielaborato 

in modo da ottenere due pagine A5 per ogni pagina A4 finale. 

Si ottiene un file con estensione ‘.a5-2-a4.ps’. 

--a4-to-a6-4-a4 


in modo da ottenere quattro pagine A6 per ogni pagina A4 finale. 

Si ottiene un file con estensione ‘.a6-4-a4.ps’. 

--a4-to-a5-2-a4-1h-1 


in modo da ottenere due pagine A5 per ogni pagina A4 finale, che deve essere piegata a 

metà, in orizzontale, rilegando il tutto a segnature di un solo foglio. 

Si ottiene un file con estensione ‘.a5-2-a4-1h-1.ps’. 

--a4-to-a5-2-a4-1h-10 


in modo da ottenere due pagine A5 per ogni pagina A4 finale, che deve essere piegata a 

metà, in orizzontale, rilegando il tutto a segnature di 10 fogli. 


--a4-to-a6-4-a4-2h-2 


in modo da ottenere quattro pagine A6 per ogni pagina A4 finale, che deve essere piegata 

a metà, in orizzontale, per due volte, rilegando il tutto a segnature di due fogli. In pratica, 

ogni segnatura si ottiene da un solo foglio A4 che viene piegato due volte. 


--a4-to-a6-4-a4-2h-4 


in modo da ottenere quattro pagine A6 per ogni pagina A4 finale, che deve essere piegata a 

metà, in orizzontale, per due volte, rilegando il tutto a segnature di quattro fogli. In pratica, 

ogni segnatura si ottiene da due fogli A4 che vengono piegati assieme per due volte. 


--a4-to-a6-4-a4-2h-6 



a metà, in orizzontale, per due volte, rilegando il tutto a segnature di sei fogli. In pratica, 

ogni segnatura si ottiene da tre fogli A4 che vengono piegati assieme per due volte.



--a4-to-a6-4-a4-2h-8 



a metà, in orizzontale, per due volte, rilegando il tutto a segnature di otto fogli. In pratica, 

ogni segnatura si ottiene da quattro fogli A4 che vengono piegati assieme per due volte. 


--a4-to-a6-4-a4-2h-10 



metà, in orizzontale, per due volte, rilegando il tutto a segnature di 10 fogli. In pratica, ogni 

segnatura si ottiene da cinque fogli A4 che vengono piegati assieme per due volte. 


--a4-to-a6-4-a4-1v-1 



metà, in verticale, rilegando il tutto a segnature di un foglio. 

Si ottiene un file con estensione ‘.a6-4-a4-1v-1.ps’. 

--a7x4-to-a7x4-2-a4-1v-1 

Prevede che l’argomento finale sia un file PostScript, in formato A7x4, che viene rielaborato 

in modo da ottenere due pagine A7x4 per ogni pagina A4 finale, che deve essere piegata a 

metà, in verticale, rilegando il tutto a segnature di un foglio. 

Si ottiene un file con estensione ‘.a7x4-2-a4-1v-1.ps’. 

--a7x4-to-a7x4-2-a4-1v-10 

Prevede che l’argomento finale sia un file PostScript, in formato A7x4, che viene rielaborato 

in modo da ottenere due pagine A7x4 per ogni pagina A4 finale, che deve essere piegata a 

metà, in verticale, rilegando il tutto a segnature di 10 fogli. 

Si ottiene un file con estensione ‘.a7x4-2-a4-1v-10.ps’. 


Il documento secondo Alml 

Capitolo 272 

Il DTD di Alml è organizzato per gestire documenti molto grandi, che possono essere suddivisi 

in tomi (intesi come volumi che raccolgono un gruppo di parti), parti e capitoli. Tuttavia, la 

suddivisione in tomi o in parti resta facoltativa, mentre la divisione in capitoli è obbligatoria. 

Alml non ha ancora raggiunto una sistemazione «definitiva» e si evolverà ancora assieme a Appunti 

di informatica libera. In questo capitolo non sono descritti tutti i dettagli sull’impostazione 

attuale del DTD di Alml; eventualmente si può sempre studiare il DTD stesso. Tuttavia, il DTD 

non rappresenta in modo perfetto i vincoli che si pongono poi nella composizione. 

Quando devono essere indicate delle dimensioni che prevedono la specificazione dell’unità di 

misura, si usano le sigle elencate nella tabella 272.1. 

Tabella 272.1. Sigle delle unità di misura utilizzabili con Alml. 

Sigla 

pt 

bp 

pc 

in 

cm 

mm 

Unità di misura corrispondente 

Punti tipografici corrispondenti a 1/72,27 di pollice. 

Punti tipografici corrispondenti a 1/72 di pollice. 

Pica corrispondenti a 1/6 di pollice. 

Pollici. 

Centimetri. 

Millimetri. 

272.1 Organizzazione generale 

Secondo il DTD di Alml, il documento ha una struttura generale ben definita: 

 

 

 

... 

 

[ 

... 

] 

 

... 

 

[ 

... 

] 

[ 

... 

] 

 

In questa struttura, gli elementi ‘head’ e ‘body’ sono obbligatori, mentre gli altri possono essere 

omessi, se non sono richiesti. 

Si può intuire il senso della cosa: l’elemento ‘head’ serve a contenere informazioni amministrative, 

oltre a ciò che deve apparire nelle primissime pagine (il titolo dell’opera, il copyright 

ecc.); l’elemento ‘intro’ permette di inserire dei capitoli speciali da trattare come introduzioni 

o prefazioni, che come tali non risultano numerate; l’elemento ‘body’ permette di inserire capitoli, 

oppure parti, o tomi; l’elemento ‘appendix’ permette di inserire capitoli da trattare come 

appendici, numerate convenzionalmente in modo letterale; infine, l’elemento ‘index’ permette 

di inserire capitoli speciali per l’inclusione degli indici analitici. 

2946

Il documento secondo Alml 2947 

272.2 Dalla copertina all’indice generale 

L’elemento che delimita il documento nella sua interezza, ‘alml’, può contenere due attributi 

facoltativi: ‘lang’ e ‘spacing’. L’attributo ‘lang’ permette di definire il linguaggio generale 

con cui è stato scritto il documento, attraverso una sigla secondo lo standard ISO 639 (sezione 

543). 1 

L’attributo ‘spacing’ permette di definire il modo in cui vengono gestiti gli spazi alla fine dei 

periodi. Assegnando la parola chiave ‘normal’, si ottiene la spaziatura normale della convenzione 

inglese, in cui lo spazio dopo un punto ha una lunghezza maggiore degli altri; in alternativa, 

assegnando la parola chiave ‘uniform’, oppure ‘french’, si ottiene una spaziatura uniforme, 

come richiede la tradizione tipografica italiana e anche di altri paesi. 

In generale, un documento scritto in lingua italiana dovrebbe utilizzare l’elemento ‘alml’ in 

questo modo: 

 

Tabella 272.2. Elementi SGML dalla copertina all’indice generale. 


Chiusu- 

attributo 


alml Sì Sì Contenitore del documento. 

lang -- -- Attributo Sigla ISO 639 del linguaggio. 

spacing -- -- Attributo ‘normal’, ‘french’ e ‘uniform’. 

head Sì Sì Intestazione del documento. 

admin Sì Sì Informazioni amministrative. 

description 

Descrizione in breve del documento. 

Sì Sì 

keywords Sì Sì Elenco di parole chiave. 

Contenuto di un elemento HTML 

htmlmeta Sì Sì 

‘META’. 

name -- -- Attributo Equivalente all’HTML. 

lang -- -- Attributo Equivalente all’HTML. 

chapterdefinitiolo. 

Definizione alternativa del capito- 

Sì Sì 

partdefinition Sì Sì Definizione alternativa della parte. 

tomedefinition Sì Sì Definizione alternativa del tomo. 

printedfontsize Sì Sì Corpo del carattere in punti. 


Definisce il contesto a cui si fa 

riferimento. 

printedpagesize Sì Sì Margini e giustezza. 


Definisce il contesto a cui si fa 

riferimento. 

title Sì Sì %inline; Titolo del documento. 

subtitle Sì Sì %inline; Sottotitolo. 

author Sì Sì %inline; Autore. 

date Sì Sì #PCDATA Data. 

edition Sì Sì %inline; Edizione, se diversa dalla data. 

version Sì Sì %inline; Versione, se diversa dall’edizione. 

frontcovertop Sì Sì %block; Blocco che precede il titolo. 

abstract Sì Sì %block; Descrizione del contenuto. 

frontcoverbottom Sì Sì %block; Testo aggiuntivo di copertina, dopo 

il titolo e le altre indicazioni 

standard. 

backcover Sì Sì %block; Contenuto della copertina finale. 

textbeforelegal Sì Sì %block; 

Testo prima delle informazioni 

legali. 

1 Quando le informazioni su un certo linguaggio non sono disponibili, si applicano le convenzioni inglesi.

2948 Il documento secondo Alml 


Chiusu- 

attributo 


legal Sì Sì %block; Informazioni legali. 

dedications Sì Sì %block; Pagina della dedica. 

textafterdedications 

Sì Sì %block; Testo successivo alla dedica. 

maincontents Sì Vuoto Inserimento dell’indice generale. 

levels -- -- Attributo Livelli di dettaglio dell’indice. 

nopages -- -- Attributo ‘true’, ‘false’. 

La tabella 272.2 mostra in breve l’elenco degli elementi che riguardano l’intestazione del documento; 

cosa che contiene tutte le informazioni per realizzare la copertina, fino ad arrivare 

all’indice generale. 

Si può osservare che tutto è contenuto nell’elemento ‘head’, all’inizio del quale prende posto 

un altro «contenitore» denominato ‘admin’. Al suo interno sono previsti elementi relativi a informazioni 

amministrative, in particolare ‘description’ e ‘keywords’, il cui scopo è quello di 

generare degli elementi ‘META’ corrispondenti nella composizione HTML: 

 

... 

 

 

... 

 

Inoltre, si possono aggiungere anche altri elementi ‘META’ di HTML, attraverso l’elemento 

‘HTMLMETA’, come si vede nell’esempio seguente: 

 

 

GNU/Linux e altro software libero 

Linux, GNU/Linux, Unix, software, software libero, 

free software 

Document 

15 days 

ALL 

 

... 

... 

 

Gli elementi ‘chapterdefinition’, ‘partdefinition’ e ‘tomedefinition’ vengono 

descritti più avanti in questo capitolo (272.8). 

L’elemento ‘printedfontsize’ consente di definire l’altezza del carattere indicato attraverso 

l’attributo ‘type’, per la composizione stampata. 

L’elemento ‘printedpagesize’ consente di definire I margini e la giustezza per la 

composizione stampata, in base al contesto indicato dall’attributo ‘type’. 

L’elemento ‘title’ serve a indicare il titolo del documento; gli elementi eventuali ‘subtitle’ 

permettono di inserire dei sottotitoli successivi. 

L’elemento ‘abstract’, facoltativo, permette l’inserimento di una descrizione, più o meno articolata, 

composta da blocchi di testo (ciò che nella tabella viene rappresentato schematicamente 

dalla macro ‘%block;’). 

Successivamente è possibile inserire uno o più elementi ‘author’, uno per il nominativo di ogni 

coautore, eventualmente.


Gli elementi ‘date’ e ‘edition’ servono per indicare una data o una sigla differente che rappresenti 

in qualche modo l’edizione. In generale dovrebbe essere sufficiente l’indicazione di uno 

solo di questi due elementi. 

L’elemento ‘frontcovertop’ permette l’inserzione di blocchi prima del titolo; così, l’elemento 

‘frontcoverbottom’ consente di fare la stessa cosa dopo il titolo e le altre indicazioni standard. 

L’elemento ‘backcover’ permette di definire il contenuto della copertina finale. 

Gli elementi successivi riguardano la seconda pagina assoluta e quelle successive. 

Nella seconda pagina appaiono di solito le informazioni sul copyright, nella parte bassa, mentre 

nella parte superiore potrebbero esserci altre informazioni, come una breve descrizione degli 

autori. L’elemento ‘textbeforelegal’ permette di inserire blocchi di testo da collocare nella 

prima parte della seconda pagina, mentre l’elemento ‘legal’ è fatto per le informazioni legali, a 

partire dal copyright. 

Dopo le informazioni legali è possibile inserire una pagina di dediche, attraverso l’elemento 

‘dedications’. Eventualmente, se necessario, è possibile aggiungere altre notizie all’interno 

dell’elemento ‘textafterdedications’ che segue le dediche. 

Infine, è possibile collocare l’elemento vuoto ‘maincontents’ per ottenere l’inserimento dell’indice 

generale. L’attributo ‘levels’ permette di definire il livello di dettaglio desiderato dell’indice: 

il numero zero rappresenta il minimo e fa in modo di ottenere informazioni fino alle 

parti, mentre valori superiori aumentano il dettaglio. Assegnando all’attributo ‘nopages’ il valore 

‘true’, si richiedere espressamente l’eliminazione dei riferimenti ai numeri di pagina; cosa 

che può essere utile soltanto nella composizione per la stampa. 

272.2.1 Margini e giustezza nella composizione stampata 

È possibile definire i margini e la giustezza (la larghezza del testo) della composizione stampata, 

senza dover intervenire modificando lo stile TeX. Si utilizza per questo l’elemento 

‘printedpagesize’, all’interno dell’elemento ‘admin’, nell’intestazione del documento, specificando 

il contesto con l’attributo ‘type’. Si osservi l’esempio in cui si mostrano tutti i valori 

disponibili per l’attributo ‘type’: 

 

 

... 

2.5cm 

2.5cm 

3.5cm 

15cm 

... 

 

... 

 

Il tipo ‘topmargin’ è il margine superiore, fino alla base del testo normale (la riga di intestazione 

viene collocata automaticamente); il tipo ‘bottommargin’ è il margine inferiore; il tipo 

‘internalmargin’ è il margine sinistro per le pagine destre e il margine destro per le pagine 

sinistre; il tipo ‘bodywidth’ è la giustezza, ovvero la larghezza della colonna in cui scorre 

effettivamente il testo. 

Quando la composizione non richiede un margine sinistro diverso da quello destro, si ignora 

il valore del margine interno, utilizzando margini uguali.


Tabella 272.3. Valori dell’attributo ‘type’ dell’elemento ‘printedpagesize’. 

Valore 

topmargin 

bottommargin 

internalmargin 

bodywidth 

Contesto a cui si fa riferimento 

Margine superiore. 

Margine inferiore. 

Margine interno. 

Giustezza. 

Il margine esterno non viene indicato, perché si preferisce indicare la giustezza, essendo un valore 

che è meglio non vari automaticamente, dal momento che da questo dipendono anche le 

dimensioni che si assegnano ad altri componenti contenuti nel testo. 

Il formato della carta viene definito al di fuori del sorgente SGML, attraverso le opzioni di Alml. 

Ciò permette di produrre composizioni differenti a seconda del tipo di carta disponibile. Tuttavia, 

è evidente che le dimensioni adottate per la carta devono essere compatibili con i margini e la 

giustezza richiesti nel sorgente SGML. 

272.2.2 Corpo del carattere nella composizione stampata 

È possibile definire il corpo del carattere, nella composizione stampata, in alcune situazioni 

importanti, senza dover intervenire modificando lo stile TeX. Si utilizza per questo l’elemento 

‘printedfontsize’, all’interno dell’elemento ‘admin’, nell’intestazione del documento, 

specificando il contesto con l’attributo ‘type’. Si osservi l’esempio: 

 

 

... 

4mm 

3.5mm 

... 

 

... 

 

Il tipo ‘normal’ è il carattere normale del testo; il tipo ‘table’ è il carattere utilizzato nelle tabelle 

di Alml. La distanza tra le righe viene impostata automaticamente al 120 % della dimensione 

del carattere utilizzato. 

La dimensione del carattere deve essere armoniosa rispetto al resto del documento. Bisogna 

provare per rendersi conto se il risultato che si ottiene è accettabile oppure no. 

Tabella 272.4. Valori dell’attributo ‘type’ dell’elemento ‘printedfontsize’. 

Valore 

title 

tomeheading 

h0 

h1 

h2 

h3 

h4 

normal 

table 

Carattere a cui si fa riferimento 

Titolo dell’opera che appare in copertina. 

Titolo dei tomi nella loro pagina iniziale. 

Titolo delle parti nella loro pagina iniziale. 

Titolo dei capitoli. 

Titolo delle sezioni di primo livello. 

Titolo delle sottosezioni. 

Titolo delle sotto-sottosezioni. 

Testo normale. 

Testo delle tabelle.


272.3 Contenuto 

Il contenuto del documento si articola in tre blocchi fondamentali: ‘intro’, ‘body’ e 

‘appendix’. In coda, possono apparire degli indici analitici, racchiusi nel blocco dell’elemento 

‘index’. 

Questa classificazione in blocchi va a compensare la mancanza di elementi atti a circoscrivere 

l’estensione delle sezioni in cui si articola il testo. La mancanza di una strutturazione dettagliata 

delle sezioni 2 fa sì che in presenza di errori di sintassi SGML, l’analizzatore tenda a segnalare 

in seguito una quantità di errori inesistenti che non vanno considerati. In tali situazioni, si 

correggono i primi errori evidenti e si ripete la verifica SGML. 

272.3.1 Introduzione 

Dopo l’elemento ‘head’ è prevista la possibilità di inserire l’elemento ‘intro’, il cui scopo è 

quello di delimitare uno o più capitoli speciali, da intendere come prefazioni o introduzioni a 

vario titolo. 

Per la definizione del capitolo, si veda quanto descritto a proposito dell’elemento ‘body’. 

272.3.2 Corpo 

Il corpo vero e proprio del documento è contenuto nell’elemento ‘body’, il quale si può articolare 

in tomi, parti o capitoli. Sta all’autore scegliere quale livello di suddivisione superiore 

adottare. È evidente che se si usa una suddivisione in tomi, si prevede una sottoclassificazione 

in parti, che poi si dividono in capitoli; se si usa una suddivisione in parti, è obbligatoria una 

sottoclassificazione in capitoli. 

Eccezionalmente, un tomo può contenere solo capitoli, senza parti, quando per qualche 

ragione ciò è necessario. 

Tomi, parti, capitoli e sezioni inferiori sono delimitate materialmente attraverso la dichiarazione 

del titolo relativo, come avviene in HTML. La tabella 272.5 elenca gli elementi relativi, assieme 

agli attributi eventuali. 

Tabella 272.5. Dichiarazione dei titoli di tomi, parti, capitoli e sezioni inferiori, oltre ad 

altri elementi essenziali nella definizione della scomposizione del testo. 


Chiusu- 


attributo 

tomeheading Sì Sì %inline; Titolo del tomo. 

id -- -- Attributo Ancora di riferimento. 

lang -- -- Attributo Linguaggio del tomo. 

bookmark -- -- Attributo 

Testo da usare come segnalibro 

alternativo per la composizione 

PDF. 

tomecontents Sì Vuoto Indice generale del tomo. 

levels -- -- Attributo Livello di dettaglio dell’indice. 


h0 Sì Sì %inline; Titolo della parte. 


lang -- -- Attributo Linguaggio della parte. 

2 Qui si intendono sezioni a qualsiasi livello, compresi i capitoli, le parti e i tomi.


Elemento o 

attributo 

Contenuto 


Descrizione 



PDF. 

partcontents Sì Vuoto Indice generale della parte. 



h1 Sì Sì %inline; Titolo del capitolo. 


lang -- -- Attributo Linguaggio del capitolo. 




PDF. 

chaptercontents Sì Vuoto Indice generale del capitolo. 



h2 Sì Sì %inline; Titolo della sezione. 





PDF. 

h3 Sì Sì %inline; Titolo della sottosezione. 



bookmark -- -- Attributo alternativo per la composizione 

PDF. 

h4 Sì Sì %inline; Titolo della sotto-sottosezione. 


Apertura 

Chiusura 


bookmark -- -- Attributo alternativo per la composizione 

PDF. 

segment Sì Sì Segmento di testo finale. 

segmenthead Sì Sì %inline; Titolo di un segmento. 

extramaincontentbile 

ovunque. 

Indice generale dell’opera, piazza- 

Sì 

Vuoto 



endofchapter Sì Sì %inline; Riga finale del capitolo. 

Nella parte iniziale delle classificazioni principali (tomi, parti e capitoli), è possibile collocare 

la richiesta di inserimento di un indice generale specifico. Si ottiene questo con gli elementi: 

‘tomecontents’, ‘partcontents’ e ‘chaptercontents’ (è disponibile anche l’elemento 

‘extramaincontents’ che riguarda l’opera intera e può essere collocato ovunque). Ognuno di 

questi elementi prevede l’attributo ‘levels’, con il quale è possibile stabilire il livello di dettaglio 

di tali indici, tenendo presente che con il numero zero si ottengono voci fino alle parti, 

con uno si ottengono anche i capitoli, mentre con valori superiori si accede alle sezioni di livello 

inferiore. Anche in questo caso è possibile inibire la segnalazione delle pagine (nel caso di 

composizione per la stampa), utilizzando l’attributo ‘nopages’. 

Alla fine del testo di ognuna di queste classificazioni, prima dell’inizio di una sottoclassificazione 

eventuale, è possibile collocare un «segmento» di testo, con un titolo che assomiglia a una 

voce di un elenco descrittivo. Si tratta dell’elemento ‘segment’, i cui titoli si indicano nell’elemento 

‘segmenthead’. Questo gruppo rappresenta un’anomalia nell’organizzazione generale, 

introdotta solo per mantenere la compatibilità con le convenzioni usate in passato nella redazione 

di questa opera.


Infine, sempre per mantenere la compatibilità con il passato, esiste l’elemento ‘endofchapter’, 

il cui scopo è quello di consentire l’inserimento di una riga di informazioni alla fine del capitolo. 

272.3.3 Appendici 

Dopo il corpo è possibile inserire l’elemento ‘appendix’, il cui scopo è quello di delimitare uno 

o più capitoli speciali, da intendere come appendici. 

272.3.4 Indici analitici 

Alml consente la definizione di diversi tipi di indici analitici. Per questi è previsto uno spazio 

speciale collocato dopo le appendici, se ci sono, o in caso contrario subito dopo il corpo. Si tratta 

dell’elemento ‘index’, che prevede l’inserimento di capitoli, come nel caso delle appendici. 

L’inserimento di un elenco riferito a un indice analitico particolare si ottiene con l’elemento 

vuoto ‘printindex’. Verrà descritto meglio in seguito l’uso di questo elemento, perché Alml è 

in grado di gestire più indici analitici differenti. 

272.3.5 Suddivisioni speciali 

Oltre alle suddivisioni standard nella forma ‘hn’, sono disponibili altre suddivisioni per scopi 

particolari. Sono previsti due capitoli speciali per le presentazioni (diapositive o lucidi per lavagna 

luminosa) e per i prospetti schematici riassuntivi (tavole sintetiche e simili), oltre a due tipi 

di sezioni per domande e risposte. 

Elemento o 

attributo 

Tabella 272.6. Dichiarazione dei titoli di capitoli e sezioni speciali. 

Apertura 

Chiusura 

Contenuto 

slideh1 Sì Sì %inline; 

Descrizione 

Titolo della diapositiva o del lucido. 


lang -- -- Linguaggio della diapositiva o del 

Attributo 

lucido. 

Titolo della scheda sintetica riassuntiva. 

sheeth1 Sì Sì %inline; 


lang -- -- Attributo Linguaggio della scheda sintetica. 

faqh2 Sì Sì %inline; 

Titolo del gruppo di domande e 

risposte. 


faqh3 Sì Sì %inline; Domanda a cui segue una risposta. 


Osservando la tabella 272.6, si può intuire che gli elementi ‘slideh1’ e ‘sheeth1’ si usano al 

posto di un capitolo normale. La differenze più importante rispetto all’elemento ‘h1’, sta nel fatto 

che non possono contenere altre suddivisioni in sezioni; inoltre, nella composizione per la stampa 

non appare il numero della pagina. Anche se non c’è modo di controllare la dimensione del 

contenuto, è bene che ogni diapositiva e ogni scheda occupi una sola pagina nella composizione 

per la stampa. 

L’elemento ‘faqh2’ va usato al posto di ‘h2’, all’interno di un capitolo normale. Permette di 

introdurre un gruppo di domande e risposte, precedendole eventualmente da qualche blocco di 

testo introduttivo.


L’elemento ‘faqh3’ serve a contenere il testo di una domanda, anche se potrebbe essere più lungo 

di un titolo normale. Il testo viene rappresentato in modo evidenziato, ma non tanto quanto un 

elemento ‘h3’ normale. Dopo l’elemento ‘faqh3’ ci si aspetta di trovare la risposta alla domanda. 

Eventualmente, la struttura composta da ‘faqh2’ e ‘faqh3’ può essere utilizzata anche per 

realizzare dei questionari o dei test valutativi. 

272.3.6 Titoli delle sezioni e interruzioni di pagina 

In generale, nella composizione stampata, non è garantito che il titolo di una sezione si trovi nella 

stessa pagina in cui inizia il testo della sezione stessa. 

Solo quando ciò che segue il titolo di una sezione è un elemento ‘p’, ‘syntax’ o ‘command’, 

si forma un legame inscindibile. 

272.4 Documento multilingua 

Oltre a indicare il linguaggio nell’elemento ‘alml’, attraverso l’attributo ‘lang’, lo stesso attributo 

è disponibile all’inizio dei tomi, delle parti e dei capitoli. In pratica, si può usare l’attributo 

‘lang’ anche negli elementi ‘tomeheading’, ‘h0’ e ‘h1’. 

Contrariamente alla logica comune, in questo caso l’attributo ‘lang’ attribuisce il valore della 

scelta linguistica a tutto il tomo, alla parte o al capitolo relativo. Un tomo, una parte o un capitolo 

che non abbiano la definizione esplicita di un linguaggio, ereditano la definizione del livello 

precedente. 

La motivazione più importante per la quale è stato introdotto questo attributo nella dichiarazione 

dei tomi, delle parti e dei capitoli, sta nel fatto che così la composizione in HTML genera file con 

intestazioni adeguate, anche per l’indicizzazione delle informazioni. 

La sigla della lingua va attribuita secondo lo standard ISO 639 (sezione 543). Se non è stata prevista 

la traduzione dei termini relativi alla composizione nella lingua richiesta, questi si ottengono 

in inglese. 

L’esempio seguente mostra la dichiarazione esplicita di un capitolo che è da considerare in lingua 

inglese: 

Here I am 

La definizione del tomo, della parte o del capitolo viene adattata alla lingua, solo se questa 

non è stata modificata attraverso gli elementi ‘tomedefinition’, ‘partdefinition’ e 

‘chapterdefinition’, descritti più avanti in questo capitolo. 

272.5 Blocchi di testo ed elementi inseriti all’interno delle 

righe 

A parte gli elementi strutturali del documento, il DTD di Alml organizza il testo in due gruppi 

fondamentali: i blocchi di testo, a cui corrisponde l’entità parametrica ‘%block;’, e gli elementi 

collocabili all’interno delle righe, corrispondente all’entità ‘%inline;’. Il caso tipico di elemento 

che costituisce un blocco di testo è il paragrafo, ‘p’, mentre il caso tipico di elemento che 

costituisce un’inserzione nella riga è l’enfatizzazione, ‘em’. La tabella 272.7 riepiloga gli elementi 

comuni che riguardano inserzioni all’interno della riga, mentre quelli che rappresentano 

un blocco e altri elementi speciali sono descritti separatamente in sezioni apposite.


Tabella 272.7. Elementi inseriti all’interno delle righe. 


Chiusu- 

attributo 


em Sì Sì %inline; Enfasi normale. 

strong Sì Sì %inline; Enfasi rafforzata. 

big Sì Sì %inline; Testo relativamente più grande. 

small Sì Sì %inline; Testo relativamente più piccolo. 

acronym Sì Sì %inline; Acronimo. 

dacronym Sì Sì %inline; Descrizione di un acronimo. 

kbd Sì Sì %inline; Tasto. 

button Sì Sì %inline; Bottone o tasto grafico. 

menuitem Sì Sì %inline; Voce di un menù. 

asciicode Sì Sì %inline; Codice ASCII. 

code Sì Sì %inline; Codice (come in HTML). 

samp Sì Sì %inline; Stringa (come in HTML). 

kerneloption Sì Sì %inline; Opzione del kernel. 

file Sì Sì 

var|em|#PCDA- File o directory. 

TA 

dfn Sì Sì 

#PCDATA | special 

Definizione. 

strdfn Sì Sì %inline; Definizione in lingua straniera. 

Termine speciale per qualche ragione. 

special Sì Sì #PCDATA 

special -- -- Nome attribuito al genere del 

Attributo 

termine. 

sup Sì Sì 

var|em|strong| Apice. 

#PCDATA 

sub Sì Sì 

var|em|strong| Pedice. 

#PCDATA 

pwr Sì Sì 

var|em|strong| Potenza (esponente). 

#PCDATA 

Riferimento per la navigazione 

navlink Sì Sì #PCDATA 

HTML. 

272.5.1 Numeri 

La rappresentazione uniforme di valori numerici, specie quando si opera spesso con basi di numerazione 

insolite, diventa un aspetto delicato. Alml prevede alcuni elementi da utilizzare all’interno 

delle righe per delimitare valori numerici, eventualmente con basi di numerazioni particolari, 

come si vede nella tabella 272.8. 

Elemento o 

attributo 

Tabella 272.8. Elementi inseriti all’interno delle righe per la rappresentazione uniforme 

di valori numerici. 

Apertura 

Chiusura 

Contenuto 

num Sì Sì [+-]?[0-9]+[.,]?[0-9]* 

exa Sì Sì 

dec Sì Sì 

oct Sì Sì 

bin Sì Sì 

Numero decimale comune. 

var|em|strong|#PCDA- 

TA 


TA 


TA 


TA 

Descrizione 

Numero in base 16. 



Numero in base 2.


Il caso dell’elemento ‘num’ è speciale. In particolare, si fa riferimento a un numero in base 10, in 

cui non si mostra la base di numerazione, ma si usa una modalità di rappresentazione standard. 

Per questa ragione, il numero in questione deve essere inserito come previsto, utilizzando la 

virgola o il punto come separatore della parte decimale, 3 aggiungendo il segno all’inizio, se 

necessario, senza usare altri spazi o altri caratteri. Il numero viene elaborato separando le cifre a 

terne. 

Per quanto riguarda gli altri elementi, a seconda del tipo di composizione si utilizza un modo 

diverso per mostrare la base di numerazione. Tuttavia, in questi casi il contenuto degli elementi 

non è strettamente letterale, come si vede dalla tabella. 

272.5.2 Elenchi e simili 

Gli elenchi di Alml sono molto semplici. Si tratta dei soliti elenchi puntati, numerati e descrittivi. 

Questi si comportano in modo molto simile all’HTML; la differenza sostanziale sta nel fatto che 

il contenuto delle voci è composto da uno o più blocchi di testo, mentre in HTML è consentita 

anche la presenza di righe pure e semplici. 

Tabella 272.9. Elenchi. 


Chiusu- 

attributo 


dl Sì Sì Elenco descrittivo. 

dt Sì Sì %inline; Termine descrittivo. 

dd Sì Sì %block; Descrizione relativa. 

ol Sì Sì Elenco numerato. 

li Sì Sì %block; Elemento dell’elenco. 

ul Sì Sì Elenco puntato. 

li Sì Sì %block; Elemento dell’elenco. 

272.5.3 Testo letterale o quasi 

L’inclusione di testo letterale in un sorgente SGML è sempre un problema. Alml prevede tre 

ambienti diversi: ‘verbatimpre’, ‘asciiart’ e ‘pre’. Nei primo due casi si può scrivere senza 

alcuna preoccupazione, tranne per il fatto che il testo va inserito in una sezione marcata di tipo 

‘CDATA’; nel terzo caso invece, è necessario comportarsi come nel testo normale, utilizzando le 

entità standard quando servono, potendo includere anche gran parte degli elementi che rappresentano 

un’inserzione all’interno di una riga. In entrambi i casi vengono rispettate le interruzioni 

di riga. 

 

 

 

 

uno 

& 

due 

 

I due esempi portano allo stesso risultato: 

3 Il segno meno, va indicato con il trattino normale.


uno 

& 

due 

In generale si sceglierà il primo o il secondo modo (quando appropriato), mentre il terzo lo si 

riserva ai casi in cui si devono inserire le cose che i primi due non possono contenere. 

In un documento a carattere tecnico-informatico, è essenziale la possibilità di indicare dei modelli 

sintattici. Alml prevede l’uso di un elemento simile a ‘pre’, dedicato precisamente a questo 

scopo: ‘syntax’. 

 

man n_sezione nome 

 

All’interno di questo elemento si possono inserire altri elementi specifici per rappresentare i 

componenti della sintassi. Infatti, è necessario distinguere tra parole chiave, metavariabili e altre 

indicazioni. In generale, quello che si scrive normalmente deve essere inteso come un dato fisso, 

ovvero delle parole chiave o delle stringhe fisse. Per indicare un contenuto variabile si utilizza 

l’elemento ‘var’ per delimitare la denominazione di un qualcosa di variabile (un’opzione o 

simile). 

Altri elementi speciali servono a guidare la lettura della sintassi: ‘synsqb’ delimita una parte 

della sintassi che va intesa come facoltativa e si traduce generalmente con delle parentesi 

quadre che, se possibile, si distinguono dal testo normale; ‘syncub’ delimita una parte della 

sintassi che va intesa come un corpo unico e si traduce generalmente con delle parentesi graffe 

speciali; ‘synverbar’ (elemento vuoto) indica un’alternativa e si rappresenta con una barra verticale. 

Nell’uso di questi elementi occorre sempre un po’ di prudenza, tenendo conto dei tipi di 

composizione in cui non è possibile mostrare questi simboli in forme diverse dal normale. 

Tabella 272.10. Elementi SGML che riguardano la rappresentazione di testo 

preformattato. 


Chiusu- 


attributo 

pre Sì Sì %inline; Testo preformattato. 

Ampiezza massima in caratteri del 

width -- -- Attributo testo; zero richiede espressamente 

le stesse dimensioni del contesto. 

pnewline 

Continuazione nella riga successiva. 

Sì Vuoto 

verbatimpre Sì Sì testo letterale Testo letterale preformattato. 


width -- -- Attributo testo; zero richiede espressamente 


syntax Sì Sì %inline; Modello sintattico preformattato. 

width -- -- Attributo 


testo; zero richiede espressamente 

sep -- -- Attributo 


‘none’, ‘border’. 

synsqb 

Parentesi quadre di un modello 


sintattico. 

syncub 

Parentesi graffe di un modello 


sintattico. 

synverbar 

Barra verticale di un modello 


sintattico. 

var Sì Sì %inline; Metavariabile sintattica. 

synellipsis Sì Vuoto Ellissi nei modelli sintattici. 

snewline Sì Vuoto 

Continuazione nella riga successiva.


Si tenga in considerazione il fatto che gli elementi ‘synsqb’, ‘syncub’, ‘synverbar’ e ‘var’, 

possono essere utilizzati anche al di fuori dell’elemento ‘syntax’, in qualità di inserzioni 

normali nelle righe. 

La riga di un modello sintattico che si estende troppo in orizzontale, può essere spezzata e ripresa 

inserendo l’elemento vuoto ‘snewline’, in modo da ottenere una segnalazione evidente 

nella composizione finale, senza lasciare ambiguità. La stessa cosa, eventualmente, si può fare 

nell’elemento ‘pre’, usando l’elemento vuoto ‘pnewline’. Si osservi l’esempio seguente che si 

riferisce a un modello sintattico: 

 

pippo --primo --secondo --terzo 

 

pippo --primo | ←↪ 

↩→--secondo | --terzo 

Quando si usa un elemento ‘snewline’, ‘pnewline’ o ‘cnewline’, vicino a uno spazio 

orizzontale, è bene che lo spazio venga lasciato prima dell’inserzione dell’elemento stesso, 

senza eliminarlo, in modo da sottolinearne la presenza. 

Gli elementi ‘pre’, ‘verbatimpre’, ‘asciiart’ e ‘syntax’, sono predisposti inizialmente per 

poter rappresentare 80 colonne di testo letterale, in una larghezza pari a quella normale del testo. 

In situazioni particolari può essere necessario ampliare o ridurre la dimensione dei caratteri nella 

composizione stampata, per consentire la rappresentazione di un testo più ampio orizzontalmente. 

In questi casi, si può utilizzare l’attributo ‘width’, assegnando la quantità di colonne che si 

desiderano. 

Viene lasciata la facoltà di ridefinire la larghezza del testo anche negli elementi ‘syntax’ e ‘pre’, 

benché sia possibile interrompere e riprendere le righe troppo lunghe, come già descritto, con gli 

elementi ‘snewline’ e ‘pnewline’. 

 

1234567890 

1234567890 

1234567890 

1234567890 

1234567890 

1234567890 

1234567890 

1234567890 

1234567890 

 

L’esempio mostra l’utilizzo di un elemento ‘pre’ per rappresentare un testo che si estende su 90 

colonne. 

In caso di necessità, se si vuole che la dimensione del carattere sia la stessa dell’ambiente in 

cui si trova l’elemento in questione, è sufficiente richiedere espressamente una larghezza pari 

a zero.


272.5.4 Comandi 

I comandi che si impartiscono attraverso una riga di comando, possono essere rappresentati con 

l’elemento ‘command’. Si osservi l’esempio seguente: 

$ lsInvio 

Nell’ambito dell’elemento ‘command’ è quasi tutto facoltativo; tuttavia, l’invito, rappresentato 

dall’elemento ‘prompt’, va messo per primo. Dopo l’elemento ‘type’, che serve a delimitare 

il testo che viene inserito sulla riga di comando, è possibile anche specificare il tasto che serve 

a concludere la digitazione, come in questo caso, oppure se ne può fare a meno, lasciandolo 

sottinteso. 

Il testo che viene restituito da un comando si rappresenta normalmente con l’elemento 

‘verbatimpre’. 

A volte, si ha la necessità di rappresentare dei comandi piuttosto lunghi, che nella composizione 

stampata potrebbero risultare spezzati in modo imprevedibile e indesiderabile. È possibile 

indicare esplicitamente dove spezzare il comando, facendo in modo che nella composizione si 

intenda chiaramente questo fatto. Per questo si usa l’elemento vuoto ‘cnewline’, che si inserisce 

all’interno di ‘type’. 

Tabella 272.11. Elementi SGML che servono a rappresentare un comando. 


Chiusu- 

attributo 


command Sì Sì Comando da digitare. 

prompt Sì Sì %inline; Stringa dell’invito. 

type Sì Sì %inline; Digitazione del comando. 

cnewline Sì Vuoto Continua il comando a riga nuova. 

kbd Sì Sì %inline; Tasto o combinazione di tasti. 

button Sì Sì %inline; Bottone o tasto grafico. 

272.5.5 Figure 

Alml permette di gestire le figure in diversi modi. In generale può trattarsi di file di immagini, 

oppure di altre cose, come dei disegni ASCII racchiusi nell’elemento ‘verbatimpre’. 

L’ambiente normale in cui si inserisce una figura è quello dato dall’elemento ‘figure’, che in 

particolare può essere definito come fluttuante oppure fisso nel punto in cui si trova. All’interno 

di questo elemento può essere collocata una figura costituita da un’immagine esterna, da un’immagine 

incorporata, oppure un blocco di testo normale, come un elemento ‘verbatimpre’ per 

realizzare un disegno ASCII. 

 

 

Figura . Ecco il mio primo esempio. 

 

 

 

L’esempio mostra la situazione più comune. Si tratta dell’incorporazione del file 

‘esempio-1.png’, dove viene stabilita l’altezza di quattro centimetri, lasciando che la larghezza 

si adatti di conseguenza, in modo relativo. Si può osservare che l’elemento ‘figure’ contiene un 

attributo ‘id’, con lo scopo evidente di potervi fare riferimento.


L’elemento ‘fcaption’ serve a delimitare il testo che si vuole fare apparire come didascalia. 

Al suo interno si nota la presenza di un elemento vuoto, ‘figureref’, che in questo caso 

rappresenta un riferimento all’ultima figura, cioè a se stessa. 

Una figura ASCII potrebbe essere realizzata, per esempio, nel modo seguente, come in tanti altri 

modi possibili che fanno uso di blocchi di testo: 

 

 


 

 

pinco & pallino 

| 

‘--> e-commerciale 

 

 

Oltre all’elemento ‘figure’, esiste l’elemento ‘img’ per le immagini inserite nel testo. 

Bla bla bla bla 

bla bla. 

Tabella 272.12. Elementi SGML che servono a rappresentare delle figure di qualche 

tipo. Prima parte. 


Chiusu- 


attributo 

figure Sì Sì Involucro di una figura normale. 

id -- -- Attributo Ancora di riferimento per la figura. 

pos -- -- Attributo ‘fixed’, ‘float’. 

sep -- -- Attributo ‘none’, ‘rule’, ‘border’. 

fcaption Sì Sì %inline; Didascalia. 

Codice ASCII letterale preformattato. 

asciiart Sì Sì testo letterale 

width -- -- Numero di colonne, in caratteri, del 

Attributo 

testo. 

image 

Riferimento a un’immagine esterna. 

Sì Vuoto 

imgfile -- -- File contenente l’immagine, senza 

Attributo 

estensione. 


width -- -- Attributo Larghezza dell’immagine. 

embimage 

Immagine incorporata; algoritmo 

Sì Sì #PCDATA 

Base64. 

alt -- -- Descrizione alternativa alla visualizzazione. 

Attributo 



epsimage Sì Sì #PCDATA Codice EPS letterale. 


Attributo 

width -- -- Attributo Larghezza. 

height -- -- Attributo Altezza. 

figimage Sì Sì #PCDATA Codice XFig letterale. 


Attributo 



teximage Sì Sì #PCDATA Codice TeX letterale. 


Attributo 

width -- -- Attributo Larghezza.



Chiusu- 


attributo 


lateximage Sì Sì #PCDATA Codice LaTeX letterale. 

alt -- -- Attributo 



Descrizione alternativa alla visualizzazione. 

Tabella 272.13. Elementi SGML che servono a rappresentare delle figure di qualche 

tipo. Seconda parte. 


Chiusu- 


attributo 

img Sì Vuoto Immagine inserita in una riga. 


Attributo 

imgfile -- -- File contenente l’immagine, senza 

Attributo 

estensione. 



embimg 

Immagine incorporata; algoritmo 

Sì Sì #PCDATA 

Base64. 


Attributo 



epsimg Sì Sì #PCDATA Codice EPS letterale. 


Attributo 



figimg Sì Sì #PCDATA Codice XFig letterale. 


Attributo 



teximg Sì Sì #PCDATA Codice TeX letterale. 


Attributo 



lateximg Sì Sì #PCDATA Codice LaTeX letterale. 


Attributo 



I nomi dei file indicati nell’attributo ‘imgfile’ devono essere privi di estensione, intendendo 

implicitamente che questa sia ‘.png’. 

Quando si inserisce il file di un’immagine, l’elemento relativo consente l’utilizzo degli attributi 

‘height’ e ‘width’. Evidentemente il primo permette di specificare l’altezza della figura e il 

secondo riguarda la larghezza. In linea di principio, i file di immagini hanno delle dimensioni, 

anche se queste sono espresse in pixel, ovvero in punti grafici. In generale conviene specificare 

l’altezza, oppure la larghezza, tenendo in considerazione il risultato per la composizione 

stampata, sapendo che l’informazione mancante viene determinata in modo relativo. Eviden-


temente, fissando entrambe le dimensioni, si ottiene un adattamento dell’immagine che non è 

necessariamente relativo. 

Le dimensioni, ovvero le stringhe che si assegnano agli attributi citati, hanno una forma 

prestabilita: 

nunità_di_misura 

La composizione in HTML implica l’adattamento delle figure, in modo tale che la dimensione 

in punti grafici corrisponda al 200 % dei punti tipografici. 4 In pratica, nell’ambito di questa 

conversione, un punto grafico equivale a circa 0,0278 pollici, ovvero a 0,7055 mm. Questo tipo 

di rapporto è quello che ha dimostrato produrre la composizione HTML più vicina al risultato 

stampato. 

Gli elementi per l’inserimento di immagini nel testo, come si vede dalle tabelle 272.12 e 272.13, 

hanno un attributo denominato ‘alt’. Si tratta di un’informazione facoltativa, con la quale si 

descrive brevemente l’immagine. Questa informazione serve nella composizione HTML, per 

mostrare una descrizione minima in caso di problemi nella visualizzazione dell’immagine. 

Oltre a immagini esterne, è possibile incorporare nel sorgente SGML diversi tipi di immagini: file 

trasformati secondo l’algoritmo Base64; codice EPS; codice XFig; codice TeX; codice LaTeX. 

Per incorporare un’immagine codificata con l’algoritmo Base64 si può usare il programma Uuencode, 

oppure Mpack, descritti nel capitolo 153. Supponendo di utilizzare Uuencode e di volere 

inserire l’immagine contenuta nel file ‘prova.jpg’, basta procedere come segue: 

$ uuencode -m prova.jpg ciao > prova.uuencode 

Quello che si ottiene in questo caso è il file ‘prova.uuencode’, che può apparire simile al testo 

seguente, che è stato ridotto per comodità: 

begin-base64 664 ciao 

JSFQUy1BZG9iZS0yLjAKJSVDcmVhdG9yOiAiYmFyY29kZSIsIGxpYmJhcmNv 

ZGUgc2FtcGxlIGZyb250ZW5kCiUgJSVEb2N1bWVudFBhcGVyU2l6ZXM6IGE0 

... 

... 

b3cKMTA0LjAwIDEwLjAwIG1vdmV0byAoOSkgc2hvdwoKJSBFbmQgYmFyY29k 

ZSBmb3IgIjk5MTIzNDU2Nzg5MCIKCiUlRW5kUGFnZQoKc2hvd3BhZ2UKJSVU 

cmFpbGVyCiUlRU9GCgo= 

==== 

Da questo file, ottenuto con Uuencode, va tolta la prima e l’ultima riga; il resto si può inserire in 

un elemento ‘embimg’, oppure ‘embimage’. Vengono mostrati entrambi i casi. 

Bla bla bla 

 

 

bla bla bla. 

4 Un punto tipografico, viene inteso qui come corrispondente a 1/72 di pollice, secondo la convenzione del linguaggio 

PostScript.


 

 


 

 

 

 

 

Dal momento che si vuole evitare qualunque interpretazione SGML, può essere conveniente 

racchiudere il contenuto di questi elementi in una sezione marcata di tipo CDATA, così come si 

può vedere. 

In modo analogo funzionano gli elementi ‘epsimg’ e ‘epsimage’, per quanto riguarda il codice 

EPS inserito direttamente nel sorgente. Vengono mostrati due esempi. 

Bla bla bla 

 

 

bla bla bla. 

 

 


 

 

 

 

 

Nello stesso modo, sono disponibili gli elementi ‘figimg’ e ‘figimage’, per quanto riguarda il 

codice XFig. Vengono mostrati due esempi e il risultato del secondo nella figura 272.1.


Bla bla bla 

 

 

bla bla bla. 

 

 

Figura . Esempio con XFig. 

 

 

 

 

 

Figura 272.1. Esempio con XFig. 

Esempio con XFig 

Infine, funzionano così anche gli elementi ‘teximg’, ‘teximage’, ‘lateximg’ e ‘lateximage’ 

per quanto riguarda il codice TeX e LaTeX inserito direttamente nel sorgente. Per la precisione, 

nel caso di ‘teximg’ e ‘teximage’, vengono aggiunte automaticamente all’inizio due istruzioni, 

‘\nonstopmode’ e ‘\nopagenumbers’, inoltre, alla fine viene aggiunta l’istruzione ‘\bye’; 

invece, nel caso di ‘lateximg’ e ‘lateximage’ viene aggiunta l’istruzione ‘\nonstopmode’ 

all’inizio e ‘\end{document}’ alla fine. 5 Segue un esempio riferito all’inclusione di codice 

5 Il codice LaTeX che viene inserito deve includere tutto il necessario a funzionare correttamente, ma l’aggiunta

¦§ ¥ 

¥ 


TeX: 

 

 

Figura . Ecco una bella formula. 

 

 

 

 

 

Figura 272.2. Ecco una bella formula. 

§ § 

§ ¡ 

 

¢¡¤£ 

¦§ 

¤ 

Segue lo stesso esempio, realizzato con l’inclusione di codice LaTeX; si osservi in particolare la 

necessità di definire il tipo di documento e il tipo di pagina più semplice: 

 

 

Figura . Ecco un’altra bella formula. 

 

 

 

 

 

¨© 

Figura 272.3. Ecco un’altra bella formula. 

§ § 

§ ¡ 

 

¢¡¤£ 

 

272.5.6 Tabelle 

¨¢© 

Come nel caso delle figure, le tabelle sono organizzate in modo da poter essere rappresentate 

da qualunque cosa: una tabella come si è abituati di solito, oppure dei blocchi di testo, anche 

preformattato, come ‘pre’ e ‘verbatimpre’. 

L’involucro di una tabella funziona in modo simile a quello di una figura: 

 

 

Tabella . Ecco il mio primo esempio. 

 

... 

... 

 

dell’istruzione ‘\end{document}’ in modo automatico non può far male se questa è già stata inserita correttamente.


Anche l’elemento ‘table’ possiede gli attributi ‘id’ e ‘pos’, con lo stesso significato che hanno 

nell’elemento ‘figure’. Nello stesso modo funziona la didascalia, che in questo caso è delimitata 

dall’elemento ‘tcaption’, mentre il riferimento all’ultima tabella avviene con l’elemento 

‘tableref’. 

A parte la possibilità di disegnare la tabella usando blocchi di testo normali, la tabella tipica 

incorpora l’elemento ‘tabular’: 

 

 

Tabella . Ecco il mio primo esempio. 

 

 

 

Dispositivo Descrizione 

 

 

/dev/fd0 Prima unità a dischetti. 

/dev/hda Primo disco fisso ATA. 

/dev/hdb Secondo disco fisso ATA. 

/dev/sda Primo disco SCSI. 

/dev/lp0 Prima porta parallela. 

/dev/ttyS0 Prima porta seriale. 

 

 

 

L’esempio mostrato è sufficientemente completo: l’elemento ‘tabular’ ha un attributo obbligatorio, 

‘col’, con il quale è necessario dichiarare subito la quantità di colonne che compone la 

tabella. Le righe della tabella sono raggruppate in due gruppi: l’intestazione, delimitata dall’elemento 

‘thead’, e il corpo, delimitato dall’elemento ‘tbody’. Le righe sono definite dall’elemento 

‘trow’ e la separazione tra una colonna e l’altra avviene con l’elemento vuoto ‘colsep’. 

Tabella 272.14. Elementi SGML che servono a rappresentare le tabelle. 


Chiusu- 

attributo 


table Sì Sì Involucro di una tabella. 

id -- -- Ancora di riferimento per la tabella. 

Attributo 


Non si può dividere = ‘0’ (predefinito); 

split -- -- Attributo 

si può dividere automatica- 

mente = ‘1’. 

tcaption Sì Sì %inline; Didascalia. 

Descrizione del reticolo di righe e 

tabular Sì Sì 

colonne. 

col -- -- Attributo Quantità di colonne presenti. 

columnfractions -- -- Attributo Frazioni orizzontali per le colonne. 

printedfontsize -- -- Attributo Dimensione del carattere da usare. 

border -- -- Normale = ‘0’ (predefinito); caselle 

Attributo 

bordate = ‘1’. 

thead Sì Sì trow Righe di intestazione. 

trow Sì Sì Riga. 

colsep Sì Sì Separazione tra le colonne. 

tbody Sì Sì trow Righe del corpo. 

trow Sì Sì Riga. 

colsep Sì Sì Separazione tra le colonne.


La gestione delle tabelle di Alml è un po’ limitata; in situazioni eccezionali, si può valutare 

anche la possibilità di realizzare tabelle HTML utilizzando l’elemento ‘html’, come si vede 

nell’esempio di tabella 272.26. Tuttavia, si deve ricordare che si tratta di codice esterno, per 

cui non si possono inserire elementi tipici di Alml, ma solo codice HTML; inoltre, la trasformazione 

in forma di testo puro di una tabella HTML complessa non avviene sempre nel modo 

corretto. 

L’esempio seguente mostra il caso di una tabella in cui le celle possono contenere più di una riga. 

Si vede il risultato in 272.15. 

 

 

Tabella . Esempio di tabella un po’ più complessa. 

 

 

 

Parola di controllo 

Competenza 

Condizione o valore predefinito 

 

 

 

\hoffset 

Posizione iniziale dei paragrafi nella pagina. 

0 

 

\hsize 

Larghezza del paragrafo a partire da \hoffset. 

6,5 pollici 

 

\parindent 

Rientro della prima riga. 

20 punti 

 

\baselineskip 

Distanza tra la base di una riga e la base della riga successiva. 

12 punti 

 

\parskip 

Distanza aggiuntiva tra i paragrafi. 

0 

 

\raggedright 

Allinea il testo a sinistra. 

allineato simultaneamente a sinistra e a destra 

 

\leftskip 

Rientro sinistro complessivo. 

0 

 

\rightskip 

Rientro destro complessivo. 

0 

 

 

 


Tabella 272.15. Esempio di tabella un po’ più complessa. 

Parola di controllo Competenza Condizione o valore predefinito 

\hoffset 

Posizione iniziale dei paragrafi nella 

pagina. 

0 

\hsize 

Larghezza del paragrafo a partire da 

‘\hoffset’. 

6,5 pollici 

\parindent Rientro della prima riga. 20 punti 

\baselineskip 

Distanza tra la base di una riga e la 

base della riga successiva. 

12 punti 

\parskip Distanza aggiuntiva tra i paragrafi. 0 

\raggedright 

allineato simultaneamente a sinistra e 

Allinea il testo a sinistra. 

a destra 

\leftskip Rientro sinistro complessivo. 0 

\rightskip Rientro destro complessivo. 0 

Eccezionalmente (purché si utilizzi l’attributo ‘columnfractions’), è possibile inserire nelle 

celle alcuni elementi che rappresentano blocchi di testo; per esempio: ‘syntax’, ‘command’, 

‘pre’ e ‘verbatimpre’. Ciò dovrebbe consentire l’uso delle tabelle per realizzare degli schemi 

riassuntivi riferiti a comandi sintassi o simili. Si osservi l’esempio seguente, rappresentato alla 

fine dalla tabella 272.16. 6 

 

 

 

Comando 

Descrizione 

 

 

 

mbadblock unità_dos 

Scandisce un’unità &DOS; alla ricerca di settori difettosi. 

 

mcd directory_dos 

Permette di modificare o conoscere la directory corrente delle unità &DOS;. 

 

mdel file_dos 

Cancella i file &DOS; indicati come argomento. 

 

mdeltree directory_dos 

Cancella le directory &DOS; indicate come argomento. 

 

mmd directory_dos 

Crea le directory &DOS; indicate come argomento. 

 

mmove origine_dos destinazione_dos 

Sposta o rinomina uno o più file e directory. 

 

mrd directory_dos 

Elimina le directory indicate come argomento, purché siano vuote. 

 

mren origine_dos destinazione_dos 

Rinomina o sposta uno o più file e directory. 

 

 

 

 

Comando 

mbadblock unità_dos 

Descrizione 

Scandisce un’unità Dos alla ricerca di 

settori difettosi. 

6 La scelta del rapporto tra le due colonne della tabella, 61,8 % e 38,2 %, rappresenta quello che è noto come «rapporto 

aureo».


Comando 

mcd [directory_dos] 

mdel file_dos ... 

mdeltree directory_dos... 

mmd directory_dos... 

mmove origine_dos ... destinazione_dos 

mrd directory_dos... 

mren origine_dos ... destinazione_dos 

Descrizione 

Permette di modificare o conoscere la 

directory corrente delle unità Dos. 

Cancella i file Dos indicati come 

argomento. 

Cancella le directory Dos indicate 

come argomento. 

Crea le directory Dos indicate come 

argomento. 

Sposta o rinomina uno o più file e 

directory. 

Elimina le directory indicate come 

argomento, purché siano vuote. 

Rinomina o sposta uno o più file e 

directory. 

Le tabella molto lunghe possono essere realizzate in modo da consentire il salto pagina, utilizzando 

l’attributo ‘split’. In ogni caso, perché ci possa essere una tabella suddivisibile tra le 

pagine, è necessario che questa non sia fluttuante. 

272.5.7 Listati 

Come le figure e le tabelle, i listati possono essere rappresentati da qualunque cosa; di solito si 

tratta di blocchi di testo preformattato, come ‘pre’ e ‘verbatimpre’. L’involucro di un listato 

funziona in modo simile a quello di una figura: 

 

 

Listato . Ecco il mio primo esempio. 

 

... 

... 

 

Anche l’elemento ‘listing’ possiede gli attributi ‘id’, ‘pos’ e ‘sep’, con lo stesso significato 

che hanno nell’elemento ‘figure’. Nello stesso modo funziona la didascalia, che in questo 

caso è delimitata dall’elemento ‘lcaption’, mentre il riferimento all’ultimo listato avviene con 

l’elemento ‘listingref’. 

Tabella 272.17. Elementi SGML che servono a rappresentare i listati. 


Chiusu- 

attributo 


Involucro di un listato. 

id -- -- Attributo Ancora di riferimento per il listato. 


sep -- -- Attributo ‘none’, ‘rule’, ‘border’. 

listing Sì Sì 

Non si può dividere = ‘0’ (predefinito); 

split -- -- Attributo 

si può dividere automatica- 

mente = ‘1’. 

lcaption Sì Sì %inline; Didascalia.


272.5.8 Riferimenti incrociati e ipertestuali 

I riferimenti incrociati si realizzano attraverso l’indicazione di ancore (o etichette se si preferisce 

il termine) e di puntatori a tali ancore. Esistono diversi modi per definire un’ancora e un riferimento 

a questa: tutti gli elementi che dispongono di un attributo ‘id’, sono ancore oppure sono 

puntatori alle ancore. 

Fino a questo punto sono stati descritti gli elementi che delimitano i titoli dei tomi, delle parti, 

dei capitoli e delle sezioni; inoltre sono stati visti gli elementi che avvolgono le figure e le tabelle. 

Tutti questi sono ancore a cui si può puntare. Inoltre, per inserire un’ancora nel testo normale, è 

possibile usare l’elemento vuoto ‘anchor’, anche questo provvisto di attributo ‘id’. 

Esistono quattro elementi vuoti per fare riferimento alle ancore: ‘sectionref’, per ottenere un 

riferimento alla sezione in cui si trova l’ancora; ‘figureref’ per fare riferimento a una figura; 

‘tableref’ per fare riferimento a una tabella; ‘listingref’ per fare riferimento a un listato. 

In particolare, gli elementi ‘figureref’, ‘tableref’ e ‘listingref’ possono essere usati 

anche senza l’attributo ‘id’ per fare riferimento all’ultima ancora di una figura, di una tabella o 

di un listato, come è già stato mostrato nell’uso delle didascalie. 

Quando si realizza un documento che può includere o meno una certa porzione a cui puntano 

alcuni riferimenti, per evitare che vengano mostrati questi collegamenti mancanti, si può usare 

l’elemento ‘ifref’, con il quale si delimita la parte da non comporre se manca il riferimento 

indicato nell’attributo ‘id’. 

Tabella 272.18. Gestione dei riferimenti incrociati. 


Chiusu- 

attributo 


tomeheading Sì Sì Titolo di un tomo. 

id -- -- Ancora di riferimento per il titolo 

Attributo 

del tomo. 

h0 Sì Sì Titolo di una parte. 


Ancora di riferimento per il titolo 

della parte. 

h1 Sì Sì Titolo di un capitolo. 



di un capitolo. 

h2 Sì Sì Titolo di una sezione. 



di una sezione. 

h3 Sì Sì Titolo di una sottosezione. 



di una sottosezione. 

h4 Sì Sì Titolo di una sotto-sottosezione. 


Ancora per il titolo di una sottosottosezione. 

anchor Sì Vuoto Ancora inserita nel testo. 


Stringa di identificazione dell’ancora. 

sectionref Sì Vuoto Riferimento a un’ancora del testo. 

id -- -- Attributo Stringa a cui si fa riferimento. 

figure Sì Sì Involucro di una figura. 

id -- -- Attributo Ancora di riferimento per la figura. 

figureref Sì Vuoto 

Riferimento a un’ancora di una 

figura. 


table Sì Sì Involucro di una tabella. 


Ancora di riferimento per la tabella.


Elemento o 

attributo 

Apertura 

Chiusura 

Contenuto 

Descrizione 

Riferimento a un’ancora di una 

tableref Sì Vuoto 

tabella. 


listing Sì Sì Involucro di un listato. 

id -- -- Attributo Ancora di riferimento per il listato. 

Riferimento a un’ancora di un 

listato. 


listingref Sì Vuoto 

%inline; o Delimita un’area da comporre solo 

ifref Sì Sì 

%block; 

se l’ancora esiste veramente. 


272.5.9 Note e piè pagina 

Alml prevede l’utilizzo di tre tipi di annotazioni: avvertimenti che devono risaltare in un riquadro 

e due tipi di note a piè pagina. Le note evidenziate sono indicate all’interno di un elemento 

‘frame’, mentre quelle a piè pagina sono inserite nell’elemento ‘footnote’, oppure 

‘blockfootnote’. 

Le note a piè pagina normali sono quelle dell’elemento ‘footnote’, che si colloca all’interno 

delle righe; al contrario, ‘blockfootnote’ rappresenta un blocco di testo, che rimane solo per 

compatibilità con il passato. 

 

Attenzione! Si tratta di un’operazione rischiosa. 

 

L’esempio precedente mostra l’utilizzo di un riquadro, mentre quello successivo mostra l’uso di 

un piè pagina normale. 

Bla bla blaQuesta parola si ripete. bla bla... 

Tabella 272.19. Annotazioni a vario titolo. 


Chiusu- 

attributo 


frame Sì Sì %block; Riquadro. 

blockfootnote Sì Sì %inline; Piè pagina tra i blocchi di testo. 

footnote Sì Sì %inline; 

Piè pagina all’interno di una riga di 

testo. 

272.5.10 Riferimenti esterni e citazioni 

Alcuni elementi sono specializzati per fare riferimento a qualcosa di esterno. Il caso più comune 

riguarda l’elemento ‘uri’, con il quale si indica un URI: 

Bla bla bla bla bla... 

Per indicare il riferimento a una pagina di manuale, si può usare l’elemento ‘man’, in modo da 

ottenere una rappresentazione uguale a quella tradizionale: 

Bla bla bla ls1 bla bla... 

La tabella 272.20 riepiloga questi e altri elementi affini.


Tabella 272.20. Riferimenti esterni. 


Chiusu- 

attributo 


uri Sì Sì CDATA Riferimento a un URI esterno. 

Riferimento a un URI che non 

uristr Sì Sì #PCDATA 

funziona. 

%block;, 

blockquote Sì Sì 

quoteinfo 

Citazione. 

quoteinfo Sì Sì %inline; Informazioni sulla citazione. 

bibref Sì Sì %inline; Titolo di un documento. 

man Sì Sì 

#PCDATA, mansect 

Pagina di manuale. 

mansect Sì Sì #PCDATA Numero della sezione. 

L’elemento ‘uristr’ è una variante di ‘uri’, con lo scopo di non generare un riferimento ipertestuale. 

Ciò può servire per rappresentare un indirizzo di fantasia, oppure un indirizzo reale che 

non è più valido. Si possono indicare in questo modo anche i nomi di dominio. 

L’elemento ‘blockquote’ è previsto per delimitare una citazione in uno o più blocchi. Alla fine 

dell’elemento ‘blockquote’ è prevista la possibilità di usare un solo elemento ‘quoteinfo’, 

con lo scopo di contenere informazioni relative alla citazione: 

 

%block; 

... 

[%inline; ...] 

 

272.5.11 Altre inserzioni particolari 

Sono disponibili altri elementi di importanza minore. Si tratta di ‘br’, ‘hr’, ‘newpage’, 

‘bottompage’ e ‘navlink’. I primi due emulano gli elementi corrispondenti dell’HTML, 

interrompendo una riga e inserendo una linea orizzontale rispettivamente. 

L’elemento ‘newpage’ richiede un salto pagina, se il tipo di composizione lo consente. 

L’elemento ‘bottompage’ serve per definire un gruppo di blocchi di testo da rappresentare nella 

parte bassa della pagina, nella composizione per la stampa. In pratica, si usa ‘bottompage’ per 

delimitare informazioni legali nella seconda pagina relativa dei tomi: 

Bla bla bla 

 

Copyright © Pinco Pallino... 


 

Tabella 272.21. Inserzioni varie. 


Chiusu- 

attributo 


br Sì Vuoto Interruzione della riga. 

hr Sì Vuoto Riga orizzontale di separazione. 

newpage Sì Vuoto Salto pagina se ammissibile. 

bottompage Sì Sì %block; 

Testo da rappresentare nella parte 

bassa della pagina. 

navlink Sì Sì #PCDATA 

Riferimento ipertestuale per la navigazione 

HTML.


L’elemento ‘navlink’ consente di aggiungere nella composizione HTML un riferimento ipertestuale 

fisso, in tutte le pagine, allo scopo di raggiungere facilmente la posizione in cui l’elemento 

stesso viene inserito. Si osservi l’esempio seguente: 

 

Indice analitico 

 

indice analitico 

 

 

Si tratta dell’inserimento dell’indice analitico, con l’aggiunta di un riferimento ipertestuale fisso 

nelle pagine della composizione HTML. 

272.6 Tracciamento di informazioni particolari 

Diversi tipi di elementi nella struttura di Alml sono predisposti per accumulare informazioni da 

restituire a richiesta. La situazione più semplice è data dalla gestione degli indici analitici, dove 

con l’elemento ‘indexentry’ si inserisce una voce nell’indice analitico generale o in un altro 

individuato da un nome libero: 

 

I colori dell’arcobaleno 

arcobaleno 

color 

 

L’elemento ‘indexentry’ appartiene al gruppo di quelli che possono essere inseriti all’interno 

di una riga; nell’esempio si vede la situazione tipica in cui lo si inserisce nel testo di un titolo. 

In questo caso, sono state indicate due voci dell’indice analitico generale: la parola «arcobaleno» 

viene inserita in modo normale, mentre la parola «color» viene inserita con un carattere 

dattilografico. 

Ogni indice analitico ha un nome e quello generale, o predefinito, corrisponde a ‘main’. 

L’esempio mostrato sopra sarebbe perfettamente equivalente a quello seguente: 

 

I colori dell’arcobaleno 

arcobaleno 

color 

 

Per recuperare l’elenco di un indice analitico si utilizza l’elemento ‘printindex’, in cui, lo 

stesso attributo ‘index’ permette di stabilire quale indice estrapolare. 

Elemento o 

attributo 

Tabella 272.22. Gestione degli indici analitici. 

Apertura 

Chiusura 

Contenuto 

Descrizione 

indexentry 

Dichiarazione di una voce per 

Sì Sì #PCDATA|code 

l’indice analitico. 

index -- -- Nome dell’indice analitico in cui 

Attributo 

inserire la voce. 

special Sì Sì #PCDATA Termine speciale. 

special -- -- Nome dell’indice analitico in cui 

Attributo 

inserire la voce. 

printindex 

Inserisce l’elenco dell’indice analitico 

richiesto. 

Sì Vuoto 

index -- -- Nome dell’indice analitico richiesto. 

Attributo


Elemento o 

attributo 

Apertura 

Chiusura 

Contenuto 

indexcontext -- -- Attributo 

indexref -- -- Attributo 

Descrizione 

Specifica un contesto tra: ‘all’, 

‘tome’, ‘part’, ‘chapter’. È predefinito 

il contesto ‘all’, che 

richiede l’indice completo. 

Specifica in che modo devono apparire 

i riferimenti: ‘default’, 

‘section’. In pratica, con la parola 

chiave ‘section’ si impone di 

mostrare numeri di sezione e non le 

pagine. 

Esiste anche un altro elemento che inserisce voci negli indici analitici; si tratta di ‘special’, che 

inserisce una voce nell’indice corrispondente al nome indicato con l’attributo che ha lo stesso 

nome: ‘special’. 

272.6.1 Caratteristiche del software e di altri «lavori» 

La struttura di Alml dispone di un elemento ‘%inline;’ speciale, il cui scopo è quello di 

annotare alcune informazioni sul software e su lavori simili. Si osservi l’esempio seguente: 

Stiamo parlando di Mpage, 

 

Mpage 

licenza speciale che non ammette le modifiche 

 

Permission is granted to anyone to make or distribute verbatim 

copies of this document as received, in any medium, provided that 

this copyright notice is preserved, and that the distributor grants 

the recipient permission for further redistribution as permitted by 

this notice. 

 

 

un programma che si occupa di... 

Solo gli elementi ‘workname’ e ‘worklicense’ sono obbligatori, dal momento che il loro contenuto 

appare in un piè pagina locale. L’elemento ‘worklicensetext’ è facoltativo e può essere 

utile per annotare una licenza unica, per la quale non possa essere individuato un riferimento 

standard; inoltre, un altro elemento, ‘worknotes’, permette di annotare qualcosa al riguardo. 

Dove lo si ritiene più opportuno, si può collocare l’elemento ‘printworkinfo’, per ottenere 

l’elenco ordinato di queste informazioni accumulate. 

Elemento o 

attributo 

Tabella 272.23. Tracciamento di informazioni sul software citato. 

Apertura 

Chiusura 

Contenuto 

Descrizione 

Dichiarazione del blocco di informazioni. 

workinfo Sì Sì 

Nome del software o di altro 

workname Sì Sì #PCDATA 

lavoro. 

Denominazione o descrizione breve 

della licenza. 

worklicense Sì Sì #PCDATA 

worklicensetext Sì Sì %block; Testo della licenza specifica. 

worknotes Sì Sì %block; Annotazioni. 

printworkinfo Sì Vuoto 

Inserisce le informazioni accumulate 

in modo ordinato.


Elemento o 

attributo 

Apertura 

Chiusura 

Contenuto 

workinforef -- -- Attributo 

Descrizione 

Specifica in che modo devono apparire 

i riferimenti: ‘default’, 

‘section’. In pratica, con la parola 

chiave ‘section’ si impone di 

mostrare numeri di sezione e non le 

pagine. 

272.6.2 Informazioni su sezioni specifiche del documento 

In situazioni particolari, potrebbe essere necessario, o anche solo utile, tenere traccia dell’origine 

di una sezione del documento, assieme a delle annotazioni a vario titolo. Per questo si può 

utilizzare l’elemento ‘docinfo’, che questa volta costituisce un blocco. 

 

 

2002.09.15 

 

Il testo viene aggiornato nel contenuto, con l’inserimento 

della sezione «bla bla bla», da parte di Caio Cai 

(caio@brot.dg). 

 

2002.09.08 

 

Il testo viene modificato per adeguarlo alla nuova veste 

grafica dell’opera, per opera di Caio Cai (caio@brot.dg); 

il contenuto rimane invariato. 

 

2002.02.02 

 

 

 

 

Il testo originale è di Tizio Tizi e risale al 2002.02.02. Nello 

stesso giorno, il testo ha subito qualche aggiustamento per opera di 

Caio Cai (caio@brot.dg), con il consenso dell’autore. 

L’esempio mostra in particolare l’uso dell’elemento ‘docinfo’ per annotare lo storico delle 

modifiche fatte su quella porzione di documento; come si può vedere, vengono indicate prima le 

azioni più recenti, ma questo dipende solo da una scelta organizzativa. 

Per ottenere l’elenco delle informazioni accumulate in questo modo, si utilizza l’elemento vuoto 

‘printdocinfo’.


Tabella 272.24. Tracciamento di informazioni su sezioni particolari del documento 

globale. 

Elemento o 

attributo 

docinfo Sì Sì 

Apertura 

Chiusura 

Contenuto 

printdocinfo Sì Vuoto 

Descrizione 

Annotazioni sul documento (tomo, 

parte, capitolo o sezione inferiore). 

Inserisce nel testo le informazioni 

accumulate. 

272.6.3 Condizioni particolari per il contenuto di una sezione 

È previsto un contenitore speciale per indicare le condizioni particolari che riguardano una certa 

sezione (anche un tomo intero). Si tratta dell’elemento ‘specialcondition’, all’interno del 

quale può eventualmente apparire l’elemento vuoto ‘nomod’: 

non è consentita la modifica di questa 

sezione 

L’esempio dovrebbe rendere l’idea della cosa. Il testo contenuto nell’elemento 

‘specialcondition’ viene mostrato effettivamente, utilizzando un carattere un po’ diverso da 

quello normale, in modo da risaltare. 

L’elemento vuoto ‘nomod’ serve per tenere traccia in particolare di quelle sezioni che non possono 

essere modificate. Evidentemente, può essere utile solo se il documento, nella sua globalità, è 

inteso come modificabile, in base alle condizioni della licenza. In generale non dovrebbe essere 

necessario; 7 tuttavia, in questo modo, è possibile poi ottenere un elenco dettagliato di tutte le 

sezioni che non possono essere modificate, con l’elemento vuoto ‘printnomod’. 

Elemento o 

attributo 

Tabella 272.25. Annotazione delle condizioni particolari di una sezione. 

specialcondition Sì Sì 

Apertura 

Chiusura 

Contenuto 

nomod Sì Vuoto 

printnomod Sì Vuoto 

#PCDATA | nomod 

Descrizione 

Dichiarazione di condizioni particolari. 

Annotazione di sezione non modificabile. 

Elenco delle sezioni non modificabili. 

272.7 Inserimento letterale di codice TeX e HTML, con 

eventuale inserimento condizionato 

In situazioni eccezionali, può essere conveniente l’inserimento di codice scritto secondo il linguaggio 

di composizione che si trova al di sotto della struttura SGML di Alml. Lo scopo di Alml 

non è quello di mantenere un legame sicuro con TeX e HTML, tuttavia viene lasciata aperta 

questa possibilità. 

Si pensi all’eventuale necessità di inserire qualcosa di particolare nella composizione HTML, 

per esempio per inserire un contatore di accesso, o altri tipi di inserzioni ritenuti utili per qualche 

ragione. 

7 Se nella sezione che non si può modificare è scritto chiaramente come stanno le cose al riguardo, non serve alcun 

elenco di tali sezioni.


Per risolvere questo problema si possono usare due elementi speciali: ‘tex’ e ‘html’. Come si 

può intuire, il primo elemento è fatto per racchiudere codice TeX o LaTeX; il secondo serve per 

includere codice HTML. 

Dal momento che si vuole evitare qualunque interpretazione SGML, conviene racchiudere il 

contenuto di questi elementi in una sezione marcata di tipo CDATA. Si osservi l’esempio 

seguente: 

 

Web-Counter: 

]]> 

In questo caso si tratta di un’inclusione di codice HTML, dove per poter scrivere i marcatori in 

modo letterale è stato necessario includere tutto all’interno della sezione marcata CDATA. 

A fianco di questo problema, sta poi la possibilità di delimitare facilmente dei blocchi di sorgente 

che debbano essere presi in considerazione solo se la composizione avviene attraverso una 

trasformazione in TeX o in HTML. In pratica, si utilizzano rispettivamente gli elementi ‘iftex’ 

e ‘ifhtml’. Questi elementi non sono indispensabili, perché l’SGML offre già un meccanismo 

di controllo dell’elaborazione del sorgente, attraverso le sezioni marcate; tuttavia, servono per 

completare e concludere il problema degli elementi contenenti codice speciale TeX o HTML. 

Il codice HTML può essere rappresentato in parte anche quando la composizione avviene attraverso 

TeX, per mezzo di HTML2ps. In pratica, con il codice HTML si ottiene un’immagine che 

viene poi incorporata nel sorgente TeX. Questa estensione serve specialmente per consentire la 

realizzazione di tabelle più complesse di quanto consenta Alml con il suo elemento ‘tabular’. 

Si osservi l’esempio seguente, che viene poi rappresentato nella tabella 272.26: 

 

 

Tabella . Incorporazione di codice HTML per rappresentare 

una tabella complessa. 

 

 

 

 

 

Denominazione della porta seriale su i386 nei sistemi 

Dos 

 

Risorse 

 

File di dispositivo nei sistemi GNU/Linux 

 

Annotazioni 

 

 

 

IRQ 

 

I/O 

 

 

 

 

 

COM1:


 

4 

 

3F816 

 

/dev/ttyS0 

 

La prima e la terza porta seriale condividono lo 

stesso IRQ. 

 

 

 

COM3: 

 

3E816 

 

/dev/ttyS2 

 

 

 

COM2: 

 

3 

 

2F816 

 

/dev/ttyS0 

 

La seconda e la quarta porta seriale condividono lo 

stesso IRQ. 

 

 

 

COM4: 

 

2E816 

 

/dev/ttyS2 

 

 

 

 

]]> 

 

 

Tabella 272.26. Incorporazione di codice HTML per rappresentare una tabella 

complessa. 

Denominazione della porta seriale su 

i386 nei sistemi Dos 

Risorse 

IRQ I/O 

File di dispositivo nei sistemi 

GNU/Linux 

Annotazioni 

COM1: 

3F8 16 /dev/ttyS0 

4 

COM3: 3E8 16 /dev/ttyS2 

COM2: 

2F8 16 /dev/ttyS0 

3 

COM4: 2E8 16 /dev/ttyS2 

La prima e la terza porta seriale 

condividono lo stesso IRQ. 

La seconda e la quarta porta seriale 

condividono lo stesso IRQ. 

Si osservi nell’esempio l’uso dell’attributo ‘width’. Precisamente, l’elemento ‘html’ consente 

l’uso degli attributi ‘width’ e ‘height’ per stabilire le dimensioni dell’oggetto HTML importato 

nella composizione stampata. In questo caso, è stata specificata la larghezza, corrispondente 

allo spazio orizzontale a disposizione, in modo che l’altezza venga adattata automaticamente, 

mantenendo lo stesso rapporto.


Tabella 272.27. Inserimento letterale di codice TeX e HTML; inserimento condizionato 

in base al tipo di composizione. 


Chiusu- 

attributo 


html Sì Sì #PCDATA Codice HTML letterale. 

width -- -- Attributo 

Larghezza nella composizione 

stampata. 

height -- -- Attributo 

Altezza nella composizione stampata. 

tex Sì Sì #PCDATA Codice TeX o LaTeX letterale. 

Blocco condizionato alla composizione 

in HTML. 

ifhtml Sì Sì %block; 

Blocco condizionato alla composizione 

in 

iftex Sì Sì %block; 

TeX. 

Si rammenti che mentre quanto contenuto nell’elemento ‘html’ appare sia nella composizione 

per la stampa, sia nella composizione HTML, l’elemento ‘tex’ genera un risultato utile solo 

nella composizione per la stampa. 

Per quanto riguarda il caso particolare dell’elemento ‘tex’, si tenga in considerazione piuttosto 

la possibilità di usare gli elementi ‘teximg’ e ‘teximage’, che generano un risultato 

visibile anche nel formato HTML finale, attraverso la trasformazione automatica in forma di 

immagine. 

272.8 Definizione alternativa della suddivisione del 

documento 

Alml è pensato per la realizzazione di documenti di grandi dimensioni. In questo senso, la sua 

struttura normale è quella di un libro, articolato in capitoli che si possono raggruppare in parti 

e tomi. Eventualmente, se questa struttura va definita attraverso termini differenti, si possono 

sostituire le parole «capitolo», «parte» e «tomo», con altre più appropriate. 

Per questo si usano gli elementi ‘chapterdefinition’, ‘partdefinition’ e 

‘tomedefinition’, all’interno delle informazioni amministrative. L’esempio seguente 

dovrebbe permettere di comprendere il problema; per la precisione si tratta di una rivista 

telematica ipotetica: 

 

 

Rivista di informatica libera 

informatica libera, software libero 

articolo 

numero 

anno 

 

RIL, rivista di informatica libera 

Pinco Pallino <pinco.pallino@brot.dg> 

2011.11.11 

 

Copyright © Pinco Pallino, <pinco.pallino@brot.dg> 

 

Table of contents 

 

Si può osservare che le parole «articolo», «numero» e «anno», sono state inserite usando lettere 

minuscole e in forma singolare. Ciò è necessario, perché l’iniziale maiuscola viene ottenuta 

automaticamente quando opportuno; inoltre, questi termini vengono usati sempre quando si fa 

riferimento a un solo oggetto.


La numerazione dei tomi, delle parti e dei capitoli è indipendente, per cui non ci si può aspettare 

che al cambio di un tomo o di una parte, i capitoli riprendano la numerazione a partire da 

uno. 

272.9 Riferimento alla larghezza del testo 

In generale, non esiste la possibilità di attribuire agli attributi ‘width’ di immagini e simili, un 

riferimento alla larghezza effettivamente a disposizione. In altri termini, non esiste la possibilità 

di fare riferimento a ciò che per LaTeX può essere l’istruzione ‘\textwidth’. In questo modo, 

se si decide in un momento successivo di modificare lo spazio orizzontale utilizzabile all’interno 

delle pagine, si può essere costretti a verificare tutte le dimensioni di questi oggetti particolari. 

Per risolvere l’inconveniente si può definire un’entità interna all’inizio del documento: 

 

Successivamente si può usare questa stessa entità per dichiarare la larghezza del corpo della 

pagina: 

 

 

... 

&BODYWIDTH; 

... 

 

Quindi, nello stesso modo per le immagini e altri oggetti che si traducono nell’incorporazione di 

immagini che devono avere una larghezza uguale alla massima ampiezza disponibile: 

Bla bla bla 

 

 

bla bla bla. 


Entità ISO gestite da Alml 

Capitolo 273 

Nel seguito vengono mostrate alcune tabelle che riportano lo stato attuale del supporto dato da 

Alml alle entità ISO standard. Ciò che non è disponibile, appare come racchiuso tra parentesi 

quadre. 

Tabella 273.1. Entità ISOnum: numeric and special graphic. Prima parte. 

SGML macro Risultato Descrizione in inglese 

&half; ½ fraction one-half 

½ ½ fraction one-half 

¼ ¼ fraction one-quarter 

¾ ¾ fraction three-quarters 

&frac18; [frac18] fraction one-eighth 

&frac38; [frac38] fraction three-eighths 

&frac58; [frac58] fraction five-eighths 

&frac78; [frac78] fraction seven-eighths 

¹ 1 superscript one 

² 2 superscript two 

³ 3 superscript three 

+ + plus sign 

± ± plus-or-minus sign 

< < less-than sign 

= = equals sign 

> > greater-than sign 

÷ ÷ divide sign 

× × multiply sign 

¤ ¤ general currency sign 

£ £ pound sign 

&dollar; $ dollar sign 

¢ ¢ cent sign 

¥ ¥ yen sign 

&num; # number sign 

&percnt; % percent sign 

& & ampersand 

&ast; * asterisk 

&commat; @ commercial at 

[ [ left square bracket 

\ \ reverse solidus 

] ] right square bracket 

{ { left curly bracket 

&horbar; [horbar] horizontal bar 

| | vertical bar 

} } right curly bracket 

Tabella 273.2. Entità ISOnum: numeric and special graphic. Seconda parte. 


µ µ micro sign 

&ohm; [ohm ] ohm sign 

° ° degree sign 

º º ordinal indicator, masculine 

ª ª ordinal indicator, feminine 

§ § section sign 

¶ pilcrow (paragraph sign) 

· . middle dot 

← [larr ] leftward arrow 

2981

2982 Entità ISO gestite da Alml 


→ [rarr ] rightward arrow 

↑ [uarr ] upward arrow 

↓ [darr ] downward arrow 

© © copyright sign 

® ® registered sign 

™ [trade ] trade mark sign 

¦ ¦ broken (vertical) bar 

¬ ¬ not sign 

&sung; [sung ] music note (sung text sign) 

&excl; ! exclamation mark 

¡ ¡ inverted exclamation mark 

" " quotation mark 

' ’ apostrophe 

( ( left parenthesis 

) ) right parenthesis 

, , comma 

&lowbar; _ low line 

&hyphen; - hyphen 

&period; . full stop, period 

/ / solidus 

&colon; : colon 

&semi; ; semicolon 

&quest; ? question mark 

¿ ¿ inverted question mark 

« « angle quotation mark, left 

» » angle quotation mark, right 

‘ ‘ single quotation mark, left 

’ ’ single quotation mark, right 

“ [ldquo ] double quotation mark, left 

” [rdquo ] double quotation mark, right 

 

no break (required) space 

 

soft hyphen 

Tabella 273.3. Entità ISOtech: general technical. Prima parte. 


&aleph; [aleph ] aleph, Hebrew 

&and; [and ] logical and 

&ang90; [ang90 ] right (90 degree) angle 

&angsph; [angsph] angle-spherical 

≈ [ap ] approximate 

&becaus; [becaus] because 

&bottom; [bottom] perpendicular 

∩ [cap ] intersection 

&cong; [cong ] congruent with 

&conint; [conint] contour integral operator 

∪ [cup ] union or logical sum 

&equiv; [equiv ] identical with 

∃ [exist ] at least one exists 

∀ [forall] for all 

&fnof; [fnof ] function of (italic small f) 

≥ ≥ greater-than-or-equal 

&iff; [iff ] if and only if 

∞ [infin ] infinity 

∫ [int ] integral operator 

∈ [isin ] set membership 

&lang; [lang ] left angle bracket

Entità ISO gestite da Alml 2983 


⇐ [lArr ] is implied by 

≤ ≤ less-than-or-equal 

− - minus sign 

&mnplus; [mnplus] minus-or-plus sign 

∇ [nabla ] del, Hamilton operator 

≠ [ne ] not equal 

&ni; [ni ] contains 

&or; [or ] logical or 

Tabella 273.4. Entità ISOtech: general technical. Seconda parte. 


&par; [par ] parallel 

∂ [part ] partial differential 

&permil; [permil] per thousand 

&perp; [perp ] perpendicular 

′ [prime ] prime or minute 

″ [Prime ] double prime or second 

&prop; [prop ] is proportional to 

√ [radic ] radical 

&rang; [rang ] right angle bracket 

⇒ [rArr ] implies 

&sim; [sim ] similar 

&sime; [sime ] similar, equals 

&square; [square] square 

⊂ [sub ] subset or is implied by 

&sube; [sube ] subset, equals 

⊃ [sup ] superset or implies 

&supe; [supe ] superset, equals 

&there4; [there4] therefore 

&Verbar; [Verbar] dbl vertical bar 

&angst; [angst ] capital A, ring 

&bernou; [bernou] bernoulli function (script capital B) 

&compfn; [compfn] composite function (small circle) 

&Dot; [Dot ] dieresis or umlaut mark 

&DotDot; [DotDot] four dots above 

&hamilt; [hamilt] hamiltonian (script capital H) 

&lagran; [lagran] lagrangian (script capital L) 

&lowast; [lowast] low asterisk 

∉ [notin ] negated set membership 

&order; [order ] order of (script small o) 

&phmmat; [phmmat] physics M-matrix (script capital M) 

&tdot; [tdot ] three dots above 

‴ [tprime] triple prime 

&wedgeq; [wedgeq] corresponds to (wedge, equals) 

Tabella 273.5. Entità ISOlat1: added latin 1. Prima parte. 


á á small a, acute accent 

Á Á capital A, acute accent 

â â small a, circumflex accent 

Â Â capital A, circumflex accent 

à à small a, grave accent 

À À capital A, grave accent 

å å small a, ring

2984 Entità ISO gestite da Alml 


Å Å capital A, ring 

ã ã small a, tilde 

Ã Ã capital A, tilde 

ä ä small a, dieresis or umlaut mark 

Ä Ä capital A, dieresis or umlaut mark 

æ æ small ae diphthong (ligature) 

Æ Æ capital AE diphthong (ligature) 

ç ç small c, cedilla 

Ç Ç capital C, cedilla 

ð ð small eth, Icelandic 

Ð Ð capital Eth, Icelandic 

é é small e, acute accent 

É É capital E, acute accent 

ê ê small e, circumflex accent 

Ê Ê capital E, circumflex accent 

è è small e, grave accent 

È È capital E, grave accent 

ë ë small e, dieresis or umlaut mark 

Ë Ë capital E, dieresis or umlaut mark 

í í small i, acute accent 

Í Í capital I, acute accent 

î î small i, circumflex accent 

Î Î capital I, circumflex accent 

ì ì small i, grave accent 

Ì Ì capital I, grave accent 

ï ï small i, dieresis or umlaut mark 

Ï Ï capital I, dieresis or umlaut mark 

Tabella 273.6. Entità ISOlat1: added latin 1. Seconda parte. 


ñ ñ small n, tilde 

Ñ Ñ capital N, tilde 

ó ó small o, acute accent 

Ó Ó capital O, acute accent 

ô ô small o, circumflex accent 

Ô Ô capital O, circumflex accent 

ò ò small o, grave accent 

Ò Ò capital O, grave accent 

ø ø small o, slash 

Ø Ø capital O, slash 

õ õ small o, tilde 

Õ Õ capital O, tilde 

ö ö small o, dieresis or umlaut mark 

Ö Ö capital O, dieresis or umlaut mark 

ß ß small sharp s, German (sz ligature) 

þ þ small thorn, Icelandic 

Þ Þ capital THORN, Icelandic 

ú ú small u, acute accent 

Ú Ú capital U, acute accent 

û û small u, circumflex accent 

Û Û capital U, circumflex accent 

ù ù small u, grave accent 

Ù Ù capital U, grave accent 

ü ü small u, dieresis or umlaut mark 

Ü Ü capital U, dieresis or umlaut mark 

ý ý small y, acute accent

selezionare composizione occorre

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?