Compilatore
Da Wikipedia, l'enciclopedia libera.
Motivazione: ha uno stile non uniforme e a tratti colloquiale, non è completo, contiene informazioni poco rilevanti. Segnalazione di Smallpox
In informatica, un compilatore è un programma che traduce una serie di istruzioni scritte in un determinato linguaggio di programmazione (codice sorgente) in istruzioni di un altro linguaggio (codice oggetto). Questo processo di traduzione si chiama compilazione.
L'attività inversa, passare dal codice oggetto al codice sorgente è chiamata decompilazione ed è effettuata per mezzo di un decompilatore.
Se tutti i compilatori aderiscono esattamente alla specifica del linguaggio, lo stesso programma potrà essere compilato senza modifiche da ciascun compilatore, producendo risultati semanticamente uguali, ovvero programmi che producono lo stesso risultato se sottoposti agli stessi dati di ingresso. Nella realtà, molti compilatori implementano il linguaggio in modo incompleto, o aggiungono estensioni proprietarie, creando in effetti dei dialetti di ciascun linguaggio. Per i linguaggi che adottano uno standard nella decorazione dei simboli, il codice oggetto generato da compilatori differenti può essere linkato assieme in un unico eseguibile.
Indice |
[modifica] Cenni storici
Negli anni 50 sono stati sviluppati diversi compilatori sperimentali (vedi ad esempio, i primi lavori di Grace Hopper sul linguaggio A-0), ma nel 1957 il team FORTRAN presso l'IBM, guidato da John Backus, fu accreditato come primo inventore di un compilatore completo. Il COBOL fu uno dei primi linguaggi nel 1960 ad essere compilato su più architteture [1].
L'idea della compilazione prese velocemente piede e molti dei principi di design dei compilatori vennero sviluppati negli anni 60.
Un compilatore è esso stesso un programma scritto in un qualche linguaggio. I primi compilatori venivano scritti in Assembler. Il primo compilatore auto-compilato, capace cioè di compilare il suo stesso codice, fu creato per il linguaggio Lisp da Hart e Levin presso il MIT nel 1962 [2].
L'uso di linguaggio ad alto livello per scrivere i compilatori ebbe una spinta nei primi anni '70, quando i compilatori Pascal e C furono scritti negli stessi linguaggi. Creare un compilatore autocompilante introduce un problema di bootstrapping, il primo compilatore di quel linguaggio deve essere per forza scritto in un altro linguaggio o compilato facendo girare il compilatore come un interprete (come fecero Hart e Levin con il loro compilatore Lisp).
[modifica] Schema di funzionamento
Il compilatore prende in ingresso un programma, il codice sorgente, su cui esegue una serie di operazioni in modo da ottenere, in assenza di errori, il codice oggetto. In generale i compilatori sono in grado di riconoscere alcune classi di errori presenti nel programma, e in alcuni casi di suggerire in che modo correggerli.
I compilatori attuali dividono l'operazione di compilazione in due stadi principali il front end e il back-end. Nello stadio di front end il compilatore traduce il sorgente in un linguaggio intermedio (di solito interno al compilatore); nello stadio di back end avviene la generazione del codice oggetto.
[modifica] Stadio di front end
Questo stadio si suddivide in più fasi:
- Analisi lessicale Attraverso un'analizzatore lessicale, spesso chiamato scanner o lexer, il compilatore divide il codice sorgente in tanti pezzetti chiamati token. I token sono gli elementi minimi (non ulteriormente divisibili) di un linguaggio, ad esempio parole chiave (for, while), nomi di variabili (pippo), operatori (+, -, <<).
- Analisi sintattica L'analisi sintattica prende in ingresso la sequenza di token generata nella fase precedente ed esegue il controllo sintattico. Il controllo sintattico è effettuato attraverso un grammatica. Il risultato di questa fase è un albero di sintassi.
- Analisi semantica L'analisi semantica si occupa di controllare il significato delle istruzioni presenti nel codice in ingresso. Controlli tipici di questa fase sono il type checking, ovvero il controllo di tipo, controllare che gli identificatori siano stati dichiarati prima di essere usati e cosi via. Come supporto a questa fase viene creata una tabella dei simboli (symbol table) che contiene informazioni su tutti gli elementi simbolici incontrati quali nome, scope, tipo (se presente) etc. Il risultato di questa fase è l'albero di sintassi astratta (AST).
- Generazione del codice intermedio: Dall'albero di sintassi viene generato il codice intermedio.
[modifica] Stadio di back end
Anche lo stadio di back end si divide in più fasi:
- Ottimizzazione del codice intermedio: in questa fase avvengono delle ottimizzazione sul codice intermedio.
- Generazione del codice target: in questa fase viene generato il codice nella forma del linguaggio target. Spesso il linguaggio target è un linguaggio macchina.
[modifica] Schema riassuntivo
Flusso | Attività |
---|---|
Codice sorgente | Editing |
Analizzatore lessicale | Analisi lessicale |
Token | |
Analizzatore sintattico | Analisi sintattica |
Albero di sintassi | |
Analizzatore semantico | Analisi semantica |
Albero di sintassi astratta | |
Generatore di codice intermedio | |
codice intermedio | |
Ottimizzatore codice intermedio | |
codice intermedio | |
Generatore codice target | |
codice target |
[modifica] Riferimenti
- Compilers: Principles, Techniques and Tools di Alfred V. Aho, Ravi Sethi, e Jeffrey D. Ullman (ISBN 0201100886) è considerato il testo di riferimento sui principi della compilazione e sulle tecniche citate in precedenza. (Il libro è spesso chiamato Dragon Book (il libro del dragone) a causa dell'immagine della copertina che raffigura il Cavaliere della Programmazione che lotta con il Dragone del design dei compilatori.)
Collegamento esteso all'editore