Dynamic-link library
Da Wikipedia, l'enciclopedia libera.
In informatica, una dynamic-link library (in inglese libreria a collegamento dinamico) è una libreria software che non viene collegata staticamente ad un eseguibile in fase di compilazione, ma che viene caricata dinamicamente in fase di esecuzione. Queste librerie sono note con l'acronimo DLL, che è l'estensione del file che hanno nel sistema operativo Microsoft Windows. Nei sistemi Linux sono invece note come "so", abbreviazione di shared object.
Indice |
[modifica] Vantaggi e svantaggi
La separazione del codice in librerie a collegamento dinamico permette di spezzare i programmi in parti concettualmente separate, che verranno caricate solo se effettivamente necessarie. Inoltre, una singola libreria può essere caricata in memoria una sola volta e utilizzata da più programmi, il che permette di risparmiare le risorse del sistema.
Un altro vantaggio è la possibilità di aggiornare un programma modificando solo le DLL: inserendo una versione diversa della DLL, che contiene ad esempio dei bug fix, tutti i programmi che la usano saranno automaticamente "aggiornati" senza bisogno di essere ricompilati.
Il principale svantaggio è legato al fatto che una nuova versione di una DLL, se mal progettata, potrebbe avere un comportamento diverso, interferendo in alcuni casi addirittura con il funzionamento di alcuni programmi che usavano la versione precedente. Ancora più critico il caso in cui un programma di installazione sovrascriva una DLL con una versione più vecchia. Questi problemi, ben noti ai programmatori, sono chiamati in gergo "DLL Hell" (inferno delle DLL).
[modifica] Struttura e funzionamento
Quanto segue descrive la struttura ed il funzionamento di una libreria a collegamento dinamico in ambiente Windows, tuttavia i concetti espressi sono generalmente equivalenti in tutti i sistemi che permettono l'uso di librerie dinamiche.
[modifica] Entry point
Una libreria a collegamento dinamico è a tutti gli effetti un codice eseguibile. Ogni file eseguibile (EXE o DLL) dispone di un punto d'ingresso (entry point) invocato dal sistema operativo subito dopo il caricamento. Per una DLL il punto d'ingresso è mappato per convenzione sulla funzione DllMain (a discrezione, comunque, del compilatore).
La funzione DllMain viene invocata, oltre che al caricamento della DLL, anche allo scaricamento e quando un thread viene creato o distrutto nel processo in cui la DLL risiede.
A differenza di un file EXE, la DLL deve uscire dall'entry point non appena ha terminato le inizializzazioni necessarie.
[modifica] Struttura
Per semplificare, possiamo pensare ad una libreria come ad una raccolta di funzioni. Ognuna di queste funzioni avrà il proprio indirizzo di base, calcolato come offset rispetto all'indirizzo di base assegnato dal sistema operativo durante il caricamento della libreria (vedi paragrafo successivo). Ciò che distingue una libreria dinamica è che queste funzioni possono essere esportate, ovvero i loro nomi vengono posti in una lista in una sezione dell'eseguibile. Perciò è possibile determinare il punto di ingresso di una funzione con una ricerca testuale basata sul nome della funzione. Questa operazione è svolta dall'API GetProcAddress che restituisce l'indirizzo della funzione il cui nome è passato come parametro.
[modifica] Caricamento
Le librerie dinamiche vengono caricate dal sistema operativo all'interno dello spazio di memoria del processo che le ha richieste. In questo modo l'accesso al codice della DLL avrà prestazioni quasi equivalenti a quelle del codice dell'applicazione stessa o del codice delle librerie statiche (vedremo in seguito perché quasi equivalenti).
Per evitare che il codice dell'appicazione e quello della DLL occupino la stessa posizione in memoria, il linker dovrà predisporre la DLL per la rilocazione. In pratica, il sistema operativo determina un'area di memoria disponibile e rimappa ogni riferimento alla memoria contenuto nella DLL. Siccome quest'operazione richiede tempo, ogni DLL dispone di un proprio indirizzo di base ideale: la rilocazione sarà necessaria solo se a questo indirizzo prederminato è già stata mappata una precedente DLL. Per specificare l'indirizzo ideale si può usare una regola empirica, basata sulla lettera iniziale del nome della DLL, secondo la seguente tabella:
Lettera iniziale | Indirizzo di base |
---|---|
A-C | 0x60000000 |
D-F | 0x61000000 |
G-I | 0x62000000 |
J-L | 0x63000000 |
M-O | 0x64000000 |
P-R | 0x65000000 |
S-U | 0x66000000 |
V-X | 0x67000000 |
Y-Z | 0x68000000 |
[modifica] Collegamento ad un eseguibile
Il collegamento di un eseguibile ad una libreria dinamica avviene durante l'esecuzione (a run time) ed avviene tramite l'API LoadLibrary, che accetta in input il nome della libreria. Ad esempio LoadLibrary(_T("MyLib.dll")) caricherà all'interno dello spazio di memoria dell'applicazione la DLL MyLib.dll.
Il collegamento può essere di due tipi: esplicito o implicito.
[modifica] Collegamento esplicito
Il collegamento esplicito viene gestito direttamente dal codice del programma con l'utilizzo delle due API LoadLibrary e GetProcAddress precedentemente descritte. Se si utilizza il linguaggio C si allocherà un puntatore alla funzione specificata nel quale, al momento di utilizzare la funzione richiesta, si caricherà l'indirizzo con GetProcAddress. Questa tecnica permette di gestire in modo appropriato la condizione nella quale una DLL richiesta non è presente nel sistema, ma in generale è più macchinosa perché richiede l'utilizzo esplicito delle due API. Questa tecnica è indispensabile usando alcuni linguaggi di programmazione, quali ad esempio Visual Basic.
[modifica] Collegamento implicito
Il collegamento implicito è gestito direttamente dal linker in fase di compilazione, ed è usato quando si assume che una DLL sia sempre presente nel sistema. Ogni volta che nel codice sorgente è richiamata una funzione contenuta in una DLL, il linker collegherà la chiamata a funzione ad una funzione stub, ovvero ad una funzione fittizia. All'interno dell'eseguibile vi sarà una tabella contenente gli stub a tutte le funzioni di DLL richieste. In fase di caricamento dell'eseguibile, il sistema operativo caricherà in automatico tutte le DLL richieste e mapperà ogni stub al punto di ingresso della relativa funzione nella relativa DLL. Se una DLL (o anche una singola funzione in una DLL) richiesta non viene trovata il sistema operativo bloccherà l'avvio del programma con un messaggio di errore.
L'utilizzo del collegamento implicito ha uno svantaggio in termini di prestazioni, perché ogni volta che viene richiamata una funzione contenuta in una DLL vi è un doppio salto a funzione: prima allo stub e poi all'indirizzo della funzione; l'overhead generato è in realtà trascurabile.
[modifica] Collegamento implicito ritardato
Una variante al collegamento implicito prevista da alcuni compilatori è il collegamento ritardato. In questo caso viene utilizzato uno stub speciale, che non viene mappato al caricamento dal sistema operativo. Questo stub invece, la prima volta che verrà invocato, si mapperà automaticamente (con la tecnica del collegamento esplicito) alla funzione della DLL. Questa tecnica ha il vantaggio di non richiedere la presenza della DLL per il caricamento dell'eseguibile, insieme alla comodità di non dover caricare esplicitamente da codice la libreria.