Privacy Policy Cookie Policy Terms and Conditions SMILES - Wikipedia

SMILES

Da Wikipedia, l'enciclopedia libera.

Stubby
Questa voce è solo un abbozzo (stub) del Progetto chimica. Se puoi, contribuisci adesso a migliorarla secondo le convenzioni di Wikipedia. Per l'elenco completo degli stub di Chimica vedi la relativa categoria.

SMILES è l'acronimo di Simplified Molecular Input Line Entry Specification un metodo per descrivere la struttura di un molecola usando una breve stringa ASCII. Le stringhe SMILES vengono importate da gran parte dei software per il disegno delle molecole per creare modelli bidimensionali o tridimensionali.

La codifica SMILES è stata sviluppata nel 1980 da Arthur Weininger e David Weininger, poi modificata ed estesa da altri, di cui il maggiore è Daylight Chemical Information Systems Inc. Altre notazioni lineari sono il Wiswesser Line Notation (WLN), ROSDAL and SLN (Tripos Inc). Recentemente la IUPAC ha introdotto l'InChI (International Chemical Identifier) come standard di rappresentazione delle formule.

Indice

[modifica] SMILES canonico e SMILES isomerico

Il termine SMILES canonico (Canonical SMILES) indica la versione delle specifiche SMILES che detta le regole affiché ogni molecola abbia una sola rappresentazione SMILES. Una applicazione comune è l'indicizzazione delle molecole in un database.

Il termine SMILES Isomerico (Isomeric SMILES) indica la versione delle specifiche SMILES che include le regole per specificare gli isotopi, la chiralità e le configurazioni del doppio legame.

[modifica] SMILES come rappresentazione di un grafo

In termini di procedure computazionali basate sui grafi, SMILES è una stringa ottenuta per stampa dei simboli dei nodi presenti sul grafo che rappresenta la formula di struttura. Dal grafo vengono prima rimossi gli atomi di idrogeno, quindi i cicli vengono aperti per convertire il grafo in un albero aperto. Dove i cicli sono stati aperti, vengono aggiunti dei suffissi numerici per indicare quali sono i nodi connessi. Le ramificazioni dell'albero sono indicate attraverso l'uso di parentesi.

[modifica] Esempi

Gli atomi sono rappresentati utilizzando il loro simbolo chimico chiuso tra parentesi quadre, come [Au] per oro. L'anione idrossido è [OH-]. Le parentesi quadre possono essere omesse per gli atomi "organici" C, N, O, P, S, Br, Cl e I. Tutti gli altri elementi devono essere racchiusi tra parentesi quadre. Se si omettono le parentesi quadre, si presume che il numero degli atomi di idrogeno sia implicito; per esempio lo SMILES per l'acqua è semplicemente O e per l'etanolo è CCO.

Il doppio legame dell'ossido di carbonio è rappresentato come O=C=O e il triplo legame dell'acido cianidrico come C#N.

Il cicloesano è rappresentato come C1CCCCC1, l'idea è che i due uno indicano la stessa posizione nella molecola, formando così un anello con sei atomi di carbonio. Da notare che è il numerale (in questo caso 1) che rappresenta la posizione piuttosto che la combinazione "C1". Ecco la notazione espansa per chiarire: (C1)-(C)-(C)-(C)-(C)-(C)-1 piuttosto che (C1)-(C)-(C)-(C)-(C)-(C)-(C1).

Gli atomi di C, O, S e N aromatici vengono rappresentati con i loro caratteri minuscoli, rispettivamente 'c', 'o', 's' e 'n'.

Le ramificazioni sono rappresentate da parentesi tonde, ad esempio CCC(=O)O per l'acido propionico e C(F)(F)F per il fluoroformio, che potrebbe anche essere descritto con la formula non canonica: FC(F)F.

[modifica] SMILES isomerici

Struttura del cis-difluoroetilene
Ingrandisci
Struttura del cis-difluoroetilene

Configurazioni del doppio legame sono rappresentate usando i caratteri "/" e "\". Per esempio, F/C=C/F rappresenta il trans-difluoroetilene, dove gli atomi di fluoro sono dalla parte opposta rispetto al doppio legame, invece F/C=C\F rappresenta il cis-difluoroetilene, dove gli atomi di fluoro sono dallo stesso lato del doppio legame.

[modifica] Estensioni

SMARTS è una variante di SMILES che consente l'indicazione di atomi e legami "jolly". Questa funzione è utilizzata ampiamente negli algoritmi di ricerca in database di dati chimici.

[modifica] Voci correlate

  • International Chemical Identifier (InChI), l'alternativa gratuita e open-source a SMILES prodotta dalla IUPAC.

[modifica] Collegamenti esterni

Chimica
float Progetto Chimica | Portale Chimica | Il baretto di chimica
Tutte le voci di chimica | Composti chimici | Voci richieste | Richieste di traduzione | Voci da completare
THIS WEB:

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - be - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - closed_zh_tw - co - cr - cs - csb - cu - cv - cy - da - de - diq - dv - dz - ee - el - eml - en - eo - es - et - eu - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gd - gl - glk - gn - got - gu - gv - ha - haw - he - hi - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mg - mh - mi - mk - ml - mn - mo - mr - ms - mt - mus - my - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - rm - rmy - rn - ro - roa_rup - roa_tara - ru - ru_sib - rw - sa - sc - scn - sco - sd - se - searchcom - sg - sh - si - simple - sk - sl - sm - sn - so - sq - sr - ss - st - su - sv - sw - ta - te - test - tet - tg - th - ti - tk - tl - tlh - tn - to - tokipona - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia 2008 (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -

Static Wikipedia 2007:

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - be - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - closed_zh_tw - co - cr - cs - csb - cu - cv - cy - da - de - diq - dv - dz - ee - el - eml - en - eo - es - et - eu - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gd - gl - glk - gn - got - gu - gv - ha - haw - he - hi - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mg - mh - mi - mk - ml - mn - mo - mr - ms - mt - mus - my - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - rm - rmy - rn - ro - roa_rup - roa_tara - ru - ru_sib - rw - sa - sc - scn - sco - sd - se - searchcom - sg - sh - si - simple - sk - sl - sm - sn - so - sq - sr - ss - st - su - sv - sw - ta - te - test - tet - tg - th - ti - tk - tl - tlh - tn - to - tokipona - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu

Static Wikipedia 2006:

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - be - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - closed_zh_tw - co - cr - cs - csb - cu - cv - cy - da - de - diq - dv - dz - ee - el - eml - en - eo - es - et - eu - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gd - gl - glk - gn - got - gu - gv - ha - haw - he - hi - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mg - mh - mi - mk - ml - mn - mo - mr - ms - mt - mus - my - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - rm - rmy - rn - ro - roa_rup - roa_tara - ru - ru_sib - rw - sa - sc - scn - sco - sd - se - searchcom - sg - sh - si - simple - sk - sl - sm - sn - so - sq - sr - ss - st - su - sv - sw - ta - te - test - tet - tg - th - ti - tk - tl - tlh - tn - to - tokipona - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu