Expressed sequence tag
Da Wikipedia, l'enciclopedia libera.
Le Expressed Sequence Tags (ESTs) sono dei brevi frammenti di DNA trascritti e sequenziati da una sequenza di cDNA (mRNA risultante dopo il processo di splicing) più lunga. In sostanza, rappresentano parti di geni espressi e possono venire utilizzate ad esempio come sonde per identificare quali proteine vengono espresse in una cellula, come nei microarray o possono essere usate nella scoperta di nuovi geni o nella determinazione della loro sequenza e della loro posizione nel genoma.
Il termine EST fu introdotto nel 1991 da Craig Venter, divenuto in seguito famoso per la sua partecipazione al progetto di sequenziamento del genoma umano parallelo allo Human Genome Project [1].
Le EST non corrispondono necessariamente a frammenti di mRNA, ma possono appartenere anche ad altri mRNA non codificanti per alcuna proteina come i miRNA, sebbene presenti in quantità molto basse. Le EST sono sequenze brevi (in genere tra le 300 bp e le 500 bp) e piuttosto inaccurate (circa un 2% di errore); ciò è dovuto al fatto che la reazione di sequenziamento viene di solito effettuata automaticamente in una sola direzione o comunque non-overlapping. Le EST sono dunque in genere piu' corte dei trascritti completi, perché sequenziare un intero mRNA è più costoso: questo però può produrre risultati errati nel caso vi siano forme di splicing alternativo non conosciute.
Le identificazioni di nuove EST procede rapidamente, ed ora le EST pubbliche disponibili ammontano a quasi 40 milioni (GenBank, novembre 2006), di cui quasi 8 milioni derivano da sequenze umane: tuttavia alcuni rappresentano sequenze ridondanti o mappano sullo stesso mRNA, sebbene in punti diversi, il che può spiegare l'enorme abbondanza di EST in rapporto al numero di geni. Infatti al momento attuale di conoscenza del genoma umano (2006), non vi è alcuna verifica sperimentale dell'esistenza di un numero così alto di geni codificanti.
[modifica] Collegamenti
(EN) The NCBI Handbook sezione sulla descrizione delle EST