Etichette di Sequenze Espresse

Le etichette di sequenze espresse sono piccoli segmenti sequenziati dalle estremità dei cloni complementari del DNA (cDNA). Un EST è ottenuto da una sequenza automatica e parziale di una delle centinaia di cloni casualmente selezionati da una libreria di cDNA. Gli EST sono utilizzati per scoprire geni sconosciuti, per mappare un genoma o per identificare le regioni codificanti del genoma.

La parola tag (s.) ha senso traslato di un piccolo pezzo di informazioni utilizzate per identificare qualcosa, azione che denota il verbo corrispondente, che è quello di tag (per etichettare i geni umani). Il primo ad utilizzare EST affacciato sul sequenziamento del genoma umano è stato Craig Venter nel 1991 (anche se la tecnica di John Sulston attribuito a Paul Schimmel e colleghi, che lo utilizzò per la prima volta nel 1983 per trovare i geni che sono espressi nei muscoli). All’epoca, esistevano già sequenze di nucleotidi che diventavano marcatori convenzionali della mappa fisica del genoma umano, conosciuti come STS (siti sequenziati).

EST Venter aveva il vantaggio di rappresentare una piccola porzione del genoma è trascritto, modificato e tradotto, cioè, che “espresso” nella cellula in un dato momento e corrispondeva, quindi, a delle regioni di codifica. Sequenza automatica e rapida di poco più di seicento cDNA cloni selezionati in modo casuale da una libreria di cDNA commerciale ha permesso a Venter di ottenere rapidamente 609 EST genoma umano poi classificati in otto gruppi per la loro somiglianza con le sequenze registrate in banche dati GenBank, PIR o ProSite. Nel 1995, i ricercatori delle istituzioni pubbliche e private avevano isolato più di 170.000 EST, utilizzati per identificare più della metà dei 60.000 o 80.000 geni stimati in quel momento dal genoma umano.