La Community italiana per le Scienze della Vita

Un gene, molte proteine: la caduta di un assioma della biologia molecolare

La teoria che ciascun gene è responsabile della sintesi di un singolo enzima fu enunciata dal genetista statunitense George Beadle nel 1945. Successivamente si comprese che i geni possono codificare anche per proteine non enzimatiche o singole catene polipeptidiche e da “un gene, un enzima” si passò a “un gene, una catena polipeptidica“. Solo in tempi più recenti si è scoperto che questo, che era considerato un assioma della biologia molecolare, è vero solo in parte e che anzi negli organismi complessi come l’uomo da un singolo gene vengono spesso generate più proteine. E non potrebbe essere diversamente, se consideriamo che il genoma umano è costituito da “soli” 20000-25000 geni, meno del doppio di genomi di organismi estremamente meno complessi dell’uomo, come Drosophila melanogaster, il comune moscerino della frutta.

Dal gene alla proteina

Il DNA contiene le istruzioni per la sintesi della proteine “scritte” nella sequenza dei nucleotidi che lo compongono: serie di 3 nucleotidi, i codoni, codificano per un amminoacido, che è l’unità fondamentale della proteina. La cellula però non è in grado di leggere l’informazione così come è scritta nel DNA: così questa viene prima ricopiata su una molecola di RNA messaggero (mRNA) nel nucleo (trascrizione) e poi usata come stampo per la sintesi della proteina da organelli cellulari chiamati ribosomi nel citoplasma (traduzione). E’ nelle fasi intermedie di questa catena che si verificano una serie di processi, soprattutto a carico dell’RNA messaggero, che possono generare proteine la cui sequenza di amminoacidi non corrisponde esattamente alla sequenza di nucleotidi del gene originale.

Splicing alternativo

Il primo e più noto processo è quello dello splicing alternativo dell’RNA. Un gene eucariotico è costituito da porzioni codificanti, gli esoni, separate da porzioni non codificanti, gli introni, il cui ruolo nella cellula non è ancora completamente chiaro. Certo è che questi introni non vengono tradotti in proteine e sono quindi assenti nell’mRNA maturo. Sono però stati osservati precursori degli mRNA non ancora maturi e di dimensioni maggiori, la cui presenza nel nucleo suggerisce che gli introni vengono inizialmente trascritti sulla molecola di RNA assieme agli esoni e poi rimossi in un secondo momento, in un processo di “taglia e cuci“.

La rimozione degli introni e il congiungimento dei rimanenti esoni è il cosiddetto splicing, che viene definito “alternativo” quando uno stesso precursore subisce processi di splicing differenti originando trascritti maturi diversi, in cui ad esempio gli esoni vengono congiunti in maniera diversa o viene mantenuta solo una delle due versioni mutuamente esclusive di un esone. Questi diversi mRNA produrranno proteine differenti, ognuna con la sua funzione.

Fig.1 Rappresentazione di splicing alternativo

Editing dell’RNA

Ancora a carico dell’RNA è il cosiddetto processo di editing, che consente di modificare, inserire o rimuovere singoli nucleotidi, generando mRNA che differiscono tra di loro e dal loro stampo di DNA in una o più posizioni. Non pensate che la sostituzione di un singolo nucleotide sia cosa da poco, anzi! Spesso significa sostituire un amminoacido con un altro e quindi modificare le proprietà strutturali e funzionali di una proteina. Un esempio classico è quello dell’apolipoproteina B,  che serve a trasportare i lipidi e viene normalmente sintetizzata intera nel fegato dei mammiferi, mentre nell’intestino il suo mRNA subisce un processo di editing: a causa della conversione di un solo nucleotide, il codone dell’amminoacido glutammina viene sostituito con un codone di stop, interrompendo il processo di traduzione a metà e generando una proteina tronca, più corta della sua controparte nel fegato ma comunque funzionale, anche se con un ruolo diverso.

Un gene..nessuna proteina

Ma chi ha detto che un gene debba necessariamente codificare per una o più proteine? Di tutto il nostro genoma solo il 2% codifica per proteine; il restante 98% veniva definito poco carinamente “DNA spazzatura”, proprio perché non genera nessuna proteina. Le sue funzioni rimangono ancora parzialmente sconosciute, ma stiamo iniziando a scoprirle: sappiamo, ad esempio, che parte di questo DNA viene trascritto in RNA, ma qui il processo si arresta e non prosegue con la sintesi di una proteina. In questo caso l’RNA non è un intermedio o un messaggero, ma il prodotto finale vero e proprio, che esercita una funzione all’interno della cellula.

Sono chiamati RNA non codificanti (ncRNA) e ne esistono diversi tipi, classificati in base alle loro dimensioni e funzioni. I ncRNA hanno un ruolo importante nella regolazione dell’espressione genica; sono in grado di “accendere” o “spegnere” determinati geni, interagendo con il DNA in posizioni precise che dipendono dalla loro sequenza e sono stati associati a un grande numero di processi fisiologici e patologici. Attenzione quindi a chiamarlo DNA spazzatura: la presenza di regioni non codificanti, ma comunque funzionali, ci ha costretto a estendere la definizione stessa di “gene”, scardinando ancora di più il vecchio assioma “un gene, una proteina”.

Fig.2 Il gene viene oggi definito come una porzione del genoma che contiene le informazioni necessarie per codificare molecole che hanno una funzione, siano esse proteine o RNA

Una proteina…molte funzioni

Ritorniamo a quel 2% di DNA codificante: sappiamo che possono esserci una serie di modificazioni a carico dell’RNA, cosicché la successione di amminoacidi nella proteina non corrisponda più alla sequenza del DNA iniziale. Ma se pensate che sia finita qui, vi sbagliate. Le modificazioni post-traduzionali a carico delle proteine consentono di aumentare ancora di uno o due ordini di grandezza il numero di varianti proteiche presenti nell’organismo rispetto al numero dei geni che compongono il genoma.

Le proteine all’interno della cellula vanno incontro a una serie di peripezie e vicissitudini: possono essere processate, rompendo il legame peptidico tra gli amminoacidi che le compongono, o possono legarsi a un grande numero di gruppi chimici diversi, che gli conferiscono funzioni, ne modificano la struttura o la localizzazione, ne modulano il riconoscimento da parte di recettori, ne attivano o inibiscono l’attività enzimatica. Da una stessa proteina possono quindi originarsi diverse isoforme, ognuna con le sue peculiarità.

Non rattristiamoci quindi se nostri geni in proporzione ci sembrano  “pochi”; la biologia molecolare ci insegna che non è importante la quantità, ma la complessità dei processi di regolazione genica, che riescono a moltiplicare le varianti proteiche e a generare quello straordinariamente complesso insieme di cellule, molecole, organi e apparati che è l’essere umano.

Scarica il PDF dell’articolo

Fonte: Biologia molecolare (2011). Amaldi, Benedetti, Pesole, Plevani.

Articoli correlati
Commenta