Inizialmente la scoperta del DNA non destò particolare interesse, venne anzi considerata una normale molecola biologica con funzione non identificata. Solo con gli esperimenti di Griffith, che cercò di capire quale fosse l’elemento dello Streptococcus pneumoniae a causare la differenza di patogenicità tra batteri con capsula e senza, si dedusse che il DNA fosse la sede di tutte quelle informazioni chiave alla base della vita. Ad oggi studiare la sequenza genica e verificarne l’integrità è di interesse letteralmente vitale e trova applicazione dalla genetica medica alla genetica evolutiva.
Che significa che il DNA contiene l’informazione di base alla vita?
Il DNA di fatto non è altro che una sequenza di nucleotidi (base azotata + zucchero + gruppo fosfato) che legate tra loro formano una lunga molecola (3 miliardi di nucleotidi circa). Le basi sono poste successivamente l’una all’altra senza uno schema prestabilito, apparentemente, e legando tra di loro formando una struttura a doppia elica. Come può tale struttura, polimero chimicamente, dire al resto della cellula cosa fare? Lo fa tramite due meccanismi: la trascrizione e la successiva traduzione. Essi consistono nella conversione della sequenza dei nucleotidi in una sequenza di RNA (che differisce per l’uso dell’uracile al posto della timina e del ribosio al posto del deossiribosio, e per essere strutturalmente composto da un singolo filamento) e la traduzione di tale sequenza in proteine, che interagendo con le strutture cellulari esplicano una funzione appunto dettata dal DNA. Ovviamente questa è una breve sintesi che ho inserito per far capire quanto sia importante conoscere la sequenza del DNA.
Perché è importante conoscere l’esatta sequenza del DNA?
Diviene importante perché per arrivare alla struttura proteica o alla sequenza degli RNA (ne esistono vari tipi e alcuni agiscono senza la necessità di venire tradotti in proteine) si parte appunto dalla sequenza nucleotidica del Genoma. Con quest ultimo termine si intende l’insieme di tutto il materiale genetico di una cellula.
A questo punto appare chiaro che una o più mutazioni alterino le sequenza di RNA e proteine con possibile alterazione della loro funzionalità, da qui l’importanza nella diagnostica. Dire che non è detto che un cambiamento di sequenza sia necessariamente dannoso è fondamentale: il segreto della biodiversità presente sul nostro Pianeta è proprio lì. Siamo partiti da una sequenza ancestrale che con modificazioni non svantaggiose ci ha portati a ciò che siamo oggi.
Anche i genomi di popolazioni abitanti aree diverse possono differire. Ci sono variazioni, dette polimorfismi, non letali che ci distinguono e aiutano l’identificazione di soggetti con la genetica forense o previene frodi permettendo, ad esempio, di rintracciare la filiera di provenienza di alimenti. Appare chiaro che la conoscenza della sequenza sia fondamentale anche per identificare e ricostruire l’evoluzione e gli spostamenti degli organismi viventi.
Come si sequenzia il DNA?
Per sequenziare il genoma serve quindi escogitare un metodo che permetta di capire come le basi si susseguano tra loro in un segmento o nell’intero materiale genomico.
I metodi classici che hanno iniziato ciò sono due:
- Il metodo di Maxam e Gilbert o a degradazione chimica di catena
- Il metodo di Sanger o a terminazione di catena
Entrambi seguono la stessa logica di base: ottenere dei frammenti di DNA di diversa lunghezza che quindi differiscano tra loro per la presenza di un nucleotide terminale aggiuntivo rispetto al frammento precedente. Se ad esempio consideriamo la seguente sequenza inventata 3′-AAAGTC-5′ il nostro scopo sarebbe quello di ottenere i seguenti prodotti:
- 3′-A-5′
- 3′-AA-5′
- 3′-AAA-5′
- 3′-AAAG-5′
- 3′-AAAGT-5′
- 3-‘AAAGTC-5’
Ovviamente servirebbe una grande quantità di DNA e a singolo filamento per lo stampo. Se la logica è la stessa, in cosa differiscono?
Il primo metodo consiste di usare quattro campioni di DNA e di inserire in ognuno dei composti mutageni che modifichino le basi. In particolare in due si usa il dimetilsolfato che metila preferenzialmente i residui G sull’azoto N(7) e in ambiente acido metila in eguale misura sia i residui G che i residui di A. Nei rimanenti due si usa l’idrazina che modifica sia i residui C che T e in ambiente salino modifica solo le C. In corrispondenza di ogni base modificata si fa agire un agente idrolizzante, la piperidina, che idrolizza la catena di DNA nella posizione in cui si trova la base modificata. In questo modo si ottengono frammenti che vengono fatti correre su un gel elettroforetico e partendo da quello che ha corso di più, che corrisponde al più piccolo e quindi al più vicino all’estremità, si sale ricostruendo la sequenza.
Ad oggi tale metodo è stato totalmente superato per la cancerogenicità dei composti usati.
Il secondo metodo utilizza la DNA polimerasi e il campione di DNA come stampo. Si preparano quattro campioni in ognuno dei quali si mettono 3 dosi di nucleotidi “normali” e i restante in forma “dideossi” ovvero senza la possibilità di legare il nucleotide successivo impedendo l’allungamento della catena. In ogni campione si userà un dideossi nucleotide diverso. La polimerasi sintetizzerà i filamenti in ogni campione e si arresterà ogni qualvolta inserirà un nucleotide modificato così da generare frammenti di varia lunghezza. Essendo il processo casuale è possibile che alcuni frammenti di determinate dimensioni non si formino, si procede quindi ripetendo più volte il processo e confrontando i risultati.
Anche qui i frammenti si fanno correre su un gel elettroforetico e si procede come nel precedente.
Quali solo i limiti?
Prima di tutto il tempo necessario a svolgere tutti i passaggi, successivamente la quantità di materiali da usare e quindi la quantità enorme di spazio necessario per l’elettroforesi. Inoltre sono metodi applicabili solo a piccoli frammenti altrimenti la sensibilità dell’elettroforesi sarebbe quasi nulla, vedremmo una linea continua invece delle classiche bande.
Come è stato ottimizzato?
Con l’invenzione della PCR tale sequenziamento può essere svolto in qualche ora e con pochissimi reagenti. Basta preparare i nucleotidi e i dideossi nucleotidi che verranno aggiunti dalla reazione. Le temperature elevate della PCR fanno denaturare a singolo filamento il DNA rendendo non necessario un trattamento precedente. Inoltre l’uso della fluorescenza unito ad un avanzamento delle tecnologie ha permesso di velocizzare l’analisi dei dati. Se infatti usiamo dei nucleotidi fluorescenti ognuno in maniera diversa e un sequenziatore, ovvero un computer che legge le fluorescenze mano a mano che i frammenti si formano, otterremo una sequenza digitale senza le ambiguità di spazio. A tali sequenziatori sono infatti annessi dei capillari lunghi e meno ingombranti all’interno dei quali si svolge l’elettroforesi stessa e possono arrivare a sostenere fino a 96 campioni contemporaneamente.
Ovviamente le tecniche di fluorescenza utilizzate sono molte, quella di usare 4 dideossi nucleotidi con fluorescenze diverse è la più rapida.
Sequenziamenti di seconda e terza generazione
Ovviamente con l’avanzamento delle biotecnologie e dell’informatica tali tecniche sono state ulteriormente sviluppate e ne sono state introdotte di altre. Tra le più note:
- Pirosequenziamento
- Metodo Illumina
Il primo consiste nella rilevazione di chemoluminescenza in maniera aspecifica. In un campione si inserisce il DNA come stampo a singolo filamento. Si aggiunge una dose di nucleotide unico alla volta. Ovvero aggiungiamo la guanina e vediamo se si appaia. Aggiungiamo l’adenina e vediamo se si appaia e così via. Se c’è stata aggiunta verrà rilasciata luce.
Come? Ogni volta che tale legame avviene con successo il nucleotide rilascia un pirofosfato (due fosfati legati) che vengono usati dall’enzima luciferasi per ossidare la luciferina ed essendo la reazione esotermica rilascia energia come luce, in pratica ciò che fanno le lucciole. I nucleotidi che non si appaiano non emettono luce e vengono degradati dall’enzima apirasi. Ovviamente tutte queste molecole vengono aggiunte nella “soluzione di sequenziamento“.
Il metodo Illumina prevede l’attacco su una base solida di piccoli oligonucleotidi di DNA. Il nostro campione viene frammentato, generalmente con la sonicazione che garantisce estremità piatte e frammenti casuali, vi viene aggiunto un piccolo adattatore che permetta il legame con l’oligonucleotide. A questo punto si aggiungono i nucleotidi fluorescenti e la polimerasi comincia la sintesi: un computer rileva le fluorescenze. Questo ad oggi è tra i metodi più usati e rapidi. Permette il sequenziamento contemporaneo di migliaia di frammenti ottimizzando il tempo.
Mentre i sequenziamenti di seconda generazione, rispetto alla prima, hanno implementato sia le tecniche molecolari che informatiche uno sviluppo di quest’ultime ha portato alla terza generazione. Sono ancora tecniche poco usate dati i costi e la loro sperimentazione. Un esempio è l’utilizzo di una camera detta Zero-mode waveguide che permetta di osservare la fluorescenza dei nucleotidi mano a mano che vengono aggiunti senza la necessità di interrompere l sintesi dei filamenti.
Conoscere la sequenza del DNA è quindi fondamentale; altrettanto è conoscere la posizione di segmenti nel genoma. Infatti può accadere che alcune porzioni del DNA si spostino (traslocazione) o che ci sia del materiale genetico in più e che quindi, nelle diagnosi mediche o anche nella genomica comparata, è importante visualizzare.
Mappe genetiche
Il primo ad effettuare una mappa genetica fu uno studente di Morgan, Sturtevant, che associò la distanza tra due loci sul DNA alla frequenza di ricombinazione: più il genoma compreso tra i frammenti ricombinava e più erano lontani. Una frequenza di ricombinazione del 13% equivale a 13 unità di mappa. Tale metodo non è totalmente preciso in quanto non tiene in considerazione il fatto che alcune sequenze abbiamo una frequenza di ricombinazione maggiore a parità di distanza.
Tra le prime mappe genetiche c’è quella con gli RFLP. Questi sono polimorfismi (definiti sopra) dei siti di restrizione sul DNA. Queste sono le sequenze di riconoscimento degli enzimi di restrizione ovvero proteine che tagliano il DNA su sequenze specifiche. La mappatura consiste nel preparare il segmento da mappare, anche qui usando successivamente l’elettroforesi si deve procedere per segmenti, e lo si digerisce in cinque soluzioni diverse: in tre con un enzima ciascuno nelle restanti due con una combinazione di due enzimi scelti tra i precedenti tre. Il risultato sarà caratterizzato da una serie di frammenti le cui dimensioni vengono dedotte con un’elettroforesi. Unendo le dimensioni dei frammenti tagliati singolarmente con quelli tagliati in doppio si ricostruisce la sequenza dei frammenti. Si può fare una prova effettuando delle digestioni parziali, ovvero con condizioni di tempo e temperatura non ottimali, così da impedire un taglio completo e confrontare le lunghezze ottenute con le precedenti.
- Soluzione con enzima A
- Soluzione con enzima B
- Soluzione con enzima C
- Soluzione con A+B
- Soluzione con B+C
Per evitare le problematiche di tempo e di analisi si può usare la mappatura ottica. Essa consiste ne preparare un vetrino con sopra il campione e di effettuare un taglio con un enzima di restrizione: la rottura è visibile al microscopio e così il locus tagliato. Per fare ciò però i cromosomi devono essere distesi e tale stato si ottiene tramite due modalità:
- Gel stretching
- Combing molecolare
Nel primo si miscela il DNA con dell’agarosio su un vetrino. Questo viene poi inclinato così che i cromosomi si distendano mano a mano che il gel condensa. Il problema è che l’agarosio impedisce una corretta diffrazione luminosa nel microscopio rendendo difficile la visione. Interviene il secondo metodo. Esso consiste nel preparare in un contenitore una soluzione di DNA. In questo viene immerso un vetrino rivestito di silicone ed estratto ad una velocità di 0,3 mm al secondo. Questo permette alle forze di estrazione e di resistenza del silicone e della soluzione di distendere i cromosomi mano a mano che il vetrino fuoriesce.
Il metodo della FISH, ad oggi il più conosciuto, è uno dei meno precisi. Esso infatti consiste nell’usare delle sonde che ibridino il DNA evidenziando le bande di ibridazione. Ha però una bassa risoluzione rendendo difficile distinguere le fluorescenze di segmenti tra loro vicini meno di 1 Mb. Viene usata molto per marcare le sequenze centromeriche (vicine al centro del cromosoma) e per verificare la distanza di altre bande dalle stesse. La bassa sensibilità è stata contenuta usando dei chip con scorrimento di un fluido che distende il campione e ne favorisce la visione, la così detta Fiber FISH.
Tra i metodi più contemporanei c’è un uso sinergico della biologia molecolare e della bioinformatica. Questi metodi prevedono la degradazione del campione di DNA in numerosi frammenti nei quali, tramite PCR, si individuano sequenze dette STS che siano cioè etichette che identifichino un frammento specifico. Si scelgono le sequenze STS in modo che siano uniche nel genoma così da essere specifiche. Analizzate tali STS e la loro posizione, il computer allinea i frammenti in modo da far combaciare le sequenze e le riordina in base alle sovrapposizioni ottenute da più frammentazioni casuali.
Il limite principale sta nelle sequenze ripetute. Nel nostro DNA molte sequenze sono caratterizzate da ripetizioni di varia lunghezza, per esempio GA ripetuto n volte. Queste sono viste dal computer come sequenze sovrapposte per ridondanza piuttosto che ripetizioni consecutive: si ha quindi perdita di tali frammenti. Si supera ciò ripetendo la mappatura più volte e osservando in quali porzioni il computer vari la lunghezza del frammento, probabilmente per il motivo appena descritto. Si procede quindi a tecniche di sequenziamento per entrare nel dettaglio della sequenza.
Conclusioni
Le tecniche di sequenziamento e mappatura ci informano sulla corretta sequenza dei nucleotidi e di porzioni del genoma. Una continua ottimizzazione ci permette di migliorar non solo i empi e le sensibilità dei processi fini a se stessi, ma di migliorare quindi le tecniche di diagnosi molecolare di malattie e predisposizione alle stesse e anche analisi forensi e paleogenetiche sempre più precise.
Fonti
- Brown T. A., “Biotecnologie molecolari”, cap. 10 pagg. 173-197, 2017, Zanichelli, Bologna.
- Brown T. A., “Genomi 4”, cap. 3 pagg. 75-83, 2018, EdiSES, Napoli.