Una comprensione completa della funzione delle molecole di RNA richiede la conoscenza delle loro strutture di ordine superiore (2D e 3D) e delle caratteristiche della loro sequenza primaria. La struttura dell’RNA è importante per molte funzioni, tra cui la regolazione della trascrizione e della traduzione, la catalisi, il trasporto di proteine attraverso le membrane e la regolazione dei virus a RNA. La comprensione di queste funzioni è importante per la biologia di base e per lo sviluppo di farmaci che possono intervenire nei casi in cui si verifica la funzionalità patologica di queste molecole.
Il nostro gruppo svolge attività di ricerca e sviluppo di metodologie per migliorare la piegatura dell’RNA e tecniche di analisi per aiutare ulteriormente la nostra comprensione delle proprietà funzionali di queste molecole. Inoltre, ci stiamo concentrando sul campo emergente della nanobiologia dell’RNA. L’RNA rappresenta un materiale molecolare relativamente nuovo per lo sviluppo di nano dispositivi biologicamente orientati. È un materiale interessante per le sue funzionalità naturali, la sua capacità di piegarsi in strutture complesse e di autoassemblarsi. Abbiamo sviluppato metodologie computazionali e sperimentali che consentono la progettazione di nanoparticelle basate su RNA che potenzialmente hanno una varietà di usi. Pertanto, la nostra ricerca sull’RNA copre cinque aree di ricerca altamente correlate e integrate:
- Ricerca in algoritmi per la previsione e l’analisi della struttura secondaria dell’RNA;
- Biologia dell’RNA e sua relazione con le caratteristiche di piegatura della sequenza e della struttura secondaria;
- Ricerca in algoritmi per la previsione e l’analisi della struttura 3D dell’RNA e loro applicazione alla biologia dell’RNA;
- Ricerca in algoritmi per la progettazione e l’analisi di nanoparticelle di RNA;
- Progettazione sperimentale, sintesi e delivery di nanoparticelle a base di RNA.
Ciò che si apprende in un’area viene applicato alle altre aree, migliorando la nostra comprensione della struttura dell’RNA, della funzione e della nanobiologia e dell’autoassemblaggio dell’RNA.
Biologia computazionale parallela e struttura dell’RNA
Sono necessari cambiamenti rivoluzionari nei paradigmi computazionali per mantenere la potenza computazionale necessaria per risolvere problemi in biologia molecolare. Non ci si poteva aspettare che le metodologie basate su architetture di computer sequenziali tenessero continuamente il passo con le velocità computazionali necessarie. Al fine di soddisfare le alte velocità necessarie, vengono ora impiegate tecniche computazionali altamente parallele. Il nostro gruppo è stato uno dei pionieri nell’area della biologia computazionale e dell’uso di architetture di computer ad alte prestazioni parallele per questo sforzo.
Tecniche computazionali per la previsione e l’analisi della struttura secondaria dell’RNA
Siamo stati i primi a sviluppare una tecnica di piegatura dell’RNA che utilizza concetti da algoritmi genetici. Il nostro algoritmo, MPGAfold, è stato originariamente sviluppato per funzionare su un supercomputer SIMD massicciamente parallelo, un MasPar MP-2 con processori 16384. Questo algoritmo è stato modificato e ora funziona su cluster Linux ad alte prestazioni paralleli. Caratteristiche di scaling eccezionali si ottengono con la possibilità di eseguire l’algoritmo con centinaia di migliaia di elementi di popolazione. RNA pseudoknot predizione è parte dell’algoritmo genetico, con conseguente sua capacità di prevedere le interazioni terziarie. Altre caratteristiche includono la simulazione della piegatura co-trascrizionale, la capacità di incorporare diverse regole energetiche e l’inibizione forzata e l’incorporamento dei gambi elicoidali desiderati. Inoltre, STRUCTURELAB, il nostro banco di lavoro di analisi dell’RNA bioinformatica eterogenea, può essere utilizzato in combinazione con MPGAfold e RNA2D3D per produrre le coordinate atomiche 3D previste delle strutture di RNA insieme alla visualizzazione di queste strutture. Inoltre, abbiamo sviluppato una nuova metodologia di visualizzazione interattiva che fa parte di STRUCTURELAB. Questa tecnica consente il confronto e l’analisi di pieghe di RNA a sequenza multipla da un punto di vista filogenetico, consentendo così il miglioramento dei risultati strutturali previsti in una famiglia di sequenze.
Abbiamo sviluppato KNetFold, un nuovo e potente algoritmo per la previsione della struttura dell’RNA da allineamenti di sequenza. L’algoritmo utilizza una rete di classificazione gerarchica unica basata su informazioni reciproche, termodinamica e corrispondenza di base Watson-Crick per prevedere le strutture. Inoltre, abbiamo sviluppato un’applicazione basata sul web, CorreLogo, che utilizza informazioni reciproche derivate da allineamenti di sequenze di RNA per determinare covariazioni tra posizioni accoppiate alla base. L’algoritmo include una misura di errore univoco e descrive i risultati in 3D.
Abbiamo sviluppato, CyloFold, un algoritmo unico per la previsione, da una singola sequenza, RNA strutture secondarie che possono includere pseudoknots. Questo algoritmo utilizza una nuova tecnica che approssima il potenziale di scontri sterici 3D nelle strutture previste, filtrando così tali strutture dalla considerazione. L’algoritmo ha dimostrato di avere un’elevata precisione rispetto ad altri algoritmi del suo tipo.
Abbiamo sviluppato un software web basato su un approccio statistico bayesiano che stima l’accuratezza della formazione di coppie di basi da dati derivati da esperimenti di FORMA (selettiva 2′ – Idrossil acilazione analizzata da estensione di Primer). I risultati statistici/probabilistici sono stati ottenuti analizzando le strutture note di RNA 3D con vari tipi di interazioni di base note e correlandole con i valori di FORMA. È stato dimostrato che i valori di FORMA bassa si correlano bene con le interazioni di accoppiamento e impilamento della base Watson-Crick mentre i valori di FORMA alta indicano regioni a singolo filamento. Miglioramenti potrebbero essere visti se si tiene conto anche di un contesto di base 2 o 3. Abbiamo anche dimostrato che altri tipi di interazioni note non sono correlati bene. Questo tipo di informazioni è utile in ultima analisi, determinare la struttura secondaria di RNA.
Studi computazionali di RNA Folding Pathways
RNA folding pathways stanno dimostrando di essere molto importante nella determinazione della funzione di RNA. Gli studi indicano che l’RNA può entrare negli stati conformazionali intermedi che sono chiave alla sua funzionalità. Questi stati possono avere un impatto significativo sull’espressione genica. È noto che gli stati biologicamente funzionali delle molecole di RNA potrebbero non corrispondere al loro stato energetico minimo, che potrebbero esistere barriere cinetiche che intrappolano la molecola in un minimo locale, che il ripiegamento si verifica spesso durante la trascrizione e esistono casi in cui una molecola transiterà tra una o più conformazioni funzionali prima di raggiungere il suo stato nativo. Pertanto, i metodi per simulare i percorsi di piegatura di una molecola di RNA, incluso il ripiegamento co-trascrizionale e l’individuazione di stati intermedi significativi sono importanti per la previsione della struttura dell’RNA e della sua funzione associata. Diversi percorsi biologici di ripiegamento dell’RNA sono stati studiati con successo utilizzando MPGAfold e STRUCTURELAB. Gli esempi includono il viroide del tubero del fuso della patata, il meccanismo ospite-uccisione del plasmide R1 di Escherichia coli, il virus di delta dell’epatite, l’HIV ed il virus della dengue. Questi risultati computazionali sono coerenti con quelli derivati da esperimenti biologici. Inoltre, sono state previste nuove interazioni strutturali e importanti stati intermedi e nativi funzionali. Questi hanno portato a ulteriori esperimenti di conferma di successo.
Computational Prediction of RNA Interaction Networks
Abbiamo anche sviluppato programmi CovaRna e CovStat per esplorare a lungo raggio co-variing RNA interaction networks utilizzando allineamenti genoma intero. Questa nuova metodologia, che è stata applicata ai genomi di Drosophila, è attualmente applicata ad altri genomi. Una versione parallela del programma è stata ideata per accelerare l’elaborazione e gli algoritmi si basano anche su schemi di indicizzazione veloce e metodi statistici conservativi per determinare interazioni altamente significative. La metodologia ha trovato interessanti interazioni correlate ai SIRNA endogeni, al trasporto genico e ai geni legati alla morfogenesi.
Studi computazionali di strutture tridimensionali di RNA
Alcuni elementi strutturali di molecole di RNA sono stati studiati utilizzando simulazioni di meccanica molecolare e dinamica molecolare. Le strutture esaminate includono un tetraloop RNA in cui sono state eseguite la denaturazione dipendente dalla temperatura del tetraloop e il successivo refolding alla struttura cristallina originale. È stata esplorata una giunzione a tre vie dal dominio centrale del nucleo della subunità ribosomiale degli anni ‘ 30 da Thermus thermophilus. È stato determinato sperimentalmente che le interazioni intermolecolari tra la giunzione a tre vie e la proteina ribosomiale S15 iniziano il processo di assemblaggio della subunità ribosomiale 30S. Utilizzando simulazioni di dinamica molecolare abbiamo ottenuto approfondimenti sulle transizioni conformazionali della giunzione associata al legame di S15. Abbiamo determinato utilizzando, simulazioni di dinamica molecolare, gli effetti strutturali dell’utilizzo di nuovi tipi di nucleotidi RNA modificati contenenti zuccheri carbociclici che sono vincolati a conformazioni nord o sud (C2 ‘o C3’ exo). Inoltre, abbiamo mostrato utilizzando simulazioni di dinamica molecolare, come ioni e basi di accompagnamento svolgono un ruolo molto importante nel virus dell’immunodeficienza umana (HIV) baciare conformazioni monomeri loop. Questi risultati correlano bene e possono spiegare in dettaglio, studi sperimentali che indicano l’importanza degli ioni per la dimerizzazione dell’HIV-1.
Abbiamo anche esaminato il dominio pseudoknot della telomerasi. Sono state eseguite modellazioni molecolari e dinamiche molecolari del dominio pseudoknot, incluso il suo tornante. I risultati hanno indicato come la dinamica del tornante abbia influenzato l’apertura e la chiusura delle coppie di basi U-U non canoniche presenti nello stelo. L’apertura suggeriva punti di nucleazione per la formazione dello pseudoknot. Abbiamo anche esaminato l’effetto delle mutazioni di dyskeratosis congenita (DKC) nel ciclo e come hanno ridotto la propensione all’apertura dello stelo formando una rete di legame idrogeno relativamente stabile nel ciclo del tornante. Abbiamo modellato lo pseudoknot stesso usando il nostro software RNA2D3D combinato con l’analisi filogenetica. Abbiamo studiato l’impatto dinamico delle mutazioni DKC sullo pseudoknot con il risultato che lo pseudoknot è diventato instabile mentre la forma a forcina è diventata più stabile.
Abbiamo scoperto e chiarito le strutture 3D di nuovi tipi di enhancers traslazionali che si trovano nel 3′ UTRs del virus Crinkle Rape (il primo del suo genere trovato) e il virus del mosaico enation pisello. La scoperta di questi elementi strutturali ha portato alla luce nuovi meccanismi per il miglioramento traslazionale nei virus delle piante eucariotiche che possono avere implicazioni più ampie per la comprensione dei meccanismi traslazionali in generale. Questo è stato realizzato con l’uso combinato di MPGAfold, il nostro software di modellazione molecolare 3D RNA2D3D, e strette interazioni con i nostri collaboratori sperimentali. Abbiamo anche modellato un romanzo pseudoknot trovato nel mRNA CCR5. Questo pseudoknot è coinvolto nel frameshifting e sembra essere stabilizzato da un microRNA, una nuova funzione per un microRNA.
Inoltre, abbiamo utilizzato metodi basati sull’interpolazione di rete elastica per ridurre i costi computazionali relativi alla dinamica RNA 3D. Le traiettorie dinamiche tridimensionali possono essere determinate utilizzando una rappresentazione atomica ridotta e dati stati conformazionali. Il tempo di calcolo può essere ridotto da settimane a ore utilizzando questo approccio.
Nanobiologia dell’RNA computazionale
La nanobiologia dell’RNA rappresenta una nuova modalità per lo sviluppo di nanodispositivi che hanno il potenziale per l’uso in una serie di aree, inclusa la terapeutica. Basandosi sulla nostra esperienza come descritto sopra, abbiamo sviluppato diverse tecniche computazionali e sperimentali (vedi sotto) che forniscono un mezzo per determinare un insieme di sequenze nucleotidiche che possono assemblare in nano complessi desiderati. Uno di questi strumenti è un database relazionale chiamato RNAJunction. Il database contiene informazioni sulla struttura e sulla sequenza per le giunzioni elicoidali dell’RNA note e le interazioni del ciclo di bacio. Questi motivi possono essere ricercati in una varietà di modi, fornendo una fonte per RNA nano building blocks. Un altro strumento computazionale, NanoTiler, consente all’utente di costruire forme nanoscala specifiche basate su RNA. NanoTiler fornisce una vista grafica 3D degli oggetti in fase di progettazione e fornisce i mezzi per lavorare in modo interattivo o con script di computer sul processo di progettazione, anche se le sequenze di RNA precise non possono ancora essere specificati, e un modello all-atom non è disponibile. NanoTiler può utilizzare i motivi 3D trovati nel database RNAJunction con quelli derivati da modelli di struttura secondaria RNA specificato per costruire una forma definita RNA nano. Inoltre, una ricerca combinatoria può essere applicata per enumerare strutture che normalmente non sarebbero considerate.
Un altro strumento software web-based per la progettazione di nanostrutture RNA è NanoFolder, che è uno dei pochi strumenti software che sono in grado di predire la struttura e gli attributi di sequenza di costrutti di RNA multi-stranded. Con questo software è possibile specificare i motivi di struttura secondaria desiderati e fare in modo che il software preveda l’insieme di sequenze che generano questi motivi desiderati con le corrette caratteristiche di piegatura intra e inter – strand.
Nanobiologia sperimentale dell’RNA
Sulla base degli approcci computazionali sopra descritti alla nanodesign dell’RNA abbiamo dimostrato la capacità di autoassemblare e funzionalizzare sperimentalmente diverse nanoparticelle basate sull’RNA. Ciò è stato realizzato con strette interazioni tra gli approcci sperimentali e computazionali che hanno portato a miglioramenti di entrambi gli insiemi di metodologie. Gli esempi includono l’auto-assemblaggio di 6 e 10 cubi incagliati; l’auto-assemblaggio di anelli esagonali di varie dimensioni e doppi anelli che utilizzano un motivo di RNA estratto dalla natura; la modifica delle sequenze nel motivo per migliorare la resa mantenendo anche geometrie appropriate; e l’auto-assemblaggio di strutture triangolari. Abbiamo anche sviluppato tecniche che definiscono protocolli di autoassemblaggio e che consentono l’assemblaggio co-trascrizionale di costrutti che possono anche includere basi modificate per aumentare la stabilità chimica di queste nanoparticelle. Inoltre, abbiamo funzionalizzato queste particelle con un massimo di sei diversi SIRNA per consentire la stechiometria controllata e il silenziamento genico, e abbiamo dimostrato che queste particelle silenziano effettivamente i geni designati quando vengono trasfettati in varie linee cellulari.
Abbiamo anche esplorato un altro paradigma basato sull’uso di nanocostruzioni ibride RNA/DNA contenenti funzionalità split. Ciò consente, ad esempio, la scissione di un siRNA Diceable in due componenti ibridi DNA/RNA con puntali di DNA, che quando trasfettati nelle cellule si riassembla in un duplex di DNA e un siRNA Diceable. Questo approccio ibrido è stato incorporato nei nostri nanorings esagonali e nanocubes. L’utilità di questo approccio consente, tra le altre cose, l’attivazione controllata delle funzionalità, l’incorporazione di beacon molecolari sui filamenti di DNA senza intefering con la funzionalità dell’RNA e la resistenza alla degradazione della nucleasi. Questo approccio è stato provato con successo nelle colture cellulari e nei modelli murini del tumore dello xenografo.
Molti dei sistemi computazionali sono stati adattati ad altri ambienti all’interno e all’esterno del nostro laboratorio e del NIH e sono accessibili attraverso il nostro sito web all’indirizzo http://www-CCRNP.ncifcrf.gov/~bshapiro.