Ein vollständiges Verständnis der Funktion von RNA-Molekülen erfordert Kenntnisse ihrer Strukturen höherer Ordnung (2D und 3D) sowie der Eigenschaften ihrer Primärsequenz. Die RNA-Struktur ist für viele Funktionen wichtig, einschließlich der Regulation der Transkription und Translation, der Katalyse, des Transports von Proteinen über Membranen und der Regulation von RNA-Viren. Das Verständnis dieser Funktionen ist wichtig für die Grundlagenbiologie sowie für die Entwicklung von Medikamenten, die in Fällen eingreifen können, in denen eine pathologische Funktionalität dieser Moleküle auftritt.
Unsere Gruppe forscht und entwickelt Methoden zur Verbesserung der RNA-Faltung und Analysetechniken, um unser Verständnis der funktionellen Eigenschaften dieser Moleküle zu verbessern. Darüber hinaus konzentrieren wir uns auf das aufstrebende Gebiet der RNA-Nanobiologie. RNA stellt ein relativ neues molekulares Material für die Entwicklung biologisch orientierter Nanobauelemente dar. Es ist ein interessantes Material wegen seiner natürlichen Funktionalitäten, seiner Fähigkeit, sich in komplexe Strukturen zu falten und sich selbst zu montieren. Wir haben computergestützte und experimentelle Methoden entwickelt, die das Design von RNA-basierten Nanopartikeln ermöglichen, die möglicherweise eine Vielzahl von Anwendungen haben. Daher umfasst unsere Forschung zu RNA fünf eng verwandte und integrierte Forschungsbereiche:
- Forschung an Algorithmen zur Vorhersage und Analyse der RNA-Sekundärstruktur;
- RNA-Biologie und ihre Beziehung zu Sequenz- und Sekundärstrukturfaltungsmerkmalen;
- Forschung in Algorithmen für RNA 3D-Strukturvorhersage und -analyse und deren Anwendung auf die RNA-Biologie;
- Forschung in Algorithmen für das Design und die Analyse von RNA-Nanopartikeln;
- Experimentelles Design, Synthese und Lieferung von RNA-basierten Nanopartikeln.
Was in einem Bereich gelernt wird, wird auf die anderen Bereiche angewendet, wodurch unser Verständnis der RNA-Struktur, -Funktion sowie der RNA-Nanobiologie und -selbstorganisation verbessert wird.
Parallel Computational Biology and RNA Structure
Revolutionäre Änderungen in den Rechenparadigmen sind erforderlich, um die notwendige Rechenleistung aufrechtzuerhalten, um Probleme in der Molekularbiologie zu lösen. Von Methoden, die auf sequenziellen Rechnerarchitekturen basieren, konnte nicht erwartet werden, dass sie mit den erforderlichen Rechengeschwindigkeiten Schritt halten. Um den hohen Geschwindigkeiten gerecht zu werden, die notwendig sind, werden jetzt hochparallele Rechentechniken eingesetzt. Unsere Gruppe war einer der Pioniere auf dem Gebiet der Computational Biology und der Verwendung paralleler Hochleistungsrechnerarchitekturen für dieses Unterfangen.
Computational Techniques for RNA Secondary Structure Prediction and Analysis
Wir waren die ersten, die eine RNA-Faltungstechnik entwickelten, die Konzepte genetischer Algorithmen verwendet. Unser Algorithmus, MPGAfold, wurde ursprünglich für die Ausführung auf einem massiv parallelen SIMD-Supercomputer entwickelt, einem MasPar MP-2 mit 16384 Prozessoren. Dieser Algorithmus wurde modifiziert und läuft nun auf parallelen Hochleistungs-Linux-Clustern. Außergewöhnliche Skalierungseigenschaften werden mit der Fähigkeit erhalten, den Algorithmus mit Hunderttausenden von Populationselementen auszuführen. Die RNA-Pseudoknoten-Vorhersage ist Teil des genetischen Algorithmus, was zu seiner Fähigkeit führt, tertiäre Wechselwirkungen vorherzusagen. Weitere Merkmale sind die Simulation der co-transkriptionellen Faltung, die Fähigkeit, verschiedene Energieregeln zu integrieren, und die erzwungene Hemmung und Einbettung der gewünschten helikalen Stämme. Darüber hinaus kann STRUCTURELAB, unsere heterogene bioinformatische RNA-Analyse-Workbench, in Verbindung mit MPGAfold und RNA2D3D verwendet werden, um vorhergesagte 3D-Atomkoordinaten von RNA-Strukturen zusammen mit der Visualisierung dieser Strukturen zu erzeugen. Außerdem haben wir eine neuartige interaktive Visualisierungsmethode entwickelt, die Teil von STRUCTURELAB ist. Diese Technik ermöglicht den Vergleich und die Analyse von RNA-Falten mit mehreren Sequenzen aus phylogenetischer Sicht, Dies ermöglicht eine Verbesserung der vorhergesagten strukturellen Ergebnisse über eine Familie von Sequenzen hinweg.
Wir haben KNetFold entwickelt, einen neuartigen und leistungsstarken Algorithmus zur Vorhersage der RNA-Struktur aus Sequenzausrichtungen. Der Algorithmus verwendet ein einzigartiges hierarchisches Klassifikationsnetzwerk, das auf gegenseitigen Informationen, Thermodynamik und Watson-Crick-Basispaarung basiert, um Strukturen vorherzusagen. Darüber hinaus haben wir eine webbasierte Anwendung, CorreLogo, entwickelt, die gegenseitige Informationen aus RNA-Sequenzausrichtungen verwendet, um Kovariationen zwischen basenpaaren Positionen zu bestimmen. Der Algorithmus enthält ein eindeutiges Fehlermaß und stellt die Ergebnisse in 3D dar.
Wir entwickelten CyloFold, einen einzigartigen Algorithmus zur Vorhersage von RNA-Sekundärstrukturen, die Pseudoknots enthalten können, aus einer einzigen Sequenz. Dieser Algorithmus verwendet eine neuartige Technik, die das Potenzial für sterische 3D-Kollisionen in den vorhergesagten Strukturen annähert und so diese Strukturen aus der Betrachtung herausfiltert. Es hat sich gezeigt, dass der Algorithmus im Vergleich zu anderen Algorithmen dieses Typs eine hohe Genauigkeit aufweist.
Wir haben eine Web-Software entwickelt, die auf einem Bayes’schen statistischen Ansatz basiert, der die Genauigkeit der Basenpaarbildung anhand von Daten aus SHAPE-Experimenten (Selektive 2′- Hydroxylacylierung, analysiert durch Primerverlängerung) abschätzt. Die statistischen / probabilistischen Ergebnisse wurden abgeleitet, indem bekannte RNA-3D-Strukturen mit verschiedenen Arten bekannter Baseninteraktionen analysiert und mit Formwerten korreliert wurden. Es wurde gezeigt, dass niedrige Formwerte gut mit Watson-Crick-Basenpaarungs- und Stapelwechselwirkungen korrelieren, während hohe Formwerte auf einzelsträngige Regionen hinweisen. Verbesserungen waren zu sehen, wenn auch ein 2- oder 3-Basiskontext berücksichtigt wurde. Wir zeigten auch, dass andere Arten bekannter Wechselwirkungen nicht gut korrelierten. Diese Art von Informationen ist hilfreich, um letztendlich die Sekundärstruktur von RNAs zu bestimmen.
Computational Studies of RNA Folding Pathways
RNA-Faltungswege erweisen sich als sehr wichtig bei der Bestimmung der RNA-Funktion. Studien deuten darauf hin, dass RNA in Konformationszwischenzustände eintreten kann, die für ihre Funktionalität von entscheidender Bedeutung sind. Diese Zustände können einen signifikanten Einfluss auf die Genexpression haben. Es ist bekannt, dass die biologisch funktionellen Zustände von RNA-Molekülen möglicherweise nicht ihrem minimalen Energiezustand entsprechen, dass kinetische Barrieren existieren können, die das Molekül in einem lokalen Minimum einfangen, dass die Faltung häufig während der Transkription auftritt, und es gibt Fälle, in denen ein Molekül zwischen einer oder mehreren funktionellen Konformationen übergeht, bevor es seinen nativen Zustand erreicht. Daher sind Methoden zur Simulation der Faltungswege eines RNA-Moleküls, einschließlich der kotranskriptionellen Faltung, und zur Lokalisierung signifikanter Zwischenzustände für die Vorhersage der RNA-Struktur und ihrer zugehörigen Funktion wichtig. Mehrere biologische RNA-Faltungswege wurden erfolgreich mit MPGAfold und STRUCTURELAB untersucht. Beispiele hierfür sind das Kartoffelspindelknollenviroid, der Wirtsabtötungsmechanismus des Escherichia coli-Plasmids R1, das Hepatitis-Delta-Virus, HIV und das Dengue-Virus. Diese Rechenergebnisse stimmen mit denen aus biologischen Experimenten überein. Darüber hinaus wurden neuartige strukturelle Wechselwirkungen und wichtige funktionelle Zwischen- und Nativzustände vorhergesagt. Diese haben zu weiteren erfolgreichen Bestätigungsexperimenten geführt.
Computational Prediction of RNA Interaction Networks
Wir haben auch die Programme CovaRna und CovStat entwickelt, um Langstrecken-co-variierende RNA-Interaktionsnetzwerke unter Verwendung von Alignments des gesamten Genoms zu untersuchen. Diese neue Methode, die auf Drosophila-Genome angewendet wurde, wird derzeit auf andere Genome angewendet. Eine parallele Version des Programms wurde entwickelt, um die Verarbeitung zu beschleunigen, und die Algorithmen basieren auch auf schnellen Indexierungsschemata und konservativen statistischen Methoden, um hochsignifikante Wechselwirkungen zu bestimmen. Die Methodik hat interessante Wechselwirkungen gefunden, die mit endogenen siRNAs, Gentransport und Genen im Zusammenhang mit Morphogenese zusammenhängen.
Computational Studies of Three-Dimensional RNA Structures
Einige Strukturelemente von RNA-Molekülen wurden mit Hilfe von Molekularmechanik- und Molekulardynamiksimulationen untersucht. Die untersuchten Strukturen umfassen einen RNA-Tetraloop, bei dem eine temperaturabhängige Denaturierung des Tetraloop und die anschließende Rückfaltung zur ursprünglichen Kristallstruktur durchgeführt wurden. Ein Drei-Wege-Übergang von der zentralen Kerndomäne der 30S-ribosomalen Untereinheit von Thermus thermophilus wurde untersucht. Es wurde experimentell festgestellt, dass die intermolekularen Wechselwirkungen zwischen dem Drei-Wege-Übergang und dem S15-ribosomalen Protein den Prozess der Assemblierung der 30S-ribosomalen Untereinheit initiieren. Durch molekulardynamische Simulationen erhielten wir Einblicke in die Konformationsübergänge der mit der Bindung von S15 verbundenen Verbindung. Wir haben mithilfe von molekulardynamischen Simulationen die strukturellen Auswirkungen der Verwendung neuer Arten modifizierter RNA-Nukleotide bestimmt, die carbocyclische Zucker enthalten, die an Nord- oder Südkonformationen (C2 ‚oder C3‘ exo) gebunden sind. Darüber hinaus haben wir anhand von Molekulardynamiksimulationen gezeigt, wie Ionen und flankierende Basen eine sehr wichtige Rolle bei der Bildung von Monomerkonformationen des humanen Immundefizienzvirus (HIV) spielen. Diese Ergebnisse korrelieren gut und können experimentelle Studien, die auf die Bedeutung von Ionen für die HIV-1-Dimerisierung hinweisen, im Detail erklären.
Wir haben auch die Pseudoknotendomäne der Telomerase untersucht. Molekulare Modellierung und Molekulardynamik der Pseudoknotendomäne, einschließlich ihrer Haarnadelschleife, wurden durchgeführt. Die Ergebnisse zeigten, wie sich die Dynamik der Haarnadelschleife auf das Öffnen und Schließen der nicht kanonischen U-U-Basenpaare im Stamm auswirkte. Die Öffnung schlug Keimbildungspunkte für die Bildung des Pseudoknotens vor. Wir haben auch die Wirkung von Dyskeratosis congenita (DKC) -Mutationen in der Schleife untersucht und wie sie die Neigung zur Öffnung des Stiels verringerten, indem sie ein relativ stabiles Wasserstoffbindungsnetzwerk in der Haarnadelschleife bildeten. Wir modellierten den Pseudoknoten selbst mit unserer RNA2D3D-Software in Kombination mit phylogenetischer Analyse. Wir untersuchten den dynamischen Einfluss der DKC-Mutationen auf den Pseudoknoten mit dem Ergebnis, dass der Pseudoknoten instabil wurde, während die Haarnadelform stabiler wurde.
Wir haben die 3D-Strukturen neuer Arten von Translationsverstärkern entdeckt und aufgeklärt, die in den 3′-UTRs des Turnip Crinkle Virus (dem ersten seiner Art) und des Pea Enation Mosaic Virus gefunden werden. Die Entdeckung dieser Strukturelemente hat neue Mechanismen zur Translationsverbesserung in eukaryotischen Pflanzenviren ans Licht gebracht, die umfassendere Auswirkungen auf das Verständnis von Translationsmechanismen im Allgemeinen haben können. Dies wurde durch den kombinierten Einsatz von MPGAfold, unserer molekularen 3D-Modellierungssoftware RNA2D3D und engen Interaktionen mit unseren experimentellen Mitarbeitern erreicht. Wir modellierten auch einen neuartigen Pseudoknoten, der in der CCR5-mRNA gefunden wurde. Dieser Pseudoknoten ist am Frameshifting beteiligt und scheint durch eine microRNA stabilisiert zu werden, eine neuartige Funktion für eine microRNA.Darüber hinaus haben wir Methoden eingesetzt, die auf elastischer Netzwerkinterpolation basieren, um die Rechenkosten im Zusammenhang mit der RNA-3D-Dynamik zu reduzieren. Dreidimensionale Dynamiktrajektorien können unter Verwendung einer reduzierten Atomdarstellung und gegebener Konformationszustände bestimmt werden. Die Rechenzeit kann mit diesem Ansatz von Wochen auf Stunden reduziert werden.RNA-Nanobiologie stellt eine neue Modalität für die Entwicklung von nanodevices dar, die das Potenzial für Gebrauch in einigen Bereichen, einschließlich Therapeutika haben. Aufbauend auf unserer Erfahrung, wie oben beschrieben, entwickelten wir mehrere rechnerische und experimentelle Techniken (siehe unten), die ein Mittel zur Bestimmung eines Satzes von Nukleotidsequenzen bereitstellen, die sich zu gewünschten Nanokomplexen zusammensetzen können. Eines dieser Tools ist eine relationale Datenbank namens RNAJunction. Die Datenbank enthält Struktur- und Sequenzinformationen für bekannte RNA-Helikalübergänge und Kissing-Loop-Wechselwirkungen. Diese Motive können auf vielfältige Weise gesucht werden und bieten eine Quelle für RNA-Nanobausteine. Ein weiteres Berechnungswerkzeug, NanoTiler, ermöglicht es einem Benutzer, bestimmte RNA-basierte nanoskalige Formen zu konstruieren. NanoTiler stellt eine grafische Ansicht 3D der Gegenstände zur Verfügung, die entworfen werden und stellt die Mittel zur Verfügung, um interaktiv oder mit Computerskripten auf dem Entwurfsprozeß zu arbeiten, obwohl die genauen RNS-Reihenfolgen möglicherweise noch nicht spezifiziert werden, und ein Allatommodell nicht verfügbar ist. NanoTiler kann die in der RNAJunction-Datenbank gefundenen 3D-Motive mit denen aus bestimmten RNA-Sekundärstrukturmustern verwenden, um eine definierte RNA-Nanoform zu erstellen. Außerdem kann eine kombinatorische Suche angewendet werden, um Strukturen aufzuzählen, die normalerweise nicht berücksichtigt würden.Ein weiteres webbasiertes Softwaretool für das Design von RNA-Nanostrukturen ist NanoFolder, eines der wenigen Softwaretools, das in der Lage ist, die Struktur- und Sequenzattribute von mehrsträngigen RNA-Konstrukten vorherzusagen. Mit dieser Software ist es möglich, die gewünschten Sekundärstrukturmotive zu spezifizieren und die Software den Satz von Sequenzen vorhersagen zu lassen, die diese gewünschten Motive mit den korrekten Intra- und Interstrangfaltungseigenschaften erzeugen.
Experimentelle RNA-Nanobiologie
Basierend auf den oben beschriebenen computergestützten Ansätzen für das RNA-Nanodesign haben wir die Fähigkeit demonstriert, mehrere RNA-basierte Nanopartikel experimentell selbst zusammenzusetzen und zu funktionalisieren. Dies wurde durch enge Wechselwirkungen zwischen den experimentellen und rechnerischen Ansätzen erreicht, die zu Verbesserungen beider Methodologien führten. Beispiele umfassen die Selbstorganisation von 6 und 10 gestrandeten Würfeln; die Selbstorganisation von sechseckigen Ringen verschiedener Größen und Doppelringen unter Verwendung eines aus der Natur extrahierten RNA-Motivs; die Modifikation von Sequenzen im Motiv, um die Ausbeute zu verbessern und gleichzeitig geeignete Geometrien beizubehalten; und die Selbstorganisation dreieckiger Strukturen. Wir haben auch Techniken entwickelt, die Selbstassemblierungsprotokolle definieren und die eine kotranskriptionelle Assemblierung von Konstrukten ermöglichen, die auch modifizierte Basen enthalten können, um die chemische Stabilität dieser Nanopartikel zu erhöhen. Darüber hinaus haben wir diese Partikel mit bis zu sechs verschiedenen siRNAs funktionalisiert, um eine kontrollierte Stöchiometrie und Gen-Silencing zu ermöglichen, und gezeigt, dass diese Partikel die bezeichneten Gene tatsächlich zum Schweigen bringen, wenn sie in verschiedene Zelllinien transfiziert werden.
Wir haben auch ein anderes Paradigma erforscht, das auf der Verwendung von RNA / DNA-Hybrid-Nanokonstrukten mit geteilten Funktionalitäten basiert. Dies ermöglicht beispielsweise die Aufspaltung einer Diceable siRNA in zwei DNA/RNA-Hybridkomponenten mit DNA-Toeholds, die sich bei Transfektion in Zellen wieder zu einem DNA-Duplex und einer Diceable siRNA zusammensetzen. Dieser hybride Ansatz wurde in unsere hexagonalen Nanoringe und Nanocubes integriert. Der Nutzen dieses Ansatzes ermöglicht unter anderem die kontrollierte Aktivierung von Funktionalitäten, den Einbau von Molecular Beacons in die DNA-Stränge ohne Beeinträchtigung der RNA-Funktionalität und die Resistenz gegen Nukleaseabbau. Dieser Ansatz wurde erfolgreich in Zellkulturen und xenographischen Tumormausmodellen erprobt.
Viele der Rechensysteme wurden an andere Umgebungen innerhalb und außerhalb unseres Labors und des NIH angepasst und sind über unsere Website unter http://www-CCRNP.ncifcrf.gov/~bshapiro zugänglich.