en fullständig förståelse av funktionen av RNA-molekyler kräver kunskap om deras högre ordningsstrukturer (2D och 3D) samt egenskaperna hos deras primära sekvens. RNA-struktur är viktig för många funktioner, inklusive reglering av transkription och translation, katalys, transport av proteiner över membran och reglering av RNA-virus. Förståelsen av dessa funktioner är viktig för grundläggande biologi såväl som för utveckling av läkemedel som kan ingripa i fall där patologisk funktionalitet hos dessa molekyler uppträder.
vår grupp gör forskning och utveckling av metoder för att förbättra RNA-vikning och analystekniker för att hjälpa till att ytterligare förstå de funktionella egenskaperna hos dessa molekyler. Dessutom fokuserar vi på det framväxande området RNA-nanobiologi. RNA representerar ett relativt nytt molekylärt material för utveckling av biologiskt orienterade nanoanordningar. Det är ett intressant material på grund av dess naturliga funktioner, dess förmåga att vikas i komplexa strukturer och självmonteras. Vi har utvecklat beräknings-och experimentella metoder som tillåter design av RNA-baserade nanopartiklar som potentiellt har olika användningsområden. Således täcker vår forskning om RNA fem mycket relaterade och integrerade forskningsområden:
- forskning i algoritmer för RNA sekundär struktur förutsägelse och analys;
- RNA-biologi och dess förhållande till sekvens och sekundär struktur vikningsegenskaper;
- forskning i algoritmer för RNA 3D-struktur förutsägelse och analys och deras tillämpning på RNA-biologi;
- forskning i algoritmer för design och analys av RNA-nanopartiklar;
- experimentell design, syntes och leverans av RNA-baserade nanopartiklar.
vad man lär sig inom ett område tillämpas på de andra områdena, vilket förbättrar vår förståelse av RNA-struktur, funktion och RNA-nanobiologi och självmontering.
parallell beräkningsbiologi och RNA-struktur
revolutionära förändringar i beräkningsparadigmer krävs för att upprätthålla den nödvändiga beräkningskraften för att lösa problem i molekylärbiologi. Metoder baserade på sekventiella datorarkitekturer kunde inte förväntas att kontinuerligt hålla jämna steg med de nödvändiga beräkningshastigheter. För att tillgodose de höga hastigheter som är nödvändiga används nu mycket parallella beräkningstekniker. Vår grupp var en av pionjärerna inom beräkningsbiologi och användningen av parallella högpresterande datorarkitekturer för denna strävan.
beräkningstekniker för RNA sekundär struktur förutsägelse och analys
vi var de första som utvecklade en RNA-vikningsteknik som använder begrepp från genetiska algoritmer. Vår algoritm, MPGAfold, utvecklades ursprungligen för att köras på en massivt parallell SIMD-superdator, en MasPar MP-2 med 16384 processorer. Denna algoritm modifierades och körs nu på parallella högpresterande Linux-kluster. Exceptionella skalningsegenskaper erhålls med förmågan att köra algoritmen med hundratusentals befolkningselement. RNA pseudoknot förutsägelse är en del av den genetiska algoritmen, vilket resulterar i dess förmåga att förutsäga tertiära interaktioner. Andra funktioner inkluderar simulering av samtranskriptionell vikning, förmågan att införliva olika energiregler och tvingad hämning och inbäddning av önskade spiralformade stjälkar. Dessutom kan STRUCTURELAB, vår heterogena bioinformatiska RNA-analysbänk, användas tillsammans med MPGAfold och RNA2D3D för att producera förutsagda 3D-atomkoordinater för RNA-strukturer tillsammans med visualiseringen av dessa strukturer. Dessutom utvecklade vi en ny interaktiv visualiseringsmetodik som ingår i STRUCTURELAB. Denna teknik möjliggör jämförelse och analys av RNA-veck med flera sekvenser från en fylogenetisk synvinkel, vilket möjliggör förbättring av förutsagda strukturella resultat över en familj av sekvenser.vi utvecklade KNetFold, en ny och kraftfull algoritm för RNA-struktur förutsägelse från sekvensinriktningar. Algoritmen använder ett unikt hierarkiskt klassificeringsnätverk baserat på ömsesidig information, termodynamik och Watson-Crick base-pairedness för att förutsäga strukturer. Dessutom har vi utvecklat en webbaserad applikation, Correlago, som använder ömsesidig information härledd från RNA-sekvensinriktningar för att bestämma kovariationer bland basparade positioner. Algoritmen innehåller ett unikt felmått och visar resultat i 3D.vi utvecklade, CyloFold, en unik algoritm för att förutsäga, från en enda sekvens, RNA sekundära strukturer som kan innefatta pseudoknoter. Denna algoritm använder en ny teknik som approximerar potentialen för 3D-steriska sammandrabbningar i de förutsagda strukturerna, vilket filtrerar bort dessa strukturer från övervägande. Algoritmen har visat sig ha hög noggrannhet jämfört med andra algoritmer av dess typ.vi utvecklade webbprogramvara baserad på en Bayesiansk statistisk metod som uppskattar noggrannheten hos basparbildning från data härledda från form (selektiv 2′ – Hydroxyl acylering analyserad av Primerförlängning) experiment. De statistiska / probabilistiska resultaten härleddes genom att analysera kända RNA 3D-strukturer med olika typer av kända basinteraktioner och korrelera dem med FORMVÄRDEN. Det visades att låga FORMVÄRDEN korrelerar väl med Watson-Crick-basparnings-och staplingsinteraktioner medan höga FORMVÄRDEN indikerar enkelsträngade regioner. Förbättringar kunde ses om en 2 eller 3 baskontext också beaktades. Vi visade också att andra typer av kända interaktioner inte korrelerade väl. Denna typ av information är till hjälp för att i slutändan bestämma den sekundära strukturen för RNA.
beräkningsstudier av RNA-Vikningsvägar
RNA-vikningsvägar visar sig vara ganska viktiga vid bestämning av RNA-funktion. Studier indikerar att RNA kan komma in i mellanliggande konformationstillstånd som är nyckeln till dess funktionalitet. Dessa tillstånd kan ha en signifikant inverkan på genuttryck. Det är känt att de biologiskt funktionella tillstånden för RNA-molekyler kanske inte motsvarar deras minsta energitillstånd, att kinetiska barriärer kan existera som fångar molekylen i ett lokalt minimum, att vikning ofta inträffar under transkription och fall finns där en molekyl kommer att övergå mellan en eller flera funktionella konformationer innan den når sitt ursprungliga tillstånd. Således är metoder för att simulera vikningsvägarna för en RNA-molekyl, inklusive kotranskriptionell vikning och lokalisering av signifikanta mellanliggande tillstånd viktiga för förutsägelsen av RNA-struktur och dess associerade funktion. Flera biologiska RNA-vikningsvägar har framgångsrikt studerats med mpgafold och STRUCTURELAB. Exempel inkluderar potatisspindeln tuber viroid, värddödande mekanismen för Escherichia coli plasmid R1, hepatit delta-viruset, HIV och den denguevirus. Dessa beräkningsresultat överensstämmer med de som härrör från biologiska experiment. Dessutom har nya strukturella interaktioner och viktiga funktionella mellanliggande och infödda stater förutsagts. Dessa har lett till ytterligare framgångsrika bekräftande experiment.
Computational Prediction of RNA Interaction Networks
Vi har också utvecklat program CovaRna och CovStat för att utforska långväga samvarierande RNA interaktionsnätverk med hjälp av hela genominriktningar. Denna nya metod, som tillämpades på Drosophila-genomer, tillämpas för närvarande på andra genom. En parallell version av programmet utformades för att påskynda bearbetningen och algoritmerna förlitar sig också på snabba indexeringsscheman och konservativa statistiska metoder för att bestämma mycket signifikanta interaktioner. Metoden har funnit intressanta interaktioner som är relaterade till endogena sirna, gentransport och gener relaterade till morfogenes.
beräkningsstudier av tredimensionella RNA-strukturer
vissa strukturella element i RNA-molekyler har studerats med hjälp av molekylmekanik och molekyldynamiksimuleringar. De undersökta strukturerna innefattar en RNA-tetraloop där temperaturberoende denaturering av tetraloopen och den efterföljande återfyllningen till den ursprungliga kristallstrukturen utfördes. En trevägs korsning från den centrala centrala domänen för 30s ribosomal subenhet från Thermus thermophilus undersöktes. Det har experimentellt bestämts att de intermolekylära interaktionerna mellan trevägskorsningen och S15 ribosomalt protein initierar processen för montering av 30S ribosomal subenhet. Genom att använda molekyldynamiksimuleringar fick vi insikter i konformationsövergångarna i korsningen associerad med bindningen av S15. Vi bestämde oss med hjälp av molekyldynamiksimuleringar de strukturella effekterna av att använda nya typer av modifierade RNA-nukleotider innehållande karbocykliska sockerarter som är begränsade till Nord-eller sydkonformationer (C2′ eller C3′ exo). Dessutom visade vi med hjälp av molekyldynamiksimuleringar hur joner och flankerande baser spelar en mycket viktig roll i humana immunbristvirus (HIV) kyssande loopmonomerkonformationer. Dessa resultat korrelerar väl och kan förklara i detalj experimentella studier som indikerar vikten av joner för HIV-1-dimerisering.
Vi har också undersökt pseudoknot-domänen för telomeras. Molekylär modellering och molekyldynamik hos pseudoknot-domänen, inklusive dess hårnålslinga, utfördes. Resultaten indikerade hur hårnålslingdynamiken påverkade öppningen och stängningen av de icke-kanoniska u-u-basparen som finns i stammen. Öppningen föreslog kärnbildningspunkter för bildandet av pseudoknot. Vi har också undersökt effekten av Dyskeratosis congenita (DKC) mutationer i slingan och hur de minskade benägenheten för öppningen av stammen genom att bilda ett relativt stabilt vätebindningsnätverk i hårnålsslingan. Vi modellerade pseudoknot själv med vår rna2d3d-programvara kombinerad med fylogenetisk analys. Vi studerade den dynamiska effekten av DKC-mutationerna på pseudoknot med resultatet att pseudoknot blev instabil medan hårnålformen blev stabilare.
vi upptäckte och belyste 3D-strukturerna för nya typer av translationella förstärkare som finns i 3′ UTR: erna för rov Crinkle-viruset (det första i sitt slag som hittades) och Pea enation Mosaic Virus. Upptäckten av dessa strukturella element har visat nya mekanismer för translationell förbättring i eukaryota växtvirus som kan ha bredare konsekvenser för att förstå translationella mekanismer i allmänhet. Detta åstadkoms med den kombinerade användningen av mpgafold, vår 3D molekylär modellering programvara RNA2D3D, och nära interaktioner med våra experimentella medarbetare. Vi modellerade också en ny pseudoknot som hittades i CCR5 mRNA. Denna pseudoknot är involverad i frameshifting och verkar stabiliseras av en mikroRNA, en ny funktion för en mikroRNA.dessutom har vi använt metoder baserade på elastisk nätverksinterpolering för att minska beräkningskostnaderna relaterade till RNA 3D-dynamik. Tredimensionella dynamikbanor kan bestämmas med hjälp av en reducerad atomrepresentation och givna konformationstillstånd. Beräkningstiden kan minskas från veckor till timmar med hjälp av detta tillvägagångssätt.
Computational RNA Nanobiology
RNA nanobiology representerar en ny modalitet för utveckling av nanodevices som har potential för användning inom ett antal områden, inklusive terapi. Med utgångspunkt i vår erfarenhet som beskrivits ovan utvecklade vi flera beräknings-och experimentella tekniker (se nedan) som ger ett sätt att bestämma en uppsättning nukleotidsekvenser som kan samlas i önskade nanokomplex. Ett av dessa verktyg är en relationsdatabas som heter RNAJunction. Databasen innehåller struktur-och sekvensinformation för kända RNA-spiralformade korsningar och kyssande loopinteraktioner. Dessa motiv kan sökas på olika sätt, vilket ger en källa för RNA nano byggstenar. Ett annat beräkningsverktyg, NanoTiler, tillåter en användare att konstruera specificerade RNA-baserade nanoskala former. NanoTiler ger en grafisk 3D-bild av objekten som designas och ger medel för att arbeta interaktivt eller med datorskript på designprocessen även om de exakta RNA-sekvenserna kanske ännu inte specificeras, och en all-atommodell är inte tillgänglig. NanoTiler kan använda 3D-motiven som finns i rnajunction-databasen med de som härrör från specificerade RNA-sekundära strukturmönster för att bygga en definierad RNA-nanoform. En kombinatorisk sökning kan också tillämpas för att räkna upp strukturer som normalt inte skulle övervägas.
ett annat webbaserat mjukvaruverktyg för RNA-nanostrukturdesign är NanoFolder, vilket är ett av få mjukvaruverktyg som kan förutsäga strukturen och sekvensattributen för FLERSTRÄNGADE RNA-konstruktioner. Med denna programvara är det möjligt att specificera de önskade sekundära strukturmotiven och få programvaran att förutsäga uppsättningen sekvenser som genererar dessa önskade motiv med rätt intra – och Inter-strand vikningsegenskaper.
experimentell RNA Nanobiologi
baserat på de ovan beskrivna beräkningsmetoderna för RNA-nanodesign har vi visat förmågan att experimentellt självmontera och funktionalisera flera RNA-baserade nanopartiklar. Detta åstadkoms med nära interaktioner mellan experimentella och beräkningsmetoder som leder till förbättringar av båda uppsättningarna av metoder. Exempel inkluderar självmontering av 6 och 10 strängade kuber; självmontering av sexkantiga ringar av olika storlekar och dubbla ringar som använder ett RNA-motiv extraherat från naturen; modifieringen av sekvenser i motivet för att förbättra utbytet samtidigt som lämpliga geometrier bibehålls; och självmontering av triangulära strukturer. Vi utvecklade också tekniker som definierar självmonteringsprotokoll och som möjliggör samtranskriptionell montering av konstruktioner som också kan inkludera modifierade baser för att öka den kemiska stabiliteten hos dessa nanopartiklar. Dessutom har vi funktionaliserat dessa partiklar med upp till sex olika sirna för att möjliggöra kontrollerad stökiometri och gentystning och visade att dessa partiklar verkligen tystnar de utsedda generna när de transfekteras till olika cellinjer.
Vi har också undersökt ett annat paradigm baserat på användningen av RNA/DNA hybrid nanokonstruktioner som innehåller delade funktioner. Detta möjliggör till exempel splittring av en Diceable siRNA i två DNA/RNA-hybridkomponenter med DNA-tåhål, som när de transfekteras i celler återmonteras i en DNA-duplex och en Diceable siRNA. Denna hybridmetod har införlivats i våra hexagonala nanorings och nanocubes. Användbarheten av detta tillvägagångssätt tillåter bland annat kontrollerad aktivering av funktioner, införlivande av molekylära fyrar på DNA-strängarna utan att intefera med RNA-funktionalitet och resistens mot nukleasnedbrytning. Detta tillvägagångssätt har testats framgångsrikt i cellkulturer och xenograph tumörmusmodeller.
många av beräkningssystemen har anpassats till andra miljöer inom och utanför vårt laboratorium och NIH och är tillgängliga via vår webbplats på http://www-CCRNP.ncifcrf.gov/~bshapiro.