Bruce A. Shapiro, Ph. D.

Una comprensión completa de la función de las moléculas de ARN requiere conocer sus estructuras de orden superior (2D y 3D), así como las características de su secuencia primaria. La estructura del ARN es importante para muchas funciones, incluida la regulación de la transcripción y la traducción, la catálisis, el transporte de proteínas a través de membranas y la regulación de los virus de ARN. La comprensión de estas funciones es importante para la biología básica, así como para el desarrollo de fármacos que pueden intervenir en los casos en que se produce la funcionalidad patológica de estas moléculas.

Nuestro grupo investiga y desarrolla metodologías para mejorar el plegado de ARN y las técnicas de análisis para ayudarnos a comprender mejor las propiedades funcionales de estas moléculas. Además, nos estamos centrando en el campo emergente de la nanobiología de ARN. El ARN representa un material molecular relativamente nuevo para el desarrollo de nanodispositivos orientados biológicamente. Es un material interesante debido a sus funcionalidades naturales, su capacidad de plegarse en estructuras complejas y autoensamblarse. Hemos desarrollado metodologías computacionales y experimentales que permiten el diseño de nanopartículas basadas en ARN que potencialmente tienen una variedad de usos. Por lo tanto, nuestra investigación sobre ARN cubre cinco áreas de investigación altamente relacionadas e integradas:

  1. Investigación en algoritmos para la predicción y el análisis de estructuras secundarias de ARN;
  2. Biología del ARN y su relación con las características de plegado de secuencias y estructuras secundarias;
  3. Investigación en algoritmos para la predicción y análisis de estructuras de ARN 3D y su aplicación a la biología del ARN;
  4. Investigación en algoritmos para el diseño y análisis de nanopartículas de ARN;
  5. Diseño experimental, síntesis y entrega de nanopartículas basadas en ARN.

Lo que se aprende en un área se aplica a las otras áreas, mejorando nuestra comprensión de la estructura, función y nanobiología y autoensamblaje del ARN.

Biología Computacional Paralela y Estructura de ARN
Se requieren cambios revolucionarios en los paradigmas computacionales para mantener el poder computacional necesario para resolver problemas en biología molecular. No se podía esperar que las metodologías basadas en arquitecturas computacionales secuenciales siguieran continuamente el ritmo de las velocidades computacionales necesarias. Con el fin de adaptarse a las altas velocidades que son necesarias, ahora se emplean técnicas computacionales altamente paralelas. Nuestro grupo fue uno de los pioneros en el área de la biología computacional y el uso de arquitecturas informáticas paralelas de alto rendimiento para este esfuerzo.

Técnicas Computacionales para Predicción y Análisis de Estructuras Secundarias de ARN
Fuimos los primeros en desarrollar una técnica de plegado de ARN que utiliza conceptos de algoritmos genéticos. Nuestro algoritmo, MPGAfold, fue desarrollado originalmente para ejecutarse en un supercomputador SIMD paralelo masivo, un MasPar MP-2 con procesadores 16384. Este algoritmo fue modificado y ahora se ejecuta en clústeres Linux paralelos de alto rendimiento. Se obtienen características de escalado excepcionales con la capacidad de ejecutar el algoritmo con cientos de miles de elementos de población. ARN pseudoknot predicción es parte del algoritmo genético, lo que resulta en su capacidad para predecir las interacciones terciarias. Otras características incluyen la simulación del plegado co-transcripcional, la capacidad de incorporar diferentes reglas de energía y la inhibición forzada y la incrustación de tallos helicoidales deseados. Además, STRUCTURELAB, nuestro banco de trabajo de análisis de ARN bioinformático heterogéneo, se puede usar junto con MPGAfold y RNA2D3D para producir coordenadas atómicas 3D predichas de estructuras de ARN junto con la visualización de estas estructuras. Además, desarrollamos una novedosa metodología de visualización interactiva que forma parte de STRUCTURELAB. Esta técnica permite la comparación y el análisis de múltiples pliegues de ARN de secuencia desde un punto de vista filogenético, lo que permite mejorar los resultados estructurales predichos en una familia de secuencias.Desarrollamos KNetFold, un novedoso y potente algoritmo para la predicción de estructuras de ARN a partir de alineaciones de secuencias. El algoritmo utiliza una red de clasificación jerárquica única basada en información mutua, termodinámica y características básicas de Watson-Crick para predecir estructuras. Además, hemos desarrollado una aplicación basada en la web, CorreLogo, que utiliza información mutua derivada de alineaciones de secuencias de ARN para determinar covariaciones entre posiciones emparejadas de bases. El algoritmo incluye una medida de error única y muestra los resultados en 3D.Desarrollamos, CyloFold, un algoritmo único para predecir, a partir de una sola secuencia, estructuras secundarias de ARN que pueden incluir pseudonotas. Este algoritmo utiliza una técnica novedosa que se aproxima al potencial de choques estéricos en 3D en las estructuras predichas, filtrando así esas estructuras de consideración. Se ha demostrado que el algoritmo tiene una alta precisión en comparación con otros algoritmos de su tipo.Desarrollamos software web basado en un enfoque estadístico bayesiano que estima la precisión de la formación de pares de bases a partir de datos derivados de experimentos de FORMA (Acilación selectiva de 2′ – Hidroxilo analizada por Extensión de Imprimación). Los resultados estadísticos / probabilísticos se obtuvieron analizando estructuras de ARN 3D conocidas que tienen varios tipos de interacciones de base conocidas, y correlacionándolas con valores de FORMA. Se demostró que los valores de FORMA baja se correlacionan bien con el emparejamiento de bases Watson-Crick y las interacciones de apilamiento, mientras que los valores de FORMA alta indican regiones de trenzado único. Se podían observar mejoras si también se tenía en cuenta un contexto de base de 2 o 3. También demostramos que otros tipos de interacciones conocidas no se correlacionaban bien. Este tipo de información es útil para determinar en última instancia la estructura secundaria de los ARN.

Los estudios computacionales de las Vías de plegado de ARN
Las vías de plegado de ARN están demostrando ser bastante importantes en la determinación de la función de ARN. Los estudios indican que el ARN puede entrar en estados conformacionales intermedios que son clave para su funcionalidad. Estos estados pueden tener un impacto significativo en la expresión génica. Se sabe que los estados biológicamente funcionales de las moléculas de ARN pueden no corresponder a su estado de energía mínima, que pueden existir barreras cinéticas que atrapan a la molécula en un mínimo local, que el plegamiento a menudo ocurre durante la transcripción, y existen casos en los que una molécula hará la transición entre una o más conformaciones funcionales antes de alcanzar su estado nativo. Por lo tanto, los métodos para simular las vías de plegado de una molécula de ARN, incluido el plegado co-transcripcional, y la localización de estados intermedios significativos son importantes para la predicción de la estructura del ARN y su función asociada. Se han estudiado con éxito varias vías biológicas de plegado de ARN utilizando MPGAfold y STRUCTURELAB. Los ejemplos incluyen el viroide del tubérculo fusiforme de la patata, el mecanismo de destrucción del huésped del plásmido R1 de Escherichia coli, el virus de la hepatitis delta, el VIH y el virus del dengue. Estos resultados computacionales son consistentes con los derivados de experimentos biológicos. Además, se han predicho nuevas interacciones estructurales e importantes estados funcionales intermedios y nativos. Estos han llevado a otros experimentos confirmatorios exitosos.

Predicción Computacional de Redes de Interacción de ARN
También hemos desarrollado programas CovaRna y CovStat para explorar redes de interacción de ARN co-variables de largo alcance utilizando alineaciones de genoma completo. Esta nueva metodología, que se aplicó a los genomas de Drosophila, se está aplicando actualmente a otros genomas. Se diseñó una versión paralela del programa para acelerar el procesamiento y los algoritmos también se basan en esquemas de indexación rápidos y métodos estadísticos conservadores para determinar interacciones altamente significativas. La metodología ha encontrado interacciones interesantes que están relacionadas con los ARN SIR endógenos, el transporte de genes y los genes relacionados con la morfogénesis.

Estudios computacionales de Estructuras tridimensionales de ARN
Se han estudiado algunos elementos estructurales de moléculas de ARN utilizando simulaciones de mecánica molecular y dinámica molecular. Las estructuras examinadas incluyen un tetraloop de ARN donde se realizó la desnaturalización dependiente de la temperatura del tetraloop y el posterior reenfoque a la estructura cristalina original. Se exploró una unión de tres vías desde el dominio central del núcleo de la subunidad ribosómica de los años 30 de Thermus thermophilus. Se ha determinado experimentalmente que las interacciones intermoleculares entre la unión de tres vías y la proteína ribosómica S15 inician el proceso de ensamblaje de la subunidad ribosómica 30S. Mediante el uso de simulaciones de dinámica molecular, obtuvimos información sobre las transiciones conformacionales de la unión asociada con la unión de S15. Determinamos mediante simulaciones de dinámica molecular, los efectos estructurales de la utilización de nuevos tipos de nucleótidos de ARN modificados que contienen azúcares carbocíclicos limitados a conformaciones norte o sur (exo C2 ‘o C3’). Además, mostramos, mediante simulaciones de dinámica molecular, cómo los iones y las bases de flanqueo desempeñan un papel muy importante en las conformaciones de monómeros de bucle de beso del virus de inmunodeficiencia humana (VIH). Estos resultados se correlacionan bien y pueden explicar en detalle los estudios experimentales que indican la importancia de los iones para la dimerización del VIH-1.

También hemos examinado el dominio pseudoknot de la telomerasa. Se realizaron modelos moleculares y dinámicas moleculares del dominio pseudoknot, incluyendo su bucle de horquilla. Los resultados indicaron cómo la dinámica del bucle de horquilla afectó la apertura y el cierre de los pares de bases U-U no canónicos encontrados en el tallo. La apertura sugirió puntos de nucleación para la formación de la pseudoknot. También hemos examinado el efecto de las mutaciones de disqueratosis congénita (DKC) en el bucle y cómo redujeron la propensión a la apertura del tallo al formar una red de enlace de hidrógeno relativamente estable en el bucle de horquilla. Modelamos el propio pseudoknot utilizando nuestro software RNA2D3D combinado con análisis filogenético. Estudiamos el impacto dinámico de las mutaciones de DKC en el pseudonot con el resultado de que el pseudonot se volvió inestable mientras que la forma de horquilla se volvió más estable.

Descubrimos y dilucidamos las estructuras 3D de nuevos tipos de potenciadores de traducción que se encuentran en los 3′ UTR del Virus de la Arruga de Nabo (el primero de su tipo encontrado) y el Virus del Mosaico de Guisantes. El descubrimiento de estos elementos estructurales ha sacado a la luz nuevos mecanismos para la mejora de la traducción en virus de plantas eucariotas que pueden tener implicaciones más amplias para comprender los mecanismos de traducción en general. Esto se logró con el uso combinado de MPGAfold, nuestro software de modelado molecular 3D RNA2D3D, y la interacción estrecha con nuestros colaboradores experimentales. También modelamos un pseudonot novedoso encontrado en el ARNm CCR5. Este pseudoknot está involucrado en frameshifting y parece ser estabilizado por un microarn, una nueva función para un microarn.
Además, hemos empleado métodos basados en interpolación de red elástica para reducir los costos computacionales relacionados con la dinámica de ARN 3D. Las trayectorias dinámicas tridimensionales se pueden determinar utilizando una representación de átomos reducida y estados conformacionales dados. El tiempo de cómputo se puede reducir de semanas a horas utilizando este enfoque.
Nanobiología computacional de ARN
La nanobiología de ARN representa una nueva modalidad para el desarrollo de nanodispositivos que tienen el potencial de ser utilizados en una serie de áreas, incluida la terapéutica. Sobre la base de nuestra experiencia descrita anteriormente, desarrollamos varias técnicas computacionales y experimentales (ver a continuación) que proporcionan un medio para determinar un conjunto de secuencias de nucleótidos que se pueden ensamblar en nano complejos deseados. Una de estas herramientas es una base de datos relacional llamada RNAJunction. La base de datos contiene información de estructura y secuencia de uniones helicoidales de ARN conocidas e interacciones de bucle de besos. Estos motivos se pueden buscar de una variedad de maneras, proporcionando una fuente para los nano bloques de construcción de ARN. Otra herramienta computacional, NanoTiler, permite al usuario construir formas a nanoescala específicas basadas en ARN. El NanoTiler proporciona una vista gráfica en 3D de los objetos que se están diseñando y proporciona los medios para trabajar de forma interactiva o con secuencias de comandos de computadora en el proceso de diseño, aunque las secuencias de ARN precisas aún no se pueden especificar, y no está disponible un modelo completamente atómico. El NanoTiler puede usar los motivos 3D encontrados en la base de datos de funciones RN con los derivados de patrones de estructura secundaria de ARN especificados para construir una forma nanométrica de ARN definida. Además, se puede aplicar una búsqueda combinatoria para enumerar estructuras que normalmente no se considerarían.

Otra herramienta de software basada en la web para el diseño de nanoestructuras de ARN es NanoFolder, que es una de las pocas herramientas de software que son capaces de predecir la estructura y los atributos de secuencia de construcciones de ARN de múltiples cadenas. Con este software es posible especificar los motivos de estructura secundaria deseados y hacer que el software prediga el conjunto de secuencias que generan estos motivos deseados con las características correctas de plegado intra e inter – filamento.

Nanobiología experimental de ARN
Sobre la base de los enfoques computacionales descritos anteriormente para el nanodiseño de ARN, hemos demostrado la capacidad de autoensamblar y funcionalizar experimentalmente varias nanopartículas basadas en ARN. Esto se logró con interacciones estrechas entre los enfoques experimental y computacional que condujeron a mejoras en ambos conjuntos de metodologías. Los ejemplos incluyen el autoensamblaje de 6 y 10 cubos trenzados; el autoensamblaje de anillos hexagonales de varios tamaños y anillos dobles que utilizan un motivo de ARN extraído de la naturaleza; la modificación de secuencias en el motivo para mejorar el rendimiento, manteniendo al mismo tiempo geometrías apropiadas; y el autoensamblaje de estructuras triangulares. También desarrollamos técnicas que definen protocolos de autoensamblaje y que permiten el ensamblaje co-transcripcional de construcciones que también pueden incluir bases modificadas para aumentar la estabilidad química de estas nanopartículas. Además, hemos funcionalizado estas partículas con hasta seis siRNAs diferentes para permitir la estequiometría controlada y el silenciamiento de genes, y hemos demostrado que estas partículas silencian los genes designados cuando se transfectan a varias líneas celulares.

También hemos estado explorando otro paradigma basado en el uso de nanoconstrucciones híbridas de ARN/ADN que contienen funcionalidades divididas. Esto permite, por ejemplo, la división de un siRNA dicable en dos componentes híbridos de ADN / ARN con orificios de ADN, que cuando se transfectan en células se vuelven a ensamblar en un dúplex de ADN y un siRNA dicable. Este enfoque híbrido se ha incorporado en nuestros nanorings y nanocubos hexagonales. La utilidad de este enfoque permite, entre otras cosas, la activación controlada de funcionalidades, la incorporación de balizas moleculares en las hebras de ADN sin interferencias con funcionalidad de ARN y resistencia a la degradación de nucleasas. Este enfoque se ha probado con éxito en cultivos celulares y modelos de ratón con tumores xenógrafos.
Muchos de los sistemas computacionales se han adaptado a otros entornos dentro y fuera de nuestro laboratorio y de los NIH y son accesibles a través de nuestro sitio web en http://www-CCRNP.ncifcrf.gov/~bshapiro.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.