Fig. 3
La huella identifica las proteínas que interactúan entre sí. a Intensidades normalizadas de interacción de proteína de abeto promediadas a partir de dos réplicas biológicas, clasificadas en orden creciente. La línea punteada horizontal representa el corte de intensidad de interacción utilizado para la clasificación de los interactores Firre. Los puntos rojos son proteínas que interactúan con el abeto; los puntos grises son proteínas que no se unen al abeto. Se indican proteínas conocidas por unirse a Firre o aquellas cuya interacción fue validada en los datos de CODIFICACIÓN ECLIP21. Consulte la sección «Métodos» para la normalización de datos. RLU son unidades de luz relativa. b Gráfico que muestra el número de socios que interactúan entre sí y que contienen un dominio Pfam en particular frente al-log10 (P) del enriquecimiento del dominio. Los valores de P se calcularon mediante la prueba de proporción. En azul se muestran los dominios representados al menos tres veces en la fracción desplegable que tienen un P < 0.05 corregido. RRM-1 se refiere al dominio Pfam PF00076. Para todos los dominios Pfam analizados, ver Datos complementarios 3.
Para determinar si se requería sobreexpresión de ARN para que la impRONTA identificara con éxito la unión de proteínas al ARN con niveles endógenos bajos, se probó un conjunto de proteínas con diferentes concentraciones de Firre-MS2 que iban desde la sobreexpresión descrita anteriormente hasta los niveles comparables a los de FIRRE endógeno en células HEK293T (Suplemento Fig. 2d, e). Mientras que la sobreexpresión de ARN resultó en puntuaciones de interacción más altas que permitieron su mejor separación de las puntuaciones de fondo, la señal de luciferasa fue detectable de forma robusta por encima de la señal de fondo cuando se utilizaron diluciones de Firre-MS2 (Fig.Suplementaria. 2d). Es importante destacar que esta señal no se asoció con los niveles de expresión de proteínas de la prueba (Fig. 2e). En conjunto, estos datos demuestran la utilidad de la impRONTA en la identificación de proteínas asociadas con transcripciones expresadas a niveles endógenos bajos.
La impRONTA identifica socios de interacción ARN-región específica
Debido a que muchos lncRNAs funcionan como andamios modulares, lo que permite la unión de RBPs específicos a dominios de ARN discretos 1,5,buscamos probar si la impRONTA permite la identificación de interacciones específicas de dominio de ARN. Una molécula ideal de prueba de principio es el lncRNA Xist, dado su papel vital en la inactivación del cromosoma X de mamíferos (XCI)22,23, y su estructura y función modulares. La transcripción Xist de7 17 kb de largo contiene varias regiones de secuencia conservadas (llamadas repeticiones de la A a la F) que llevan a cabo distintas funciones durante el proceso XCI, incluida la iniciación del silenciamiento génico (la repetición A), el mantenimiento del estado X-inactivo (las repeticiones F y B) y la localización cromosómica adecuada y la acumulación focal de Xist (las repeticiones C y E)13,24,25,26,27,28,29,30,31,32 (Fig. 4a). Además, varios estudios independientes han identificado y validado previamente un conjunto de interacciones proteicas funcionales con Xist7 de duración completa,14,15,26,28,33,34,35. Buscamos aplicar la impRONTA a tres regiones conservadas de Xist de ratón, es decir, Xist(A), Xist(F) y Xist (C) (Fig. 4a). Cuando se expresa en células HEK293T utilizadas para la huella, cada fragmento Xist-MS2 mostró un nivel de expresión diferente en comparación con Xist endógeno, que va desde un aumento de 6 60 veces para Xist(A) hasta un nivel de expresión casi endógeno para Xist(C) (Fig.Suplementaria. 3a). Todos los fragmentos individuales de Xist-MS2 se localizaron preferentemente en el núcleo, de manera similar a su contraparte endógena de longitud completa (Fig. 3b). Cada región Xist (i. e., Xist(A), Xist(F), y Xist(C)) fue interrogado con nuestra biblioteca de ~3000 proteínas. Para comparar señales a través de regiones Xist individuales expresadas en diferentes niveles (Fig.Suplementaria. 3c), las puntuaciones de interacción para cada región Xist se normalizaron utilizando los datos de unión al ARN MS2 (Datos suplementarios 4). Para la normalización, se definió un conjunto de 200 proteínas con puntajes de luciferasa de primer orden en el conjunto de datos de ARN MS2 como aglutinantes comunes de todos los ARN marcados con MS2. A continuación, se identificaron los aglutinantes comunes en cada conjunto de datos y se calculó su puntuación media de interacción para cada ARN probado y se utilizó para normalizar las intensidades de luminiscencia en bruto en cada conjunto de datos (consulte la sección «Métodos»). En particular, los datos de MS2 no se utilizaron como control de especificidad de unión, ya que muchos RBPS reconocen motifs36 de ARN de baja complejidad presentes también dentro de la etiqueta MS2, y dado que la unión de proteínas a MS2 no excluye una interacción funcional potencial con un ARN de prueba. De manera similar a Firre, encontramos que la mayoría de las proteínas no se unían a ninguno de los fragmentos Xist probados (Fig. 4b-d, puntos grises; Datos suplementarios 4), mientras que se identificaron conjuntos específicos de proteínas para interactuar con cada región Xist individual (Fig. 4b-d, puntos rojos; Datos complementarios 4). Es importante destacar que entre las proteínas que interactúan con Xist identificadas por la huella, encontramos socios de interacción bien conocidos de Xist identificados en estudios previos para unirse a la transcripción de longitud completa7,14,15 (indicado en la Fig. 4b–d, Cuadro complementario 1). Comparando los conjuntos de proteínas identificadas por la huella y sus puntuaciones de interacción para cada región Xist interrogada (Datos suplementarios 4), encontramos que cada fragmento Xist interactuaba con un conjunto de proteínas específicas de la región correspondiente, con una fracción menor de RBPs que se unían a las tres regiones Xist (Fig. 4e). Por lo tanto,la aplicación de la impRONTA a tres regiones conservadas de Xist permitió la identificación y asignación a regiones específicas de ARN de PRB previamente determinadas para unirse a la transcripción de Xist de longitud completa7,14, 15 (Fig. 4e; las proteínas conocidas que interactúan con Xist se indican a la derecha). Por ejemplo, Riprint identificó SPEN como un interactor específico de Xist(A) (Fig. 4e), confirmando hallazgos anteriores7, 8. De manera similar, RBM15, RBM15B e YTHDC1 fueron identificados por la huella para interactuar específicamente con Xist(A) y Xist(F), pero no con Xist(C), confirmando su unión reportada al extremo 5′ de Xist7,9 (Fig. 4e). Además, identificamos una interacción específica de Xist(C) con HNRNPU (también conocida como SAF-A) que previamente se había demostrado que estaba involucrada en la localización de Xist7,14,33 (Fig. 4e, Cuadro Complementario 1). Para validar las interacciones ARN-región específica Xist-proteína, la CODIFICACIÓN eCLIP data21 disponible para 14 proteínas identificadas por la huella, varias de las cuales son RPB novedosas que interactúan con Xist, confirmó su unión a XIST en la línea K562 (Suplemento Fig. 3d; Datos complementarios 2), corroborando aún más la especificidad de nuestro método. Una diferencia funcional entre los interacomas de proteínas de las tres regiones Xist fue confirmada por análisis de enriquecimiento de términos de Ontología génica (GO). De acuerdo con las funciones diferenciales reportadas para las regiones Xist individuales, las proteínas asociadas a Xist(A) y Xist(F) se enriquecieron para las PRB involucradas en el procesamiento del ARN, mientras que la región C – repetida interactuó preferentemente con las proteínas de unión al ADN involucradas en la regulación transcripcional (Fig.Suplementaria. 3e, f). De acuerdo con el análisis GO, el análisis del dominio de proteínas demostró que las proteínas que interactúan con Xist(A) se enriquecieron para los dominios de proteínas SPOC (Spen paralog y ortog C-terminal) y RRM, las proteínas que interactúan con Xist(F) se enriquecieron para el dominio RRM y las proteínas que interactúan con Xist(C) no mostraron un enriquecimiento particular (Fig. 4f; Datos suplementarios 3), resaltando aún más la especificidad de los conjuntos de proteínas identificados por la huella para cada región Xist. En resumen, Riprint recuperó con éxito las interacciones conocidas de la proteína Xist y descubrió nuevas prácticas recombinantes. Al identificar conjuntos específicos de proteínas que interactúan con regiones conservadas individuales de un lncRNA modular, hemos demostrado que la impRONTA permite la asignación específica de regiones de interacciones ARN-proteína.
Fig. 4
Proteínas identificadas para interactuar con distintas regiones del lncRNA Xist. representación esquemática de la transcripción Xist del ratón y sus regiones de repetición conservadas de A a F. Los exones se indican como cajas, los intrones como líneas. Una imagen ampliada de la región de 5′ de Xist muestra las posiciones de los fragmentos de Xist a lo largo de la transcripción de Xist. Los fragmentos de 0,9-kb, 2-kb y 1,7-kb para Xist(A), Xist(F) y Xist(C), respectivamente, utilizados en los experimentos de Incrint están delimitados por barras horizontales de colores. b Xist normalizado(A)-intensidades de interacción de proteínas promediadas a partir de dos réplicas biológicas, clasificadas en orden creciente. La línea punteada horizontal representa el corte de intensidad de interacción utilizado para la clasificación de los interactores Xist(A). Los puntos rojos son proteínas que interactúan con Xist (A); los puntos grises son proteínas que no se unen a Xist(A). Se indican proteínas seleccionadas conocidas por unirse a Xist. Consulte la sección «Métodos» para la normalización de datos. RLU son unidades de luz relativa. c Como en b), para Xist (F). d Como en b), para Xist (C). e Mapa de calor que muestra las intensidades de interacción entre Xist(A), Xist(F) y Xist (C). Las proteínas que interactúan con Xist detectadas previamente se indican a la derecha. RLU son unidades de luz relativa. f Como en la Fig. 3b, para los socios de interacción Xist(A), Xist(F) y Xist(C). SPOC se refiere al dominio Pfam PF07744.
La impRONTA identifica las interacciones funcionales ARN–proteína
Debido a que la Xist tiene una función celular bien caracterizada en el silenciamiento de genes durante la XCI, buscamos probar si algunas de las interacciones Xist-proteína descubiertas usando la impRONTA son funcionalmente relevantes. El enfoque se centró en la proteína ZZZ3, que interactúa con las tres regiones Xist probadas, y RBM6, que exhibe una unión más específica a las regiones Xist(A) y Xist(F) (Fig. 4e). En primer lugar, se confirmó la interacción de Xist con RBM6 y ZZZ3 en condiciones endógenas mediante el ensayo de precipitación conjunta de Xist con ambas proteínas en células madre embrionarias de ratón. Las proteínas fueron etiquetadas con HA en la línea celular polimórfica TX1072 ES que permite la expresión Xist inducida por doxiciclina, activando XCI en ausencia de diferenciación31,37,38,39. La inmunoprecipitación de ARN (RIP) después de la inducción de doxiciclina de Xist y la reticulación UV de células seguidas de análisis qRT-PCR identificó un enriquecimiento significativo del transcripción Xist con proteínas RBM6 y ZZZ3, confirmando su interacción in vivo (Fig. 5a, b). Cabe destacar que la incPRINT también identificó a los RBM6 interactuando con Firre. RIP qRT-PCR detectó una interacción específica de Firre con RBM6 pero no con ZZZ3, confirmando así la unión de Firre-RBM6 en condiciones endógenas y validando aún más nuestros resultados de la huella (Fig. 5a, b).
Fig. 5
RBM6 y ZZZ3 son necesarios para XCI en vivo. inmunoprecipitación de ARN (RIP) de la proteína RBM6 marcada con HA. Panel izquierdo, western blot para RMB6. Panel derecho, niveles de ARN de las transcripciones indicadas en la entrada y en los eluidos inmunoprecipitados. Todos los enriquecimientos se normalizan al ARNm GAPDH y a la muestra de entrada. Cada experimento RIP se realizó en dos réplicas biológicas independientes. Los datos se presentan como media ± d. s.; pruebas t no apareadas: * * P < 0,01. inmunoprecipitación de ARN b (RIP) de la proteína ZZZ3 marcada con HA. Panel izquierdo, western blot para ZZZ3. Panel derecho, niveles de ARN de las transcripciones indicadas en la entrada y en los eluidos inmunoprecipitados. Todos los enriquecimientos se normalizan al ARNm GAPDH y a la muestra de entrada como se describe en la sección «Métodos». Cada experimento RIP se realizó dos veces en réplicas biológicas independientes. Los datos se presentan como media ± s.d.; t no pareada pruebas: **P < 0.01; *P < 0.05, no significativo (ns). Los borradores completos se proporcionan como un archivo de datos de origen. c Imágenes representativas de ARN FISH de células inducidas por Xist tras el agotamiento de las proteínas indicadas. El Xist se muestra en rojo y el gen Lamp2 ligado al X en verde. La línea discontinua delinea los núcleos celulares. Los asteriscos indican la expresión de Lamp2 del cromosoma X activo. Las puntas de flecha indican la expresión de Lamp2 del cromosoma X inactivo que escapa a XCI. Barras de escala, 5 µm. d Cuantificación de células con expresión de Lamp2 bialélica evaluada con FISH de ARN y expresada como relación de pliegues sobre el control de RLuc. Los datos de tres experimentos independientes se representan como media ± s. d.; Pruebas t de Student: **P < 0.01; *P < 0.05; no significativo (ns). La línea discontinua delinea el nivel de RLuc.
A continuación, para probar si RBM6 y ZZZ3 tienen un impacto en XCI, utilizamos hibridación fluorescente in situ de ARN unicelular (RNA FISH) para evaluar la expresión de Lamp2 endógeno, un gen ligado al cromosoma X que normalmente se silencia durante la iniciación XCI40. Tras la expresión Xist inducida por doxiciclina, depleción de Rbm6, Zzz3 y Spen de control positivo (Suplemento Fig. 4a, b) redujo el silenciamiento de Lamp2, mientras que su expresión monoalélica inducida por XCI permaneció inalterada tras el agotamiento de Thap7, que no interactuó con Xist y se utilizó como control negativo (Fig. 5c, d; Suplemento Fig. 4c; Cuadro complementario 2). En ausencia de condiciones de Xist (- doxiciclina), la expresión de Lamp2 se mantuvo sin cambios al agotar las proteínas anteriores (Suplemento Fig. 4d; Cuadro complementario 2). Es importante destacar que los defectos en el silenciamiento del cromosoma X no se desencadenaron por la expresión alterada de Xist/Tsix al agotar las proteínas individuales (Suplemento Fig. 4e). En resumen, la identificación de interactores de importancia funcional entre las prácticas comerciales restrictivas identificadas por la huella digital demuestra el potencial de descubrimiento de la huella digital.