Fig. 3
incPRINT identifica le proteine che interagiscono con Firre. un’intensità di interazione Firre-proteina normalizzata in media da due repliche biologiche, ordinate in ordine crescente. La linea tratteggiata orizzontale rappresenta il taglio dell’intensità di interazione utilizzato per la classificazione degli interattori Firre. I punti rossi sono proteine che interagiscono con Firre; i punti grigi sono proteine che non si legano a Firre. Sono indicate le proteine note per legarsi a Firre o quelle la cui interazione è stata convalidata nei dati ENCODE eclip21. Vedere la sezione ‘Metodi’ per la normalizzazione dei dati. RLU sono unità di luce relativa. b Grafico che mostra il numero di partner che interagiscono con incPRINT Firre che contengono un particolare dominio Pfam rispetto al-log10 (P) dell’arricchimento del dominio. I valori P sono stati calcolati utilizzando il test della proporzione. Mostrati in blu sono domini rappresentati almeno tre volte nella frazione tirata verso il basso che hanno un P corretto < 0.05. RRM-1 si riferisce al dominio Pfam PF00076. Per tutti i domini Pfam analizzati, vedere Dati supplementari 3.
Per determinare se l’RNA sovraespressione è stato richiesto per incPRINT per identificare correttamente le proteine di legame per l’RNA con bassi livelli endogeni, un insieme di proteine è stato testato con diverse concentrazioni di Firre-MS2 che vanno dalla sovraespressione come descritto in precedenza per i livelli comparabili a endogeno FIRRE in HEK293T cellule (Complementare Fig. 2d, e). Mentre la sovraespressione dell’RNA ha portato a punteggi di interazione più elevati consentendo la loro migliore separazione dai punteggi di fondo, il segnale della luciferasi è stato rilevabile in modo robusto sopra il segnale di fondo quando sono state utilizzate diluizioni di Firre-MS2 (Fig. 2d). È importante sottolineare che questo segnale non è stato associato ai livelli di espressione della proteina di prova (Fig. 2e). Insieme, questi dati dimostrano l’utilità di incPRINT nell’identificazione delle proteine associate ai trascritti espressi a bassi livelli endogeni.
incPRINT identifica partner di interazione RNA-regione-specifica
Poiché molti LNCRNA funzionano come scaffold modulari, consentendo il legame di specifici RBP a domini di RNA discreti1,5, abbiamo cercato di testare se incPRINT consente l’identificazione di interazioni RNA-dominio-specifiche. Una molecola ideale di prova di principio è il lncRNA Xist, dato il suo ruolo vitale nell’inattivazione del cromosoma X dei mammiferi (XCI)22,23, e la sua struttura modulare e funzione. La trascrizione Xist lunga ∼17 kb contiene diverse regioni di sequenza conservate (chiamate ripetizioni da A a F) che svolgono funzioni distinte durante il processo XCI, tra cui l’inizio del silenziamento genico (la ripetizione A), il mantenimento dello stato X-inattivo (le ripetizioni F e B)e la corretta localizzazione cromosomica e l’accumulo focale di Xist (le ripetizioni C ed E) 13,24,25,26,27,28,29,30,31,32 (Fig. 4 bis). Inoltre, diversi studi indipendenti hanno precedentemente identificato e convalidato una serie di interazioni proteiche funzionali con Xist7 a lunghezza intera,14,15,26,28,33,34,35. Abbiamo cercato di applicare incPRINT a tre regioni conservate del mouse Xist, cioè Xist(A), Xist(F) e Xist(C) (Fig. 4 bis). Quando espresso in cellule HEK293T utilizzate per incPRINT, ogni frammento Xist-MS2 ha mostrato un diverso livello di espressione rispetto allo Xist endogeno, che va da un aumento di ∼60 volte per Xist(A) a un livello di espressione quasi endogeno per Xist (C) (Fig. 3 bis). Tutti i singoli frammenti Xist-MS2 sono stati localizzati preferenzialmente al nucleo, in modo simile alla loro controparte endogena a tutta lunghezza (Fig. 3 ter). Ogni regione Xist (cioè, Xist(A), Xist(F) e Xist(C)) è stato interrogato con la nostra libreria di ~3000 proteine. Per confrontare i segnali tra le singole regioni Xist espresse a diversi livelli (Fig. 3c), i punteggi di interazione per ogni regione Xist sono stati normalizzati utilizzando i dati di legame MS2 RNA (Dati supplementari 4). Per la normalizzazione, un insieme di 200 proteine con punteggi di luciferasi di primo livello nel dataset di RNA MS2 è stato definito come leganti comuni di tutti gli RNA con tag MS2. I leganti comuni sono stati quindi identificati in ciascun set di dati e il loro punteggio mediano di interazione è stato calcolato per ciascun RNA testato e utilizzato per normalizzare le intensità di luminescenza grezza in ciascun set di dati (vedere la sezione “Metodi”). In particolare, i dati MS2 non sono stati utilizzati come controllo della specificità di legame, poiché molti RBPS riconoscono motifs36 RNA a bassa complessità presenti anche all’interno del tag MS2 e poiché il legame proteico con MS2 non esclude una potenziale interazione funzionale con un RNA di prova. Analogamente a Firre, abbiamo scoperto che la maggior parte delle proteine non si legava a nessuno dei frammenti Xist testati (Fig. 4b-d, punti grigi; Dati supplementari 4), mentre set specifici di proteine sono stati identificati per interagire con ogni singola regione Xist (Fig. 4b-d, puntini rossi; Dati supplementari 4). È importante sottolineare che, tra le proteine interagenti Xist identificate da incPRINT, abbiamo trovato partner di interazione ben noti di Xist identificati in studi precedenti per legare la trascrizione a figura intera 7, 14, 15 (indicata in Fig. 4b-d, Tabella supplementare 1). Confrontando gli insiemi di proteine identificate da incPRINT e i loro punteggi di interazione per ciascuna regione Xist interrogata (Dati supplementari 4), abbiamo scoperto che ogni frammento Xist interagiva con un insieme di proteine specifiche per la regione corrispondente, con una frazione minore di RBPs che si legava a tutte e tre le regioni Xist (Fig. 4 e). Pertanto, l’applicazione di incPRINT a tre regioni conservate di Xist ha permesso l’identificazione e l’assegnazione a specifiche regioni di RNA di RBP precedentemente determinate per legare la trascrizione Xist a lunghezza completa7, 14, 15 (Fig. 4e; note proteine che interagiscono con Xist sono indicate a destra). Ad esempio, incPRINT ha identificato SPEN come un interattore Xist(A) specifico (Fig. 4e), confermando i precedenti rilevamenti7, 8. Allo stesso modo, RBM15, RBM15B e YTHDC1 sono stati identificati da incPRINT per interagire specificamente con Xist(A) e Xist(F), ma non Xist(C), confermando il loro legame riportato alla fine 5′ di Xist7, 9 (Fig. 4 e). Inoltre, abbiamo identificato un’interazione Xist(C)-specifica con HNRNPU (noto anche come SAF-A) precedentemente dimostrato di essere coinvolto nella localizzazione Xist7,14,33 (Fig. 4e, Tabella supplementare 1). Per convalidare le interazioni Xist-proteina specifiche per la regione dell’RNA, i dati ENCODE eclip21 disponibili per 14 proteine identificate da incPRINT, molte delle quali sono nuovi RPBS interagenti con Xist, hanno confermato il loro legame con XIST nella linea K562 (Fig. 3d; Dati integrativi 2), avvalorando ulteriormente la specificità del nostro metodo. Una differenza funzionale tra gli interattomi proteici delle tre regioni Xist è stata confermata dalle analisi di arricchimento del termine Gene Ontology (GO). Coerentemente con le funzioni differenziali riportate per le singole regioni Xist, le proteine associate a Xist(A) e Xist(F) sono state arricchite per gli RBP coinvolti nell’elaborazione dell’RNA, mentre la regione C – repeat ha interagito preferenzialmente con le proteine leganti il DNA coinvolte nella regolazione trascrizionale (Fig. 3 sexies, f). In accordo con l’analisi GO, l’analisi del dominio proteico ha dimostrato che le proteine interagenti Xist(A) sono state arricchite per i domini proteici SPOC (Spen paralog e ortholog C-terminal) e RRM, le proteine interagenti Xist(F) sono state arricchite per il dominio RRM e le proteine interagenti Xist(C) non hanno mostrato alcun particolare arricchimento (Fig. 4f; Dati supplementari 3), evidenziando ulteriormente la specificità dei set proteici identificati da incPRINT per ciascuna regione Xist. In sintesi, incPRINT ha recuperato con successo le interazioni note con proteine Xist e ha scoperto nuovi RBP. Identificando specifici insiemi di proteine che interagiscono con le singole regioni conservate di un lncRNA modulare, abbiamo dimostrato che incPRINT consente l’assegnazione specifica della regione delle interazioni RNA-proteine.
Fig. 4
Proteine identificate per interagire con regioni distinte del lncRNA Xist. una rappresentazione schematica della trascrizione Xist del mouse e delle sue regioni di ripetizione da A a F conservate. Gli esoni sono indicati come caselle, gli introni come linee. Un’immagine ingrandita della regione 5 ‘ di Xist mostra le posizioni dei frammenti Xist lungo la trascrizione Xist. I frammenti da 0,9 kb, 2 kb e 1,7 kb per Xist(A), Xist(F) e Xist(C), rispettivamente, utilizzati negli esperimenti incPRINT sono delimitati da barre colorate orizzontali. b Intensità di interazione Xist(A)-proteina normalizzata in media da due repliche biologiche, ordinate in ordine crescente. La linea tratteggiata orizzontale rappresenta il cutoff dell’intensità di interazione utilizzato per la classificazione degli interattori Xist(A). I punti rossi sono proteine che interagiscono con Xist(A); i punti grigi sono proteine che non si legano a Xist(A). Sono indicate proteine selezionate note per legarsi a Xist. Vedere la sezione ‘Metodi’ per la normalizzazione dei dati. RLU sono unità di luce relativa. c Come in (b), per Xist(F). d Come in (b), per Xist(C). e Heatmap che mostra le intensità di interazione tra Xist(A), Xist(F) e Xist(C). Le proteine che interagiscono con Xist precedentemente rilevate sono indicate sulla destra. RLU sono unità di luce relativa. f Come in Fig. 3b, per i partner di interazione Xist(A), Xist(F) e Xist(C). SPOC si riferisce al dominio Pfam PF07744.
incPRINT identifica le interazioni funzionali RNA–proteine
Poiché Xist ha una funzione cellulare ben caratterizzata nel silenziamento genico durante XCI, abbiamo cercato di verificare se alcune delle interazioni Xist-proteine scoperte usando incPRINT sono funzionalmente rilevanti. L’attenzione si è concentrata sulla proteina Zz3, che interagisce con tutte e tre le regioni Xist testate, e RBM6, che presenta un legame più specifico con le regioni Xist(A) e Xist(F) (Fig. 4 e). Innanzitutto, abbiamo confermato l’interazione di Xist con RBM6 e Rz3 in condizioni endogene testando la co-precipitazione di Xist con entrambe le proteine in cellule staminali embrionali di topo. Le proteine sono state etichettate HA nella linea cellulare polimorfica TX1072 ES che consente l’espressione Xist indotta da doxiciclina, innescando XCI in assenza di differenziazione31,37,38,39. L’immunoprecipitazione a RNA (RIP) dopo induzione doxiciclina di Xist e UV-cross-linking delle cellule seguita da analisi qRT-PCR ha identificato un significativo arricchimento del trascritto Xist con proteine RBM6 e proteinsz3, confermando la loro interazione in vivo (Fig. 5 bis, lettera b). In particolare, incPRINT ha anche identificato RBM6 come interazione con Firre. RIP qRT-PCR ha rilevato una specifica interazione di Firre con RBM6 ma non con Zz3, confermando così il legame Firre-RBM6 in condizioni endogene e convalidando ulteriormente i nostri risultati incPRINT (Fig. 5 bis, lettera b).
Fig. 5
RBM6 e Zz3 sono necessari per XCI in vivo. una immunoprecipitazione RNA (RIP) della proteina RBM6 HA-tagged. Pannello di sinistra, western blot per RMB6. Pannello di destra, livelli di RNA dei trascritti indicati nell’ingresso e negli eluati immunoprecipitati. Tutti gli arricchimenti sono normalizzati a GAPDH mRNA e al campione di input. Ogni esperimento RIP è stato eseguito su due repliche biologiche indipendenti. I dati sono presentati come media ± s. d.; test t non accoppiati: * * P < 0.01. immunoprecipitazione dell’RNA di b (RIP) della proteina HAz3 HA-contrassegnata. Pannello di sinistra, western blot per Zz3. Pannello di destra, livelli di RNA dei trascritti indicati nell’ingresso e negli eluati immunoprecipitati. Tutti gli arricchimenti sono normalizzati all’mRNA GAPDH e al campione di input come descritto nella sezione “Metodi”. Ogni esperimento RIP è stato eseguito due volte su repliche biologiche indipendenti. I dati sono presentati come media ± s. d.; test t non accoppiati: * * P <0.01; *P< 0.05, non significativo (ns). Le macchie complete sono fornite come file di dati di origine. c Immagini rappresentative di RNA FISH di cellule indotte da Xist dopo l’esaurimento delle proteine indicate. Xist è mostrato in rosso e il gene X-Linked Lamp2 in verde. La linea tratteggiata delinea i nuclei delle cellule. Gli asterischi indicano l’espressione Lamp2 dal cromosoma X attivo. Le punte di freccia indicano l’espressione Lamp2 dal cromosoma X inattivo che sfugge alle barre della scala XCI, 5 µm. d Quantificazione di cellule con espressione bi-allelica Lamp2 valutata con RNA FISH ed espressa come rapporto di piega rispetto al controllo RLuc. I dati di tre esperimenti indipendenti sono rappresentati come media ± s. d.; T-test dello studente: **P < 0.01; *P < 0.05; non significativo (ns). Linea tratteggiata delinea il livello di RLuc.
Successivamente, per verificare se RBM6 e Zz3 hanno un impatto su XCI, abbiamo usato l’ibridazione in situ fluorescente a RNA a cellule singole (RNA FISH) per valutare l’espressione di Lamp2 endogeno, un gene X-linked che viene normalmente silenziato durante l’iniziazione XCI40. In caso di espressione Xist indotta da doxiciclina, deplezione di Rbm6, Spz3 e controllo positivo Spen (Fig. 4a, b) ha portato a una riduzione del silenziamento di Lamp2, mentre la sua espressione mono-allelica indotta da XCI è rimasta inalterata dopo l’esaurimento di Thap7, che non interagiva con Xist e veniva usato come controllo negativo (Fig. 5c, d; Fig.supplementare. 4c; Tabella supplementare 2). In assenza di condizioni di Xist (-doxiciclina), l’espressione di Lamp2 è rimasta invariata dopo l’esaurimento delle proteine di cui sopra (Fig. 4d; Tabella supplementare 2). È importante sottolineare che i difetti nel silenziamento del cromosoma X non sono stati innescati dall’espressione alterata di Xist / Tsix dopo l’esaurimento delle singole proteine (Fig. 4 e). In sintesi, l’identificazione di interattori funzionalmente importanti tra gli RBP identificati da incPRINT dimostra il potenziale di scoperta di incPRINT.