Die incPRINT-Methode zur Identifizierung von RNA-Protein-Komplexen
Um RNA-Protein-Interaktionen in lebenden Zellen systematisch zu identifizieren, haben wir eine Methode entwickelt, die die zellulären Interaktionen zwischen jeder markierten Test-RNA und jedem markierten Testprotein misst. Das Prinzip von incPRINT ist die transiente duale Expression einer MS2-markierten Test-RNA und eines FLAG-markierten Testproteins in HEK293T-Zellen, die stabil einen Luciferase-Detektor exprimieren, der mit dem MS2-Hüllprotein (MS2CP) aus einem genomisch integrierten Plasmid fusioniert ist (Abb. 1). Die Test-RNA wird durch die MS2-MS2CP-Interaktion an den Luciferase-Detektor angebunden; der RNA-Luciferase-Komplex wird mit dem FLAG-markierten Testprotein, das aus Zelllysaten durch Anti-FLAG-Antikörper immunpräzipitiert wurde, co-aufgereinigt (Fig. 1). Indirekte RNA-Protein-Wechselwirkungen, die durch DNA überbrückt werden, werden durch DNase-Behandlung nach dem Zelllyseschritt eliminiert. Um jede RNA-Protein-Interaktion nachzuweisen, wird RNA-MS2, das mit dem TESTFLAG-markierten Protein co-gereinigt wurde, durch quantifizierbare Luciferase-Lumineszenz gemessen (Abb. 1). Zur Kontrolle der Expressionsniveaus der Testproteine wird die Häufigkeit der Testproteine mittels ELISA unter Verwendung eines zweiten Anti-FLAG-Antikörpers gemessen, der an Meerrettichperoxidase (HRP) gekoppelt ist (Fig. 1). Die incPRINT-Methode ist flexibel skalierbar und kann als Assay mit niedrigem oder hohem Durchsatz verwendet werden. Um eine systematische Identifizierung zellulärer RNA-Protein-Interaktionen mit hohem Durchsatz zu ermöglichen, haben wir eine maßgeschneiderte Bibliothek mit ∼3000 humanen FLAG-markierten Proteinen einschließlich ∼1500 bekannter RBPs (basierend auf refs. 10,11), ∼1300 Transkriptionsfaktoren12 und ∼170 Chromatin-assoziierte Proteine. Der markierte Proteingehalt kann an den gewünschten Versuchsaufbau angepasst werden.
incPRINT detektiert zuverlässig zelluläre RNA–Protein-Interaktionen
Um incPRINT zu etablieren, führten wir eine Reihe von kleinen Experimenten unter Verwendung einer ∼1-kb konservierten Region der lncRNA Xist durch, die als A-Wiederholung bezeichnet wird, im Folgenden als Xist(A)13 bezeichnet. Da mehrere Xist (A) -Protein-Wechselwirkungen gut etabliert sind7, dienten sie als Kontrollen in unseren ersten incPRINT-Experimenten. Wir entwickelten ein Konstrukt zur Expression von Xist(A) -MS2 und testeten die Fähigkeit von Xist(A) -MS2-RNA, mit einem ausgewählten Satz zuvor identifizierter Xist-bindender Proteine zu interagieren7,14,15. Das nichtdiskriminierende Poly(A)-bindende Protein PABPC3 wurde zur Kontrolle der RNA-Expression und EGFP (Enhanced Green Fluorescent Protein) als Negativkontrolle verwendet. incPRINT-Lumineszenz detektierte spezifische Wechselwirkungen von Xist (A) -MS2 mit SPEN, RBM15, RBM15B, YTHDC1, HNRNPC, SRSF7 und RALY, während HNRNPU berichtete, Xist in voller Länge, aber nicht spezifisch Xist (A) 7 zu binden, und EGFP basale Bindung zeigte (Abb. 2a). Die Behandlung mit RNase schaffte das mit Luciferase gemessene RNA–Protein-Interaktionssignal ab, während die Expression der mit ELISA nachgewiesenen Testproteine weitgehend unverändert blieb (Abb. 2a, Ergänzend Fig. 1a), was zeigt, dass die Wechselwirkungen zwischen den markierten Proteinen und dem Luciferase-Detektor durch RNA überbrückt wurden.
Um die Anzahl der MS2-Stammschleifen zu optimieren, die zum Markieren der getesteten RNA verwendet wurden, wurde Xist(A) mit zwei, vier, sechs, zehn oder 24 MS2-Stammschleifen fusioniert, und ihre Wechselwirkungen mit einer Reihe von Kontrollproteinen wurden in einem kleinen incPRINT-Experiment getestet. Eine Zunahme der Lumineszenzintensität korrelierte direkt mit einer erhöhten Anzahl von MS2-Stammschleifen bis zu zehn Stammschleifen ohne merkliche Zunahme der Bindung an die EGFP-Steuerung (Ergänzende Fig. 1b). Daher wurden die RNAs in allen nachfolgenden incPRINT-Experimenten mit zehn MS2-Stammschleifen markiert.
Um festzustellen, ob die durch InPrint nachgewiesenen RNA–Protein-Wechselwirkungen tatsächlich in Zellen auftraten oder erst in vitro nach Zelllysis16,17,18 auftraten, wurde das Lumineszenzsignal aus zwei unabhängigen Experimenten gemessen und verglichen. Im ersten Experiment wurden Xist(A)-MS2-RNA und FLAG-markierte Testproteine in derselben Zellpopulation wie oben beschrieben kotransfiziert. Im zweiten Versuch wurden Xist(A)-MS2–RNA und FLAG-markierte Testproteine getrennt in zwei verschiedenen Zellpopulationen transfiziert und erst nach dem Zelllyseschritt zusammengeführt, so dass ausschließlich in vitro RNA-Protein-Komplexe gebildet werden konnten (Ergänzende Abb. 1c). Wir fanden heraus, dass Wechselwirkungen bevorzugt nachgewiesen wurden, wenn Xist (A) -MS2-RNA und die FLAG-markierten Proteine kotransfiziert wurden (die Standardbedingung von incPRINT; Abb. 2b). Diese Ergebnisse legen nahe, dass immer dann, wenn ein Interaktionssignal von incPRINT detektiert wurde, es von den in Zellen gebildeten RNA–Protein–Komplexen stammte, während die Assoziation von RNA-Protein-Komplexen nach der Zelllyse unter incPRINT-spezifischen Bedingungen als vernachlässigbarer Hintergrund auftrat (Abb. 2b). Zusammengenommen stellen diese Experimente fest, dass incPRINT zelluläre RNA-Protein-Wechselwirkungen unter Verwendung einer Lumineszenzanzeige misst.
Hochdurchsatzdetektion von RNA-Protein–Interaktionen
Um die Skalierbarkeit von incPRINT für die systematische Identifizierung von RNA–Protein-Interaktionen zu testen, haben wir unsere maßgeschneiderte Bibliothek mit ~ 3000 FLAG-markierten humanen Proteinen (einschließlich ∼1500 bekannter RBPs10,11, ∼1300 Transkriptionsfaktoren12 und ∼170 Chromatin-assoziierten Proteinen) mit Xist (A) -MS2 abgefragt. Um das Vertrauen der incPRINT-identifizierten RNA-Protein-Wechselwirkungen zu stärken, wurden alle Wechselwirkungen in biologischem Duplikat untersucht, wobei für jedes getestete RNA–Protein–Paar zwei Lumineszenz- (RNA-Protein-Interaktionsintensität) und zwei ELISA-Werte (Testprotein-Expressionsniveau) erzeugt wurden. Nach dem Herausfiltern der unzureichend exprimierten Proteine (siehe Abschnitt ‚Methoden‘) wurden Interaktionsdaten für 2405 Proteine analysiert. Die Reproduzierbarkeit von incPRINT wurde durch Berechnung der Korrelationswerte biologischer Duplikate sowohl für die Lumineszenz (Abb. 2c; R2 = 0.87) und ELISA-Signale (Fig. 2d; R2 = 0,99). Bemerkenswerterweise wurde keine Korrelation zwischen Lumineszenz- und ELISA-Werten nachgewiesen, was darauf hindeutet, dass die Interaktionsintensitäten nicht nur die Proteinexpressionsniveaus widerspiegelten (Abb. 2e). Zusammenfassend zeigen unsere Daten, dass incPRINT eine skalierbare Hochdurchsatzmethode ist, die RNA–Protein-Interaktionen in Zellen reproduzierbar misst.
incPRINT identifiziert Proteom von niedrig exprimierten RNAs
Als nächstes wollten wir testen, ob incPRINT Proteine, die mit Transkripten interagieren, die auf niedrigen endogenen Ebenen exprimiert werden, robust identifizieren kann. Die Identifizierung von Proteinen, die mit RNAs mit niedriger Kopienzahl assoziiert sind, ist im Allgemeinen eine Herausforderung bei der Verwendung von RNA-Affinitätsfang-MS-Ansätzen aufgrund der typischerweise geringen Effizienz von RNA-Aufreinigungen und der großen Menge an Material, die für die Massenspektrometrie erforderlich ist. Da Firre eine funktionell wichtige lncRNA ist, die die Kernarchitektur höherer Ordnung über Chromosomen moduliert19 und ist von einer eher geringen endogenen Häufigkeit (∼20 Moleküle pro Zelle basierend auf RNA-Seq-Daten über verschiedene Mausgewebe), Wir haben sein RBP-Interaktom mit incPRINT bewertet. Das mit MS2 markierte Firre-Transkript in voller Länge wurde in den für InPrint verwendeten HEK293T-Zellen ∼40-fach höher exprimiert als endogenes FIRRE (Ergänzende Abb. 2a). Wie für das endogene Transkript19 berichtet, war Firre-MS2 bevorzugt im Zellkern lokalisiert (Ergänzende Abb. 2b). Bei der Abfrage unserer Bibliothek von ~ 3000 Proteinen identifizierte incPRINT eine Reihe spezifischer Proteine als Firre-Interaktoren (Abb. 3a, rote Punkte; Ergänzende Daten 1), während die Mehrzahl der Proteine nicht mit Firre interagierte (Abb. 3a, graue Punkte; Ergänzende Daten 1). Wichtig ist, dass incPRINT sowohl bekannte als auch neuartige Firre-wechselwirkende Proteine identifizierte. CTCF und HNRNPU, von denen zuvor in zwei unabhängigen Studien berichtet wurde, dass sie Firre binden und für seine Funktion wichtig sind19,20, wurden ebenfalls von incPRINT identifiziert (Abb. 3a). Um die Bindung neuartiger Firre-Interaktoren zu validieren, analysierten wir die ENCODE eCLIP-Daten21. Die eCLIP-Daten, die für sieben incPRINT-identifizierte Firre-wechselwirkende RBPs verfügbar sind, bestätigten ihre Bindung an Firre in der K562-Zelllinie, was die incPRINT-Methode weiter validiert (Ergänzende Abb. 2c; Ergänzende Angaben 2). In Übereinstimmung mit der Rolle von Firre in der nuklearen Organisation19 waren eine Reihe von Firre-Interaktoren, die von incPRINT identifiziert wurden, Chromatin-assoziierte Proteine, einschließlich CHD1, POU5F1, JARID2, EPC1, SATB1, MECP2, AEBP2 und CTCF (Ergänzende Daten 1). Proteindomänenanalysen zeigten, dass Firre-interagierende Proteine für das RNA-Erkennungsmotiv (RRM) signifikant angereichert waren (Abb. 3b; Ergänzende Daten 3).
Um festzustellen, ob eine RNA-Überexpression für incPRINT erforderlich war, um erfolgreich Proteine zu identifizieren, die an RNA mit niedrigen endogenen Spiegeln binden, wurde ein Satz von Proteinen mit unterschiedlichen Konzentrationen von Firre-MS2 getestet, die von der oben beschriebenen Überexpression bis zu den mit endogenem FIRRE in HEK293T-Zellen vergleichbaren Spiegeln reichten (Ergänzende Abb. 2d, e). Während die RNA-Überexpression zu höheren Interaktionswerten führte, die eine bessere Trennung von den Hintergrundwerten ermöglichten, war das Luciferasesignal bei Verwendung von Verdünnungen von Firre-MS2 robust über dem Hintergrundsignal nachweisbar (Ergänzende Abb. 2d). Wichtig ist, dass dieses Signal nicht mit den Expressionsniveaus des Testproteins assoziiert war (Ergänzende Abb. 2e). Zusammen zeigen diese Daten den Nutzen von incPRINT bei der Identifizierung von Proteinen, die mit Transkripten assoziiert sind, die auf niedrigen endogenen Spiegeln exprimiert werden.
incPRINT identifiziert RNA-regionsspezifische Interaktionspartner
Da viele lncRNAs als modulare Scaffolds fungieren und die Bindung spezifischer RBPs an diskrete RNA-Domänen1,5 ermöglichen, wollten wir testen, ob incPRINT die Identifizierung von RNA-domänenspezifischen Interaktionen ermöglicht. Ein ideales Proof-of-Principle-Molekül ist die lncRNA Xist, da sie eine wichtige Rolle bei der X-Chromosomeninaktivierung (XCI) von Säugetieren spielt 22,23, und seine modulare Struktur und Funktion. Das ∼17 kb lange Xist-Transkript enthält mehrere konservierte Sequenzregionen (sogenannte Wiederholungen A bis F), die während des XCI-Prozesses unterschiedliche Funktionen ausführen, einschließlich der Initiierung der Genstummschaltung (die A-Wiederholung), der Aufrechterhaltung des X-inaktiven Zustands (die F- und B-Wiederholungen) und der richtigen chromosomalen Lokalisierung und fokalen Akkumulation von Xist (die C- und E-Wiederholungen) 13,24,25,26,27,28,29,30,31,32 (Abb. 4a). Darüber hinaus haben mehrere unabhängige Studien zuvor eine Reihe funktioneller Proteininteraktionen mit Xist7 in voller Länge identifiziert und validiert,14,15,26,28,33,34,35. Wir haben versucht, incPRINT auf drei konservierte Regionen von Maus Xist anzuwenden, d. H. Xist (A), Xist (F) und Xist (C) (Abb. 4a). Bei Expression in HEK293T-Zellen, die für die inzISION verwendet wurden, zeigte jedes Xist-MS2-Fragment ein anderes Expressionsniveau im Vergleich zu endogenem Xist, das von einem ∼ 60-fachen Anstieg für Xist (A) bis zu einem nahezu endogenen Expressionsniveau für Xist (C) reichte (Ergänzende Abb. 3a). Alle einzelnen Xist-MS2-Fragmente waren bevorzugt im Kern lokalisiert, ähnlich wie ihr endogenes Gegenstück in voller Länge (Ergänzende Abb. 3b). Jede Xist-Region (d.h., Xist (A), Xist (F) und Xist (C)) wurde mit unserer Bibliothek von ~ 3000 Proteinen abgefragt. Um Signale über einzelne Xist-Regionen hinweg zu vergleichen, die auf verschiedenen Ebenen ausgedrückt werden (Ergänzende Abb. 3c) wurden die Interaktionswerte für jede Xist-Region unter Verwendung der MS2-RNA-Bindungsdaten normalisiert (Ergänzungsdaten 4). Zur Normalisierung wurde ein Satz von 200 Proteinen mit Top-Ranking-Luciferase-Scores im MS2-RNA-Datensatz als gemeinsame Bindemittel aller MS2-markierten RNAs definiert. Die gemeinsamen Bindemittel wurden dann in jedem Datensatz identifiziert und ihr medianer Interaktionswert wurde für jede getestete RNA berechnet und verwendet, um die Rohlumineszenzintensitäten in jedem Datensatz zu normalisieren (siehe Abschnitt ‚Methoden‘). Bemerkenswerterweise wurden MS2-Daten nicht als Bindungsspezifizitätskontrolle verwendet, da viele RBPs RNA-Motive mit geringer Komplexität erkennen36, die auch innerhalb des MS2-Tags vorhanden sind, und da die Proteinbindung an MS2 eine mögliche funktionelle Interaktion mit einer Test-RNA nicht ausschließt. Ähnlich wie bei Firre fanden wir heraus, dass die Mehrheit der Proteine an keines der getesteten Xist-Fragmente bindet (Abb. 4b-d, graue Punkte; Ergänzende Daten 4), während spezifische Sätze von Proteinen identifiziert wurden, die mit jeder einzelnen Xist-Region interagieren (Abb. 4b-d, rote Punkte; Ergänzende Daten 4). Wichtig ist, dass wir unter den INCI-identifizierten Xist-wechselwirkenden Proteinen bekannte Interaktionspartner von Xist fanden, die in früheren Studien identifiziert wurden, um das Transkript in voller Länge zu binden7,14,15 (in Abb. 4b-d, ergänzende Tabelle 1). Beim Vergleich der Sätze von incPRINT-identifizierten Proteinen und ihrer Interaktionswerte für jede befragte Xist-Region (ergänzende Daten 4) stellten wir fest, dass jedes Xist-Fragment mit einem Satz von Proteinen interagierte, die für die entsprechende Region spezifisch waren, wobei ein geringer Teil der RBPs an alle drei Xist-Regionen bindet (Abb. 4e). Somit ermöglichte die Anwendung von incPRINT auf drei konservierte Regionen von Xist die Identifizierung und Zuordnung zu spezifischen RNA-Regionen von RBPs, die zuvor bestimmt wurden, um das Xist-Transkript voller Länge zu binden7,14,15 (Fig. 4e; bekannte Xist-wechselwirkende Proteine sind rechts angedeutet). Beispielsweise identifizierte incPRINT SPEN als Xist(A) -spezifischen Interaktor (Abb. 4e), die frühere Feststellungen bestätigen7,8. In ähnlicher Weise wurden RBM15, RBM15B und YTHDC1 durch incPRINT identifiziert, um spezifisch mit Xist (A) und Xist (F), aber nicht mit Xist (C) zu interagieren, was ihre berichtete Bindung an das 5′-Ende von Xist7,9 bestätigt (Abb. 4e). Darüber hinaus identifizierten wir eine Xist (C) -spezifische Interaktion mit HNRNPU (auch bekannt als SAF-A), von der zuvor gezeigt wurde, dass sie an der Xist-Lokalisierung beteiligt ist7,14,33 (Abb. 4e, Ergänzende Tabelle 1). Um die RNA-regionsspezifischen Xist-Protein-Interaktionen zu validieren, bestätigten die ENCODE eCLIP-daten21, die für 14 incPRINT-identifizierte Proteine verfügbar sind, von denen einige neuartige Xist-interagierende RPBs sind, ihre Bindung an XIST in der K562-Linie (Ergänzende Abb. 3d; Ergänzende Daten 2), was die Spezifität unserer Methode weiter bestätigt. Ein funktioneller Unterschied zwischen den Proteininteraktomen der drei Xist-Regionen wurde durch genontologische (GO) Termanreicherungsanalysen bestätigt. In Übereinstimmung mit den für die einzelnen Xist-Regionen berichteten Differentialfunktionen wurden Xist (A) – und Xist (F) -assoziierte Proteine für RBPs angereichert, die an der RNA-Verarbeitung beteiligt sind, während die C-Repeat-Region bevorzugt mit DNA-bindenden Proteinen interagierte, die an der Transkriptionsregulation beteiligt sind (Ergänzende Abb. 3e, f). In Übereinstimmung mit der GO-Analyse zeigte die Proteindomänenanalyse, dass Xist(A) -wechselwirkende Proteine für die SPOC- (Spen paralog und ortholog C-terminal) und RRM-Proteindomänen angereichert waren, Xist (F) -wechselwirkende Proteine für die RRM-Domäne angereichert waren und Xist (C) -wechselwirkende Proteine keine besondere Anreicherung zeigten (Abb. 4f; Ergänzende Daten 3), wobei die Spezifität von INCID-identifizierten Proteinsätzen für jede Xist-Region weiter hervorgehoben wird. Zusammenfassend hat incPRINT erfolgreich bekannte Xist-Protein-Interaktionen abgerufen und neue RBPs aufgedeckt. Durch die Identifizierung spezifischer Gruppen von Proteinen, die mit einzelnen konservierten Regionen einer modularen lncRNA interagieren, haben wir gezeigt, dass incPRINT die regionsspezifische Zuordnung von RNA-Protein–Interaktionen ermöglicht.
incPRINT identifiziert funktionelle RNA–Protein-Interaktionen
Da Xist während der XCI eine gut charakterisierte zelluläre Funktion beim Gen-Silencing hat, wollten wir testen, ob einige der mit incPRINT entdeckten Xist-Protein-Interaktionen funktionell relevant sind. Der Fokus lag auf dem Protein ZZZ3, das mit allen drei getesteten Xist-Regionen interagiert, und RBM6, das eine spezifischere Bindung an die Xist (A) – und Xist(F) -Regionen aufweist (Abb. 4e). Zunächst bestätigten wir die Wechselwirkung von Xist mit RBM6 und ZZZ3 unter endogenen Bedingungen durch Testen der Xist-Co-Präzipitation mit beiden Proteinen in embryonalen Stammzellen der Maus. Die Proteine wurden in der polymorphen TX1072 ES-Zelllinie HA-markiert, die eine Doxycyclin-induzierte Xist-Expression ermöglicht und XCI ohne Differenzierung auslöst31,37,38,39. RNA-Immunpräzipitation (RIP) nach Doxycyclin-Induktion von Xist und UV-Vernetzung von Zellen, gefolgt von qRT-PCR-Analysen, ergab eine signifikante Anreicherung des Xist-Transkripts mit RBM6- und ZZZ3-Proteinen, was deren Interaktion in vivo bestätigt (Abb. 5a, b). Insbesondere identifizierte incPRINT auch RBM6 als Interaktion mit Firre. Die qRT-PCR detektierte eine spezifische Wechselwirkung von Firre mit RBM6, jedoch nicht mit ZZZ3, was die Firre-RBM6-Bindung unter endogenen Bedingungen bestätigte und unsere incPRINT-Ergebnisse weiter validierte (Abb. 5a, b).
Um zu testen, ob RBM6 und ZZZ3 einen Einfluss auf XCI haben, verwendeten wir Einzelzell-RNA-Fluoreszenz-in-situ-Hybridisierung (RNA FISH), um die Expression von endogenem Lamp2, einem X-verknüpften Gen, das normalerweise während der XCI-Initiierung zum Schweigen gebracht wird40. Bei Doxycyclin-induzierter Xist-Expression, Depletion von Rbm6, Zzz3 und Positivkontrolle Spen (Ergänzende Abb. 4a, b) führte zu einer verminderten Stummschaltung von Lamp2, während seine XCI-induzierte monoallelische Expression nach Abreicherung von Thap7 unverändert blieb, das nicht mit Xist interagierte und als Negativkontrolle verwendet wurde (Abb. 5c, d; ergänzend Fig. 4c; Ergänzende Tabelle 2). In Abwesenheit von Xist (-Doxycyclin-Bedingungen) blieb die Lamp2-Expression nach Abreicherung der obigen Proteine unverändert (Ergänzende Fig. 4d; Ergänzende Tabelle 2). Wichtig ist, dass die Defekte im X-Chromosom-Silencing nicht durch eine veränderte Expression von Xist/Tsix bei Depletion der einzelnen Proteine ausgelöst wurden (Ergänzende Abb. 4e). Zusammenfassend zeigt die Identifizierung funktionell wichtiger Interaktoren unter den von incPRINT identifizierten RBPs das Entdeckungspotenzial von incPRINT.