de incPRINT methode om RNA–eiwitcomplexen te identificeren
om RNA–eiwit interacties systematisch in levende cellen te identificeren, ontwikkelden we een methode die de cellulaire interacties meet tussen elk getagd testrna en elk getagd testproteïne. Het principe van incPRINT is de voorbijgaande duale expressie van een MS2-tagged testrna en een FLAG-tagged testproteïne in HEK293T-cellen die stabiel een luciferasedetector uitdrukken die is gefuseerd met het MS2 coat protein (MS2CP) van een genomisch geïntegreerd plasmide (Fig. 1). Het testrna is gebonden aan de luciferasedetector door de MS2-MS2CP interactie; het RNA-luciferasecomplex is co-gezuiverd met de vlag-geëtiketteerde testproteã ne immunoprecipitated van cellysaten door anti-vlag antilichaam (Fig. 1). De indirecte RNA-eiwitinteracties die door DNA worden overbrugd worden geëlimineerd door DNase behandeling na de stap van de cellysis. Om elke RNA–eiwitinteractie te ontdekken, wordt RNA-MS2 co-gezuiverd met het TESTVLAGGED eiwit gemeten door kwantificeerbare luciferaseluminescentie (Fig. 1). Om de expressieniveaus van het testeiwit te controleren, wordt de abundantie van de testeiwitten gemeten met ELISA met behulp van een tweede Anti-FLAG antilichaam gekoppeld aan mierikswortelperoxidase (HRP) (Fig. 1). De incPRINT methode is flexibel in schaal, bruikbaar als een laag-of hoog-productie assay. Om systematische, hoog-productieidentificatie van cellulaire RNA–eiwitinteractie toe te laten, produceerden wij een aangepaste bibliotheek van human 3000 menselijke vlag-geëtiketteerde proteã nen met inbegrip van 1500 1500 bekende RBPs (gebaseerd op refs. 10,11), ∼1300 transcriptiefactors12, en 170 170 chromatine-geassocieerde eiwitten. Het geëtiketteerde eiwitgehalte kan worden aangepast aan de gewenste experimentele opstelling.
incPRINT detecteert op betrouwbare wijze cellulaire RNA–eiwitinteracties
om incPRINT vast te stellen, hebben we een reeks kleinschalige experimenten uitgevoerd met een ∼1-kb behouden gebied van de lncRNA Xist genaamd de A-herhaling, hierna aangeduid als Xist(a)13. Omdat verscheidene Xist (A) – eiwitinteractie goed vastgesteld7, dienden zij als controles in onze aanvankelijke incprintexperimenten. Wij bouwden een construct om Xist(a)-MS2 uit te drukken en analyseerden de capaciteit van RNA Xist(a)-MS2 om met een geselecteerde reeks eerder geà dentificeerde Xist-bindende proteins7,14,15 in wisselwerking te staan. De niet-discriminerende poly(A)-bindende proteã ne PABPC3 werd gebruikt om voor de uitdrukking van RNA te controleren en EGFP (verbeterde groene fluorescente Proteã ne) werd gebruikt als negatieve controle. incPRINT luminescentie ontdekte specifieke interacties van Xist(a)-MS2 met SPEN, RBM15, RBM15B, YTHDC1, HNRNPC, SRSF7, en RALY, terwijl HNRNPU, gemeld om volledige lengte Xist maar niet specifiek Xist(a)7 te binden, en EGFP basale binding toonde (Fig. 2 bis). De behandeling met RNase schafte het RNA-eiwitinteractiesignaal af dat door luciferase werd gemeten, terwijl de expressie van testeiwitten die door ELISA werden gedetecteerd grotendeels onveranderd bleef (Fig. 2a, aanvullende Fig. 1a), die aantonen dat de interactie tussen de geëtiketteerde proteã nen en de luciferasedetector door RNA werden overbrugd.
om het aantal MS2-stamlussen te optimaliseren dat wordt gebruikt om het geteste RNA te markeren, werd Xist(A) gefuseerd met twee, vier, zes, tien of 24 MS2-stamlussen, en hun interacties met een reeks controleproteïnen werden getest in een kleinschalig incPRINT-experiment. Een toename van de luminescentieintensiteit correleerde direct met een toename van het aantal MS2-stemlussen tot tien stemlussen zonder duidelijke toename van de binding aan de EGFP-regeling (aanvullende Fig. 1 ter). Daarom, in alle volgende incprint experimenten, werden RNAs geëtiketteerd met tien MS2 stamlussen.
om te bepalen of de door incPRINT gedetecteerde RNA–eiwitinteracties inderdaad in cellen voorkwamen of alleen in vitro ontstonden na cellysis16,17,18, werd het luminescentiesignaal van twee onafhankelijke experimenten gemeten en vergeleken. In het eerste experiment, werden RNA van Xist(a)-MS2 en vlag-geëtiketteerde testproteã nen co-transfected in dezelfde celpopulatie zoals hierboven beschreven. In het tweede experiment werden Xist(a)-MS2 RNA en FLAG-tagged testproteïnen afzonderlijk getransfecteerd in twee verschillende celpopulaties en samengevoegd pas na de cellysistap, waardoor de vorming van RNA–eiwitcomplexen uitsluitend in vitro (aanvullende Fig. 1c). We vonden dat interacties bij voorkeur werden gedetecteerd wanneer Xist (a)-MS2 RNA en de vlag-tagged eiwitten werden co-transfected (de standaard incPRINT voorwaarde; Fig. 2b). Deze resultaten suggereren dat wanneer een interactiesignaal werd ontdekt door incPRINT, het stamde uit de RNA-eiwitcomplexen gevormd in cellen, terwijl de Vereniging van RNA–eiwitcomplexen post-cel lysis als verwaarloosbare achtergrond onder incPRINT-specifieke voorwaarden verscheen (Fig. 2b). Samen genomen, stellen deze experimenten vast dat incPRINT cellulaire RNA–eiwitinteractie meet gebruikend een luminescentieuitlezing.
High-throughput detectie van RNA–eiwit interacties
om de schaalbaarheid van incPRINT te testen voor systematische identificatie van RNA–eiwit interacties, ondervroegen we onze aangepaste bibliotheek van ~3000 FLAG-tagged menselijke eiwitten (inclusief 1500 1500 bekende rbps10,11, 13 1300 transcriptiefactors12, en 170 170 chromatine-geassocieerde eiwitten), met Xist(A)-MS2. Om het vertrouwen van de incPRINT-geïdentificeerde RNA–eiwitinteracties te versterken, werden alle interacties geanalyseerd in biologisch duplicaat, waarbij twee luminescentiewaarden (RNA–eiwitinteractieintensiteit) en twee ELISA–waarden (test protein expression level) werden gegenereerd voor elk getest RNA-eiwitpaar. Na het filteren van de proteã nen uitgedrukt in onvoldoende niveaus (zie de ‘methodes’ sectie), werden interactiegegevens geanalyseerd voor 2405 proteã nen. de reproduceerbaarheid van incPRINT werd beoordeeld door de correlatiescores van biologische duplicaten te berekenen voor zowel de luminescentie (Fig. 2c; R2 = 0.87) en elisa signalen (vijg. 2d; R2 = 0,99). Met name werd geen correlatie tussen luminescentie-en ELISA-waarden ontdekt, wat erop wijst dat de interactieintensiteit niet louter een weerspiegeling was van de eiwitexpressieniveaus (Fig. 2e). Samengevat tonen onze gegevens aan dat incPRINT een schaalbare high-throughput methode is die reproduceerbaar RNA–eiwitinteracties in cel meet.
incPRINT identificeert proteoom van laag uitgedrukte RNAs
vervolgens probeerden we te testen of incPRINT robuust eiwitten kan identificeren die interageren met transcripten die worden uitgedrukt op lage endogene niveaus. De identificatie van proteã nen verbonden aan laag exemplaaraantal RNAs is over het algemeen uitdagend wanneer het gebruiken van de affiniteit van RNA capture-de benaderingen van lidstaten toe te schrijven aan de typisch lage efficiency van de zuiveringen van RNA en de grote hoeveelheid materiaal die voor massaspectrometrie wordt vereist. Omdat Firre een functioneel belangrijke lncRNA is die hogere-orde nucleaire architectuur over chromosomen19 moduleert en van een vrij lage endogene overvloed (∼20 molecules per cel gebaseerd op RNA-Seq gegevens over verschillende muizenweefsels) is, beoordeelden wij zijn RBP-interactoom met incPRINT. Het door MS2 gelabelde Firre-transcript over de volledige lengte werd ∼40 maal hoger uitgedrukt dan endogene FIRRE in de HEK293T-cellen die voor incPRINT werden gebruikt (aanvullende Fig. 2 bis). Zoals gerapporteerd voor de endogene transcript19, werd Firre-MS2 bij voorkeur gelokaliseerd in de kern (aanvullende Fig. 2b). Bij het ondervragen van onze bibliotheek van ~ 3000 eiwitten, identificeerde incPRINT een set van specifieke eiwitten als Firre interactors (Fig. 3a, rode stippen; aanvullende gegevens 1), terwijl de meerderheid van de proteã nen geen interactie met Firre (Fig. 3a, grijze stippen; aanvullende gegevens 1). Belangrijk, identificeerde incPRINT zowel bekende als nieuwe Firre-interacting proteã nen. CTCF en HNRNPU, die eerder door twee onafhankelijke studies werden gemeld om Firre te binden en belangrijk te zijn voor zijn functie19, 20, werden ook geïdentificeerd door incPRINT (Fig. 3a). Om de binding van nieuwe Firre interactors te valideren, analyseerden we de ENCODE eCLIP data21. De eCLIP-gegevens, die beschikbaar waren voor zeven Incprint-geïdentificeerde Firre-interagerende RBP ‘ s, bevestigden hun binding aan Firre in de k562-cellijn, waardoor de incPRINT-methode verder werd gevalideerd (aanvullende Fig. 2c; aanvullende gegevens 2). In overeenstemming met de rol van Firre in de nucleaire organisatie19 waren een aantal door incPRINT geïdentificeerde Firre-interactoren chromatine-geassocieerde eiwitten, waaronder CHD1, POU5F1, JARID2, EPC1, SATB1, MECP2, AEBP2 en CTCF (aanvullende gegevens 1). De analyses van het eiwitdomein toonden aan dat Firre-interagerende proteã nen beduidend voor het herkenningsmotief van RNA (RRM) werden verrijkt (Fig. 3b; aanvullende gegevens 3).
om te bepalen of RNA-overexpressie nodig was voor incPRINT om met succes eiwitbinding aan RNA met lage endogene spiegels te identificeren, werd een set eiwitten Getest met verschillende concentraties Firre-MS2 variërend van overexpressie zoals hierboven beschreven tot de niveaus vergelijkbaar met endogene FIRRE in HEK293T-cellen (aanvullende Fig. 2d, e). Terwijl de overexpressie van RNA in hogere interactiescores resulteerde die hun betere scheiding van de achtergrondscores mogelijk maakten, was het luciferasesignaal robuust detecteerbaar boven achtergrondsignaal wanneer verdunningen van Firre-MS2 werden gebruikt (aanvullende Fig. 2d). Belangrijk is dat dit signaal niet werd geassocieerd met de test eiwit expressie niveaus (aanvullende Fig. 2e). Samen, tonen deze gegevens het nut aan van incPRINT in het identificeren van proteã nen verbonden aan afschriften die bij lage endogene niveaus worden uitgedrukt.
incPRINT identificeert RNA-regio-specifieke interactiepartners
omdat veel lncRNA ’s functioneren als modulaire scaffolds, waardoor binding van specifieke RBP’ s aan afzonderlijke RNA-domains1,5 mogelijk is, hebben we geprobeerd te testen of incPRINT de identificatie van RNA-domein-specifieke interacties mogelijk maakt. Een ideale proof-of-principle molecule is lncRNA Xist, gezien zijn vitale rol in zoogdierx-chromosoom inactivering (XCI)22,23, en zijn modulaire structuur en functie. Het trans 17-kb lange Xist transcript bevat verscheidene behouden opeenvolgingsgebieden (genoemd herhaalt A tot en met F) die verschillende functies tijdens het XCI-proces uitvoeren, met inbegrip van initiatie van gen het tot zwijgen brengen (de A herhaling), behoud van de x – inactieve toestand (de F-en B – herhalingen) en juiste chromosomale lokalisatie en focale accumulatie van Xist (de C-en E-herhalingen)13,24,25,26,27,28,29,30,31,32 (Fig. 4a). Bovendien hebben verscheidene onafhankelijke studies eerder een reeks functionele eiwitinteractie met volledige lengte xist7 geà dentificeerd en gevalideerd,14,15,26,28,33,34,35. We probeerden incPRINT toe te passen op drie behouden gebieden van muis Xist, dat wil zeggen, Xist(A), Xist(F), en Xist(C) (Fig. 4a). Wanneer uitgedrukt in cellen HEK293T die voor incPRINT worden gebruikt, toonde elk fragment Xist-MS2 een verschillend niveau van uitdrukking in vergelijking met endogeen Xist, die zich van een 60-voudige verhoging voor Xist(A) tot een dichtbij-endogeen uitdrukkingsniveau voor Xist(C) uitstrekken (aanvullende Fig. 3a). Alle individuele Xist-MS2 fragmenten werden bij voorkeur gelokaliseerd aan de kern, op dezelfde manier als hun full-length endogene tegenhanger (aanvullende Fig. 3b). Elke Xist regio (d.w.z., Xist( A), Xist(F), en Xist(C)) werd ondervraagd met onze bibliotheek van ~3000 proteã nen. Het vergelijken van signalen over individuele Xist-regio ‘ s uitgedrukt op verschillende niveaus (aanvullende Fig. 3c), werden de interactiescores voor elk Xist-gebied genormaliseerd gebruikend de MS2 RNA-Bindende gegevens (aanvullende gegevens 4). Voor normalisatie, werd een reeks 200 proteã nen met hoogste rangschikkende luciferasescores in de dataset van MS2 RNA gedefinieerd als gemeenschappelijke bindmiddelen van alle MS2-geëtiketteerde RNAs. De gemeenschappelijke bindmiddelen werden vervolgens geïdentificeerd in elke dataset en hun mediane interactiescore werd berekend voor elk getest RNA en gebruikt om de ruwe luminescentieintensiteit in elke dataset te normaliseren (zie de sectie ‘methoden’). Met name werden de gegevens van MS2 niet gebruikt als controle van de bindende specificiteit, aangezien vele RBP ‘ s de motieven van laag complexiteitsrna36 ook huidig binnen de MS2-markering erkennen, en aangezien de eiwitbinding aan MS2 een potentiële functionele interactie met een testrna niet uitsluit. Evenzo aan Firre, vonden wij dat de meerderheid van proteã nen aan geen van de geteste fragmenten van Xist (Fig. 4b-d, grijze punten; aanvullende gegevens 4), terwijl de specifieke reeksen proteã nen werden geà dentificeerd om met elk individueel gebied van Xist in wisselwerking te staan (Fig. 4b-d, rode stippen; aanvullende gegevens 4). Belangrijk, onder de incPRINT-geà dentificeerde Xist-interagerende proteã nen, vonden wij bekende interactiepartners van Xist die in vorige studies werden geà dentificeerd om de volledige transcript7,14,15 (vermeld in Fig. 4b-d, aanvullende tabel 1). Het vergelijken van de reeksen van incPRINT-geïdentificeerde proteã nen en hun interactiescores voor elk ondervraagd gebied Xist (aanvullende gegevens 4), vonden wij dat elk fragment Xist met een reeks proteã nen specifiek aan het overeenkomstige gebied, met een kleine fractie van rbps die aan alle drie gebieden Xist binden (Fig. 4e). Aldus, liet het toepassen van incPRINT op drie behouden gebieden van Xist toe de identificatie en toewijzing aan specifieke gebieden van RNA van rbps eerder bepaald om de volledige lengte Xist transcript7,14,15 (Fig. 4e; bekende Xist-op elkaar inwerkende proteã nen zijn rechts aangegeven). IncPRINT identificeerde bijvoorbeeld SPEN als een Xist (A)-specifieke interactor (Fig. 4e), bevestiging van eerdere vondsten7, 8. Evenzo werden RBM15, RBM15B en YTHDC1 geïdentificeerd door incPRINT om specifiek te interageren met Xist (A) en Xist(F), maar niet met Xist(C), wat hun gerapporteerde binding aan het 5’ einde van Xist7,9 bevestigt (Fig. 4e). Bovendien identificeerden we een Xist (C)-specifieke interactie met HNRNPU (ook bekend als SAF-A) eerder aangetoond betrokken te zijn bij Xist localization7, 14, 33 (Fig. 4e, aanvullende tabel 1). Om de RNA-regio-specifieke Xist-eiwitinteracties te valideren, bevestigde de codering eCLIP data21 beschikbaar voor 14 incPRINT-geïdentificeerde proteã nen, waarvan verscheidene nieuwe Xist-interacterende RPBs zijn, hun band aan XIST in de lijn K562 (aanvullende Fig. 3d; aanvullende gegevens 2), verdere bevestiging van de specificiteit van onze methode. Een functioneel verschil tussen de eiwitinteractomen van de drie Xist-gebieden werd bevestigd door genontologie (GO) term verrijkingsanalyses. In overeenstemming met de differentiële functies gerapporteerd voor de individuele Xist – regio ‘s, werden Xist(A)-en Xist(F)-geassocieerde eiwitten verrijkt voor RBP’ s die betrokken zijn bij de verwerking van RNA, terwijl het C-repeat-gebied bij voorkeur interageerde met DNA-bindende eiwitten die betrokken zijn bij de transcriptionele Regulatie (aanvullende Fig. 3e, f). In overleg met de GO-analyse, het eiwit domein analyse aangetoond dat Xist(A)-interactie eiwitten zijn verrijkt voor de SPOC (Spen paralog en ortholog C-terminal) en SNELLE eiwitten domeinen, Xist(F)-interactie eiwitten zijn verrijkt voor de SNELLE domein en Xist(C)-interactie eiwitten toonde geen bijzondere verrijking (Afb. 4f; aanvullende gegevens 3), waarbij de specificiteit van incPRINT-geïdentificeerde eiwitsets voor elke Xist-regio verder wordt benadrukt. Samengevat, incPRINT met succes teruggekregen bekende Xist-eiwitinteractie en ontdekte nieuwe RBP ‘ s. Door specifieke reeksen proteã nen te identificeren die met individuele behouden gebieden van een modulaire lncRNA in wisselwerking staan, hebben wij aangetoond dat incPRINT de regio-specifieke toewijzing van RNA–eiwitinteractie toelaat.
incPRINT identificeert functionele RNA–eiwitinteracties
omdat Xist een goed gekarakteriseerde cellulaire functie heeft bij het tot zwijgen brengen van genen tijdens XCI, probeerden we te testen of sommige Xist-eiwitinteracties die met incPRINT werden ontdekt functioneel relevant zijn. De nadruk was op de proteã ne ZZZ3, die met alle drie geteste gebieden van Xist in wisselwerking staat, en RBM6, die specifiekere band aan de gebieden van Xist(A) en Xist(F) tentoonstelt (Fig. 4e). Ten eerste bevestigden we de interactie van Xist met RBM6 en ZZZ3 onder endogene omstandigheden door het testen van Xist co-precipitatie met beide eiwitten in muis embryonale stam (ES) cellen. De proteã nen werden ha-geëtiketteerd in de polymorfe cellijn van TX1072 ES die doxycycline-veroorzaakte Xist uitdrukking toelaat, die XCI in afwezigheid van differentiëring teweegbrengt 31,37,38,39. RNA immunoprecipitation (RIP) na doxycycline inductie van Xist en UV-cross-linking van cellen gevolgd door QRT-PCR analyses identificeerde een significante verrijking van het Xist transcript met rbm6 en zzz3 eiwitten, bevestiging van hun interactie in vivo (Fig. 5a, b). IncPRINT identificeerde ook RBM6 als interactie met Firre. RIP qRT-PCR detecteerde een specifieke interactie van Firre met RBM6 maar niet met ZZZ3, waardoor de binding van Firre-RBM6 onder endogene omstandigheden werd bevestigd en onze incprintresultaten verder werden gevalideerd (Fig. 5a, b).
om vervolgens te testen of RBM6 en ZZZ3 een impact hebben op XCI, gebruikten we eencellige RNA fluorescente in situ hybridisatie (RNA FISH) om de expressie van endogene Lamp2 te beoordelen, een X-gebonden gen dat normaal tot zwijgen wordt gebracht tijdens XCI-initiatie40. Na doxycycline-geïnduceerde Xist-expressie, depletie van Rbm6, Zzz3 en positieve controle Spen (aanvullende Fig. 4a, b) leidde tot verminderde geluiddemping van Lamp2, terwijl zijn XCI-veroorzaakte mono-allelic uitdrukking onveranderd bleef op uitputting van Thap7, die niet met Xist in wisselwerking stond en als negatieve controle werd gebruikt (Fig. 5c, d; aanvullende Fig. 4c; aanvullende tabel 2). In afwezigheid van Xist (- doxycycline voorwaarden), bleef lamp2 expressie onveranderd na depletie van de eiwitten hierboven (aanvullende Fig. 4d; aanvullende tabel 2). Belangrijk, werden de tekorten in chromosoom het tot zwijgen brengen van X niet teweeggebracht door veranderde uitdrukking van Xist / Tsix op uitputting van de individuele proteã nen (aanvullende Fig. 4e). Samengevat, de identificatie van functioneel belangrijke interactors onder de incPRINT-geïdentificeerde RBP ’s toont incPRINT’ s potentieel voor ontdekking.