incPRINT-metoden för att identifiera RNA-proteinkomplex
för att identifiera RNA–protein-interaktioner systematiskt i levande celler utvecklade vi en metod som mäter de cellulära interaktionerna mellan alla märkta test-RNA och alla märkta testprotein. Principen för incPRINT är det övergående dubbla uttrycket av ett MS2-märkt test-RNA och ett FLAGGMÄRKT testprotein i HEK293T-celler som stabilt uttrycker en luciferasdetektor smält till MS2 coat-proteinet (Ms2cp) från en genomiskt integrerad plasmid (Fig. 1). Test-RNA är bunden till luciferasdetektorn genom MS2-MS2CP-interaktionen; RNA-luciferaskomplexet samrenas med det FLAGGMÄRKTA testproteinet immunoprecipitated från celllysater av anti-FLAGGANTIKROPP (Fig. 1). Indirekta RNA-proteininteraktioner som överbryggas av DNA elimineras genom DNas-behandling efter celllyssteget. För att detektera varje RNA–proteininteraktion, RNA-MS2 samrenad med testflaggmärkt protein mäts med kvantifierbar luciferasluminescens (Fig. 1). För att kontrollera för testproteinuttrycksnivåer mäts testproteinernas överflöd med ELISA med användning av en andra anti-FLAGGANTIKROPP kopplad till pepparrotperoxidas (HRP) (Fig. 1). IncPRINT-metoden är flexibel i skala, användbar som en låg – eller hög genomströmningsanalys. För att möjliggöra systematisk identifiering med hög genomströmning av cellulära RNA-proteininteraktioner genererade vi ett anpassat bibliotek med 3000 humana FLAGGMÄRKTA proteiner inklusive 1500 kända rbps (baserat på refs. 10,11), 1300 transkriptionsfaktorer12 och 170 kromatinassocierade proteiner. Det märkta proteininnehållet kan anpassas för att passa den önskade experimentella inställningen.
incPRINT detekterar tillförlitligt cellulära RNA–proteininteraktioner
för att upprätta incPRINT utförde vi en serie småskaliga experiment med en konserverad region i 1 kb konserverad region i lncRNA Xist som kallas A-upprepningen, nedan kallad Xist(A)13. Eftersom flera Xist (a) – protein-interaktioner har etablerats väl7 fungerade de som kontroller i våra initiala incPRINT-experiment. Vi konstruerade en konstruktion för att uttrycka Xist(a)-MS2 och analyserade förmågan hos Xist (a)-MS2 RNA att interagera med en utvald uppsättning tidigare identifierade Xist-bindande proteiner7,14,15. Det icke-diskriminerande Poly (a) – bindande proteinet PABPC3 användes för att kontrollera för RNA-uttryck och EGFP (Enhanced Green Fluorescent Protein) användes som en negativ kontroll. incPRINT luminescens detekterade specifika interaktioner mellan Xist(a)-MS2 med SPEN, RBM15, RBM15B, YTHDC1, HNRNPC, SRSF7 och RALY, medan HNRNPU rapporterade att binda Full längd Xist men inte specifikt Xist (a) 7, och EGFP visade basalbindning (Fig. 2a). Behandlingen med RNAs avskaffade RNA – proteininteraktionssignalen mätt med luciferas, medan uttrycket av testproteiner detekterade av ELISA förblev mestadels oförändrat (Fig. 2a, kompletterande Fig. 1a), vilket visar att interaktionerna mellan de taggade proteinerna och luciferasdetektorn överbryggades av RNA.
För att optimera antalet MS2 stamöglor som används för att märka det testade RNA, fusionerades Xist(A) med två, fyra, sex, tio eller 24 MS2 stamöglor, och deras interaktioner med en uppsättning kontrollproteiner testades i ett litet incPRINT-experiment. En ökning av luminiscensintensiteten korrelerade direkt med ett ökat antal MS2-stamöglor upp till tio stamöglor utan någon markant ökning av bindningen till EGFP-kontrollen (kompletterande Fig. 1b). Därför märktes rna i alla efterföljande incPRINT-experiment med tio MS2-stamöglor.
för att bestämma huruvida RNA-proteininteraktionerna som detekterades av incPRINT faktiskt inträffade i celler eller uppstod endast in vitro efter celllysis16,17,18 mättes och jämfördes luminiscenssignalen från två oberoende experiment. I det första experimentet transfekterades Xist(a)-MS2 RNA och FLAGGMÄRKTA testproteiner i samma cellpopulation som beskrivits ovan. I det andra experimentet transfekterades Xist(a)-MS2 RNA och FLAGGMÄRKTA testproteiner separat i två olika cellpopulationer och slogs samman först efter celllyssteget, vilket möjliggjorde bildandet av RNA-proteinkomplex uteslutande in vitro (kompletterande Fig. 1c). Vi fann att interaktioner företrädesvis detekterades när Xist (a)-MS2 RNA och de FLAGGMÄRKTA proteinerna samtransfekterades (standard incPRINT-tillståndet; Fig. 2b). Dessa resultat tyder på att närhelst en interaktionssignal detekterades av incPRINT, härrörde den från RNA-proteinkomplexen bildade i celler, medan associering av RNA–proteinkomplex post-celllys verkade som försumbar bakgrund under incPRINT-specifika förhållanden (Fig. 2b). Sammantaget fastställer dessa experiment att incPRINT mäter cellulära RNA-proteininteraktioner med hjälp av en luminiscensavläsning.
hög genomströmningsdetektering av RNA – proteininteraktioner
för att testa skalbarheten hos incPRINT för systematisk identifiering av RNA–proteininteraktioner, förhörde vi vårt anpassade bibliotek med ~3000 FLAGGMÄRKTA humana proteiner (inklusive 1500 kända rbps10,11, 1300 transkriptionsfaktorer12 och 170 kromatinassocierade proteiner), med Xist(a)-MS2. För att stärka förtroendet för de incPRINT-identifierade RNA–proteininteraktionerna analyserades alla interaktioner i biologisk duplikat, vilket genererade två luminiscens (RNA–proteininteraktionsintensitet) och två ELISA–värden (test protein expression level) för varje testat RNA-proteinpar. Efter filtrering av proteinerna uttryckta vid otillräckliga nivåer (se avsnittet ’metoder’) analyserades interaktionsdata för 2405 proteiner. incprints Reproducerbarhet bedömdes genom att beräkna korrelationspoängen för biologiska dubbletter för både luminescensen (Fig. 2c; R2 = 0.87) och ELISA-signaler (Fig. 2D; R2 = 0,99). I synnerhet detekterades ingen korrelation mellan luminiscens och ELISA-värden, vilket indikerar att interaktionsintensiteterna inte bara återspeglade proteinexpressionsnivåerna (Fig. 2e). Sammanfattningsvis visar våra data att incPRINT är en skalbar metod med hög genomströmning som reproducerbart mäter RNA-proteininteraktioner i cellen.
incPRINT identifierar proteom av lågt uttryckta rna
därefter försökte vi testa om incPRINT robust kan identifiera proteiner som interagerar med transkript uttryckta vid låga endogena nivåer. Identifiering av proteiner associerade med lågt kopieringsnummer RNA är generellt utmanande när man använder RNA-affinitetsupptagning-MS-tillvägagångssätt på grund av den typiskt låga effektiviteten hos RNA-reningar och den stora mängden material som krävs för masspektrometri. Eftersom Firre är en funktionellt viktig lncRNA som modulerar högre ordningens kärnarkitektur över kromosomer19 och har en ganska låg endogen överflöd (20 molekyler per cell baserat på RNA-Seq-data över olika musvävnader) bedömde vi dess RBP-interaktom med incPRINT. Firre-transkriptet i full längd märkt av MS2 uttrycktes 40 gånger högre än endogen FIRRE i HEK293T-cellerna som användes för incPRINT (kompletterande Fig. 2a). Som rapporterats för det endogena transkriptet19 lokaliserades Firre-MS2 företrädesvis till kärnan (kompletterande Fig. 2b). Genom att förhöra vårt bibliotek med ~3000 proteiner identifierade incPRINT en uppsättning specifika proteiner som Firre-interaktorer (Fig. 3a, röda prickar; kompletterande Data 1), medan majoriteten av proteinerna inte interagerade med Firre (Fig. 3A, grå prickar; kompletterande Data 1). Det är viktigt att incPRINT identifierade både kända och nya Firre-interagerande proteiner. CTCF och HNRNPU,som tidigare rapporterats av två oberoende studier för att binda Firre och vara viktiga för dess funktion19, 20, identifierades också av incPRINT (Fig. 3a). För att validera bindning av nya Firre-interaktorer analyserade vi koda eCLIP data21. ECLIP-data, tillgängliga för sju incPRINT-identifierade Firre-interagerande RBPs, bekräftade deras bindning till Firre i k562-cellinjen, ytterligare validering av incPRINT-metoden (kompletterande Fig. 2C; kompletterande uppgifter 2). I överensstämmelse med firres roll i kärnorganisationen19 var en uppsättning Firre-interaktorer identifierade av incPRINT kromatinassocierade proteiner inklusive CHD1, POU5F1, JARID2, EPC1, SATB1, MECP2, AEBP2 och CTCF (kompletterande Data 1). Proteindomänanalyser visade att Firre-interagerande proteiner berikades signifikant för RNA-igenkänningsmotivet (RRM) (Fig. 3b; kompletterande uppgifter 3).
för att bestämma om RNA-överuttryck krävdes för incPRINT för att framgångsrikt identifiera proteiner som binder till RNA med låga endogena nivåer testades en uppsättning proteiner med olika koncentrationer av Firre-MS2 som sträcker sig från överuttryck som beskrivits ovan till nivåerna jämförbara med endogen FIRRE i HEK293T-celler (kompletterande Fig. 2d, e). Medan RNA-överuttryck resulterade i högre interaktionspoäng som möjliggjorde deras bättre separation från bakgrundspoängen, var luciferassignalen robust detekterbar ovanför bakgrundssignalen när utspädningar av Firre-MS2 användes (kompletterande Fig. 2d). Viktigt är att denna signal inte var associerad med testproteinuttrycksnivåerna (kompletterande Fig. 2e). Tillsammans visar dessa data nyttan av incPRINT vid identifiering av proteiner associerade med transkript uttryckta vid låga endogena nivåer.
incPRINT identifierar RNA-regionspecifika interaktionspartners
eftersom många lncRNA fungerar som modulära ställningar, vilket möjliggör bindning av specifika RBPs till diskreta RNA-domäner1,5, försökte vi testa om incPRINT tillåter identifiering av RNA-domänspecifika interaktioner. En idealisk proof-of-principle molekyl är lncRNA Xist, med tanke på dess vitala roll i däggdjurs X-kromosominaktivering (XCI)22,23, och dess modulära struktur och funktion. 17 kb långa xist-transkriptet innehåller flera konserverade sekvensregioner (kallas upprepningar A till F) som utför distinkta funktioner under XCI-processen, inklusive initiering av gendämpning (a – upprepningen), underhåll av X-inaktivt tillstånd (F – och B-upprepningarna)och korrekt kromosomal lokalisering och fokal ackumulering av Xist (C-och E-upprepningarna) 13,24,25,26,27,28,29,30,31,32 (Fig. 4a). Dessutom har flera oberoende studier tidigare identifierat och validerat en uppsättning funktionella proteininteraktioner med Xist7 i full Längd,14,15,26,28,33,34,35. Vi försökte tillämpa incPRINT på tre bevarade regioner av mus Xist, dvs Xist (a), Xist(F) och Xist(C) (Fig. 4a). När de uttrycks i hek293t-celler som används för incPRINT, visade varje Xist-MS2-fragment en annan uttrycksnivå jämfört med endogen Xist, allt från en 60-faldig ökning för xist(A) till en nästan endogen uttrycksnivå för Xist(C) (kompletterande Fig. 3a). Alla enskilda Xist-MS2-fragment lokaliserades företrädesvis till kärnan, på samma sätt som deras endogena motsvarighet i full längd (kompletterande Fig. 3b). Varje Xist-region (dvs., Xist (a), Xist(F) och Xist(C)) förhördes med vårt bibliotek med ~3000 proteiner. Att jämföra signaler över enskilda Xist-regioner uttryckta på olika nivåer (kompletterande Fig. 3C) normaliserades interaktionspoängen för varje Xist-region med användning av MS2 RNA-bindningsdata (kompletterande Data 4). För normalisering definierades en uppsättning av 200 proteiner med topprankade luciferaspoäng i MS2 RNA-dataset som vanliga bindemedel av alla MS2-märkta rna. De vanliga bindemedlen identifierades sedan i varje dataset och deras medianinteraktionspoäng beräknades för varje testat RNA och användes för att normalisera råa luminiscensintensiteter i varje dataset (se avsnittet ’metoder’). I synnerhet användes inte MS2-data som en bindande specificitetskontroll, eftersom många RBPs känner igen låg komplexitet RNA-motiv36 närvarande också inom MS2-taggen, och eftersom proteinbindning till MS2 inte utesluter en potentiell funktionell interaktion med ett test-RNA. På samma sätt som Firre fann vi att majoriteten av proteinerna inte binder till något av de testade Xist-fragmenten (Fig. 4b-d, grå prickar; kompletterande Data 4), medan specifika uppsättningar proteiner identifierades för att interagera med varje enskild Xist-region (Fig. 4B-d, röda prickar; kompletterande Data 4). Det är viktigt att bland de incPRINT-identifierade Xist-interagerande proteinerna fann vi välkända interaktionspartners av Xist identifierade i tidigare studier för att binda transkriptet i full längd7,14,15 (anges i Fig. 4b-d, kompletterande Tabell 1). Jämförelse av uppsättningarna av incPRINT-identifierade proteiner och deras interaktionspoäng för varje förhörd Xist-region (kompletterande Data 4) fann vi att varje Xist-fragment interagerade med en uppsättning proteiner specifika för motsvarande region, med en mindre bråkdel av RBPs-bindning till alla tre Xist-regioner (Fig. 4e). Således tillämpade incPRINT till tre konserverade regioner av Xist möjliggjorde identifieringen och tilldelningen till specifika RNA-regioner av RBPs som tidigare bestämts för att binda Xist-transkriptet i full längd7,14,15 (Fig. 4e; kända Xist-interagerande proteiner anges till höger). Till exempel identifierade incPRINT SPEN som en Xist(A)-specifik interaktor (Fig. 4e), bekräftar tidigare fundings7, 8. På samma sätt identifierades rbm15, RBM15B och YTHDC1 av incPRINT för att interagera specifikt med Xist(A) och Xist(F), men inte Xist(C), vilket bekräftar deras rapporterade bindning till 5′ – änden av Xist7, 9 (Fig. 4e). Dessutom identifierade vi en Xist (C)-specifik interaktion med HNRNPU (även känd som SAF-A) som tidigare visat sig vara involverad i Xist-lokalisering7,14,33 (Fig. 4e, kompletterande Tabell 1). För att validera RNA-regionspecifika Xist – protein-interaktioner, koda eCLIP data21 tillgänglig för 14 incPRINT-identifierade proteiner, varav flera är nya Xist-interagerande RPBs, bekräftade deras bindning till XIST i k562-linjen (kompletterande Fig. 3D; kompletterande Data 2), vilket ytterligare bekräftar specificiteten av vår metod. En funktionell skillnad mellan proteininteraktomerna i de tre Xist-regionerna bekräftades av Gen ontologi (GO) termanrikningsanalyser. I överensstämmelse med de differentiella funktioner som rapporterats för de enskilda Xist – regionerna berikades Xist(a)-och Xist(F)-associerade proteiner för RBPs involverade i RNA-bearbetning, medan C-upprepningsregionen företrädesvis interagerade med DNA-bindande proteiner involverade i transkriptionsreglering (kompletterande Fig. 3e, f). I överensstämmelse med GO-analysen visade proteindomänanalysen att Xist(A)-interagerande proteiner berikades för SPOC (Spen paralog och ortholog C-terminal) och RRM-proteindomäner, Xist(F) – interagerande proteiner berikades för RRM-domänen och Xist(C) – interagerande proteiner visade ingen särskild anrikning (Fig. 4F; kompletterande Data 3), som ytterligare belyser specificiteten hos incPRINT-identifierade proteinuppsättningar för varje Xist-region. Sammanfattningsvis hämtade incPRINT framgångsrikt kända Xist-protein-interaktioner och avslöjade nya RBPs. Genom att identifiera specifika uppsättningar av proteiner som interagerar med enskilda konserverade regioner i ett modulärt lncRNA har vi visat att incPRINT möjliggör regionspecifik tilldelning av RNA–proteininteraktioner.
incPRINT identifierar funktionella RNA–proteininteraktioner
eftersom Xist har en väl karakteriserad cellfunktion vid gendämpning under XCI, försökte vi testa om några av Xist-proteininteraktionerna som avslöjats med incPRINT är funktionellt relevanta. Fokus var på zzz3-proteinet, som interagerar med alla tre testade Xist-regioner, och RBM6, som uppvisar mer specifik bindning till Xist(a) och Xist(F) regioner (Fig. 4e). Först bekräftade vi interaktionen mellan Xist och RBM6 och ZZZ3 under endogena förhållanden genom att testa Xist-Utfällning med båda proteinerna i musembryonala stamceller (ES). Proteinerna var HA-märkta i den polymorfa TX1072 ES – cellinjen som möjliggör doxycyklininducerat Xist-uttryck, vilket utlöser XCI i frånvaro av differentiering31,37,38,39. RNA immunoprecipitation (RIP) efter doxycyklininduktion av Xist och UV-tvärbindning av celler följt av qRT-PCR-analyser identifierade en signifikant anrikning av Xist-transkriptet med rbm6-och ZZZ3-proteiner, vilket bekräftar deras interaktion in vivo (Fig. 5a, b). I synnerhet identifierade incPRINT också RBM6 som interagerar med Firre. RIP qRT-PCR upptäckte en specifik interaktion mellan Firre och RBM6 men inte med ZZZ3, vilket bekräftar Firre-RBM6-bindningen under endogena förhållanden och ytterligare validerar våra incPRINT-resultat (Fig. 5a, b).
Nästa, för att testa om RBM6 och ZZZ3 påverkar XCI, använde vi ENCELLSRNA fluorescerande in situ hybridisering (RNA FISH) för att bedöma uttrycket av endogen Lamp2, en X-länkad gen som normalt tystas under XCI-initiering40. Vid doxycyklininducerat Xist-uttryck, utarmning av Rbm6, Zzz3 och positiv kontrollspen (kompletterande Fig. 4a, b) ledde till minskad tystnad av Lamp2, medan dess XCI-inducerade mono-alleliska uttryck förblev oförändrat vid utarmning av Thap7, som inte interagerade med Xist och användes som en negativ kontroll (Fig. 5c, d; kompletterande Fig. 4c; kompletterande Tabell 2). I frånvaro av Xist (- doxycyklinbetingelser) förblev Lamp2-uttrycket oförändrat vid utarmning av proteinerna ovan (kompletterande Fig. 4D; kompletterande Tabell 2). Det är viktigt att defekterna i X-kromosomtystning inte utlöstes av förändrat uttryck av Xist/Tsix vid utarmning av de enskilda proteinerna (kompletterande Fig. 4e). Sammanfattningsvis visar identifieringen av funktionellt viktiga interaktorer bland de incPRINT-identifierade RBP: erna incprints potential för upptäckt.