incPRINT-metoden til identifikation af RNA–proteinkomplekser
for at identificere RNA–proteininteraktioner systematisk i levende celler udviklede vi en metode, der måler de cellulære interaktioner mellem ethvert tagget test-RNA og ethvert tagget testprotein. Princippet om incPRINT er den forbigående dobbelte ekspression af et MS2-mærket test-RNA og et FLAG-mærket testprotein i HEK293T-celler, der stabilt udtrykker en luciferase-detektor smeltet sammen med MS2 coat-proteinet (MS2CP) fra et genomisk integreret plasmid (Fig. 1). Test-RNA ‘ et er bundet til luciferasedetektoren gennem MS2-MS2CP-interaktionen; RNA-luciferasekomplekset er co-oprenset med det FLAG-mærkede testprotein, der er immunopræcipiteret fra cellelysater af anti-FLAG-antistof (Fig. 1). Indirekte RNA-proteininteraktioner, der er broet af DNA, elimineres ved Dnasebehandling efter cellelysetrinnet. For at detektere hver RNA–proteininteraktion måles RNA-MS2 Co-oprenset med testflagget protein ved kvantificerbar luciferase luminescens (Fig. 1). For at kontrollere testproteinekspressionsniveauer måles testproteinernes overflod ved hjælp af ELISA ved hjælp af et andet Anti-FLAG-antistof koblet til peberrodsperidase (HRP) (Fig. 1). IncPRINT-metoden er fleksibel i skala og kan bruges som en lav – eller høj gennemløbsanalyse. For at muliggøre systematisk identifikation med høj kapacitet af cellulære RNA–proteininteraktioner genererede vi et tilpasset bibliotek med 3000 humane flagmærkede proteiner inklusive 1500 kendte rbps (baseret på refs. 10,11), kr1300-transkriptionsfaktorer12 og kr170-kromatinassocierede proteiner. Det mærkede proteinindhold kan tilpasses til den ønskede eksperimentelle opsætning.
incPRINT registrerer pålideligt cellulære RNA–proteininteraktioner
for at etablere incPRINT udførte vi en række småskalaeksperimenter ved hjælp af et bevaret område af lncrna-Ksisten kaldet A-gentagelsen, i det følgende benævnt Ksist(a)13. Fordi flere ksist (a) – protein interaktioner er blevet veletableret7, tjente de som kontroller i vores indledende incPRINT eksperimenter. Vi konstruerede en konstruktion til at udtrykke Ksist (a)-MS2 og analyserede evnen af KSIST(a)-MS2 RNA til at interagere med et udvalgt sæt af tidligere identificerede Ksist-bindende proteiner7,14,15. Det ikke-diskriminerende Poly (a) – bindende protein PABPC3 blev brugt til at kontrollere for RNA-ekspression, og EGFP (Enhanced Green Fluorescent Protein) blev anvendt som en negativ kontrol. incPRINT luminescens detekterede specifikke interaktioner af Ksist (a)-MS2 med SPEN, RBM15, RBM15B, YTHDC1, HNRNPC, SRSF7 og RALY, hvorimod HNRNPU, rapporteret at binde Fuld længde Ksist, men ikke specifikt Ksist(a) 7, og EGFP viste basal binding (Fig. 2a). Behandlingen med RNase afskaffede RNA-proteininteraktionssignalet målt ved luciferase, mens ekspressionen af testproteiner detekteret af ELISA forblev for det meste uændret (Fig. 2a, supplerende Fig. 1a), der viser, at interaktionerne mellem de mærkede proteiner og luciferasedetektoren blev broet af RNA.
for at optimere antallet af MS2-stamsløjfer, der blev brugt til at tagge det testede RNA, blev Ksist(a) fusioneret med to, fire, seks, ti eller 24 MS2-stamsløjfer, og deres interaktioner med et sæt kontrolproteiner blev testet i et lille incPRINT-eksperiment. En stigning i luminescensintensiteten korrelerede direkte med et øget antal MS2-stamsløjfer op til ti stamsløjfer uden nogen markant stigning i binding til EGFP-kontrollen (supplerende Fig. 1b). Derfor blev RNA ‘ erne i alle efterfølgende incPRINT-eksperimenter mærket med ti MS2-stamsløjfer.
for at bestemme,om RNA–proteininteraktionerne påvist af incPRINT faktisk forekom i celler eller kun opstod in vitro efter cellelys16,17, 18, blev luminescenssignalet fra to uafhængige eksperimenter målt og sammenlignet. I det første forsøg blev KSIST(a)-MS2 RNA og FLAG-mærkede testproteiner Co-transficeret i den samme cellepopulation som beskrevet ovenfor. I det andet forsøg blev KSIST(a)-MS2 RNA og FLAG-mærkede testproteiner transficeret separat i to forskellige cellepopulationer og samlet sammen først efter cellelysetrinnet, hvilket tillod dannelsen af RNA–proteinkomplekser udelukkende in vitro (supplerende Fig. 1c). Vi fandt ud af, at interaktioner fortrinsvis blev detekteret, når Ksist(a)-MS2 RNA og de FLAGMÆRKEDE proteiner blev co-transficeret (standard incPRINT-tilstanden; Fig. 2b). Disse resultater antyder, at når et interaktionssignal blev detekteret af incPRINT, stammede det fra RNA–proteinkomplekserne dannet i celler, hvorimod forening af RNA–proteinkomplekser efter cellelyse syntes som ubetydelig baggrund under incPRINT-specifikke betingelser (Fig. 2b). Samlet set fastslår disse eksperimenter, at incPRINT måler cellulære RNA-proteininteraktioner ved hjælp af en luminescensaflæsning.
detektion med høj kapacitet af RNA-proteininteraktioner
for at teste skalerbarheden af incPRINT til systematisk identifikation af RNA–proteininteraktioner, forhørte vi vores tilpassede bibliotek med ~3000 FLAG–mærkede humane proteiner (inklusive larp 1500 kendte RBPs10,11, larp 1300 transkriptionsfaktorer12 og larp 170 chromatin-associerede proteiner) med Ksist(a)-MS2. For at styrke tilliden til de incPRINT-identificerede RNA–proteininteraktioner blev alle interaktioner analyseret i biologisk duplikat, hvilket genererede to luminescens (RNA–proteininteraktionsintensitet) og to Elisa (testproteinekspressionsniveau) værdier for hvert testet RNA–proteinpar. Efter filtrering af proteinerne udtrykt ved utilstrækkelige niveauer (se afsnittet ‘metoder’) blev interaktionsdata analyseret for 2405 proteiner. incprints Reproducerbarhed blev vurderet ved at beregne korrelationsscore for biologiske duplikater for både luminescensen (Fig. 2c; R2 = 0.87) og Elisa-signaler (Fig. 2D; R2 = 0,99). Især blev der ikke påvist nogen sammenhæng mellem luminescens og ELISA-værdier, hvilket indikerer, at interaktionsintensiteterne ikke blot afspejler proteinekspressionsniveauerne (Fig. 2e). Sammenfattende viser vores data, at incPRINT er en skalerbar metode med høj kapacitet, der reproducerbart måler RNA-proteininteraktioner i celle.
incPRINT identificerer proteom af lavt udtrykte RNA ‘ er
dernæst forsøgte vi at teste, om incPRINT robust kan identificere proteiner, der interagerer med udskrifter udtrykt ved lave endogene niveauer. Identifikation af proteiner forbundet med lavt kopiantal RNA ‘ er er generelt udfordrende, når man bruger RNA-affinitetsfangst-MS-tilgange på grund af den typisk lave effektivitet af RNA-rensninger og den store mængde materiale, der kræves til massespektrometri. Fordi Firre er et funktionelt vigtigt lncRNA, der modulerer højere ordens nuklear arkitektur på tværs af kromosomer19 og har en ret lav endogen overflod (20 molekyler pr.celle baseret på RNA-Sekv-data på tværs af forskellige musevæv), vurderede vi dets RBP-interactome med incPRINT. Firre-transkriptet i fuld længde mærket af MS2 blev udtrykt 40 gange højere end endogent FIRRE i HEK293T-cellerne, der blev brugt til incPRINT (supplerende Fig. 2a). Som rapporteret for den endogene transkript19 var Firre-MS2 fortrinsvis lokaliseret til kernen (supplerende Fig. 2b). Ved at forhøre vores bibliotek med ~3000 proteiner identificerede incPRINT et sæt specifikke proteiner som Firre interactors (Fig. 3a, røde prikker; supplerende Data 1), hvorimod størstedelen af proteinerne ikke interagerede med Firre (Fig. 3a, grå prikker; supplerende Data 1). Det er vigtigt, at incPRINT identificerede både kendte og nye Firre-interagerende proteiner. Ctcf og HNRNPU, tidligere rapporteret af to uafhængige undersøgelser for at binde Firre og være vigtige for dets funktion19,20, blev også identificeret af incPRINT (Fig. 3a). For at validere binding af nye Firre interactors analyserede vi ENCODE eCLIP data21. ECLIP-dataene, der var tilgængelige for syv incPRINT-identificerede Firre-interagerende RBP ‘ er, bekræftede deres binding til Firre i k562-cellelinjen, hvilket yderligere validerede incPRINT-metoden (supplerende Fig. 2C; supplerende Data 2). I overensstemmelse med Firres rolle i nuklear organisation19 var et sæt Firre-interaktorer identificeret af incPRINT kromatinassocierede proteiner inklusive CHD1, POU5F1, JARID2, EPC1, SATB1, MECP2, AEBP2 og Ctcf (supplerende Data 1). Proteindomæneanalyser viste, at Firre-interagerende proteiner blev signifikant beriget for RNA-genkendelsesmotivet (RRM) (Fig. 3b; supplerende Data 3).
for at bestemme, om RNA-overekspression var påkrævet for, at incPRINT kunne identificere proteiner, der binder til RNA med lave endogene niveauer, blev et sæt proteiner testet med forskellige koncentrationer af Firre-MS2, der spænder fra overekspression som beskrevet ovenfor til niveauer, der kan sammenlignes med endogen FIRRE i HEK293T-celler (supplerende Fig. 2d, e). Mens RNA-overekspression resulterede i højere interaktionsresultater, der muliggjorde deres bedre adskillelse fra baggrundsscore, var luciferase-signalet robust detekterbart over baggrundssignalet, når fortyndinger af Firre-MS2 blev anvendt (supplerende Fig. 2d). Det er vigtigt, at dette signal ikke var forbundet med testproteinekspressionsniveauerne (supplerende Fig. 2e). Tilsammen viser disse data nytten af incPRINT til at identificere proteiner forbundet med transkripter udtrykt ved lave endogene niveauer.
incPRINT identificerer RNA-region-specifikke interaktionspartnere
fordi mange lncrna ‘er fungerer som modulære stilladser, hvilket muliggør binding af specifikke RBP’ er til diskrete RNA-domæner1,5, forsøgte vi at teste, om incPRINT tillader identifikation af RNA-domænespecifikke interaktioner. Et ideelt proof-of-principle molekyle er lncRNA, givet sin afgørende rolle i pattedyrs kromosom inaktivering (22,23)og dens modulære struktur og funktion. Den 17-kb lange transkription indeholder flere bevarede sekvensregioner (kaldet gentagelser A til F), der udfører forskellige funktioner under processen, herunder initiering af genhæmning (a-gentagelsen), vedligeholdelse af den inaktive tilstand (F – og B-gentagelserne) og korrekt kromosomal lokalisering og fokal akkumulering af Ksist (C – og E-gentagelserne)13,24,25,26,27,28,29,30,31,32 (Fig. 4a). Desuden har flere uafhængige undersøgelser tidligere identificeret og valideret et sæt funktionelle proteininteraktioner med fuld længde 7,14,15,26,28,33,34,35. Vi søgte at anvende incPRINT til tre bevarede områder af mus Ksist, dvs. Ksist (a), Ksist(F) og Ksist(C) (Fig. 4a). Når det blev udtrykt i HEK293T-celler, der blev brugt til incPRINT, viste hvert ksist-MS2-fragment et andet ekspressionsniveau sammenlignet med endogent Ksist, der spænder fra en 60 gange stigning for ksist(A) til et næsten endogent ekspressionsniveau for Ksist(C) (supplerende Fig. 3a). Alle individuelle ksist-MS2-fragmenter blev fortrinsvis lokaliseret til kernen på samme måde som deres endogene modstykke i fuld længde (supplerende Fig. 3b). Hver region (dvs. C) blev forhørt med vores bibliotek af ~3000 proteiner. At sammenligne signaler på tværs af individuelle Ksistregioner udtrykt på forskellige niveauer (supplerende Fig. 3C) blev interaktionsscore for hver Ksistregion normaliseret ved anvendelse af MS2 RNA-bindingsdata (supplerende Data 4). Til normalisering blev et sæt på 200 proteiner med toprangerende luciferase-score i MS2 RNA-datasættet defineret som almindelige bindemidler af alle MS2-mærkede RNA ‘ er. De almindelige bindemidler blev derefter identificeret i hvert datasæt, og deres median interaktionsscore blev beregnet for hvert testet RNA og brugt til at normalisere rå luminescensintensiteter i hvert datasæt (se afsnittet ‘metoder’). Især blev MS2-data ikke brugt som en bindende specificitetskontrol, da mange RBP ‘ er genkender lav kompleksitet RNA motifs36 også til stede inden for MS2-taggen, og da proteinbinding til MS2 ikke udelukker en potentiel funktionel interaktion med et test-RNA. På samme måde som Firre fandt vi, at størstedelen af proteinerne ikke bandt til nogen af de testede ksistfragmenter (Fig. 4b-d, grå prikker; supplerende Data 4), mens specifikke sæt proteiner blev identificeret til at interagere med hver enkelt Ksistregion (Fig. 4b-d, røde prikker; supplerende Data 4). Det er vigtigt, at blandt de incPRINT-identificerede ksist-interagerende proteiner fandt vi kendte interaktionspartnere af Ksist identificeret i tidligere undersøgelser for at binde transkript7,14,15 i fuld længde (angivet i Fig. 4b-d, supplerende tabel 1). Sammenligning af sætene af incPRINT-identificerede proteiner og deres interaktionsscore for hver forhørt Ksistregion (supplerende Data 4) fandt vi, at hvert ksistfragment interagerede med et sæt proteiner, der var specifikke for den tilsvarende region, med en mindre brøkdel af RBPs, der binder til alle tre Ksistregioner (Fig. 4e). Anvendelse af incPRINT på tre bevarede regioner af Ksist muliggjorde således identifikation og tildeling til specifikke RNA-regioner af RBP ‘ er,der tidligere var bestemt til at binde Ksist-transkript7,14, 15 i fuld længde (Fig. 4e; kendte ksist-interagerende proteiner er angivet til højre). For eksempel identificerede incPRINT SPEN som en Ksist(a)-specifik interaktor (Fig. 4e), bekræfter tidligere fund7, 8. Tilsvarende blev rbm15, RBM15B og YTHDC1 identificeret af incPRINT til at interagere specifikt med Ksist(A) og KSIST(F), men ikke Ksist(C), hvilket bekræfter deres rapporterede binding til 5’ – slutningen af Ksist7, 9 (Fig. 4e). Desuden identificerede vi en Ksist(C)-specifik interaktion med HNRNPU (også kendt som SAF-A), der tidligere viste sig at være involveret i Lokalisering7,14, 33 (Fig. 4e, supplerende tabel 1). For at validere de RNA-regionsspecifikke ksist-protein-interaktioner, koden eCLIP data21 tilgængelig for 14 incPRINT-identificerede proteiner, hvoraf flere er nye Ksist-interagerende RPB ‘ er, bekræftede deres binding til KSIST i k562-linjen (supplerende Fig. 3D; supplerende Data 2), der yderligere bekræfter specificiteten af vores metode. En funktionel forskel mellem proteininteraktomerne i de tre regioner blev bekræftet af Gen ontologi (GO) term berigelsesanalyser. I overensstemmelse med de differentielle funktioner, der blev rapporteret for de enkelte Ksistregioner, blev proteiner beriget for RBP ‘ er involveret i RNA – behandling, mens C-gentagelsesregionen fortrinsvis interagerede med DNA-bindende proteiner involveret i transkriptionel regulering(supplerende Fig. 3e, f). I overensstemmelse med GO-analysen viste proteindomæneanalysen, at proteindomæneanalysen(a)-interagerende proteiner blev beriget for SPOC (Spen paralog og ortholog C-terminal) og RRM-proteindomænerne, Proteindomænerne(F) – interagerende proteiner blev beriget for RRM-domænet og Proteindomænerne(C) – interagerende proteiner viste ingen særlig berigelse (Fig. 4F; supplerende Data 3), der yderligere fremhæver specificiteten af incPRINT-identificerede proteinsæt for hver Ksist-region. I sammendraget hentede incPRINT med succes kendte ksist-protein-interaktioner og afdækkede nye RBP ‘ er. Ved at identificere specifikke sæt proteiner, der interagerer med individuelle konserverede regioner i et modulært lncRNA, vi har demonstreret, at incPRINT muliggør den regionspecifikke tildeling af RNA-proteininteraktioner.
incPRINT identificerer funktionelle RNA–proteininteraktioner
fordi Ksist har en velkarakteriseret cellulær funktion i genhæmning under KCI, forsøgte vi at teste, om nogle af de ksist-proteininteraktioner, der blev afdækket ved hjælp af incPRINT, er funktionelt relevante. Der var fokus på 3-proteinet, som interagerer med alle tre testede Ksistregioner, og RBM6, som udviser mere specifik binding til ksistregionerne(A) og Ksistregionerne(f) (Fig. 4e). For det første bekræftede vi interaktionen mellem Ksist og RBM6 og SS3 under endogene forhold ved at teste Ksist-Co-udfældning med begge proteiner i musens embryonale stamceller. Proteinerne blev ha-mærket i den polymorfe tks1072 es cellelinie, der muliggør doksycyklin-induceret ksistekspression, udløser KCI i fravær af differentiering31, 37, 38, 39. RNA-immunudfældning (RIP) efter doksycyklininduktion af Ksist og UV-tværbinding af celler efterfulgt af KRT-PCR-analyser identificerede en signifikant berigelse af Ksist-transkriptionen med rbm6-og S3-proteiner, hvilket bekræftede deres interaktion in vivo (Fig. 5a, b). Især identificerede incPRINT også RBM6 som interagerende med Firre. RBM6, men ikke med SS3, hvilket bekræfter Firre-RBM6-bindingen under endogene betingelser og yderligere validering af vores incPRINT-resultater (Fig. 5a, b).
for at teste, om RBM6 og SV3 har indflydelse på sci, brugte vi encellet RNA fluorescerende in situ hybridisering (RNA FISH) til at vurdere ekspressionen af endogen Lamp2, et K-bundet gen, der normalt tavles under sci-initiering40. Ved ekspression, udtømning af Rbm6, S3 og positiv kontrol Spen (supplerende Fig. 4a, b) førte til reduceret lyddæmpning af Lampe2, hvorimod dens MONOALLELISKE udtryk forblev uændret ved udtømning af Thap7, som ikke interagerede med Ksist og blev anvendt som en negativ kontrol (Fig. 5c, d; supplerende Fig. 4c; supplerende tabel 2). Lamp2-ekspression forblev uændret ved udtømning af proteinerne ovenfor (supplerende Fig. 4D; supplerende tabel 2). Det er vigtigt, at defekterne i kromosom-dæmpning ikke blev udløst af ændret ekspression af Ksist/Tseks ved udtømning af de enkelte proteiner (supplerende Fig. 4e). Sammenfattende viser identifikationen af funktionelt vigtige interaktorer blandt de incPRINT-identificerede RBP ‘ er incprints potentiale for opdagelse.