incPRINT metoden for å identifisere RNA–protein komplekser
for å identifisere RNA–protein interaksjoner systematisk i levende celler, utviklet vi en metode som måler cellulære interaksjoner mellom noen merket test RNA og noen merket test protein. Prinsippet med incPRINT er det forbigående doble uttrykket AV ET MS2-merket test-RNA og ET FLAGGMERKET testprotein i HEK293T-celler som stabilt uttrykker en luciferase-detektor smeltet TIL MS2 coat-proteinet (MS2CP) fra et genomisk integrert plasmid (Fig. 1). Test-RNA er bundet til luciferase-detektoren GJENNOM MS2-MS2CP-interaksjonen; RNA-luciferase-komplekset er co-renset med FLAGG-merket testproteinimmunoprecipitated fra cellelysater av ANTI-FLAGG antistoff (Fig. 1). Indirekte rna-protein interaksjoner brodd AV DNA elimineres Ved DNase behandling etter celle lysis trinn. FOR å oppdage hver RNA–proteininteraksjon, måles RNA-MS2 co-renset med testflagget protein ved kvantifiserbar luciferase luminescens(Fig. 1). For å kontrollere for testproteinuttrykksnivåer måles overflod av testproteinene ved ELISA ved hjelp av et andre ANTI-FLAGG antistoff koblet til pepperrotperoxidase (HRP) (Fig. 1). IncPRINT-metoden er fleksibel i skala, kan brukes som en lav-eller høy gjennomstrømmingsanalyse. For å muliggjøre systematisk identifisering med høy gjennomstrømming av cellulære rna-protein-interaksjoner, genererte vi et tilpasset bibliotek med ∼3000 HUMANE FLAGGMERKEDE proteiner, inkludert ∼1500 kjente RBPs (basert på refs. 10,11), ∼1300 transkripsjonsfaktorer12, og ∼170 kromatinassosierte proteiner. Det merkede proteininnholdet kan tilpasses for å passe til ønsket eksperimentelt oppsett.
for å etablere incPRINT, utførte vi en serie småskala eksperimenter ved hjelp av en ∼1 kb konservert region av lncRNA Xist kalt a repeat, heretter referert Til Som Xist(A)13. Fordi Flere Xist (a) – proteininteraksjoner har blitt godt etablert7, fungerte de som kontroller i våre første incPRINT-eksperimenter. Vi konstruerte en konstruksjon for å uttrykke Xist (A)-MS2 og analyserte evnen Til Xist(A)-MS2 RNA til å interagere med et valgt sett med tidligere identifiserte Xist-bindende proteiner7,14,15. Det ikke-diskriminerende poly (A)-bindende proteinet PABPC3 ble brukt til å kontrollere RNA-uttrykk og EGFP (Enhanced Green Fluorescent Protein) ble brukt som en negativ kontroll. incPRINT luminescens oppdaget spesifikke interaksjoner Av Xist(A)-MS2 MED SPEN, RBM15, RBM15B, YTHDC1, HNRNPC, SRSF7 og RALY, MENS HNRNPU, rapportert å binde Full lengde Xist, men ikke spesifikt Xist (a) 7, og EGFP viste basal binding (Fig. 2a). Behandlingen med RNase avskaffet rna-protein interaksjonssignalet målt ved luciferase, mens ekspresjonen av testproteiner oppdaget AV ELISA forblev stort sett uendret (Fig. 2a, Supplerende Fig. 1a), som viser at samspillet mellom de merkede proteinene og luciferase-detektoren ble brodd av RNA.
For å optimalisere ANTALL MS2 stamsløyfer som brukes til å merke det testede RNA, ble Xist(A) smeltet sammen med to, fire, seks, ti ELLER 24 MS2 stamsløyfer, og deres interaksjoner med et sett med kontrollproteiner ble testet i et lite incPRINT-eksperiment. En økning i luminescens intensitet direkte korrelert med et økt antall MS2 stem sløyfer opp til ti stem sløyfer uten markert økning i binding TIL EGFP kontroll (Supplerende Fig. 1b). Derfor, i alle etterfølgende incPRINT-eksperimenter, Ble Rna-ene merket med ti MS2-stammeløkker.For å avgjøre om RNA-proteininteraksjonene oppdaget av incPRINT faktisk forekom i celler eller oppsto bare in vitro etter cellelysis16,17 ,18, ble luminescenssignalet fra to uavhengige eksperimenter målt og sammenlignet. I det første forsøket ble Xist(A)-MS2 RNA og FLAGG-merkede testproteiner transfisert i samme cellepopulasjon som beskrevet ovenfor. I det andre forsøket ble Xist(A)-MS2 RNA og FLAGG-merkede testproteiner transfisert separat i to forskjellige cellepopulasjoner og samlet sammen bare etter cellelysetrinnet, og tillot dannelsen av RNA–proteinkomplekser utelukkende in vitro (Supplerende Fig. 1c). Vi fant at interaksjoner ble fortrinnsvis oppdaget når Xist (A) – MS2 RNA og DE FLAGGMERKEDE proteinene ble transfisert (standard incPRINT tilstand; Fig. 2b). Disse resultatene antyder at når et interaksjonssignal ble detektert av incPRINT, stammet det fra RNA-proteinkompleksene dannet i celler, mens forening av RNA–proteinkomplekser etter cellelyse dukket opp som ubetydelig bakgrunn under incPRINT-spesifikke forhold (Fig. 2b). Samlet sett fastslår disse forsøkene at incPRINT måler cellulære RNA-proteininteraksjoner ved hjelp av en luminescensavlesning.
deteksjon Med høy gjennomstrømming av rna–protein-interaksjoner
for å teste skalerbarheten til incPRINT for systematisk identifisering av rna-protein-interaksjoner, har vi avhørt vårt tilpassede bibliotek med ~3000 FLAGGMERKEDE humane proteiner (inkludert ∼1500 kjente RBPs10, 11, ∼1300 transkripsjonsfaktorer12 og ∼170 kromatinassosierte proteiner), Med Xist(A)-MS2. For å styrke tilliten til incPRINT-identifiserte rna-protein-interaksjoner, ble alle interaksjoner analysert i biologisk duplikat, og genererte to luminescens (RNA–protein interaksjonsintensitet) og to elisa (testproteinuttrykk nivå) verdier for hvert testet RNA–protein par. Etter å ha filtrert ut proteinene uttrykt ved utilstrekkelige nivåer (se Avsnittet ‘Metoder’), ble interaksjonsdata analysert for 2405 proteiner. incprints reproduserbarhet ble vurdert ved å beregne korrelasjonsresultatene for biologiske duplikater for både luminescensen(Fig. 2c; R2 = 0.87) OG ELISA signaler (Fig. 2d; R2 = 0,99). Spesielt ble det ikke påvist noen korrelasjon mellom luminescens og ELISA-verdier, noe som indikerer at interaksjonsintensitetene ikke bare var en refleksjon av proteinuttrykksnivåene (Fig. 2e). Oppsummert viser våre data at incPRINT er en skalerbar høy gjennomstrømningsmetode som reproduserbart måler RNA–proteininteraksjoner i cellen.
incPRINT identifiserer proteom av lavt uttrykte Rna
Deretter forsøkte vi å teste om incPRINT robust kan identifisere proteiner som interagerer med transkripsjoner uttrykt ved lave endogene nivåer. Identifisering av proteiner assosiert med lav kopi nummer Rna er generelt utfordrende ved BRUK AV rna affinitetsfangst-MS tilnærminger på grunn av den typisk lave effektiviteten AV RNA-rensninger og den store mengden materiale som kreves for massespektrometri. Fordi Firre er en funksjonelt viktig lncRNA som modulerer høyere orden kjernefysisk arkitektur over kromosomer19 og er av en ganske lav endogen overflod (∼20 molekyler per celle basert PÅ RNA-Seq data på tvers av forskjellige mus vev), vi vurdert SIN RBP-interactome med incPRINT. Full-lengde Firre transkripsjon merket MED MS2 ble uttrykt ∼40 ganger høyere enn endogen FIRRE i HEK293T celler som brukes for incPRINT (Supplerende Fig. 2a). Som rapportert for endogen transkript19, Firre-MS2 var fortrinnsvis lokalisert til kjernen (Supplerende Fig. 2b). Avhør vårt bibliotek av ~3000 proteiner, incprint identifisert et sett av spesifikke proteiner Som Firre interactors(Fig. 3a, røde prikker; Supplerende Data 1), mens flertallet av proteinene ikke interagerte Med Firre (Fig. 3a, grå prikker; Supplerende Data 1). Det er viktig at incPRINT identifiserte både kjente og nye Firre-interagerende proteiner. CTCF og HNRNPU, tidligere rapportert av to uavhengige studier for å binde Firre og være viktig for funksjonen19, 20, ble også identifisert av incPRINT(Fig . 3a). For å validere binding av nye Firre interactors, analyserte vi KODE eCLIP data21. ECLIP-dataene, tilgjengelig for syv incPRINT-identifiserte Firre-interagerende RBPs, bekreftet deres binding Til Firre i k562-cellelinjen, ytterligere validering av incPRINT-metoden (Supplerende Fig. 2c; Supplerende Data 2). I samsvar Med Firres rolle i kjernefysisk organisasjon19 var et sett Med Firre-interaktorer identifisert av incPRINT kromatinassosierte proteiner inkludert CHD1, POU5F1, JARID2, EPC1, SATB1, MECP2, AEBP2 og CTCF (Tilleggsdata 1). Proteindomeneanalyser viste at Firre-interagerende proteiner ble signifikant beriket for RNA-gjenkjenningsmotivet (Rrm) (Fig. 3b; Supplerende Data 3).