incPRINT metoda k identifikaci RNA–proteinové komplexy
identifikovat RNA–protein interakcí systematicky v živých buňkách, jsme vyvinuli metodu, která měří buněčné interakce mezi jakékoliv tagem test RNA a jakékoliv tagem test bílkovin. Princip incPRINT je přechodné dual vyjádření MS2-tagged test RNA a FLAG-tagged test proteinů v HEK293T buňkách stabilně vyjádření luciferase detektor napojený na MS2 kabát bílkovin (MS2CP) z genomically integrovaný plazmid (Obr. 1). Test RNA je upoutaná na luciferase detektor přes MS2-MS2CP interakce; RNA-luciferase komplex je co-purifikovaný s FLAG-tagged test bílkovin immunoprecipitated z buněčné lyzáty anti-FLAG protilátkou (Obr. 1). Nepřímé interakce RNA-protein přemostěné DNA jsou eliminovány léčbou Dnázou po kroku buněčné lýzy. K detekci jednotlivých RNA–protein interakce, RNA-MS2 ko-purifikovaný s test FLAG-tagged bílkovin se měří pomocí vyčíslitelných luciferase luminiscence (Obr. 1). Ovládání pro test exprese proteinů úrovní, množství zkoušené bílkoviny je měřena pomocí ELISA pomocí druhé anti-FLAG protilátky vázané na křenovou peroxidázou (HRP) (Obr. 1). Metoda incPRINT je flexibilní v měřítku, použitelná jako test s nízkou nebo vysokou propustností. Umožnit systematické, high-propustnost identifikace buněčné RNA–protein interakcí, jsme vytvořili vlastní knihovny ∼3000 human FLAG-tagged bílkoviny, včetně ∼1500 známo, RBPs (na základě rozhodčí. 10,11), ∼1300 transkripčních faktorů12 a 170 170 proteinů spojených s chromatinem. Obsah označeného proteinu lze upravit tak, aby odpovídal požadovanému experimentálnímu nastavení.
incPRINT spolehlivě detekuje buněčné RNA–protein interakce
stanovit incPRINT, jsme provedli řadu drobných experimentů pomocí ∼1-kb zachovaných oblasti lncRNA, tzv. opakování, dále jen, (A)13. Protože bylo dobře zavedeno několik interakcí Xist(a)-protein7, sloužily jako kontroly v našich počátečních experimentech incPRINT. Vytvořili jsme konstrukci vyjádřit, (A)-MS2 a analyzují schopnost, (A)-MS2 RNA komunikovat s vybranou sadu dříve zjištěné,-závazné proteins7,14,15. Nediskriminační poly(A)-vázající protein PABPC3 byl použit k ovládání pro RNA projevu a EGFP (Enhanced Green Fluorescent Protein) byl použit jako negativní kontrola. incPRINT luminiscence detekována specifická interakce, (A)-MS2 s SPEN, RBM15, RBM15B, YTHDC1, HNRNPC, SRSF7, a RALY, vzhledem k tomu, že HNRNPU, uvádí se vázat full-length, ale ne konkrétně, (A)7, a EGFP ukázal bazální vazby (Obr. 2a). Léčba Rnázou zrušila signál interakce RNA-protein měřený luciferázou, zatímco exprese testovaných proteinů detekovaných pomocí ELISA zůstala většinou nezměněna (obr. 2a, Doplňkový obr. 1a), prokazující, že interakce mezi značenými proteiny a detektorem luciferázy byly přemostěny RNA.
optimalizovat počet MS2 kmenových smyček, používá se tag testované RNA, ,(A) sloučilo s dvou, čtyř, šesti, deseti nebo 24 MS2 kmenových smyček, a jejich interakce s řadou kontrolní proteiny byly testovány v malém měřítku incPRINT experiment. Zvýšení intenzity luminiscence přímo souvisí se zvýšeným počtem MS2 kmenových smyček až deset kmenových smyček s žádné výrazné zvýšení vazby na EGFP ovládání (Doplňkový Obr. 1b). Proto ve všech následujících experimentech incPRINT byly RNA označeny deseti kmenovými smyčkami MS2.
určit, zda RNA–protein interakce detekována incPRINT skutečně došlo v buňkách nebo vznikly pouze in vitro po cele lysis16,17,18, luminiscence signál ze dvou nezávislých experimentů byly měřeny a porovnány. V prvním experimentu byly XIST (a)-MS2 RNA a FLAG značené testovací proteiny ko-transfektovány ve stejné buněčné populaci, jak je popsáno výše. V druhém experimentu, (A)-MS2 RNA a FLAG-tagged test proteiny byly transfektovaly odděleně ve dvou různých buněčných populací a sloučit pouze po lýze buněk krok, umožňující tvorbu RNA–proteinové komplexy výhradně in vitro (Doplňkový Obr. 1c). Zjistili jsme, že interakce byly přednostně detekován, když, (A)-MS2 RNA a FLAG-tagged proteiny byly co-transfektovaly (standardní incPRINT stavu; Obr. 2b). Tyto výsledky naznačují, že kdykoli byl detekován interakční signál incPRINT, pocházel z komplexů RNA-protein vytvořených v buňkách, zatímco asociace komplexů RNA-protein po buněčné lýze se objevila jako zanedbatelné pozadí za podmínek specifických pro incPRINT (obr. 2b). Společně tyto experimenty prokázaly, že incPRINT měří buněčné interakce RNA-protein pomocí luminiscenčního odečtu.
High-propustnost detekce RNA–protein interakce
otestovat škálovatelnost incPRINT pro systematickou identifikaci RNA–protein interakcí, vyslechli jsme naše vlastní knihovna z ~3000 FLAG-tagged lidských proteinů (včetně ∼1500 známý RBPs10,11, ∼1300 přepis factors12, a ∼170 chromatinu-asociovaných proteinů), s, (A)-MS2. Posílit důvěru incPRINT-identifikována RNA–protein interakcí, všechny interakce byly testovány v biologických duplicitní, generování dvou luminiscence (RNA–protein interakce, intenzita) a dva ELISA (test exprese proteinů úrovni) hodnot pro každý testovaný RNA–protein pár. Po odfiltrování proteinů exprimovaných v nedostatečných hladinách (viz část „metody“) byly analyzovány údaje o interakcích pro 2405 proteinů. Reprodukovatelnost incprintu byla hodnocena výpočtem korelačních skóre biologických duplikátů pro obě luminiscence (obr. 2c; R2 = 0.87) a signály ELISA (obr. 2d; R2 = 0,99). Zejména nebyla zjištěna žádná korelace mezi hodnotami luminiscence a ELISA, což naznačuje, že intenzity interakce nebyly pouhým odrazem hladin exprese proteinu (obr. 2e). Stručně řečeno, naše data ukazují, že incPRINT je škálovatelná vysoce výkonná metoda, která reprodukovatelně měří interakce RNA-protein v buňce.
incPRINT identifikuje proteomu pokorný vyjádřil RNAs
Next, jsme se snažili ověřit, jestli incPRINT může spolehlivě identifikovat proteiny interagující s přepisy vyjádřeny na nízké endogenní hladiny. Identifikace proteinů asociovaných s nízkým počtem kopií Rna je obecně náročné, když se pomocí RNA affinity capture-MS přístupy vzhledem k obvykle nízké účinnosti RNA, purifikace a velké množství materiálu potřebné pro hmotnostní spektrometrii. Protože Firre je funkčně důležité lncRNA, které moduluje vyššího řádu jaderné architektury přes chromosomes19 a je spíše nízká endogenní hojnosti (∼20 molekul na buňku na základě RNA-Seq dat v různých myších tkáních), hodnotili jsme jeho RBP-interactome s incPRINT. Full-délka Firre přepis tagged podle MS2 byl vyjádřen ∼40-krát vyšší než endogenní FIRRE v HEK293T buněk použitých pro incPRINT (Doplňkový Obr. 2a). Jak bylo uvedeno pro endogenní transkript19, Firre-MS2 byl přednostně lokalizován do jádra (Doplňkový obr. 2b). Při výslechu naší knihovny ~3000 proteinů identifikoval incPRINT sadu specifických proteinů jako Firre interactors (obr. 3a, červené tečky; doplňující údaje 1), zatímco většina proteinů nereagovala s Firre (obr. 3a, šedé tečky; doplňkové údaje 1). Důležité je, že incPRINT identifikoval známé i nové firre-interagující proteiny. CTCF a HNRNPU, již dříve uvedl dvě nezávislé studie vázat Firre a být důležité pro jeho function19,20, byly také identifikovány incPRINT (Obr. 3a). Pro ověření vazby nových Firre interactors, analyzovali jsme kód eCLIP data21. Data eCLIP, dostupná pro sedm RBP identifikovaných Firre interagujícími s incPRINT, potvrdila jejich vazbu na Firre v buněčné linii k562, což dále potvrdilo metodu incPRINT (Doplňkový obr. 2c; doplňkové údaje 2). V souladu s úlohou Firre v jaderné organization19, sada Firre interactors označeny incPRINT byly chromatinu-asociovaných proteinů, včetně CHD1, POU5F1, JARID2, EPC1, SATB1, MECP2, AEBP2, a CTCF (Doplňující Údaje 1). Analýzy proteinové domény ukázaly, že firre-interagující proteiny byly významně obohaceny o motiv rozpoznávání RNA (RRM) (obr. 3B; doplňkové údaje 3).
určit, zda zvýšená exprese RNA byla nutná pro incPRINT, aby se úspěšně identifikovat proteiny vazba na RNA s nízkou endogenní hladiny, sada proteinů byla testována s různou koncentrací Firre-MS2 od overexprese, jak je popsáno výše do úrovně srovnatelné s endogenní FIRRE v HEK293T buněk (Doplňkový Obr. 2d, e). Zatímco zvýšená exprese RNA za následek vyšší interakce skóre, které umožní jejich lepší oddělení od pozadí skóre, luciferase signál byl spolehlivě zjistitelný nad pozadí signál při ředění Firre-MS2 byly použity (Doplňkový Obr. 2d). Důležité je, že tento signál nebyl spojen s hladinami exprese testovaného proteinu (Doplňkový obr. 2e). Společně tato data prokazují užitečnost incprintu při identifikaci proteinů spojených s transkripty exprimovanými na nízkých endogenních hladinách.
incPRINT identifikuje RNA-region-specifické interakční partneři
Protože mnoho lncRNAs funkce jako modulární lešení, což závazných specifických RBPs na diskrétní RNA domains1,5, jsme se snažili ověřit, jestli incPRINT umožňuje identifikaci RNA-domény-specifické interakce. Ideálním důkazem principu molekuly je Lncrna Xist, vzhledem k jeho zásadní roli v inaktivaci chromozomu X savců (XCI)22,23 a jeho modulární struktuře a funkci. Na ∼17 kb dlouhý, obsahuje přepis několika konzervované sekvence oblastí (tzv. opakuje A až F), které provádějí různé funkce v průběhu procesu XCI, včetně zahájení umlčování genů (opakování), údržba X-neaktivní stav (F – a B-opakování) a správné chromozomální lokalizace a fokální akumulace, (C – a E-opakuje)13,24,25,26,27,28,29,30,31,32 (Obr. 4a). Navíc, několik nezávislých studií již dříve identifikován a ověřen soubor funkčních proteinových interakcí s full-délka Xist7,14,15,26,28,33,34,35. Jsme se snažili aplikovat incPRINT na tři konzervovaným regionům myš,, tj.,, (),, (F), a, (C) (Obr. 4a). Když se vyjádřil v HEK293T buněk použitých pro incPRINT, každý,-MS2 fragmentem ukázal jinou úroveň exprese ve srovnání s endogenní,, od ∼60-násobné zvýšení, (A) na u-endogenní výraz úrovni, (C) (Doplňkový Obr. 3a). Všechny jednotlivé fragmenty Xist-MS2 byly přednostně lokalizovány do jádra, podobně jako jejich endogenní protějšek v plné délce (Doplňkový obr. 3b). Každá oblast Xist (tj.,, (),, (F), a, (C)) byl vyslýchán s naší knihovně ~3000 proteiny. Porovnat signály v jednotlivých oblastech Xist vyjádřené na různých úrovních (Doplňkový obr. 3C), skóre interakcí pro každou oblast Xist bylo normalizováno pomocí vazebných dat MS2 RNA (doplňkové údaje 4). Pro normalizaci byla sada 200 proteinů s nejvyšším skóre luciferázy v datovém souboru MS2 RNA definována jako společná pojiva všech RNA značených MS2. Společné pojiva byly pak identifikovány v každé datové sady a jejich medián interakce skóre byla vypočítána pro každý testovaný RNA a používá k normalizaci syrové intenzity luminiscence v každém datovém souboru (viz ‚Postupy‘ sekce). Zejména, MS2 údaje nebyly použity jako závazný specifičnost řízení, jako mnoho RBPs rozpoznat nízké složitosti RNA motifs36 přítomen také v MS2 tag, a vzhledem k tomu, protein vazba na MS2 nevylučuje potenciální funkční interakce s test RNA. Podobně jako Firre jsme zjistili, že většina proteinů se neváže na žádný z testovaných fragmentů Xist (obr. 4B-d, šedé tečky; doplňující údaje 4), zatímco byly identifikovány specifické sady proteinů, které interagují s každou jednotlivou oblastí Xist (obr. 4b-d, červené tečky; doplňkové údaje 4). Důležitější je, že mezi incPRINT-identifikovat,-interagující proteiny, našli jsme známé interakce partnerů, identifikovány v předchozích studiích vázat full-délka transcript7,14,15 (uvedeno na Obr. 4b-d, doplňková Tabulka 1). Porovnání sad incPRINT-identifikovaných proteinů a jejich interakce skóre pro každou vyslýchán, regionu (Doplňující Údaje 4), zjistili jsme, že každý, fragment interaguje s řadou proteinů specifická pro daný region, s menší zlomek RBPs závazné pro všechny tři, regiony (Obr. 4e). Tak, použití incPRINT na tři konzervovaným regionům, umožnil identifikaci a přiřazení specifických RNA regionech RBPs dříve stanovena vázat full-délka, transcript7,14,15 (Obr. 4E; známé proteiny interagující s Xist jsou uvedeny vpravo). Například incPRINT identifikoval SPEN jako interaktor specifický pro Xist(a) (obr. 4e), potvrzující předchozí nález7, 8. Podobně, RBM15, RBM15B a YTHDC1 byly identifikovány incPRINT komunikovat specificky s, (a), (F), ale ne, (C), což potvrzuje jejich hlášeny vazbu na 5′ konci Xist7,9 (Obr. 4e). Navíc, jsme identifikovali, (C) specifické interakce s HNRNPU (také známý jako SAF -) v minulosti ukázal být zapojeny v, localization7,14,33 (Obr. 4e, doplňková Tabulka 1). Pro ověření RNA-regionu-konkrétní,-proteinové interakce, KÓDOVAT eCLIP data21 k dispozici pro 14 incPRINT-identifikovány proteiny, z nichž některé jsou nové,-interakci RPBs, potvrdila jejich vazba k, v linie K562 (Doplňkový Obr. 3d; doplňující údaje 2), které dále potvrzují specifičnost naší metody. Funkční rozdíl mezi bílkovin interactomes ze tří regionů, potvrdil Gene Ontology (GO) termín obohacení analýzy. V souladu s diferenciální funkce hlášeny pro jednotlivce, regiony, (A)- a, (F)-asociovaných proteinů, byly obohaceny pro RBPs zapojených v RNA zpracování, zatímco C-opakujte regionu přednostně interaguje s DNA-vazebné proteiny se podílejí transkripční regulace (Doplňkový Obr. 3e, f). Po dohodě s GO analýzy, proteinové domény analýza prokázala, že, (A)-interagující proteiny byly obohaceny pro SP (Spen paralog a ortholog C-terminal) a ROZUMÍTE proteinové domény, (F)-interagující proteiny byly obohaceny pro ROZUMÍTE domény a, (C)-interagující proteiny neprokázaly žádné zvláštní obohacení (Obr. 4F; doplňující údaje 3), dále zdůrazňující specificitu proteinových sad identifikovaných incPRINT pro každou oblast Xist. Stručně řečeno, incPRINT úspěšně získal známé interakce XIST-protein a odhalil nové RBP. Díky identifikaci konkrétní sady proteinů interagujících s jednotlivými konzervovaným regionům modulární lncRNA, jsme prokázali, že incPRINT umožňuje regionu-konkrétní úkol RNA–protein interakce.
incPRINT identifikuje funkční RNA–protein interakce
Protože, má dobře charakterizované buněčné funkce v umlčování genů během XCI, jsme se snažili ověřit, jestli některé z,-proteinové interakce odhalili pomocí incPRINT jsou funkčně relevantní. Důraz byl kladen na ZZZ3 protein, který interaguje s všechny tři testované, regionů, a RBM6, který vykazuje více konkrétní vazby, (a), (F) regiony (Obr. 4e). Za prvé, jsme potvrdili, interakce, s RBM6 a ZZZ3 pod endogenní podmínky testování, co-srážení s obou proteinů v myších embryonálních kmenových (ES) buněk. Proteiny byly HA označené v polymorfní TX1072 ES buněčné linie, která umožňuje doxycyklin indukované, výraz, což vyvolalo XCI v nepřítomnosti differentiation31,37,38,39. RNA immunoprecipitation (RIP), po doxycyklin indukce, a UV-cross-propojení buněk, následuje zásahovou jednotku-PCR analýz identifikovány významné obohacení, přepis s RBM6 a ZZZ3 proteiny, potvrzující jejich interakce in vivo (Obr. 5a, b). Incprint také identifikoval RBM6 jako interakci s Firre. RIP zásahovou jednotku-PCR zjištěna konkrétní interakce Firre s RBM6 ale ne s ZZZ3, což potvrzuje Firre-RBM6 závazných v rámci endogenní podmínky a dále potvrzuje, že naše incPRINT výsledky (Obr. 5a, b).
Next, aby otestovat, zda RBM6 a ZZZ3 mít dopad na XCI, jsme použili single-cell RNA fluorescenční in situ hybridizace (RNA, RYBY) k posouzení exprese endogenního Lamp2, X-spojený genu, který je za normálních okolností umlčen během XCI initiation40. Při expresi XIST indukované doxycyklinem, depleci Rbm6, Zzz3 a pozitivní kontrolní Spen (Doplňkový obr. 4a, b) vedlo ke snížení tlumící Lamp2, vzhledem k tomu, že jeho XCI-indukované mono-allelickou výraz zůstal nezměněn po vyčerpání Thap7, které nebyly komunikovat s, a byl použit jako negativní kontrola (Obr. 5c, d; Doplňkový obr. 4c; doplňková Tabulka 2). Při absenci Xist (-doxycyklinových podmínek) zůstala exprese Lamp2 po depleci výše uvedených proteinů nezměněna (Doplňkový obr. 4d; doplňková Tabulka 2). Důležité je, že defekty v umlčení chromozomu X nebyly vyvolány změněnou expresí Xist / Tsix po vyčerpání jednotlivých proteinů (Doplňkový obr. 4e). V souhrnu, identifikace funkčně důležitých interaktorů mezi RBP identifikovanými incPRINT ukazuje potenciál incPRINT pro objev.