以往研究历程 基因调控是多层次的:从三维基因组层面来说,基因组的三维空间折叠让不同功能非编码与编码区域相互作用,比如增强子被带到启动子附近从而激活特定基因的表达;而从表观遗传修饰的角度来看,DNA或组蛋白的化学修饰对基因的表达也起着非常重要的调控作用。同样,转录后RNA的加工也是极其重要的调控过程,譬如通过RNA选择性剪接,可以产生具有不同外显子的转录本,从而产生具有不同氨基酸序列和不同功能的蛋白。这些错综复杂的基因调控过程环环相扣,时刻处于动态变化之中,使有限数量的基因可以产生千变万化的可能性。然而,当调控产生错误时,基因功能则不能得到正确表达,从而可能引起生理功能紊乱甚至疾病。 郑瑚研究员长期致力于研究表观基因组、三维基因组及RNA剪接等在细胞重编程、分化以及癌症中的作用机制。在一项研究中,郑研究员利用RNA-seq和ChIP-seq等高通量测序技术,解析了增强子的表观遗传标记,发现增强子可以处于不同的表观遗传状态,而通过状态的转换在干细胞分化上调控基因的表达以及预示着分化中的下游细胞命运。该研究确立了H3K27ac修饰作为标准的活性增强子的标记。在另外两项研究中,郑研究员利用RNA-seq分别分析了乳腺癌转移与血红蛋白生成过程中的RNA选择性剪接,并发现调控这两个重要过程的剪接因子。随着人们对基因调控机制的不断了解,对基因组或者转录组的编辑改写需求也越来越强烈。2012年,高效的基因组编辑工具CRISPR技术应运而生。基于CRISPR技术,郑研究员研发了多种基因组和表观组的编辑工具。在2013年发表了基于CRISPR的RNA诱导基因激活/表观遗传编辑系统CRISPR-on。为了进一步提升CRISPR对于表观遗传编辑的灵活性和效率,郑研究员创建了支持同时对多个位点进行不同的表观遗传编辑的Casilio系统。基于Casilio系统,研究组开发了Casilio-ME高效DNA甲基化编辑工具,以及Casilio-Imaging活细胞染色质成像工具。利用Casilio-Imaging,研究组成功追踪增强子和启动子的相互作用动态,并通过合作对于癌细胞里的ecDNA进行了实时追踪,发现了ecDNA在细胞分裂中时的子细胞之间的不均匀分配和ecDNA枢纽形成。对于RNA层面上的编辑工具,研究组建立基于CRISPR-Cas13的RNA剪接编辑系统CASFx,以及支持同时多个RNA不同编辑效果的CREST编辑系统。在另外一项合作中,研究组利用多组学分析了室管膜瘤中融合蛋白影响三维基因组以及基因表达的分子机制。 未来研究方向 研究组主要探讨的科学问题在于发育和发病过程中的细胞命运转换以及命运决定中的基因调控机制,特别在于表观遗传修饰、染色质三维空间结构、转录调控、以及RNA加工层面。最近二十年来的高通量测序技术提供了对于各个基因调控层面大量而详细的数据。可是这些从各个基因调控层面“读取”的数据大部分只能提供分子事件与表型的相关性,很难精确地阐明因果关系,或是从错综复杂的基因网络里的众多事件中找出决定性的先导事件。为了攻克这些问题,我们需要能“写入”的工具,可以精准地在活细胞或动物中改写分子状态。为了研究复杂的基因网络,这些工具必须能同时以不同形式改写多个分子,并且能够延伸至高通量实验支持全基因组的探索。研究组的第一个方向就是开发满足这些要求的“写入”基因组,表观基因组和转录组的技术,并结合这些技术和高通量及单细胞测序技术研究发育和疾病过程中的基因调控机制。另一方面,大部分“读取”技术针对群体固定或是死亡的细胞,只能测量瞬时状态。然而,生物上很多过程都是异质且动态多变的,而且细胞或基因组的状态演变可能取决于过往的经历。研究组的第二个方向就是开发新型的“实时读取”技术,用以追踪单个活细胞的动态变化,特别在于三维基因组结构动态与表观基因标记和基因表达上的异质形、随机性、记忆,以及最终表现到表型上的多样性的关系,并且通过结合“实时读取”和“写入”元件以及分子逻辑门构建能同时感应多个细胞状态因应作出特定治疗效果的智能基因疗法。 方向1:开发及应用新型“写入”技术研究发育过程中的基因调控网络 项目1.1开发全面的、多任务的、多功能的表观基因编辑工具箱 测序技术阐明了正常和疾病状态下的全面分子变化。使用高通量测序技术“读取”不同基因调控水平的分子事件,使我们能够描绘出复杂的基因调控网络。为了验证这些观察结果并查明关键参与者,研究者需要能够高度精确地修改(即“写入”)基因组和表观基因组。 CRISPR / Cas系统最初被应用到编辑基因组序列上(基因组编辑技术)。通过对Cas9以及gRNA改造的CRISPR/Cas可以调控基因表达状态或实现表观遗传标记的修改,被称之为表观基因组编辑技术。表观基因组编辑扩大了CRISPR对于基础科研和转化应用的可能性。但是,较早发表的表观基因组编辑工具不能对于复杂的基因网络进行多路复用或多任务编辑。本项目的目标是在Casilio平台的基础上开发一个全面的表观基因组编辑工具箱。Casilio系统是CRISPR / dCas9和Pumilio (PUF)RNA结合蛋白效应子的组合体。在Casilio系统中,gRNA可以通过特定RNA支架序列募集不同效应子到标靶上,实现多任务效应子支配。而且,PUF的可塑性为Casilio系统提供了巨大的扩充性。具体目标是:(1)开发一套全面的表观遗传编辑工具箱。Casilio可以利用这些编辑模块实现多重和组合编辑,譬如同时在不同的基因组位点编辑不同的表观遗传标记,同时还可以在每个位点编辑多种标记。(2)构建内含Casilio功能的细胞系和动物模型。将把Casilio和常用模块(例如,基因编辑、基因激活/抑制、DNA甲基化/去甲基化等)“安装”到常用细胞系和动物模型(如小鼠)中。研究者只需导入gRNA,即可实现表观基因组编辑。(3)构建针对基因组调控元件(如增强子和绝缘子)的全基因组gRNA文库,支持反向表观遗传学筛选实验。 图1. (1)构建编辑各种表观遗传标记的分子工具。 (2) 构建具有编辑功能的细胞系和动物模型。(3)构建全基因组调控元件gRNA文库用以高通量功能筛选。 项目1.2建立基于CRISPR的人工RNA编辑与调控平台 此项目将CRISPR编辑工具扩展到RNA层面上。目的是设计一系列人工RNA效应子,在整个RNA生命周期内控制和编辑RNA分子,包括RNA剪接、末端加工、翻译、定位、稳定性和转录组修饰(如m6A)。具体目标是:(1)设计一系列基于CRISPR的人工RNA效应子(Artificial CRISPR RNA effectors, ACRE),用于调节靶RNA分子的选择性剪接、末端加工、翻译、稳定性和m6A修饰。(2)实施化学/光诱导控制。通过设计不同的控制机制,赋予ACRE以化学和光诱导的可调性,增加应用上的灵活度。(3)开发针对各种RNA元件的gRNA文库,针对转录组中已知编码和非编码RNA种类上不同类型的顺式调控元件,包括RNA剪接元件、5'和3'非翻译区(UTR)、上游开放阅读框(uORF)等。 图2. 构建RNA调控平台(ACRE)特异性控制RNA分子在各个层面上的加工和功能。 项目1.3 整合单细胞分析,表观基因组编辑研究细胞转化、发病机制以及创立新型基因疗法 研究组将使用scRNA-seq技术获得经历iPSC分化、反分化及细胞转化(如成纤维细胞到神经元)及上皮-间质转化的单个细胞的时间序列转录组。我们将使用时间序列数据和表观遗传概况数据构建基因调控网络模型。然后,我们将使用Casilio或ACRE来扰动网络中的重要节点,以研究细胞状态转变的基因调控机制,并利用表观遗传/转录组编辑技术开发更高效率的重编程/分化实验方案。另外,研究组将应用CRISPR工具调节癌症基因网络,研究乳腺癌的剪接因子网络,以及其他疾病(如糖尿病)的表观遗传调控,同时也正在探索在治疗中使用Casilio基因激活的可能性。例如,使用Casilio来激活癌细胞中的特定基因,从而导致体外癌细胞死亡以及体内癌症消退。在另外一项合作里,利用多组学,研究组分析了由融合蛋白在癌细胞里诱导的转录组、表观基因组和三维基因组。目前正在进行和分析CRISPR全基因组敲除筛选实验,以发现癌细胞增殖所需的基因。通过合作,正在对该融合蛋白的蛋白质相互作用组进行分析,并解析融合蛋白的蛋白质结构,希望将系统生物学方法与药物筛选和再利用相结合,找出可抑制或消融癌细胞的可操作靶标和药物。研究组将使用Casilio表观遗传编辑模块来干扰从多组学发现的顺式调控元件的表观遗传状态,以研究其对癌细胞基因表达程序和细胞表型的重要性。 方向2开发并应用“实时读取”技术研究三维基因组与基因表达动态以及创建结合读取和写入技术的智能疗法 项目2.1 开发活细胞成像技术研究染色质相互作用和折叠动态 基因组的三维空间结构是异质和动态的。此项目设计荧光探针,用于体内非重复DNA序列的标记,例如,用不同的荧光团分别标记一对增强子和启动子,并可在数百个单细胞中以活细胞荧光共聚焦显微成像技术探索他们的相互动态。已发表的CRISPR成像方法可以有效标记重复序列,但非重复序列的标记却由于目标位点的信噪比(SNR)低而具有非常大的挑战性。非重复序列需要在标靶周围平铺数十个gRNA达到所需的SNR。然而,Casilio系统使用gRNA支架上的多个PUF结合点募集多个荧光团,可大大提高SNR,让一个gRNA足以标记非重复序列,这样大大提升了染色质成像的效率。还可以通过同时部署多个探针来跟踪连续的DNA区域,从而研究DNA区域的折叠动态。为了方便广泛应用,研究组设计了用于设计成像gRNA的新软件,还将扩展荧光调色板,以允许同时跟踪更多的位点。研究组将应用新这些成像技术来回答关于三位基因组结构未解决的问题:(1)成对和多向相互作用的动力学和细胞间异质性。研究组和其他团队从测序实验中鉴定出许多顺式调控元件(如增强子和启动子)的成对或多向相互作用。它们代表了所有单个单元格之间的稳定相互作用吗?还是,在多个可能状态之间动态循环的“合并”快照视图,其中在每个单个单元格中的任何给定时间都可能有不同的交互组合?利用多色的Casilio成像对多个相互的位点进行观察将阐明这些问题; (2)染色质环挤出(loop extrusion)。染色质环被由建筑因子(如粘着蛋白)形成的,该粘着蛋白与DNA结合并卷入DNA中以形成环。同行科学家提出了几种关于环挤压动力学过程发生的模型,即单方向、双方向或混合模型。这些模型源自测序数据的理论分析或通过对DNA和建筑因子的体外重构混合物进行成像,因此省略了活细胞天然染色质中环形成的动态和异质性质。要了解在生理条件下天然染色质中的环形成过程,研究组将利用Casilio成像方法对活细胞内的天然染色质进行成像; (3)组蛋白修饰或DNA甲基化对染色质相互作用动力学的影响。组蛋白修饰和DNA甲基化如何影响染色质相互作用的频率和动力学,是在特定的基因座发生的吗?通过利用Casilio工具,同时进行表观遗传编辑改变增强子或启动子的甲基化/组蛋白修饰以及染色质结构实时活体成像,研究组将研究表观遗传标记对染色质结构动态的影响。 图3. 通过Casilio表观遗传编辑和实时活体三维基因组成像研究表观遗传、三维基因组动态以及细胞表型的因果关系。 项目2.2 体内序列传感器以及基于合成生物电路的智能疗法 此项目计划开发能在活细胞中实时工作的序列感应器。通过将这些传感器耦合到合成生物响应电路,可以检测到特定DNA或RNA序列时触发特定的细胞程序以实现治疗功能,例如,可以在监测到特定的遗传异常后特异性地诱导恶性细胞自毁。研究组的前期工作中已经使用TALE或CRISPR / Cas作为DNA识别模块生成了这些传感器。当两个DNA结合结构域在目标位点紧密结合在一起时,基于邻近诱导的内含肽发生蛋白剪接重组合成转导转录因子,转导转录因子将结合到响应电路并触发转基因(如毒素)的表达,达到特定的效应。接下来将设计DNA传感器来识别癌症特异性融合基因或突变,并使用毒素或前药酶作为响应基因来测试这种合成生物电路对于癌症特异性细胞的消效用。研究组将进一步开发体内序列传感器和细胞状态传感器,开发并应用合成生物逻辑门将这些传感器连接到Casilio和ACRE,以实现“智能疗法”,即一种可以检测序列或细胞状态,整合传感器信号并通过CRISPR系统触发基因组、表观基因组和转录组的特定变化的合成生物电路。这种新型基因疗法将为精准和个性化治疗提供重大突破。 图4. 结合合成序列和细胞状态传感器、生物逻辑门以及写入系统构建因应细胞状态和基因型做出不同基因治疗效果的合成生物电路。 | 代表性发表论文: *通讯, #共同一作 - Liu, Z., Jillette N., Robson, P., Cheng, A.W.* (2023) Simultaneous multifunctional transcriptome engineering by CRISPR RNA scaffold. Nucleic Acid Research gkad547 doi: 10.1093/nar/gkad547. IF=19.16
- Clow, P.A., Du, M., Jillette, N., Taghbalout, A., Zhu, J.J.*, Cheng, A.W.* (2022) CRISPR-mediated multiplexed live cell imaging of nonrepetitive genomic loci with one guide RNA per locus. Nature Communications 13:1871. doi: 10.1038/s41467-022-29343-z. IF=17.694
- Yi, E., Gujar, A.D., Guthrie, M., Kim, H., Zhao, D., Johnson K.C., Amin, S.B., Costa, M.L., Yu, Q., Das, S., Jillette, N., Clow, P.A., Cheng, A.W.*, Verhaak, R.G.W.* (2022) Live-cell imaging shows uneven segregation of extrachromosomal DNA elements and transcriptionally active extrachromosomal DNA hubs in cancer. Cancer Discovery doi: 10.1158/2159-8290.CD-21-1376 (co-corresponding) IF=39.397
- Zhu, J.J., Cheng, A.W.* (2022) JACKIE: Fast enumeration of genome-wide single- and multi-copy CRISPR target sites and their off-target numbers. The CRISPR Journal doi: 10.1089/crispr.2022.0042 IF=4.321
- Du, M.#, Jillette, N.#, Zhu, J.J., Li, S., Cheng, A.W.* (2020) CRISPR Artificial Splicing Factors. Nature Communications 11:2973. doi: 10.1038/s41467-020-16806-4 IF=17.694
- Zhu, J.J., Jillette, N., Li X., Cheng, A.W.*, Lau C.C.* (2020) C11orf95-RELA Reprograms 3D Epigenome in Supratentorial Ependymoma. Acta Neuropathologica doi: 10.1007/s00401-020-02225-8 (co-corresponding) IF=21.534
- Taghbalout, A., Du, M., Jillette, N., Rosikiewicz, W. Rath, A., Heinen, C., Li, S., Cheng, A.W.* (2019) Enhanced CRISPR-based DNA demethylation by Casilio-ME-mediated RNA-guided coupling of methylcytosine oxidation and DNA repair pathways. Nature Communications 10:4296. doi:10.1038/s41467-019-12339-7 IF=17.694
- Jillette, N.#., Du, M.#, Zhu, J.J., Cardoz, P., Cheng, A.W.* (2019) Split Selectable Markers. Nature Communications 10:4968. doi: 10.1038/s41467-019-12891-2 IF=17.694
- Cheng, A.W.*#, Jillette, N.#, Lee, P., Plaskon, D., Fujiwara, Y., Wang, W., Taghbalout, A., Wang, H.* (2016) Casilio: a versatile CRISPR-Cas9-Pumilio hybrid for gene regulation and genomic labeling. Cell Research 26:254–257. doi: 10.1038/cr.2016.3 PMID:26768771 (co-corresponding) IF=46.3
- Cheng, A.W.#, Shi, J.#, Wong, P.#, Luo, K.L., Trepman, P., Wang, E.T., Choi, H., Burge, C.B., Lodish, H.F.* (2014) Muscleblind-like 1 (Mbnl1) regulates pre-mRNA alternative splicing during terminal erythropoiesis. Blood doi: 10.1182/blood-2013-12-542209 PMID: 24869935 IF=25.48
- Cheng, A.W.#, Wang, H.#, Yang, H, Shi, L., Katz, Y., Theunissen, T.W., Rangarajan, S., Shivalila, C.S., Dadon, D.B., Jaenisch, R.* (2013) Multiplexed activation of endogenous genes by CRISPR-on, an RNA-guided transcriptional activator system. Cell Research 23(10):1163-71 PMID: 23979020 IF=46.3
- Yang, H.#, Wang, H.#, Shivalila, C.S.#, Cheng, A.W., Shi, L., Jaenisch, R.* (2013). One-step generation of mice carrying reporter and conditional alleles by CRISPR/Cas-mediated genome engineering. Cell 154(6):1370-9 PMID: 23992847
- Wang, H.#, Yang, H.#, Shivalila, C.S.#, Dawlaty, M.M., Cheng, A.W., Zhang, F., Jaenisch, R.* (2013). One-step generation of mice carrying mutations in multiple genes by CRISPR/Cas-mediated genome engineering. Cell 153(4):910-8 PMID: 23643243
- Buganim, Y.#, Faddah D.A.#, Cheng, A.W., Itskovich, E., Markoulaki, S., Gantz, K., Klemm S.L., van Oudenaarden A., Jaenisch, R.* (2012) Single-Cell Expression Analyses during Cellular Reprogramming Reveal an Early Stochastic and a Late Hierarchic Phase. Cell 150(6):1209-22 PMID: 22980981
- Shapiro, I.M.#, Cheng, A.W.#, Flytzanis, N.C., Balsamo, M., Condeelis, J.S., Oktay, M.H., Burge, C.B.*, Gertler, F.B.* (2011) An EMT-driven alternative splicing program occurs in human breast cancer and modulates cellular phenotype. PLoS Genet. 7(8):e1002218 PMID: 21876675 (co-first) IF=6.02
- Creyghton, M.P.#, Cheng A.W.#, Welstead, G.G., Kooistra, T., Carey, B.W., Steine, E.J., Hanna, J., Lodato, M.A., Frampton, G.M., Sharp, P.A., Boyer, L.A., Young, R.A.*, Jaenisch, R.* (2010) Histone H3K27ac separates active from poised enhancers and predicts developmental state. Proc. Natl. Acad. Sci. U.S.A. 107(50):21931-6 PMID: 21106759 (co-first) IF=12.78
|