DNA遗传信息隐藏在交替排布的腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)和鸟嘌呤(G)四种基本碱基中。5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC)因在基因表达调控中扮演了重要作用而被称为第5和第6种碱基,识别这两种修饰碱基的蛋白是其表观遗传信息传递和表达的关键因子。
2014年6月,微生物代谢国家重点实验室贺新义副研究员领衔的研究小组报导了链霉菌中一个能特异性识别并水解5羟甲基胞嘧啶单核苷酸(5hmCMP)的蛋白MilB,它负责核苷类抗生素米多霉素的起始合成步骤,对5hmCMP结合偏好性是CMP的27倍。结构研究表明,MilB蛋白中存在一个5hmC结合口袋,与真核生物中5mC识别蛋白中对应的空间结构很类似,MilB蛋白中的一个关键氨基酸Arg23在底物进入的过程中扮演了开关的作用。通过分子改造, 突变后的蛋白能够利用CMP而降低对5hmCMP的识别,该发现可以应用于代谢途径改造产生新的结构类似物。该项工作得到了吴更教授的协助,发表在Nucleic Acids Research.
2015年1月,该研究小组在链霉菌中报导了一个5mC特异性识别蛋白Sco5333,这个蛋白有独特的SRA-HNH双结构域,广泛的存在于细菌中并被注释为未知蛋白。通过系统性的生化表征发现该蛋白结合5mC的能力比结合正常胞嘧啶的能力高至少100倍以上,该种结合只有甲基化特异性而没有DNA序列的特异性,这对于富集DNA样本中任何位置上的5mC是极其有利的,它比目前商业化的5mCG结合蛋白具有更大的应用前景。通过进一步研究,研究小组提出了一种不同于经典的修饰和限制系统的模型: Sco5333蛋白通过SRA结构域高效结合5mC以及HNH结构域的微弱切割活性的配合达到限制外来DNA,保护自身DNA的目的,这对IV型限制性内切酶的作用机制具有普适性。该项成果发表在Nucleic Acids Research上,整合了NEW England Biolabs郑钰课题组的部分研究内容.
这是继该研究小组在链霉菌中发现能够特异性识别并切割磷硫酰化DNA的IV限制酶ScoMcrA (PLoS Genetics, December 23, 2010)之后的系统性研究成果,以上研究工作均在国内独立完成。