端粒与衰老研究组发现基因转录中形成的DNA/RNA杂合G四链体结构
除了双链配对的双螺旋结构以外,DNA可以形成一些更高级的结构比如G四链体(G-quadruplex,图A)。G四链体是一种四链结构并且由二层以上鸟嘌呤平面组成,每个鸟嘌呤平面含有4个相互氢键配对的鸟嘌呤碱基(图B)。端粒DNA的TTAGGG序列可以形成由3层鸟嘌呤平面组成的分子内G四链体结构,这种结构形成可以阻挡端粒酶对端粒的延伸。除了端粒DNA以外,越来越多的可以形成G四链体的DNA序列在人和其他物种基因组中被发现。利用生物信息学的方法,人们发现G四链体形成序列在基因组中分布的频率高,而且其分布位置也很有规律,比如癌基因的启动子以及转录起始区。
单个基因的研究表明转录相关区域的G四链体结构对基因转录会产生一定的影响。然而G四链体结构能够那些生理过程中形成,形成的机制以及特点至今不清楚。中国科学院动物研究所端粒与衰老研究组最近研究发现:基因转录过程中,新生RNA上的多聚鸟嘌呤可以与非模板链上的同样碱基序列形成一种DNA/RNA 杂合G四链体结构(图C),并且这种杂合结构的数量可能内源性地决定了基因的表达能力。
DNA上分子内G四链体的形成需要至少4段多聚鸟嘌呤序列,而DNA/RNA杂合G四链体的形成仅需要DNA非模板链上含有2段或以上多聚鸟嘌呤,因而这种杂合结构的发现极大的扩充了人们对G四链体形成能力的认识。该课题组进一步通过生物信息学的方法对人和其他物种中具有杂合G四链体形成能力的DNA序列(PHQS)进行查找和统计分析,结果显示:>97%的人类基因中都含有PHQS,且平均每个基因有73个PHQS。杂合G四链体序列在基因转录区中的富集和庞大数量以及其对基因转录的抑制揭示这种结构可能是调节基因基础转录水平的元件。
这一项研究成果于2013年4月12日在《Nucleic Acids Research》杂志上以Featured Articles形式发表。该论文的通讯作者是谭铮研究员,第一作者是博士后郑克威(原文链接)。该项研究工作得到科技部973国家重点项目、国家自然科学基金的资助。