中国科学院—马普计算生物学研究所徐书华团队通过研究分析深度基因组测序数据和藏族表型数据,构建了藏族人群全基因组水平的适应性遗传变异图谱,首次系统地将藏族人群基因组中与适应性进化相关的功能性变异呈现出来。相关研究成果近日在线发表于《国家科学评论》。
经过国内外近十年的密集研究,人们对藏族高原适应的遗传学基础有了一些初步的认识;其中 EPAS1 是目前领域里普遍认为是藏族适应高原的关键基因,特别是由于在其他高原物种中也发现 EPAS1 的适应性进化的迹象,因而备受关注。但是迄今未能确定 EPAS1 基因中与藏族高原适应的功能性变异,这为理解人类在青藏高原上的适应性进化机制留下未解难题。
为此,徐书华团队与中科院昆明动物研究所、 温州医科大学、复旦大学、西藏民族大学等多家单位的研究人员合作,在全基因组水平对藏族人群的高原适应性变异进行了系统性梳理,充分利用深度基因组测序数据的优势,构建了藏族人群全基因组尺度上的适应性遗传变异图谱,鉴定了有相对明确功能的关键遗传变异,包括 63 个错义突变、7 个失活性变异、1298 个进化保守性变异,以及 509 个基因表达数量性状变异;这些分布在基因组范围的功能性变异不一定都与藏族人群的高原适应直接相关,但是大多数都与藏族人群的适应性演化密切相关。
高原适应涉及到一系列复杂性状——牵涉到的基因可能比医学中研究的一些复杂疾病更为错综繁杂。研究团队进一步发展了一个新统计量(FIS)对鉴定出的适应性遗传变异的相对重要性进行加权排序,发现排在首位的并不是通常认为的 EPAS1,而是位于 EPAS1 下游的一个跨膜蛋白编码基因 TMEM247;尤其是发现藏族人群基因组中的 TMEM247 存在一个高频关键错义变异(rs116983452),可能对藏族人群高原适应具有重要贡献和意义。
“我们新发现的 TMEM247 基因关键突变(rs116983452)导致平原人群中高频存在的丙氨酸(Ala)(野生型)与青藏高原人群特有的缬氨酸Val)(突变型)之间的显著分化,其中 94% 的藏族人都携带突变型,而在世界其他现代人群体中的频率非常低或者完全缺失,是迄今为止在青藏高原人群基因组中发现的最高频的错义突变。”徐书华研究员告诉《中国科学报》。
有趣的是,在西伯利亚丹尼索瓦洞穴中发现的距今约 5 万年的一个古人基因组也携带了这个变异,并且为纯合状态。研究人员通过计算推断藏族人群中携带 TMEM247-rs116983452 适应性变异的序列可追溯至距今约 6 万年前,这意味着这个藏族特异的高频突变可能继承自早期进入高原的具有古人类血统的祖先并传承至今。
事实上,人类征服青藏高原的历程悠久而曲折。徐书华团队之前的研究表明,青藏高原人群的遗传起源可追溯至距今4-6 万年前的旧石器时代中晚期,早期进入青藏高原的人类族群间发生广泛的基因交流,并与后期进入青藏高原的族群发生进一步基因交流。这个过程中,一些曾经帮助人类适应高原环境的古人类基因片段得以保留下来,因高原极端环境的自然选择作用,在现今高原人群中积累到较高的频率。TMEM247-rs116983452-T 就是一个典型的例子。
分析表明,TMEM247-rs116983452-T 的频率与人群居住地海拔呈显著正相关,提示与人类在青藏高原的适应可能有密切关系。进一步结合基因表达与多项生理生化表型及体质人类学特征,对高原藏族人群的适应性遗传变异进行了系统性评估;发现 TMEM247-rs116983452-T 与 TMEM247 及 EPAS1 的表达水平都有密切相关,并可能对藏族人群低氧环境下的血红蛋白和红细胞水平等高原适应性性状产生重要的调控。通过统计模型分析,研究人员发现 TMEM247-rs116983452 对藏族高原适应性表型的解释度高于 EPAS1 的变异位点,但二者之间可能存在一定的相互作用,体现了高原适应的复杂性和多基因相互作用效应。
徐书华表示,该项研究提供的这张基因组适应性变异图谱为后续进一步全面深入研究藏族适应高原的遗传基础和分子机制锁定了目标、为揭开人类征服高原极端环境的演化之谜开拓了新的视野。
相关论文信息:https://academic.oup.com/nsr/advance-article/doi/10.1093/nsr/nwz108/5544718