跳到主要内容

乳糖耐受表型和基因型的世界性相关性

摘要

背景

成年人消化乳糖的能力——乳糖酶持久性——是孟德尔的主要特征,一直是广泛的遗传、医学和进化研究的主题。乳糖酶耐受在欧洲血统的人以及一些非洲、中东和南亚人群中很常见,但在世界其他地方很罕见或不存在。最近在世界各地不同人群中发现了与乳糖酶持久性密切相关的独立核苷酸变化,这使得对该性状进行基因测试成为可能。然而,已知所有与乳糖酶持久性相关的变异是极不可能的。利用广泛的乳糖耐受表型频率数据库,以及这些数据如何收集的信息和乳糖耐受变异频率的数据,我们对当前遗传知识可以解释乳糖耐受表型频率的程度进行了全面总结。

结果

我们使用从所有可用文献中获得的旧世界乳糖酶持久性基因型和表型频率估计的表面插值,并在连续空间中对预测的和观察到的性状频率进行比较。通过容纳各种乳糖酶持久性表型测试(血糖和呼吸氢)的样本数和已知假阴性和假阳性率的额外数据,我们还应用蒙特卡罗方法来估计已知的乳糖酶持久性相关等位基因频率可以解释不同地区观察到的性状频率的概率。

结论

乳糖耐受性基因型数据目前不足以解释西部和南部非洲大部分地区、欧洲东南部、中东和中亚和南亚部分地区的乳糖耐受性表型频率。我们建议进一步研究这些区域的遗传变异应该揭示与乳糖酶持久性相关的其他核苷酸变异。

背景

据估计,65%的成年人类(以及大多数成年哺乳动物)在断奶后会下调肠道乳糖酶的产生。乳糖酶是消化牛奶中主要碳水化合物乳糖所必需的[1],如果没有维生素d,喝牛奶会导致腹胀、胀气、痉挛和恶心[2].在整个成年生活中持续产生乳糖酶(乳糖酶持久性,LP)是一种遗传决定的特征,在欧洲和一些非洲、中东和南亚人群中发现有中等至高频率(见附加文件)1和图1).

图1
图1

旧大陆LP表型频率的插值图.点代表收集地点。颜色和色键表示通过表面插值估计的LP表型频率。

最常用的非侵入性鉴定肠道乳糖酶存在的方法是基于检测受试者产生的乳糖消化产物(血糖,BG)或肠道细菌(呼吸氢,BH)。在这两种方法中,受试者在禁食一晚后服用乳糖。在产生乳糖酶的个体中,这会导致可检测到的血糖升高。对于不产生乳糖酶的人来说,未消化的乳糖会进入结肠,在那里被各种肠道细菌发酵,产生脂肪酸和各种气体,尤其是氢。氢气通过血液进入肺部,因此可以用便携式氢气分析仪在呼吸中检测到。BG和BH测试都有不对称的I型和II型错误率。因此,任何寻求特定多态性与LP之间联系的研究都应该考虑到这些错误率。此外,应该指出的是,虽然在大多数情况下,成年人肠道乳糖酶的存在/缺乏可能是由遗传决定的,但乳糖酶的丧失也可能是由肠胃炎等肠道创伤引起的[3.- - - - - -6].检测乳糖酶存在/不存在的其他非侵入性方法包括检测尿液半乳糖和检测碳14标记乳糖的代谢物。这些方法现在很少使用。最可靠的方法是肠活检,它可以直接测定肠道乳糖酶活性。然而,由于其侵入性,该程序很少用于诊断健康个体[7].

随着最近发现与LP相关的核苷酸变化,对该性状进行直接基因测试的前景[8- - - - - -10].然而,很明显存在多个独立衍生的lp相关等位基因,它们具有不同的地理分布[181112].LP在欧洲、某些非洲和中东群体中尤其常见。因此,这些区域是大多数遗传学研究的重点,目前已知的所有LP等位基因都已被识别[71112].第一个被证明与乳糖酶活性增加密切相关的等位基因变异是LCT基因上游13910个碱基的C>T变化thMCM6基因内含子[13].功能研究表明,这一变化可能会影响乳糖酶基因启动子活性,增加肠黏膜乳糖酶素水解酶mRNA的生成[14- - - - - -17]但是,与所有lp相关变异一样,与未知的致病核苷酸变化的联系仍然有可能解释所观察到的关联。单倍型长度守恒[18],相连微卫星变异[19]和早期欧洲农民的古代DNA分析[20.后来证实,这种等位基因具有最近的进化起源,并且一直是强正向自然选择的主题。此外,一个关于欧洲乳糖酶耐受和乳业起源和进化的模拟模型推断,在中欧和巴尔干半岛北部的一个地区,大约在7500 BP左右,自然选择开始作用于最初少量的乳糖酶耐受乳业者,可能与Linearbandkeramik文化有关[21].另一项模拟研究推断,与欧洲相比,乳糖酶持久性的选择优势可能不是恒定的,人口统计学是欧洲乳糖酶持久性进化和传播的一个重要因素[22].

然而,该等位基因的存在并不能解释LP在大多数非洲人群中的频率[8].进一步的研究发现,在一些非洲和中东人群中,另外三种与LP密切相关的变异和/或有功能的证据,它们都在临床上13岁的基因th内含子MCM6基因:-13,907*G, -13,915*G和-14,010*C [11122324].在数据充足的情况下,其中一些等位基因还显示出最近起源的遗传特征和强烈的积极自然选择[1223].

虽然已经确定了至少四种强有力的候选致病等位基因,但只对少数人群进行了研究,而且这些人群仅限于欧洲、非洲和中东。因此,目前不太可能已知所有与lp相关或导致lp的等位基因。因此,基于现有知识的基因检测将低估世界上大多数人群中LP的频率。作为寻求LP在非洲分布的遗传解释的第一个研究的一部分[8],一个统计程序(GenoPheno)是为了测试LP相关等位基因的频率是否可以解释种族匹配人群中LP频率的报告。至关重要的是,这一统计程序的设计是为了解释与不同表型试验(BH和BG)相关的抽样误差和不对称I型和II型错误率。

在这项研究中,我们试图将这种方法扩展到整个旧大陆。然而,虽然关于LP在不同地理区域的频率有丰富的文献[1]以及越来越多的出版物报道了导致lp的候选等位基因的频率,在大多数情况下,遗传和表型数据不是来自同一个人,而且往往不是密切相邻的群体。因此,目前LP相关基因型频率的知识在多大程度上可以解释LP频率的特征仅限于两种数据类型都可用的人群。为了克服这个问题,我们对各种数据类别(遗传、表型、样本数、所使用的表型测试及其相关错误率)进行了表面插值,并应用了在覆盖旧大陆的精细网格上描述的统计程序。这使我们能够确定报告的LP相关等位基因频率不足以解释LP存在的区域。这些区域应该是未来基因型/表型研究的良好候选区域。

方法

数据

我们的全球LP表型数据集包括112个位点[1)(见附加文件1).这些数据是从大量LP频率文献中仔细选择的,以便删除从(1)儿童,(2)选择可能患有乳糖不耐症的患者,(3)家庭成员和(4)具有20 / 21世纪移民身份的人收集的数据。获得了132个位点的基因型数据,这些位点的-13,910 C>T等位基因频率已被估计[78111825- - - - - -27],并从61个地点估计了目前已知的所有4种LP相关等位基因变异的频率[12232628)(见附加文件2).这些数据是从大量LP频率文献中仔细选择的,以便删除从(1)可能患有乳糖不耐症的患者,(2)家庭成员和(3)具有20 / 21世纪移民身份的人收集的数据。如果一个特定位置有多个数据集(无论是基因型数据还是表型数据),则计算加权平均频率。BG的I型和II型错误率分别为8.621%和6.849%,BH的错误率分别为6.818%和4.167% [8].预测的LP频率,由LP基因型频率,通过假设计算哈迪温伯格平衡和优势(见附加文件)2).

探索的地理空间为东经-19 ~ 180度,北纬-48 ~ 72度。

表面插值

为了估计LP和LP相关等位基因频率在连续空间中的分布,从不规则间隔的数据中,使用自然的邻居算法(2930.]中实现的PyNGLPython程序设计语言模块[31- - - - - -33].简单地说,该算法首先根据观测数据点的位置将二维空间划分为多边形,然后通过对每个相邻位置的相对重叠进行加权来估计数据缺失位置的值。

定量差异相关分析

我们还进行了一项分析,以量化基于lp相关等位基因频率的表型频率和预测表型频率之间的差异。如上所述,我们假设哈迪温伯格平衡并使用附加文件表中提供的数据进行表面插值1而且2.然后,我们从表示观测到的LP频率的表面减去表示期望频率的表面。地图是用PyNGL33].该程序的代码可从作者处获得。

GenoPheno相关分析

为了确定LP相关等位基因频率不足以解释观察到的LP发病率的区域,我们应用了基于蒙特卡罗的统计检验GenoPheno8]到覆盖旧大陆的198(东西)× 119(南北)网格中的每个单元。对于每个细胞,有必要提供LP相关等位基因频率和LP发生率的信息(见上文),以及每种数据类型所使用的样本数以及所使用的LP表型试验的I型和II型错误率。这些参数通过遗传和表型研究的表面插值值估计,以提供6个表面插值“层”信息。该程序的代码可从作者处获得。

相似地区相似人群分析

为了证明LP特异性的基因型-表型相关分析没有插值(表1),我们对表型和基因型数据(来自附加文件的表格)进行了定量差异和基因表型测试(如上所述)1而且2(1)民族相似,(2)国家/地区相似,且两个数据点之间偏差最大3度。

表1相似地区相似族群genpheno相关性

样品密度分析

为了表明基因型和表型采样稀少的区域,我们使用了二维核密度估计[3435]中实现的KernSmoothR统计编程环境软件包[36].我们使用了一个各向同性核,其带宽等于样本点之间的平均最近邻距离(ANND)的一半,以确保每个高斯采样区域的>95%将在ANND内。

结果

内插LP表型频率

数字1显示了基于表型测试的LP频率的插值图(也参见附加文件)1, (1])。虽然这张地图可以合理地表示欧洲和西亚的LP频率,但应该指出的是(1)东亚和北亚、印度尼西亚、美拉尼西亚、澳大利亚和波利尼西亚的数据很少,(2)在非洲和中东,生活在彼此附近的人口往往具有显著不同的LP频率,这在一定程度上取决于传统的生存策略[1].

内插预测LP表型频率

数字2显示了基于基因分型测试的所有4个目前已知的LP相关等位基因变体预测的LP频率的插值图(见附加文件)2, (78111825- - - - - -27])。与表型数据一样,亚洲东部和北部、印度尼西亚、美拉尼西亚、澳大利亚和波利尼西亚的基因型数据很少。

图2
图2

基于LP相关等位基因频率预测旧大陆LP表型频率.低频频率预测假设哈迪温伯格均衡和支配。十字形表示目前已知的所有4个lp相关等位基因进行基因分型的收集地点,菱形表示可获得- 13910 C>T等位基因唯一数据的收集地点。彩色键表示通过表面插值估计的LP表型频率。

数字3.显示了仅由- 13910 C>T等位基因数据预测的LP频率的插值图(见附加文件)2, (78111825- - - - - -27])。

图3
图3

仅基于- 13910 C>T等位基因频率数据预测旧大陆LP表型频率.低频频率预测假设哈迪温伯格均衡和支配。星星代表收集地点。彩色键表示通过表面插值估计的LP表型频率。

数字4显示了由目前已知的3个LP相关等位基因变体预测的LP频率的插值图,不包括- 13910 C>T等位基因(见附加文件)2, (12232628])。虽然这张地图提供了东非和中东地区3个LP相关等位基因变异频率的合理表示,但来自世界其他地区的数据很少。

图4
图4

根据目前已知的LP相关等位基因变异的频率数据预测旧大陆LP表型频率,不包括- 13910 C>T等位基因.低频频率预测假设哈迪温伯格均衡和支配。十字表示收集地点。彩色键表示通过表面插值估计的LP表型频率。

LP基因型-表型相关性

数字5为观察到的表型频率与基于4个lp相关等位基因频率的预测表型频率之间的定量差异。这张图是通过减去图中所示的表面得到的2如图所示1.它代表了目前对各种LP相关等位基因频率的了解在多大程度上解释了LP性状的分布。在许多情况下,用于获得分子和表型数据的样本数很少。此外,表型测试的错误率是可观的。因此,对于某些地区,预测的LP频率与观测到的LP频率之间的差异很大,这种差异可以单独用采样和测试误差来解释。

图5
图5

旧大陆LP基因型-表型相关性,通过计算观测到的LP表型频率与使用所有4个LP相关等位基因频率数据预测的LP表型频率之间的定量差异来获得.阳性和阴性值分别代表LP相关基因型不足和过度预测LP表型的情况。点表示LP表型的收集位置,十字表示目前已知的所有4个LP相关等位基因的数据收集位置,菱形表示仅- 13910 C>T数据收集位置。彩色键表示预测的LP表型频率(图2)减去观测到的LP表型频率(图1)的值。

为了考虑抽样和测试误差,我们应用了基于蒙特卡罗的统计检验GenoPheno8]到图中所示的表面1而且2.执行此测试还需要样本数和错误率的数据,为此,我们通过应用与LP频率相同的推理来生成插值曲面。通过应用GenoPheno在198 × 119单元格网格上对23562个位置进行测试,得到如图所示的表面6.在原假设下,LP相关等位基因和表型错误单独解释了观察到的LP频率,这些p值近似于观察到的基因型和表型数据的概率。

图6
图6

旧大陆LP基因型-表型相关性,由GenoPheno蒙特卡罗试验.圆点表示LP表型数据的收集位置,十字表示目前已知的所有4个LP相关等位基因的数据收集位置,菱形表示仅在- 13910 C>T上的数据收集位置。颜色键显示p的值。GenoPheno测试。红色代表的值p< 0.01,表示相关性极显著缺失,黄色表示0.01≤p< 0.05,表示相关性明显不足,蓝色表示p≥0.05,相关性不显著。

LP表型和基因型数据及相关映射的在线资源

LP表型和基因型数据集可在GLAD(全球乳糖酶持久性协会数据库)网站上获得http://www.ucl.ac.uk/mace-lab/GLAD/.这些数据集将每三个月更新一次,对应于图的地图16本文将从这些更新的数据库中重新生成。网页包含了我们认为“合适的”LP数据的指导方针(如方法部分所述)。我们鼓励读者随时向我们发送新的LP基因型和表型数据。

讨论

在本研究中,我们通过表面插值LP基因型和表型数据,确定了当前LP相关等位基因频率数据不足以解释估计LP表型频率的区域。我们的分析还指出了基因型或表型数据稀少或不存在的区域(参见附加文件的地图)3.4,5).从这些区域收集的数据可能对更全面地了解LP的分布和演化有价值。我们认为,LP相关基因型对LP预测不足的区域是进一步遗传研究的良好候选区域。

我们承认,当数据稀疏时,表面插值可能会给出误导性的结果,因此在解释这些区域的结果时要谨慎。使用的数据和生成的地图将通过GLAD网站定期更新http://www.ucl.ac.uk/mace-lab/GLAD/.因此,我们预计,随着更多的数据变得可用,在数据稀疏的区域上进行插值所引起的问题将会减少。然而,为了表示采样稀疏的区域,我们生成了三个额外的地图(附加文件3.4,5)分别表示表型数据的样本位点密度,- 13910 *T等位基因数据可用的位点密度,以及所有4个lp相关等位基因数据可用的位点密度。这些地图是使用二维核密度估计生成的[34- - - - - -36],内核带宽等于样本站点之间平均最近邻距离的一半。

虽然在大范围内,旧大陆的大多数地区都对- 13910 *T等位基因进行了采样,但其他三种lp相关等位基因的频率数据主要集中在非洲和中东。进一步的研究很可能会在其他地区发现-13,907*G、-13,915*G或-14,010*C等位基因的显著频率,或揭示新的lp相关等位基因。为了说明三个非-13,910*T等位基因的数据如何增加我们对LP遗传学的知识,我们生成了两个额外的地图:一个是显示LP表型与所有4个LP相关等位基因测序数据预测的LP表型之间的相关性(附加文件)6),第二个是显示LP表型与仅通过-13,910*T等位基因数据预测的LP表型之间的相关性(附加文件7).然后我们减去这两个图形的表面(附加文件8).

我们的分析表明,在少数地区(包括阿拉伯和巴斯克地区),LP相关等位基因频率似乎过度预测LP表型频率。如果我们假设这里考虑的所有四个lp相关等位基因都是性状的原因,或者与致病变异紧密相关,那么过度预测很可能是群体抽样问题的结果。例如,沙特阿拉伯的牧民贝都因人LP的频率较高,而来自同一地区的非贝都因阿拉伯人LP的频率通常较低[37].或者,过度预测可能在一定程度上是由于断奶后LP的非遗传原因,如肠道创伤引起的继发性乳糖不耐症[3.- - - - - -6].在某种程度上,这些匹配来自同一地理区域的人口群体的问题适用于我们的整个分析。然而,从图中可以看出这一点5当LP表型与预测表型频率之间缺乏对应关系时,通常是预测不足(最大值= 0.94;对于西非),而过度预测是罕见的,而且规模相当小(最大= 0.29;巴斯克地区)。在某些情况下,有可能确定基因型和表型数据起源于相同的人口或种族群体。对于这样的人群,我们也进行了单独的GenoPheno分析(见表1, (8])。我们注意到,LP表型频率与从“匹配”群体分析的等位基因频率数据预测的表型频率之间的巨大差异,主要发生在与插值分析显示的巨大差异相同的区域(见图)5).这表明,在广泛的范围内,我们所采用的插值方法提供了一个合理的近似,即基因型数据无法解释所观察到的LP表型频率,尽管我们使用的大部分数据来自具有不同生存策略的不同民族[3839].

通过应用GenoPheno统计程序插值层的表型和基因型相关数据(图6),我们已经确定了西非和东非的部分地区、东欧以及西亚、中亚和南亚的部分地区作为进一步基因研究的潜在目标。在这些区域中,缺乏-13,907*G、-13,915*G和-14,010*C等位基因的数据可能部分解释了预测不足(图9)5及附加文件67,8).先前的研究注意到东欧可能存在预测不足的情况,并提出存在- 13910 *T以外的等位基因[4041].上面描述的群体抽样问题也可以解释我们在南亚部分地区推断的预测不足,因为在这些地区中,获得表型和基因型数据的位置大多分离得很好。然而,这一群体数据匹配问题不太可能解释在巴基斯坦和阿富汗周边地区以及西非和意大利,LP和基于等位基因频率的预测LP频率之间缺乏对应关系。在这些地区进行的进一步基因研究应该能提供丰富的信息。

结论

在这项研究中,我们已经证明了乳糖耐受性基因型数据目前不足以解释西非和东非以及其他几个旧大陆地区的乳糖耐受性表型频率。识别额外的LP相关或LP致病等位基因,特别是在这些区域,不仅有助于更好地理解LP的进化,而且有助于阐明该性状背后的生理机制。我们在这项研究中应用的插值和映射方法也可能对研究影响人类健康的其他表型变异的潜在遗传基础和进化有价值,例如药物代谢酶功能变异的分布[42].

参考文献

  1. Ingram CJ, Mulcare CA, Itan Y, Thomas MG, Swallow DM:乳糖消化和乳糖酶持久性的进化遗传学。胡文杰,2009,34(6):589 -591。10.1007 / s00439 - 008 - 0593 - 6。

    文章中科院PubMed谷歌学者

  2. 海曼MB:婴儿、儿童和青少年的乳糖不耐症。中华儿科杂志,2006,18(3):1279-1286。10.1542 / peds.2006 - 1721。

    文章PubMed谷歌学者

  3. 新人AD, McGill DB, Thomas PJ, Hofmann AF:间接检测乳糖酶缺乏症的前瞻性比较。中华实用医学杂志,2004,29(3):344 - 344。

    文章中科院PubMed谷歌学者

  4. Peuhkuri K:乳糖、乳糖酶和肠道疾病。2000,赫尔辛基:赫尔辛基大学

    谷歌学者

  5. Gudmand-Hoyer E, Skovbjerg H:双糖消化和消化不良。中华胃肠病杂志,1996,26(3):531 - 531。10.3109 / 00365529609094566。

    文章中科院PubMed谷歌学者

  6. 吞咽型糖尿病:乳糖酶持久性和乳糖不耐症的遗传学。科学通报,2003,37:197-219。10.1146 / annurev.genet.37.110801.143820。

    文章中科院PubMed谷歌学者

  7. Mulcare CA:乳糖酶持久性表型的进化。2006,伦敦:伦敦大学

    谷歌学者

  8. Mulcare CA, Weale ME, Jones AL, Connell B, Zeitlyn D, Tarekegn A, Swallow DM, Bradman N, Thomas MG:乳糖酶基因上游13.9kb单核苷酸多态性(C-13.9kbT)的T等位基因不能预测或导致非洲人的乳糖酶持久性表型。中国科学(d辑),2004,26(3):344 - 344。10.1086/421050。

    文章公共医学中心中科院PubMed谷歌学者

  9. Rasinpera H, Savilahti E, Enattah NS, Kuokkanen M, Totterman N, Lindahl H, Jarvela I, Kolho KL:一种可用于诊断儿童成人型低视的基因检测。中国生物医学工程学报,2004,53(11):1571-1576。10.1136 / gut.2004.040048。

    文章公共医学中心中科院PubMed谷歌学者

  10. 咽DM: DNA检测早产儿低脱位症。肠道杂志,2004,55:131-132。

    谷歌学者

  11. Ingram CJ, Elamin MF, Mulcare CA, Weale ME, Tarekegn A, Raga TO, Bekele, Elamin FM, Thomas MG, Bradman N,等:一种与非洲乳糖耐受相关的新多态性:乳糖酶持久性的多种原因?中国生物工程学报,2007,29(6):457 - 457。10.1007 / s00439 - 006 - 0291 - 1。

    文章中科院PubMed谷歌学者

  12. Tishkoff SA, Reed FA, Ranciaro A, Voight BF, Babbitt CC, Silverman JS, Powell K, Mortensen HM, Hirbo JB, Osman M,等:非洲和欧洲人类乳糖酶持续性的趋同适应。植物学报,2007,39(1):31-40。10.1038 / ng1946。

    文章公共医学中心中科院PubMed谷歌学者

  13. Enattah NS, Sahi T, savilahhti E, Terwilliger JD, Peltonen L, Jarvela I:一种与成人型低脱位症相关的变异的鉴定。植物学报,2002,30(2):233-237。10.1038 / ng826。

    文章中科院PubMed谷歌学者

  14. Lewinsky RH, Jensen TG, Moller J, Stensballe A, Olsen J, Troelsen JT: T-13910与乳糖酶持久性相关的DNA变异与Oct-1相互作用并刺激乳糖酶启动子活性中国生物医学工程学报,2005,14(24):3945-3953。10.1093 /物流/ ddi418。

    文章中科院PubMed谷歌学者

  15. Kuokkanen M, Enattah NS, Oksanen A, savilahhti E, Orpana, Jarvela I:乳糖素素水解酶基因的转录调控与成体型低脱色症相关的多态性。中国生物医学工程学报,2003,52(5):647-652。10.1136 / gut.52.5.647。

    文章公共医学中心中科院PubMed谷歌学者

  16. Olds LC, Sibley E:乳糖酶持久性DNA变异增强体外乳糖酶启动子活性:作为顺式调节元件的功能作用。中国生物医学工程学报,2003,12(18):2333-2340。10.1093 /物流/ ddg244。

    文章中科院PubMed谷歌学者

  17. 王颖,Harvey CB, Hollox EJ, Phillips AD, Poulter M, Clay P, Walker-Smith JA, Swallow DM:儿童乳糖酶基因程序性下调。中华胃肠病学杂志,1998,14(6):1230-1236。10.1016 / s0016 - 5085(98) 70429 - 9。

    文章中科院PubMed谷歌学者

  18. Bersaglieri T, Sabeti PC, Patterson N, Vanderploeg T, Schaffner SF, Drake JA, Rhodes M, Reich DE, Hirschhorn JN:乳糖酶基因强近期阳性选择的遗传特征。中国科学(d辑),2004,26(6):357 - 357。10.1086/421051。

    文章公共医学中心中科院PubMed谷歌学者

  19. 李志刚,李志刚,李志刚,李志刚,李志刚,李志刚。乳糖耐受性基因的微卫星变异与进化。胡文杰,2005,(4):329-339。10.1007 / s00439 - 005 - 1322 - z。

    文章中科院PubMed谷歌学者

  20. Burger J, Kirchner M, Bramanti B, Haak W, Thomas MG:新石器时代早期欧洲人乳糖耐受相关等位基因的缺失。美国国家科学研究院。2007, 40(10): 379 - 379。10.1073 / pnas.0607187104。

    文章公共医学中心中科院PubMed谷歌学者

  21. 伊坦Y,鲍威尔A,博蒙特MA,伯格J,托马斯MG:乳糖耐受在欧洲的起源。计算机科学学报,2009,5 (8):e1000491-10.1371/journal.pcbi.1000491。

    文章公共医学中心PubMed谷歌学者

  22. 王晓明,王晓明,王晓明,王晓明,等。遗传选择和人口统计学对乳糖耐受性扩散的影响。公共科学学报,2009,4 (7):e6369-10.1371/journal. peer .0006369。

    文章公共医学中心PubMed谷歌学者

  23. Enattah NS, Jensen TG, Nielsen M, Lewinski R, Kuokkanen M, Rasinpera H, El-Shanti H, Seo JK, Alifrangis M, Khalil IF,等:将两个乳糖耐受酶等位基因独立引入人群反映了不同的牛奶文化适应历史。中国科学(d辑),2008,26(1):1 -7。10.1016 / j.ajhg.2007.09.012。

    文章公共医学中心中科院PubMed谷歌学者

  24. Ingram CJ, Raga TO, Tarekegn A, Browning SL, Elamin MF, Bekele, Thomas MG, Weale ME, Bradman N, Swallow DM:多种罕见变异导致一种常见表型:单个种族中几种不同的乳糖酶持久性相关等位基因。分子进化学报,2009,69(6):579-588。10.1007 / s00239 - 009 - 9301 - y。

    文章中科院PubMed谷歌学者

  25. Enattah NS, Trudeau A, Pimenoff V, Maiuri L, Auricchio S, Greco L, Rossi M, Lentze M, Seo JK, Rahgozar S,等:乳糖酶持久性T-13910等位基因在人类中仍在进行收敛进化的证据。中国生物医学工程学报,2007,26(3):344 - 344。10.1086/520705。

    文章公共医学中心中科院PubMed谷歌学者

  26. 林志刚:非洲和中东地区乳糖耐受的进化遗传学研究。2008,伦敦:伦敦大学

    谷歌学者

  27. Almon R, Engfeldt P, Tysk C, Sjostrom M, Nilsson TK:通过LCT -13910C > T突变基因分型诊断瑞典中部不同年龄人群成人型低脱动症的患病率和趋势。中华胃肠病杂志,2007,42(2):165-170。10.1080 / 00365520600825257。

    文章中科院PubMed谷歌学者

  28. Myles S, Bouzekri N, Haverfield E, Cherkaoui M, Dugoujon JM, Ward R:支持欧亚-北非乳业共同起源的遗传证据。胡文杰,2005,(1):34-42。10.1007 / s00439 - 005 - 1266 - 3。

    文章PubMed谷歌学者

  29. Sibson R:自然邻居插值的简单描述。解释多元数据(概率论与数理统计)。编辑:Barnett V. 1981, John Wiley & Sons, 21-36。

    谷歌学者

  30. 沃森D:轮廓:空间数据分析和显示指南。1992,佩加蒙

    谷歌学者

  31. Python编程语言。[http://www.python.org/

  32. Watson D: nngridr:自然邻居实现。1994年,大卫·沃森,1岁:

    谷歌学者

  33. PyNGL。[http://www.pyngl.ucar.edu/

  34. Wand MP:多元核估计器的快速计算。计算与图形统计,1994,3:433-445。10.2307 / 1390904。

    谷歌学者

  35. 王德MP,琼斯MC:核平滑。1994,查普曼和霍尔

    谷歌学者

  36. Wand MP, Ripley B: KernSmooth。Wand & Jones(1995)的核平滑函数。2009年,(http://cran.r-project.org/web/packages/KernSmooth/index.html

    谷歌学者

  37. Hijazi SS, Abulaban A, Ammarin Z, Flatz G:成年乳糖酶表型在约旦贝都因人及城市和农业人群中的分布。中华医学杂志,2003,26(3):357 - 357。

    中科院谷歌学者

  38. 《考古学、语言和非洲的过去》,2006年,美国阿尔塔米拉出版社

    谷歌学者

  39. Tishkoff SA, Reed FA, Friedlaender FR, Ehret C, Ranciaro A, Froment A, Hirbo JB, Awomoyi AA, Bodo JM, Doumbo O,等:非洲人和非裔美国人的遗传结构和历史。科学通报,2009,29(4):344 - 344。10.1126 / science.1172257。

    文章公共医学中心中科院PubMed谷歌学者

  40. Anagnostou P, Battaggia C, Coia V, Capelli C, Fabbri C, Pettener D, destroi - bisol G, Luiselli D:通过对T(-13910)变异的研究,追踪乳糖酶持久性在南欧的分布和进化。中华微生物学杂志,2009,21(2):217-219。10.1002 / ajhb.20851。

    文章PubMed谷歌学者

  41. Mottes M, Belpinati F, Milani M, Saccomandi D, Petrelli E, Calacoci M, Chierici R, Pignatti PF, Borgna-Pignatti C:意大利家庭成人型低视症的基因检测。临床化学检验医学,2008,46(7):980-984。10.1515 / CCLM.2008.189。

    文章中科院PubMed谷歌学者

  42. 谢鸿辉,金晓明,杨晓明,杨晓明:药物处置与反应的分子基础研究。中华药理学杂志,2001,41:815-850。10.1146 / annurev.pharmtox.41.1.815。

    文章中科院PubMed谷歌学者

  43. Olatunbosun DA, Kwaku Adadevoh B:尼日利亚乳糖酶缺乏症。中国地质大学学报(自然科学版),1997,16(10):949 - 949。10.1007 / BF02238172。

    文章中科院PubMed谷歌学者

  44. Arnold J, Diop M, Kodjovi M, Rozier J:塞内加尔成人乳糖不耐症。中华人民共和国社会科学学报,2000,29(2):379 - 379。

    中科院PubMed谷歌学者

  45. Bayoumi RA, Flatz SD, Kuhnau W, Flatz G: Beja和Nilotes:苏丹的游牧游牧群体,成年乳糖酶表型分布相反。中国生物医学工程学报,2002,23(2):379 - 379。10.1002 / ajpa.1330580208。

    文章中科院PubMed谷歌学者

  46. Cook GC, Kajubi SK:乌干达乳糖酶缺乏症的部落发病率。中华医学杂志,1996,1(1):725-729。10.1016 / s0140 - 6736(66) 90888 - 9。

    文章中科院PubMed谷歌学者

  47. 孙红梅,乔东东,陈峰,徐立德,白娟,傅树生:乳糖酶基因-13910T等位基因不能预测中国北方地区乳糖耐受表型。中华临床病学杂志,2007,16(4):598-601。

    中科院PubMed谷歌学者

  48. 王永刚,闫玉生,徐俊杰,杜rf, Flatz SD, Kuhnau W, Flatz G:中国北方3个人群原发性乳糖吸收不良的患病率。胡志刚,2004,(1):1 -10。10.1007 / BF00270566。

    文章中科院PubMed谷歌学者

  49. Swaminathan N, Mathan VI, Baker SJ, Radhakrishnan AN:来自美国和南印度对照受试者和热带直肠炎患者的空肠活检标本中的双糖酶水平。临床化学学报,1970,30(3):707-712。10.1016 / 0009 - 8981(70) 90264 - 0。

    文章中科院PubMed谷歌学者

  50. 吉田Y,佐佐木G,后藤S,柳谷S,高希娜K:日本成人牛奶不耐受病因学的研究。中华胃肠病杂志,1995,10(1):29-34。

    中科院PubMed谷歌学者

  51. 古普塔,李丽娟,李丽娟,李丽娟。热带地区正常成年人群肠道双糖酶活性的研究。中华热带医学杂志,2001,27(4):344 - 344。

    中科院PubMed谷歌学者

  52. Tandon RK, Joshi YK, Singh DS, Narendranathan M, Balakrishnan V, Lal K:北印度人和南印度人的乳糖不耐症。中华临床医学杂志,1981,34(5):943-946。

    中科院PubMed谷歌学者

  53. Kozlov AI:俄罗斯北部土著居民的失视症。国际健康杂志,1998,57(1):18-21。

    中科院PubMed谷歌学者

  54. 芬兰医院病人和年轻军人的牛奶不耐受和乳糖吸收不良。中国生物医学工程学报,2009,1(3):199-207。

    中科院PubMed谷歌学者

  55. Ladas S, Papanikos J, Arapakis G:希腊成人乳糖吸收不良:小肠转运时间与乳糖不耐受严重程度的相关性。肠道杂志,1982,23(11):968-973。10.1136 / gut.23.11.968。

    文章公共医学中心中科院PubMed谷歌学者

  56. Nagy D, Bogacsi-Szabo E, Varkonyi A, Csanyi B, Czibula, Bede O, Tari B, Rasko I:匈牙利人遗传和乳糖氢呼气试验诊断的成人型低脱动症患病率中华临床病学杂志,2009,29(3):389 - 397。10.1038 / ejcn.2008.74。

    文章中科院PubMed谷歌学者

  57. Czeizel A, Flatz G, Flatz SD:匈牙利原发性成人乳糖吸收不良的患病率。王志强,2004,34(4):398-401。10.1007 / BF00292375。

    文章中科院PubMed谷歌学者

  58. Fielding JF, Harrington MG, Fottrell PF:原生爱尔兰人中原发性低视症的发病率。中华流行病学杂志,2004,19(3):357 - 357。10.1007 / BF02938254。

    文章中科院PubMed谷歌学者

  59. Meloni T, Colombo C, Ruggiu G, Dessena M, Meloni GF:撒丁岛的原发性乳糖酶缺乏症和过去疟疾流行。中华胃肠病杂志,1998,30(5):490-493。

    中科院PubMed谷歌学者

  60. Burgio GR, Flatz G, Barbera C, Patane R, Boner A, Cajozzo C, Flatz SD:意大利原发性成人乳糖吸收不良患病率和牛奶不耐受意识。中华临床医学杂志,2004,39(1):100-104。

    中科院PubMed谷歌学者

  61. Cavalli-Sforza LT, Strata A, Barone A, Cucurachi L:意大利原发性成人乳糖吸收不良:患病率的区域差异及其与乳糖不耐症和牛奶消费量的关系。中华临床医学杂志,1997,45(4):748-754。

    中科院PubMed谷歌学者

  62. Rinaldi E, Albini L, Costagliola C, De Rosa G, Auricchio G, De Vizia B, Auricchio S:在原发性成人乳糖吸收不良高发人群中,特发性老年性和早老性白内障成人中乳糖吸收者的高频率。中华医学杂志,1984,1(1):355-357。10.1016 / s0140 - 6736(84) 90409 - 4。

    文章中科院PubMed谷歌学者

  63. Rahimi AG, Delbruck H, Haeckel R, Goedde HW, Flatz G:阿富汗肠道乳糖酶活性高的持久性(乳糖耐受性)。胡杰内。1976,34(1):57-62。10.1007 / BF00284435。

    文章中科院PubMed谷歌学者

  64. Sadre M, Karbasi K:伊朗的乳糖不耐症。中国生物医学工程学报,1997,32(9):448 - 448。

    中科院PubMed谷歌学者

  65. Gilat T, Malachi EG, Shochet SB:阿拉伯人群的乳糖耐受性。中国地质大学学报,1997,16(3):203-206。10.1007 / BF02235240。

    文章中科院PubMed谷歌学者

  66. Hijazi SS, Abulaban A, Ammarin Z, Flatz G:成年乳糖酶表型在约旦贝都因人及城市和农业人群中的分布。热带地理医学,1983,35(2):157-161。

    中科院PubMed谷歌学者

  67. Ahmad M, Flatz G:巴基斯坦原发性成人乳糖吸收不良的患病率。胡赫德。1984,34(2):69-75。10.1159 / 000153439。

    文章中科院PubMed谷歌学者

  68. Dissanayake AS, Al-Quorain AA, Al-Breiki H, El-Munshid HA, Wosornu L:沙特阿拉伯东部地区原发性成人乳糖吸收不良的患病率。中华医学杂志,1999,10:588 - 588。

    谷歌学者

  69. Flatz G, Henze HJ, Palabiyikoglu E, Dagalp K, Turkkan T:土耳其成虫乳糖酶表型的分布。热带地理医学,1986,38(3):255-258。

    中科院PubMed谷歌学者

下载参考

确认

我们要感谢Neil Bradman, Sarah Browning, Chris Plaster, Naser Ansari Pour, N. Saha和Ayele Tarekegn对样本的帮助,以及为本研究奠定基础的Charlotte Mulcare和Mike Weale, Pascale Gerbault, Adam Powell和Anke Liebert的有益评论和建议,以及Melford慈善信托对测序的支持。Yuval Itan由B'nai B'rith/Leo Baeck伦敦Lodge和人类遗传学史册奖学金资助,Bryony L. Jones由MRC/DTA奖学金资助,Catherine J.E. Ingram由BBSRC-CASE奖学金资助。我们感谢AHRC文化多样性进化中心(CECD)和伦敦大学学院生命科学与实验生物学数学与物理中心(CoMPLEX)对这项研究的支持。

作者信息

作者及隶属关系

作者

相应的作者

对应到尤Itan

额外的信息

作者的贡献

YI和MGT发起并设计了该研究。YI执行分析和编程例程。管理学院贡献了生物学、统计学和人类学的专业知识。DMS贡献了乳糖酶持久性基因型和表型专业知识。YI、DMS、BLJ和CJEI为整理数据和编辑表格做出了贡献。YI和MGT写了这篇文章。所有作者都对这篇文章进行了修改。所有作者都阅读并批准了最终的手稿。

电子辅助材料

12862 _2009_1252_moesm1_esm.xls

附加文件1:乳糖酶持久性表型频率表。列显示位置(大洲、国家、经度和纬度)、人群、检测个体数量、乳糖酶耐受个体频率、LP检测方法和主要来源参考。由于缺乏数据,美洲被排除在表格之外。数据排除的其他原因包括:近期移民人口、儿童(12岁以下)或有偏见的个体选择标准(如报告为乳糖酶不耐受或相关个体)。在只有国名的地方,地点由首都或估计的国家中心点确定。(xls 82 kb)

12862 _2009_1252_moesm2_esm.xls

附加文件2:乳糖酶持久性相关等位基因频率的表.列显示位置(大洲、国家、经纬度)、人群、被测个体数、-13910*T、- 13907 *G、- 13915 *G、- 14010 *C的lp相关等位基因频率、所有lp相关等位基因的总和、预测乳糖耐受频率、主要文献和自己的数据来源。数据来自SNP分型测试(仅显示- 13910 *T)或重测序。由于缺乏数据,美洲被排除在表格之外。通过假设计算预测的乳糖酶持久频率哈迪温伯格平衡和优势,利用所有可用的lp相关等位基因的总和在一个特定的位置。在只有国名的地方,地点由首都或估计的国家中心点确定。值得注意的是,印度和北印度基因型数据的收集地点是新加坡。作为一个例外,我们把这些数据放在祖先人口的位置,因为缺乏来自印度的遗传数据。(xls 88 kb)

附加文件3:表型数据样本位点密度图。(pdf 646 kb)

附加文件4:可获得13910个*T等位基因数据的样本位点密度图。(pdf 667 kb)

12862 _2009_1252_moesm5_esm.pdf

附加文件5:所有4个lp相关等位基因数据可用的样本位点密度图。(pdf 641 kb)

12862 _2009_1252_moesm6_esm.pdf

附加文件6:非洲和中东LP基因型-表型相关性,通过计算观察到的表型频率和预测表型频率之间的定量差异来获得,这些差异基于只有所有4-LP相关等位基因的完全测序数据可用的位置.阳性和阴性值分别代表LP相关基因型不足和过度预测LP表型的情况。点表示LP表型的收集位置,十字表示目前已知的所有4个LP相关等位基因的数据收集位置。彩色键显示预测LP表型频率的值(图4)从观察到的LP表型频率中减去(图1).没有分析亚太地区的数据,因为这些地区的4个等位基因数据非常稀疏,西欧和北欧的全测序数据也很稀疏。(pdf 4mb)

12862 _2009_1252_moesm7_esm.pdf

附加文件7:旧世界LP基因型-表型相关性,仅基于- 13910 *T等位基因数据,通过计算观察表型频率和预测表型频率之间的定量差异获得。阳性和阴性值分别代表LP相关基因型不足和过度预测LP表型的情况。点表示LP表型的收集位置,十字表示从完全测序数据中获得的13910 *T等位基因的数据收集位置,菱形表示仅- 13910 C>T的数据收集位置。彩色键表示- 13910 *T等位基因数据仅减去观测到的LP表型频率所预测的LP表型频率值。(pdf 1mb)

12862 _2009_1252_moesm8_esm.pdf

附加文件8:附加文件6和附加文件7的映射之间的差异,展示了额外的3个lp相关等位基因(除了- 13910 *T等位基因)获得的额外知识。没有分析亚太地区的数据,因为这些地区的4个等位基因数据非常稀少。(pdf 3mb)

作者提交的图片原始文件

权利和权限

本文由BioMed Central Ltd授权发布。这是一篇开放获取文章,根据创作共用属性许可协议(http://creativecommons.org/licenses/by/2.0),允许在任何媒介上不受限制地使用、传播和复制,前提是正确地引用原始作品。

转载及权限

关于本文

引用本文

伊坦,Y.,琼斯,b.l.,英格拉姆,C.J.et al。乳糖耐受表型和基因型的世界性相关性。BMC Evol Biol10, 36(2010)。https://doi.org/10.1186/1471-2148-10-36

下载引用

  • 收到了

  • 接受

  • 发表

  • DOIhttps://doi.org/10.1186/1471-2148-10-36

关键字

  • 乳糖酶
  • 乳糖不耐受
  • 乳糖耐受性
  • 表型频率
  • 强正向自然选择
Baidu
map