圖片來(lái)源:Science(DOI: 10.1126/science.aam9309)
最新刊登在Science上的一項(xiàng)研究發(fā)表了可能是有史以來(lái)的家譜:這一里程碑式的數(shù)據(jù)集關(guān)聯(lián)了有血緣或婚姻關(guān)系的1300萬(wàn)人,平均跨越11代。而正是基于這一龐大的家譜,科學(xué)家們得出了以上結(jié)論。
在這篇題為“Quantitative analysis of population-scale family trees with millions of relatives”的論文中,哥倫比亞大學(xué)的計(jì)算生物學(xué)家Yaniv Erlich及其同事分析了這一家譜上的人的出生和死亡日期,并評(píng)估了如果他們是近親,是否更有可能死于相似的年齡。
結(jié)果顯示,遺傳只解釋了這些人壽命差異的不到五分之一。大部分的差異都?xì)w結(jié)于其他因素,如,人們的居住地和生活方式。同時(shí),研究還表明,影響長(zhǎng)壽的基因是獨(dú)立起作用,而不是相互作用。
Erlich說(shuō):“‘好的’基因可能會(huì)使一個(gè)人的壽命平均延長(zhǎng)5年,但一些環(huán)境因素對(duì)長(zhǎng)壽的影響更大,例如,吸煙能夠減去10年壽命。”
盡管先前科學(xué)家們已經(jīng)懷疑,環(huán)境對(duì)人類(lèi)壽命的影響要大于基因(2001年的一項(xiàng)研究曾估計(jì),基因決定了人類(lèi)壽命變化的約四分之一),但這項(xiàng)新成果表明,基因的作用可能比研究人員想象得更少。對(duì)于致力于尋找長(zhǎng)壽基因的科學(xué)家們來(lái)說(shuō),這意味著,實(shí)現(xiàn)他們的目標(biāo)或許要加困難了。
This 6,000-person family tree was cleaned and organized using graph theory. Individuals are shown in green, spanning seven generations; marriages are depicited in red.Credit: Columbia University
龐大數(shù)據(jù)
事實(shí)上,遺傳學(xué)家們利用家譜來(lái)研究遺傳特征如何影響性狀(如,疾病風(fēng)險(xiǎn))已經(jīng)有很長(zhǎng)時(shí)間了。但是,要形成包含大量人口的家庭記錄數(shù)據(jù)集,成本很高,且難度很大。目前,有很多科學(xué)家小組正在開(kāi)展相關(guān)研究,其中,一些已經(jīng)鑒定出了與癌癥和阿爾茨海默癥等疾病相關(guān)的基因。
Erlich的研究使用的是來(lái)自在線家譜工具Geni.com(全球的合作家譜網(wǎng)站之一,用戶在Geni上分享他們的家譜)的數(shù)據(jù)。他現(xiàn)在是Geni母公司MyHeritage的首席科學(xué)官。
Erlich關(guān)于這一研究的最初想法要追溯到7年前。當(dāng)時(shí),他通過(guò)Geni.com從一個(gè)遠(yuǎn)房親戚那里收到了一封電子郵件,然后聯(lián)系了該公司的首席技術(shù)官,獲得了下載該網(wǎng)站上數(shù)千萬(wàn)公開(kāi)資料的權(quán)利。這些資料包括用戶的姓名、性別、出生日期和地點(diǎn)、死亡日期以及直系親屬,但沒(méi)有DNA信息。最終,他們分析了來(lái)自約8600萬(wàn)人的數(shù)據(jù)。
加州大學(xué)舊金山分校的計(jì)算基因組學(xué)專(zhuān)家Atul Butte說(shuō):“這種級(jí)別的參與者數(shù)量是瘋狂的??茖W(xué)家們也只能通過(guò)眾包(crowdsourcing)獲得這樣的數(shù)據(jù)集。這真是太令人印象深刻了。”
圖片來(lái)源:網(wǎng)絡(luò)
其他發(fā)現(xiàn)
除了調(diào)查基因和環(huán)境對(duì)壽命的影響,Erlich團(tuán)隊(duì)還利用這些數(shù)據(jù)分析了人們移民和結(jié)婚的模式。結(jié)果發(fā)現(xiàn),在1750年之前,數(shù)據(jù)集中的大多數(shù)美國(guó)人和歐洲人,都與“居住在離他們出生地最多10公里處的人”結(jié)婚。到1950年,大多數(shù)美國(guó)人和歐洲人都要到離家至少100公里的地方去尋找配偶。
Erlich說(shuō):“所有這些都有助于我們理解基因是如何在一個(gè)地理區(qū)域內(nèi)傳播的。”他還表示,目前的這些發(fā)現(xiàn)僅僅觸及了這一龐大家譜潛在用途的表面?,F(xiàn)在,他的團(tuán)隊(duì)已經(jīng)開(kāi)始利用一個(gè)叫DNA.Land的網(wǎng)站來(lái)進(jìn)一步研究這一家譜。在DNA.Land上,用戶會(huì)分享他們的DNA基因分型數(shù)據(jù)(這些數(shù)據(jù)來(lái)自一些公司提供的消費(fèi)者DNA測(cè)試服務(wù),如23andMe、MyHeritage),并填寫(xiě)健康調(diào)查。
Yaniv Erlich. (MyHeritage)
意義重大
未參與該研究的昆士蘭大學(xué)遺傳學(xué)家Peter Visscher說(shuō):“這項(xiàng)研究非常聰明地利用眾包數(shù)據(jù)來(lái)解決許多有趣的科學(xué)問(wèn)題。如果能夠它能夠與健康信息聯(lián)系起來(lái),探究基因在疾病中的作用,那么將帶來(lái)更大的意義。”
猶他大學(xué)的遺傳學(xué)家Lisa Cannon-Albright則表示:“Erlich等的發(fā)現(xiàn)證明了極大家譜的力量。這類(lèi)資源將是未來(lái)遺傳學(xué)研究一個(gè)強(qiáng)有力的部分。”
此外,牛津大學(xué)的人口統(tǒng)計(jì)學(xué)家Melinda Mills認(rèn)為,對(duì)于公眾科學(xué)(citizen science)來(lái)說(shuō),這是一個(gè)激動(dòng)人心的時(shí)刻。該研究很好地展示了數(shù)以百萬(wàn)計(jì)的普通人如何對(duì)科學(xué)產(chǎn)生影響。
參考資料:
World's largest family tree reveals environment’s influence on lifespan
Thirteen million degrees of Kevin Bacon: World’s largest family tree shines light on life span, who marries whom
Crowdsourced family tree yields new insights about humanity
合作咨詢(xún)
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com