世界最大家譜 含1300萬人 印證中國老話(圖)
基因系譜專家與計算機科學家組成了研究團隊,創建了一個迄今為止最大的家譜。(圖片來源:Adobe Stock)
【看中國2018年3月4日訊】(看中國記者憶文編譯)基因系譜專家與計算機科學家組成了研究團隊,創建了一個迄今為止最大的家譜。其中包括1300萬個成員,平均有11代。其研究成果發表在本星期的《科學》雜誌上。大量的數據揭示了很多信息,包括人們是什麼時候開始停止近親結婚的?為了成婚,是男人更願意離開家鄉,還是女人更傾向於遷徙?長壽基因的承傳等等,這個包含1300萬人世界上最大的家譜也印證了中國的一句老話。
據《洛杉磯時報》報導,這個家譜是基於大約3百萬家族樹愛好者彙集的數據,他們在Geni.com網站上填寫了超過8600萬人的家族關係。
據悉,美國總統唐納德.川普(特朗普)(Donald Trump)和影星凱文.培根(Kevin Bacon)的信息都在該網站上。
不過,並不是網站資料庫中的每一個人都包含在這項研究當中。作者僅使用了用戶同意公開文件中的數據。
該論文的第一作者是哥倫比亞大學計算機科學家嚴倪.埃利克(Yaniv Erlich)。埃利克說,他帶領的團隊首先必須確保數據的準確性,這花了很多時間。但因為這些數據由幾百萬人提供,也不是原始數據,因此,並不像預期的那樣有誤。
研究人員發現,有關父親信息的平均錯誤率是2%,有關母親信息的平均錯誤率是0.3%,此外,約0.3%的個人資料含有明顯錯誤,比如一個人的親生父母超過2個。為了糾正這些錯誤,團隊開發了「修剪」家族樹的計算機程序,刪除了無效的姻親關係。他們生成了530萬個沒有關聯的家譜——其中最大的一個包含1300萬人。
在系統中,研究人員比較了從1985年到2000年間,位於美國東北部與加拿大接壤的佛蒙特州(Vermont)8萬人的死亡記錄。他們發現,家譜並不能顯示出貧富的差異。但是,這些人更可能是白人。其原因可能是資料庫裡的多數人來自歐洲和美國。就美國而言,多數人是高加索人的後裔。埃利克補充說,他希望更多的非白人也能把其家譜信息上傳到該網站。白人有擺家譜的傳統,有些家庭的牆上掛著家族樹,很多小學生做過關於家譜的作業。
這個由龐大資料庫構建的巨型家族樹,追溯到幾百年前,它解答了很多疑問。
例如,在分析了家譜裡的遷徙模式後,研究人員發現:女性離開家鄉人數比男性多,但當男性遷徙時,他們往往搬到更加遙遠的地方。這種模式一直在延續,300年前是這樣,300年後的今天依然如此。
此外,數據還被用來確定人們是什麼時代停止近親結婚的。研究人員發現,在1750年以前,大多數人的結婚對象在6英里之內。1870年工業革命後,這一距離迅速增加到約60英里。在1650年到1850年之間,已婚夫婦的平均遺傳關係約為4代表親。1850年以後,約為7代表親。
研究人員在數據中發現了一些奇怪的現象。在1800年和1850年之間,結婚對象之間的距離增加了一倍——這可能是因為在歐洲和美國的大部分地區,隨著交通工具的發達,鐵路旅行成為可能。在這50年時間裏,人們可以走得更遠以尋找配偶。然而,距離增加了,婚姻伴侶之間的平均遺傳關係反而更近了。埃利克說:「那時家庭變得分散,人們卻開始搭著火車去和他們的第幾代表親結婚。」
作者還討論了長壽基因的承傳,根據他們的數據分析,以前的研究高估了壽命的遺傳性,應降低通過基因子據預測壽命的期望值。
埃利克表示,這些研究只是目前從這個巨大的家譜中所能認知的皮毛,還有更多的問題有待解析。不過,這項發表在《科學》雜誌上的論文卻印證了中國的一句老話:我們都是炎帝黃帝的子孫。