我院完成牛泛基因組和基因組結構變異數據庫構建 對牛遺傳多樣性和選擇適應性提出新見解-動物科學技術學院、動物醫學院

科研進展

當前位置: 首 頁  >  科學研究  >  科研進展

我院完成牛泛基因組和基因組結構變異數據庫構建 對牛遺傳多樣性和選擇適應性提出新見解

發布時間:2022-08-26  作者:  瀏覽次數:

(通訊員 周揚)近日,我院楊利國教授團隊的周揚副教授與(yu) 美國農(nong) 業(ye) 部George E. Liu團隊合作在Genome Research雜誌發表題為(wei) “Assembly of a pangenome for global cattle reveals missing sequences and novel structural variations, providing new insights into their diversity and evolutionary history”的論文,並被選為(wei) 雜誌的封麵文章。研究構建了目前世界規模最大的牛泛基因組和基因組結構變異數據庫,並對牛的遺傳(chuan) 多樣性和選擇適應性提出新見解。

該文章鑒定出牛參考基因組之外的83Mb新序列,率先從(cong) 群體(ti) 水平構建了牛泛基因組;同時開發基因組結構變異(Structural Variation, SV)分析流程,首次從(cong) SV的角度解析了世界牛品種的血統關(guan) 係,從(cong) 適應性等多角度全方位檢測了不同分類群體(ti) 的受選擇位點和候選基因,填補了SV作為(wei) 牛育種材料的不足,並解析SV潛在形成機理促進對牛基因組演化的深入理解。

參考基因組序列是保障一切與(yu) 基因相關(guan) 研究順利實施的必要基礎。2003年長達13年之久的人類參考基因組計劃(85%完整度)為(wei) 人類解析生命活動開啟了新篇章,被譽為(wei) 與(yu) 阿波羅登月計劃和曼哈頓計劃同等重要的大事件。牛參考基因組於(yu) 2009年發布,在之後的13年內(nei) 不斷對其進行填補和完善,並相繼公布了近10個(ge) 牛品種的參考基因組。但每個(ge) 參考基因組幾乎隻包含單個(ge) 個(ge) 體(ti) 基因組序列,忽略了個(ge) 體(ti) 之間序列的差異性,導致在科學研究過程中相當一部分基因組序列及其功能處於(yu) 未知狀態;同時已知基因組序列在不同個(ge) 體(ti) 之間存在SV,導致不同個(ge) 體(ti) 間基因組序列構成非常複雜,精準檢測和分型一直是阻止其後續解析和應用的障礙。

圖片1

圖2 泛基因組新序列在已知參考基因組上的分布及影響

為(wei) 解決(jue) 以上問題,該文章通過開發新的基因組分析流程,對來自世界57個(ge) 品種898頭牛的基因組序列進行組裝和SV檢測;發現了83Mb的牛基因組未知序列,相當於(yu) 目前參考基因組序列總長度的3.1%,並且從(cong) 中鑒定出大量未知外顯子序列,最後綜合三種策略成功將1007條contig放置在現有參考基因組上,這些序列可能通過外顯子破壞、外顯子添加等方式影響了279個(ge) 基因的序列結構。

圖片2

圖3 利用SV(缺失型變異)對世界牛品種展開精準群體(ti) 學分析

同時,利用多款SV檢測軟件重新開發新的分析流程,在準確檢測SV的基礎上實現了對缺失型變異的邊界精準鑒定和二倍體(ti) 分型;利用此流程,共檢測到了330萬(wan) 個(ge) 缺失變異、12萬(wan) 個(ge) 倒置、18萬(wan) 個(ge) 重複區域,通過對檢測結果的模擬評估,證明本論文所檢測的SV在牛上已經趨於(yu) 飽和,具有很好的群體(ti) 代表性。以此為(wei) 基礎,完成了對SV對牛基因組27種不同基因組功能元件和QTL的影響研究,構建了受SV影響的基因功能元件數據庫。進一步利用缺失型變異對世界牛品種的血統來源進行分析,實現基於(yu) SV水平的世界牛品種血統的精準鑒定,為(wei) 解析世界牛品種血統組成提供了新方法,打破了長期使用SNP進行遺傳(chuan) 學分析的局限。

進一步利用比較基因組學等手段對牛的種屬差異、地域適應性、商業(ye) 化用途等角度全麵解析獲得大量與(yu) 經濟性狀相關(guan) 的變異位點,並深入解析了位於(yu) APPL2第一外顯子區域缺失變異與(yu) 不同地域牛選擇適應性之間的關(guan) 係;發現該缺失變異是由Bov-tA1轉座子構成,並形成了APPL2基因的啟動子和增強子部分,該序列攜帶了APPL2相關(guan) 功能的轉錄因子結合位點,通過影響基因的表達,進而調控與(yu) 免疫反應、味覺功能、細胞增殖、葡萄糖代謝相關(guan) 的功能。

我校周揚副教授和其碩士研究生楊旅同學為(wei) 該論文共同第一作者,George E. Liu、楊利國教授和周揚副教授為(wei) 共同通訊作者。該研究受到國家自然科學基金、湖北省自然科學基金、美國AFRI和NIFA等項目的資助。

審核人:楊利國

【英文摘要】A cattle pangenome representation was created based on the genome sequences of 898 cattle representing 57 breeds. The pangenome identified 83 Mb of sequence not found in the cattle reference genome, representing 3.1% novel sequence compared with the 2.71-Gb reference. A catalog of structural variants developed from this cattle population identified 3.3 million deletions, 0.12 million inversions, and 0.18 million duplications. Estimates of breed ancestry and hybridization between cattle breeds using insertion/deletions as markers were similar to those produced by single nucleotide polymorphism–based analysis. Hundreds of deletions were observed to have stratification based on subspecies and breed. For example, an insertion of a Bov-tA1 repeat element was identified in the first intron of the APPL2 gene and correlated with cattle breed geographic distribution. This insertion falls within a segment overlapping predicted enhancer and promoter regions of the gene, and could affect important traits such as immune response, olfactory functions, cell proliferation, and glucose metabolism in muscle. The results indicate that pangenomes are a valuable resource for studying diversity and evolutionary history, and help to delineate how domestication, trait-based breeding, and adaptive introgression have shaped the cattle genome.

雜誌封麵鏈接:

版權所有:Copyright © 星空体育网站入口官网 星空体育网站入口官网

地址:湖北省武漢市洪山區獅子山1號星空体育网站入口官网第四綜合樓

郵箱:myoffice@mail.hzau.jianbinguozi.com

電話:027-87282091

郵政編碼:430070

微信公眾(zhong) 號