-
高同源區(qū)段SNP分型(一)
發(fā)布時間: 2025-09-19 點擊次數(shù): 219次一、核心概念
高同源區(qū)段指的是在不同DNA序列之間,存在異常高程度的序列一致性的基因組區(qū)域。
“同源":這意味著這些序列共享一個共同的祖先序列。高相似性通常是由于在進化過程中,這些區(qū)域受到強烈的功能約束或受限于復(fù)制時間而未分化。
二、高同源區(qū)段的類別
1.亞基因組
在異源多倍體生物中(如小麥、棉花、油菜),它們由兩個或多個不同的祖先物種雜交形成。形成的新基因組中,來自不同祖先的幾套染色體組就被稱為亞基因組。
與高同源區(qū)段的關(guān)系:
這些不同的亞基因組擁有共同的遠(yuǎn)古祖先,因此它們之間在整體上就是同源的。在異源多倍體物種中,不同亞基因組之間的同源染色體上存在大量高同源區(qū)段。例如,小麥A基因組上的某個基因區(qū)段,在B和D基因組的對應(yīng)位置上,幾乎一定能找到序列高度相似的區(qū)段。這些高同源區(qū)段的存在是多倍體物種進行基因表達(dá)調(diào)控(例如部分同源基因的選擇性沉默或表達(dá))和減數(shù)分裂時染色體正確配對的分子基礎(chǔ),同時也為育種提供了豐富的遺傳變異。
2.假基因
假基因是基因組中由于突變(如移碼突變、無義突變、啟動子缺失等)而喪失原有蛋白質(zhì)編碼功能的基因拷貝。
與高同源區(qū)段的關(guān)系:
假基因來源于功能性基因的復(fù)制(通過逆轉(zhuǎn)錄或基因組DNA復(fù)制),因此在誕生之初,它與它的親本功能基因的序列是高度同源的。隨著時間推移,由于不再受到自然選擇的壓力,假基因會積累更多突變,其序列同源性會逐漸降低。但一個“年輕"的假基因與其功能基因之間,依然會是一個典型的高同源區(qū)段。識別假基因的主要方法之一,就是在基因組中發(fā)現(xiàn)與功能基因序列高度相似但含有致命突變(如提前出現(xiàn)終止密碼子)的區(qū)段。
3.重復(fù)序列
指在基因組中重復(fù)出現(xiàn)多次的DNA序列。可分為兩大類:串聯(lián)重復(fù)序列:如衛(wèi)星DNA(著絲粒、端粒區(qū))、微衛(wèi)星DNA。散在重復(fù)序列:如轉(zhuǎn)座子,包括DNA轉(zhuǎn)座子和逆轉(zhuǎn)錄轉(zhuǎn)座子。
與高同源區(qū)段的關(guān)系:
重復(fù)序列的本質(zhì)就是自我復(fù)制和增殖。同一個家族的重復(fù)序列(尤其是轉(zhuǎn)座子)在基因組中有成千上萬個拷貝。這些拷貝之間序列高度相似,構(gòu)成了基因組中常見的高同源區(qū)段。這些高同源區(qū)段是基因組組裝的主要挑戰(zhàn),因為短的測序讀數(shù)無法準(zhǔn)確區(qū)分這些幾乎一模一樣的區(qū)域,容易導(dǎo)致錯誤。同時,它們也是染色體在減數(shù)分裂時發(fā)生非等位同源重組的主要根源,從而導(dǎo)致基因缺失、重復(fù)等結(jié)構(gòu)變異。
4.同源基因
指來源于一個共同祖先基因的那些基因。根據(jù)來源方式可分為:
直系同源基因:源于物種形成事件(如人類和老鼠的胰島素基因),通常保留相同功能。
旁系同源基因:源于基因復(fù)制事件(如人類體內(nèi)的多個珠蛋白基因),功能可能分化。
與高同源區(qū)段的關(guān)系:
同源基因之間必然存在同源區(qū)段,但其相似性“高"與否取決于進化時間和功能約束。近期產(chǎn)生的旁系同源基因(如人類HBA1和HBA2珠蛋白基因):序列一致性高,是典型的高同源區(qū)段。它們可能形成基因簇。古老的同源基因:雖然同源,但經(jīng)過億萬年的變異積累,序列相似性可能已經(jīng)不高,主要在關(guān)鍵功能域上保留較高相似性。
測序過程中,高相似性的序列容易引發(fā)測序錯誤和數(shù)據(jù)分析的困難。那如何解決這問題呢?
- 下一篇:牛源病原體的危害和檢測
- 上一篇:DNA甲基化年齡檢測(三)



產(chǎn)品分類

