基因組的分類
病毒基因組
病毒基因組可以由RNA或DNA組成。 RNA病毒的基因組包含單鏈或雙鏈RNA,也包含一種或多種單獨(dú)的RNA分子。 DNA病毒基因組可以是單鏈或雙鏈DNA。大多數(shù)DNA病毒基因組由單個線性DNA分子組成,但有些由DNA病毒基因組由環(huán)狀DNA分子組成? 。
原核基因組
原核生物和真核生物基因組由DNA組成。古細(xì)菌有一個環(huán)狀染色體組成的DNA基因組 。大多數(shù)細(xì)菌也有一個環(huán)狀染色體,然而,一些細(xì)菌物種含有線性染色體或多個染色體。大多數(shù)原核生物基因組中不含有重復(fù)DNA 。一些共生細(xì)菌基因組種含有高比例的假基因,例如Serratia symbiotica基因組種只有約40%的DNA編碼蛋白質(zhì) 。 一些細(xì)菌基因組還含有輔助遺傳物質(zhì),它們在質(zhì)粒中存在。為此,基因組這個詞不應(yīng)該用作染色體的同義詞。
真核基因組
真核基因組由一條或多條線性DNA染色體組成。組成真核生物基因組的染色體的數(shù)量差異很大,杰克跳線螞蟻和無性線蟲的基因組每個只有一對染色體 ,而蕨類物種有720對染色體。人類細(xì)胞具有22對常染色體和1對性染色體。
除了細(xì)胞核中的染色體外,真核生物的細(xì)胞器如葉綠體和線粒體都有自己的DNA和染色體,因此,也有“線粒體基因組”和“質(zhì)體基因組”的說法。與它們來源的細(xì)菌一樣,線粒體和葉綠體都含有環(huán)狀染色體。
與原核生物不同,真核生物具有蛋白質(zhì)編碼基因的外顯子?-內(nèi)含子組織和一定數(shù)量的重復(fù)DNA。哺乳動物和植物基因組的大多數(shù)由重復(fù)DNA組成。
編碼序列
攜帶合成蛋白質(zhì)遺傳信息的DNA序列是編碼序列。不同物種中編碼序列占基因組的比例差異很大。較大的基因組不一定含有更多的基因,并且復(fù)雜真核生物中非重復(fù)DNA的比例隨著基因組大小的增加而減少 。簡單的真核生物如秀麗隱桿線蟲和果蠅中,編碼DNA比例高于重復(fù)DNA? ,而更復(fù)雜真核生物基因組則往往主要由重復(fù)DNA組成。一些植物和兩棲動物基因組中重復(fù)DNA的比例超過80% 。同樣,人類基因組中只有2%編碼DNA。
非編碼序列
非編碼序列包括內(nèi)含子,非編碼RNA的序列,調(diào)控DNA和重復(fù)DNA。人類基因組的98%屬于非編碼序列。基因組的重復(fù)DNA有串聯(lián)重復(fù)序列和分散重復(fù)序列。
轉(zhuǎn)座子
轉(zhuǎn)座子(TEs)是具有特定結(jié)構(gòu)的DNA序列,它們可以在基因組中跳動,位置不固定? 。I類TE通過復(fù)制和粘貼機(jī)制跳動位置,II類TE從基因組中切除并插入新位置。
TE的運(yùn)動是真核生物基因組進(jìn)化的驅(qū)動力,因為它們的插入可以破壞基因功能,TE之間的同源重組可以導(dǎo)致基因的復(fù)制,TE還可以將外顯子和調(diào)節(jié)序列改組到新的位置 。
反轉(zhuǎn)錄轉(zhuǎn)座子
反轉(zhuǎn)錄轉(zhuǎn)座子可以轉(zhuǎn)錄成RNA,然后在另一個位點(diǎn)被復(fù)制到基因組中 。反轉(zhuǎn)錄轉(zhuǎn)座子可分為長末端重復(fù)序列(LTR)和非長終端重復(fù)序列(非LTR)兩大類反轉(zhuǎn)錄轉(zhuǎn)座子 。