基因組
| 遗传学 |
|---|
重要概念 |
|
|
历史及分支 |
|
研究 |
|
|
個人化醫療 |
個人化醫療 |
|
由46条染色体组成一个人类男性的二倍体基因组的图像。 (在线粒体染色体不显示。)
在生物学中,一个生物体的基因组是指包含在该生物的DNA(部分病毒是RNA)中的全部遗传信息,又稱基因體(genome)。基因组包括基因和非編碼DNA。1920年,德国汉堡大学植物学教授汉斯·温克勒(Hans Winkler)首次使用基因组这一名词。
更精确地讲,一个生物体的基因组是指一套染色体中的完整的DNA序列。例如,生物个体体细胞中的二倍体由两套染色体组成,其中一套DNA序列就是一个基因组。基因组一词可以特指整套核DNA(例如,核基因组),也可以用于包含自己DNA序列的细胞器基因组,如粒线体基因组或叶绿体基因组。当人们说一个有性生殖物种的基因组正在测序时,通常是指测定一套常染色体和两种性染色体的序列,这样来代表可能的两种性别。即使在只有一种性别的物种中,“一套基因组序列”可能也综合了来自不同个体的染色体。通常使用中,“遗传组成”一词有时在交流中即指某特定个体或物种的基因组。对相关物种全部基因组性质的研究通常被称为基因组学,该学科与遗传学不同,后者一般研究单个或一组基因的性质。
目录
1 基因组的种类
2 基因组和遗传变异
3 测序与作图
4 基因组构成
4.1 基因組大小
4.2 非重复DNA
4.3 重复DNA
4.3.1 串联重复
4.3.2 散在重复
5 基因組演化
6 基因組的次領域
7 参考文献
7.1 引用
7.2 书目
8 外部連結
9 參見
基因组的种类
大部分生物体比病毒复杂,除了染色体,有时或总是包含额外的遗传物质。某些情况下,比如对致病微生物的基因组测序,这里基因组就包含了在质粒中的遗传物质。在这种情况下基因组就包含了所有的基因和非编码DNA。
而对于像人类这样的脊椎动物,基因组通常指的只是染色体DNA。因此,尽管人类线粒体里包含了基因,但这些基因并不作为基因组的一部分。事实上,有时候称线粒体拥有自己的基因组,通常叫做线粒体基因组。
基因组和遗传变异
必须指出仅有一个基因组并不能获得物种的遗传差异或遗传多态性。例如,原则上讲,人类基因组序列可以仅仅从某个个体的一个细胞的一半DNA中测定。要知道是哪些DNA变异导致特定性状或疾病则需要进行个体间比较。这一点也解释了通常使用“基因组”(与通常使用“基因”相提并论)不仅仅指某特定DNA序列,也指某物种整个家族的序列。
尽管这个概念看上去与直觉相抵触,其实这与说没有任何一个特定的形状是印度豹的形状是相同的概念。印度豹形状各异,它们的基因组序列也并不相同。然而各动物个体和它们的序列都有共性,因此可以从单一实例中来了解印度豹和“豹性”。
测序与作图
在1976年,比利时根特大学的瓦尔特·菲尔斯第一个完成了一个基因组的完整测序——RNA病毒噬菌体MS2的基因组。次年,弗雷德里克·桑格完成了Φ-X174噬菌体的测序,这是第一个完成测序的DNA基因组,全基因组只有5386个碱基对[1]。在20世纪90年代中期,生物三域的第一个全基因组测序在很短一段时间内陆续完成。第一个被测序的细菌基因组是流感嗜血杆菌(Haemophilus influenzae),由The Institute for Genomic Research团队于1995年完成。几个月以后,第一个真核生物基因组的测序也由欧洲科学家完成了。它是一种带有16个染色体的芽殖酵母——酿酒酵母(Saccharomyces cerevisiae),其测序工作开始于80年代中期。很快地在1996年,第一个古菌基因组——詹氏甲烷球菌(Methanococcus jannaschii)基因组也被测序,同样由The Institute for Genomic Research团队完成。
新技术的发展使得测序成本快速地下降,测序耗时也显著减少,完成全基因组测序的生物越来越多。其他基因组计划包括小鼠,水稻,拟南芥,河豚和细菌(如大肠杆菌)等皆被完成测序。1990年启动的人类基因组计划旨在对人类基因组绘制物理图谱并测序[2][3]。
新的测序技术,如大规模并行测序也开辟了个人基因组测序作为一种诊断工具的前景。其中标志性的一步是2007年完成了对DNA双螺旋结构的发现者之一詹姆斯·杜威·沃森个人的基因组的测序[4]。而测序费用也一直在降低,可能最终测序单个基因组只需要几千美元。
提交到GenBank中的各物种的基因组大小与已注释的蛋白质总数对比的双对数坐标图,绿色:病毒基因组; 蓝色:细菌基因组, 紫色 :古菌基因组; 橙色:真核基因组
基因组构成
“基因组构成”(Genome composition)用于描述成一个单倍体基因组的组成,包括基因組大小、非重复DNA和重复DNA所占的比重等。通过不同基因组间的比较研究,科学家可以更好地理解给定基因组的进化史。
当讨论基因组的构成时,首先要区别的是原核基因组还是真核基因组,两者在基因组组成上有很大的不同。在原核生物中,基因组的大部分(85-90%)都是非重复DNA,这意味着其中主要的都是编码DNA,非编码区域只占了一小部分[5]。与之相反,真核生物的蛋白质编码基因有着外显子-内含子的结构特点,而且存在大量丰富的重复DNA序列。特别是哺乳动物和植物中,基因组的大部分都由重复DNA构成[6]。
大部分的生物体常常携带除位于染色体之外的遗传物质,在有的情况下,例如对致病微生物的基因组测序,“基因组”就包括了位于质粒的额外的遗传物质。在这种情况下,“基因组”描述的是所有基因以及有潜在功能的非编码DNA。
在真核生物例如植物、原生生物和动物中,基因组含有特指位于染色体DNA上的信息的意思。所以,即使这些生物含有叶绿体或者线粒体,它们有自己的DNA,但这些DNA所携带的信息不被包括在基因组中,事实上,有时我们说线粒体含有自己的基因组,即“线粒体基因组”,而在叶绿体中的被称为“叶绿体基因组”。
基因組大小
基因組大小是指一种生物单倍体基因组的全部DNA碱基对数。在原核生物和低等真核生物中,基因组大小与生物形态的复杂性基本呈正相关关系;但是在软体动物以及其它更高等的真核生物中,这种相关性就不存在了[6][7]。这一现象可能是由基因组中的重复DNA引起。
鉴于基因组如此复杂,一种研究策略就是使生物体在理论上可以生存的条件下减少基因组中的基因数目直至最小。对于单细胞生物和多细胞生物最小基因组的实验研究已经开展(见发育生物学),这些工作在体内(in vivo)和体外(in silico)进行[8][9]。
这里列出了一些重要的或有代表性的基因组的大小,更多基因组大小的请见#參見:
| 类型 | 生物 | 学名 | 基因組大小(鹼基對) | 所含基因数目 | 注 |
|---|---|---|---|---|---|
| 病毒 | 猪圆环病毒I型 | 1,759 | 已知最小的基因组[10] | ||
| 病毒 | 猿猴病毒SV40 | 5,224 | [11] | ||
| 病毒 | 噬菌體Φ-X174 | 5,386 | 最早完成測序的DNA基因組[12] | ||
| 病毒 | 人類免疫缺陷病毒HIV | 9,749 | [13] | ||
| 病毒 | 噬菌體λ | 48,502 | 常作为重组DNA的克隆载体。[14][15][16] | ||
| 细菌 | 大腸桿菌 | Escherichia coli | 4.6Mb | 4288 | [17] |
| 蓝细菌 | 原绿球藻 | Prochlorococcus | 1.7Mb | 1884 | 已知最小的蓝细菌基因组[18][19] |
| 變形蟲 | 無恒變形蟲 | Amoeba dubia | 670Gb | 已知的最大基因組[20](但有争议)[21] | |
| 植物 | 贝母属一種 | Fritillary assyriaca | 130Gb | ||
| 真菌 | 釀酒酵母 | Saccharomyces cerevisiae | 12.1Mb | 6294 | 第一个测序的真核生物基因组,完成于1996年[22] |
| 線蟲 | 咖啡短体线虫 | Pratylenchus coffeae | 20Mb | 已知最小的动物基因组[23] | |
| 線蟲 | 秀麗隱桿線蟲 | Caenorhabditis elegans | 100.3Mb | 19000 | 第一个测序的多细胞生物基因组,完成于1998年12月[24] |
| 昆蟲 | 黑腹果蠅 | Drosophila melanogaster | 175Mb | 13600 | [25] |
| 哺乳動物 | 小家鼠 | Mus musculus | 2.7Gb | 20210 | [26] |
| 哺乳動物 | 人 | Homo sapiens | 3.2Gb | 20000 | [27][28] |
| 鱼类 | 金娃娃(一种河豚) | Tetraodon nigroviridis | 385Mb | 已知最小的脊椎动物基因组约为340Mb[29][30]-385Mb[31] | |
| 鱼类 | 石花肺鱼 | Protopterus aethiopicus | 130Gb | 已知最大的脊椎动物基因组 |
非重复DNA
非重复DNA的总长除以基因组大小即为非重复DNA比重。蛋白质编码基因和非编码RNA基因一般都是非重复的DNA[32]。而更大的基因组并不意味着更多的基因,随着高等真核生物的基因组大小的增加,非重复DNA的比重相应减少[6]。
不同生物中的非重复DNA的比重会有很大不同,一些原核生物如大腸桿菌几乎只有非重复DNA,低等真核生物比如秀麗隱桿線蟲和黑腹果蝇的非重复DNA仍比重复DNA多[6][33],而更高等的真核生物的重复DNA比重超过了非重复DNA。在一些植物和两栖动物中,非重复DNA的比重不超过20%,成了基因组中的少数组分[6]。
重复DNA
基因组中的重复DNA可大致分为两类:串联重复和散在重复[34]。
串联重复
串联重复常由复制时的滑移、不等位的交换和基因转换引起[35],微衛星和卫星DNA是基因组中的串联重复序列[36]虽然串联重复序列在基因组中起很大作用,但是在哺乳动物基因组中却表现为散在重复序列。
散在重复
散在重复通常来自转座子的反转录转座,但也包括蛋白质编码的基因家族与假基因。转座子是一类DNA序列,它们能够在基因组中通过转录或逆转录,在内切酶的作用下,在其他基因座上出现[5][37],被认为是高等真核生物的进化驱动力之一[38]。转座子可分为两大类:I型转座子(反转录转座子)和II型转座子(DNA转座子)[37]。
基因組演化
基因組不仅仅是是生物基因的集合,对其研究和比较能获得生物演化信息的更多细节。一些基因组性质如“染色体数”(核型)、基因組大小、基因顺序、密码子偏好性与GC含量能反映出现存生物的许多基因組演化信息。
基因复制在基因组形成过程中起重要作用。真核生物的基因组存在大量重复序列。按照不同重复频率,可分为高度重复序列、中度重复序列、低度重复序列。这些重复序列是生物多样性的基础。
基因水平轉移常常用来解释亲缘关系很远的生物之间为什么会有很相近的基因。基因水平轉移在微生物之间比较常见。另外,真核生物的核基因组中也有些从叶绿体和线粒体转移来的基因。
基因組的次領域
- 人类基因组
- 线粒体基因组
- 真核基因组
参考文献
引用
^ [1]
^ What's a Genome?. Genomenewsnetwork.org. 2003-01-15 [27 January 2011].
^ NCBI_user_services. Mapping Factsheet. 2004-03-29 [27 January 2011].
^ Wade, Nicholas. Genome of DNA Pioneer Is Deciphered. The New York Times. 2007-05-31 [2 April 2010].
^ 5.05.1 Koonin, Eugene V.; Wolf, Yuri I. Constraints and plasticity in genome and molecular-phenome evolution. Nature Reviews Genetics. 2010, 11 (7): 487–498. PMC 3273317. PMID 20548290. doi:10.1038/nrg2810.
^ 6.06.16.26.36.4 Lewin, Benjamin. Genes VIII 8th. Upper Saddle River, NJ: Pearson/Prentice Hall. 2004. ISBN 0-13-143981-2.
^ Gregory TR, Nicol JA, Tamm H, Kullman B, Kullman K, Leitch IJ, Murray BG, Kapraun DF, Greilhuber J, Bennett MD. Eukaryotic genome size databases. Nucleic Acids Research. 3 January 2007, 35 (Database): D332–D338. doi:10.1093/nar/gkl828.
^ Glass JI, Assad-Garcia N, Alperovich N, Yooseph S, Lewis MR, Maruf M, Hutchison CA 3rd, Smith HO, Venter JC; Assad-Garcia; Alperovich; Yooseph; Lewis; Maruf; Hutchison; Smith; Venter. Essential genes of a minimal bacterium. Proc Natl Acad Sci USA. 2006, 103 (2): 425–30. Bibcode:2006PNAS..103..425G. PMC 1324956. PMID 16407165. doi:10.1073/pnas.0510013103. 引文格式1维护:显示-作者 (link)
^ Forster AC, Church GM. Towards synthesis of a minimal cell. Mol Syst Biol. 2006, 2 (1): 45. PMC 1681520. PMID 16924266. doi:10.1038/msb4100090.
^ Mankertz P. Molecular Biology of Porcine Circoviruses. Animal Viruses: Molecular Biology. Caister Academic Press. 2008. ISBN 978-1-904455-22-6.
^ Fiers, W.; Contreras, R.; Haegeman, G.; Rogiers, R.; Van De Voorde, A.; Van Heuverswyn, H.; Van Herreweghe, J.; Volckaert, G.; Ysebaert, M. Complete nucleotide sequence of SV40 DNA. Nature. 1978, 273 (5658): 113–120. Bibcode:1978Natur.273..113F. PMID 205802. doi:10.1038/273113a0.
^ Sanger, F.; Air, G.M.; Barrell, B.G.; Brown, N.L.; Coulson, A.R.; Fiddes, J.C.; Hutchison, C.A.; Slocombe, P. M.; Smith, M. Nucleotide sequence of bacteriophage phi X174 DNA. Nature. 1977, 265 (5596): 687–695. Bibcode:1977Natur.265..687S. PMID 870828. doi:10.1038/265687a0. 引文格式1维护:显示-作者 (link)
^ Virology - Human Immunodeficiency Virus And Aids, Structure: The Genome And Proteins Of HIV. Pathmicro.med.sc.edu. 2010-07-01 [27 January 2011].
^ Thomason, Lynn; Court, Donald L.; Bubunenko, Mikail; Costantino, Nina; Wilson, Helen; Datta, Simanti; Oppenheim, Amos. Recombineering: genetic engineering in bacteria using homologous recombination. Current Protocols in Molecular Biology. 2007,. Chapter 1: Unit 1.16. ISBN 0471142727. PMID 18265390. doi:10.1002/0471142727.mb0116s78.
^ Court, D. L.; Oppenheim, A. B.; Adhya, S. L. A new look at bacteriophage lambda genetic networks. Journal of Bacteriology. 2007, 189 (2): 298–304. PMC 1797383. PMID 17085553. doi:10.1128/JB.01215-06.
^ Sanger, F.; Coulson, A.R.; Hong, G.F.; Hill, D.F.; Petersen, G.B. Nucleotide sequence of bacteriophage lambda DNA. Journal of Molecular Biology. 1982, 162 (4): 729–73. PMID 6221115. doi:10.1016/0022-2836(82)90546-0.
^ Frederick R. Blattner, Guy Plunkett III; 等. The Complete Genome Sequence of Escherichia coli K-12. Science. 1997, 277 (5331): 1453–1462. PMID 9278503. doi:10.1126/science.277.5331.1453. 引文格式1维护:显式使用等标签 (link)
^
Rocap, G.; Larimer, F. W.; Lamerdin, J.; Malfatti, S.; Chain, P.; Ahlgren, N. A.; Arellano, A.; Coleman, M.; Hauser, L.; Hess, W. R.; Johnson, Z. I.; Land, M.; Lindell, D.; Post, A. F.; Regala, W.; Shah, M.; Shaw, S. L.; Steglich, C.; Sullivan, M. B.; Ting, C. S.; Tolonen, A.; Webb, E. A.; Zinser, E. R.; Chisholm, S. W. Genome divergence in two Prochlorococcus ecotypes reflects oceanic niche differentiation. Nature. 2003, 424 (6952): 1042–7. Bibcode:2003Natur.424.1042R. PMID 12917642. doi:10.1038/nature01947.
^
Dufresne, A.; Salanoubat, M.; Partensky, F.; Artiguenave, F.; Axmann, I. M.; Barbe, V.; Duprat, S.; Galperin, M. Y.; Koonin, E. V.; Le Gall, F.; Makarova, K. S.; Ostrowski, M.; Oztas, S.; Robert, C.; Rogozin, I. B.; Scanlan, D. J.; De Marsac, N. T.; Weissenbach, J.; Wincker, P.; Wolf, Y. I.; Hess, W. R. Genome sequence of the cyanobacterium Prochlorococcus marinus SS120, a nearly minimal oxyphototrophic genome. Proceedings of the National Academy of Sciences. 2003, 100 (17): 10020–5. Bibcode:2003PNAS..10010020D. PMC 187748. PMID 12917486. doi:10.1073/pnas.1733211100.
^ Parfrey LW, Lahr DJG, Katz LA. The Dynamic Nature of Eukaryotic Genomes. Molecular Biology and Evolution. 2008, 25 (4): 787–94. PMC 2933061. PMID 18258610. doi:10.1093/molbev/msn032.
^ ScienceShot: Biggest Genome Ever 互联网档案馆的存檔,存档日期2010-10-11., comments: "The measurement for Amoeba dubia and other protozoa which have been reported to have very large genomes were made in the 1960s using a rough biochemical approach which is now considered to be an unreliable method for accurate genome size determinations."
^ Saccharomyces Genome Database. Yeastgenome.org. [27 January 2011].
^ Gregory TR. Animal Genome Size Database. http://www.genomesize.com. 2005. 外部链接存在于|publisher=(帮助)
^ The C. elegans Sequencing Consortium. Genome sequence of the nematode C. elegans: a platform for investigating biology. Science. 1998, 282 (5396): 2012–2018. PMID 9851916. doi:10.1126/science.282.5396.2012.
^ Adams MD, Celniker SE, Holt RA; 等. The genome sequence of Drosophila melanogaster. Science. 2000, 287 (5461): 2185–95 [25 May 2007]. Bibcode:2000Sci...287.2185.. PMID 10731132. doi:10.1126/science.287.5461.2185. 引文格式1维护:显式使用等标签 (link)
^ Church, DM; Goodstadt, L; Hillier, LW; Zody, MC; Goldstein, S; She, X; Bult, CJ; Agarwala, R; Cherry, JL; DiCuccio, M; Hlavina, W; Kapustin, Y; Meric, P; Maglott, D; Birtle, Z; Marques, AC; Graves, T; Zhou, S; Teague, B; Potamousis, K; Churas, C; Place, M; Herschleb, J; Runnheim, R; Forrest, D; Amos-Landgraf, J; Schwartz, DC; Cheng, Z; Lindblad-Toh, K; Eichler, EE; Ponting, CP; Mouse Genome Sequencing, Consortium. Roberts, Richard J, 编. Lineage-specific biology revealed by a finished genome assembly of the mouse. PLoS Biology. May 5, 2009, 7 (5): e1000112. PMC 2680341. PMID 19468303. doi:10.1371/journal.pbio.1000112.
^ Human Genome Project Information Site Has Been Updated. Ornl.gov. 2013-07-23 [6 February 2014].
^ PMID 11181995(PubMed)
本引用來源將會在數十分鐘後自動完成。您可以检查英文对应模板或手動擴充
^ Crollius, HR; Jaillon, O; Dasilva, C; Ozouf-Costaz, C; Fizames, C; Fischer, C; Bouneau, L; Billault, A; Quetier, F; Saurin, W; Bernot, A; Weissenbach, J. Characterization and Repeat Analysis of the Compact Genome of the Freshwater Pufferfish Tetraodon nigroviridis. Genome Research. 2000, 10 (7): 939–949. PMC 310905. PMID 10899143. doi:10.1101/gr.10.7.939.
^ Olivier Jaillon; 等. Genome duplication in the teleost fish Tetraodon nigroviridis reveals the early vertebrate proto-karyotype. Nature. 21 October 2004, 431 (7011): 946–957. Bibcode:2004Natur.431..946J. PMID 15496914. doi:10.1038/nature03025. 引文格式1维护:显式使用等标签 (link)
^ Tetraodon Project Information. [17 October 2012]. (原始内容存档于2012年9月26日).
^ Britten, RJ; Davidson, EH. Repetitive and non-repetitive DNA sequences and a speculation on the origins of evolutionary novelty. The Quarterly review of biology. June 1971, 46 (2): 111–38. PMID 5160087. doi:10.1086/406830.
^ Naclerio, G; Cangiano, G, Coulson, A, Levitt, A, Ruvolo, V, La Volpe, A. Molecular and genomic organization of clusters of repetitive DNA sequences in Caenorhabditis elegans. Journal of Molecular Biology. 1992-07-05, 226 (1): 159–68. PMID 1619649. doi:10.1016/0022-2836(92)90131-3.
^ Stojanovic, edited by Nikola. Computational genomics : current methods. Wymondham: Horizon Bioscience. 2007. ISBN 1-904933-30-0.
^ Li, YC; Korol, AB, Fahima, T, Beiles, A, Nevo, E. Microsatellites: genomic distribution, putative functions and mutational mechanisms: a review. Molecular ecology. December 2002, 11 (12): 2453–65. PMID 12453231. doi:10.1046/j.1365-294X.2002.01643.x.
^ Schlötterer, C. Microsatellite analysis indicates genetic differentiation of the neo-sex chromosomes in Drosophila americana americana. Heredity. December 2000, 85 (Pt 6): 610–6. PMID 11240628. doi:10.1046/j.1365-2540.2000.00797.x.
^ 37.037.1 Wessler, S. R. Eukaryotic Transposable Elements and Genome Evolution Special Feature: Transposable elements and the evolution of eukaryotic genomes. Proceedings of the National Academy of Sciences. 13 November 2006, 103 (47): 17600–17601. Bibcode:2006PNAS..10317600W. doi:10.1073/pnas.0607612103.
^ Kazazian, H. H. Mobile Elements: Drivers of Genome Evolution. Science. 12 March 2004, 303 (5664): 1626–1632. Bibcode:2004Sci...303.1626K. PMID 15016989. doi:10.1126/science.1089670.
书目
- Benfey, P and Protopapas, AD (2004). Essentials of Genomics. Prentice Hall.
- Brown, TA (2002). Genomes 2. Bios Scientific Publishers.
- Gibson, G and Muse, SV (2004). A Primer of Genome Science (Second Edition). Sinauer Assoc.
- Gregory, TR (ed.) (2005). The Evolution of the Genome. Elsevier.
- Reece, RJ (2004). Analysis of Genes and Genomes. John Wiley & Sons.
- Saccone, C and Pesole, G (2003). Handbook of Comparative Genomics. John Wiley & Sons.
外部連結
(英文)Animal genome size database
- Plant genome size database
- Genomes OnLine Database
- The Genome News Network
參見
- 發育生物學
- 演化
- 分子系統學
- 分子演化
- 基因家族
- 基因
- 已測序的生物
- 人类基因组计划
- 全基因组测序
- 遗传学
- 已测序真核生物基因组列表
- 已测序古菌基因组列表
- 已测序细菌基因组列表
- 已测序质体基因组列表
| ||||||||||||||||||||||||
|

Comments
Post a Comment