簡易檢索 / 詳目顯示

研究生: 葉瓊玉
Yeh, Chiung-Yuh
論文名稱: 基因組k-mers分佈的模型之研究
A Modle for the Distributions of k-mers in Genomes
指導教授: 楊緒濃
Nyeo, Su-Long
學位類別: 碩士
Master
系所名稱: 理學院 - 物理學系
Department of Physics
論文出版年: 2004
畢業學年度: 92
語文別: 中文
論文頁數: 60
中文關鍵詞: 基因組Erlang 機率分佈
外文關鍵詞: genome, Erlang probability
相關次數: 點閱:134下載:2
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  •   微生物基因組已經被證明是很大的系統裡,存在著小系統的統計特性。例如:微生物基因組的成長是隨著片段複製來進行。因此,本論文比較人類基因組和微生物基因組在統計上的特性有何不同。發現脊索門的鹼基分佈圖(2-mers~8-mers)擁有明顯的雙峰特性(除了斑馬魚較不明顯之外),其餘樣本分佈圖均為單峰特性,藉由此發現來探討雙峰的演化機制。另外,我們發現到只要是同一個生物,它們內部的各個染色體鹼基分佈圖都很像,這可能跟它們都是從同一個環境演化有關。在本文裡,也分析了人類基因組的一些特性,譬如2k-mers的information分佈會受到CG的影響;人類大部分的末端染色體所含的(C+G)比例較高,可能是跟穩定末端結構有關。

    none

    1. 前言...........................................1 1.1 鹼基的結構.................................1 1.2 基因(基因組)的演化.........................2 1.3 突變的種類.................................3 2. k-mers圖形分佈.................................4 2.1 平均值及標準差.............................4 2.2 k-mers圖形分佈.............................6 3. 圖形比較......................................10 3.1 hs_chr20,hs_chr21,hs_chr22內部(C+G的比較).10 3.2 人類染色體的比較..........................12 3.3 hs_chr21跟random sequence的比較...........13 3.4 hs_chr21第一峰分佈的探討..................15 3.5 hs_chr21內部結構的探討....................18 3.6 各種生物演化比較..........................20 4. Information...................................25 4.1 Entropy...................................25 4.2 Information...............................26 4.3 影響Information分佈的模擬.................27 5. Erlang機率分佈方程式..........................30 6. 模型..........................................32 6.1 一般的基因組理有效得隨機序列長度..........32 6.2 CG次數上的限制............................35 6.3 隨機選取的片段複製長度以及單點突變........36 6.4 模型流程..................................36 7. 結論..........................................41 參考文獻.........................................43 A 人類染色體末端序列k=2的組成比例圖.............45 B 程式碼........................................56

    [1] A. Meyer, Duplication,duplication, Nature 421,31 (2003).
    [2] A. Sidow, Gen(om)e duplications in the evolution of early vertebrates, Curr. Opin. Genet. Dev. 6, 715 (1996).
    [3] D. Holste, I. Grosse, and H. Herzel, Statistical analysis of the DNA sequence of human chromosome 22, Physical Review E 64, 041917 (2001).
    [4] D. Holste, I. Grosse, Repeats and correlations in human DNA sequences, Physical Review E 67, 061913 (2003).
    [5] F. Lyko, DNA methylation learns to fly, TRENDS in Genetics 17, 169 (2001).
    [6] J.K. Percus, Mathematics of Genome Analysis, 78 (2002).
    [7] L.C. Hsieh, L.F. Luo and H.C. Lee, Evidence for Growth of Microbial Genomes by Short Segmental Duplications, IEEE Proc. Comp. Sys. Bioinformatics, 474-475(2003).
    [8] L.C. Hsieh , L. Luo , F. Ji, and H.C. Lee, Minimal model for Genome Evolution and Growth, Physical Review Letters 90, 018101 (2003).
    [9] M. Lynch and J.S. Conery, The Evolutionary Fate and Consequences of Duplicate Genes, Science 290, 1151 (2000).
    [10] T.D. Schneider, Information Theory Primer, website (2000): http://www.lecb.ncifcrf.gov/~toms/paper/primer/
    [11] T.Y. Chen, L.C. Hsieh, C.H. Chang, L.F. Luo, F.M. Jia and H.C. Lee, Universal lengths in complete microbial genomes, Mod. Phys. Lett. (2004, to appear).
    [12] 沈珝琲、方福德主編, 真核基因表達調控, 九州圖書文物有限公司, 台北市, 第一版:1999
    [13] 陳嘉芬編著, 現代遺傳學, 藝軒圖書出版社, 台北市, 1993
    [14] 道格拉斯‧鮑莫, 史前地球圖解百科, 協和國際多媒體股份有限公司, 台北縣, 2000
    [15] 染色體序列來源
    老鼠、E. coli.、T. pal、fruit fly、yeast、A. thaliana的染色體序列取自NCBI網站http://www.ncbi.nlm.nih.gov/
    人類染色體取自NCBI 2003/4 版本
    雞的染色體取自 http://genome.wustl.edu
    zebrafish染色體取自 http://www.sanger.ac.uk/DataSearch/databases.shtml

    下載圖示 校內:立即公開
    校外:2004-07-27公開
    QR CODE