| 研究生: |
李佩芳 Lee, Pei-Hong |
|---|---|
| 論文名稱: |
次世代基因定序(NGS)之基因序列的鹼基判定 Base Calling of Read Sequencing for Next Generation Sequencing (NGS) |
| 指導教授: |
詹世煌
Chan, Shih-Huang |
| 學位類別: |
碩士 Master |
| 系所名稱: |
管理學院 - 統計學系 Department of Statistics |
| 論文出版年: | 2012 |
| 畢業學年度: | 100 |
| 語文別: | 中文 |
| 論文頁數: | 57 |
| 中文關鍵詞: | 基因序列 、鹼基判定 、對談矩陣 |
| 外文關鍵詞: | read sequencing, base calling, cross-talk matrix |
| 相關次數: | 點閱:107 下載:2 |
| 分享至: |
| 查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
目前的DNA定序儀均採用桑格雙去氧鏈終止法(Sanger dideoxy chain termination method),並以螢光取代傳統的放射性物質來標示四種不同的鹼基(base)。雖然各種廠牌標示的螢光或有不同,但只有兩種位置會被標示,一種反應在鹼基上,另一種在引子(primer)上面。由於螢光物質的化學結構不同,會有不同激光波長,因此很容易區分出不同的鹼基。理論上,在基因模板(tile)的資料中,存在鹼基的位置才會出現鹼基的螢光亮度值,而且一個位置只會有A、C、G、T四種鹼基中的一個螢光亮度值。但在實際上,由於不同形式誤差(noise)的干擾,可能導致每個位置都有螢光亮度值,甚至同一個位置上,出現多個相當的鹼基螢光亮度值。如何判定哪些螢光亮度值是鹼基,且決定屬於A、C、G、T中的那個鹼基,以提高鹼基判定的品質,是NGS分析良窳的關鍵。本文中,我們利用門檻值及對談矩陣(cross-talk matrix)來解決不同形式的干擾對螢光亮度值的不當影響,之後以叢集中的最大值來決定鹼基及其位置,並以加權平均的方式決定該鹼基的螢光亮度值。此外,有別於ILLUMINA,本文對每個週期(cycle)之鹼基,允許其在模板上有不同的位置來決定基因序列(read)。最後,我們將以模擬的方式來評估所提方法的績效。
In NGS data analysis, determining which fluorescence intensity values are bases, and improving the quality of the base calling, are the two keys to have reliable NGS results. In this article, we use threshold value and cross-talk matrix to solve the inappropriate influence on the fluorescence intensity values from different forms of noise interference, and then use the maximum value of a cluster to determine the base and its location. Besides, we use weighted averages method to determine the fluorescence intensity values of a base. In determining a read, we allow base at each cycle to have different positions on the tile. Our method is different from ILLUMINA, which uses fixed position for the base in one read. In the end, a simulation study is conducted to assess the performance of the proposed method.
1. Giddings, Drumley, Haker and Smith (1993). An adaptive, object oriented strategy for base calling in DNA sequence analysis. Nucleic Acids Res. 21: 4530-4540
2. Lawrence and Solovyev (1994). Assignment of position-specific error probability to primary DNA sequence data. Nucleic Acids Res.22: 1272-1280
3. Lai, W.J. (2012). Crosstalk Matrix Selection and Base Determination. Master thesis. NCKU.
4. 李思元 與 莊以光 (2010). DNA定序技術之演進與發展. J Biomed Lab Sci Vol22 No2: 49-58
5. 高崑閎 (2011). 次世代基因定序之對談矩陣與品質指標. 國立成功大學. 碩士論文.