簡易檢索 / 詳目顯示

研究生: 陳冠雅
Chen, Kuan-Ya
論文名稱: 微生物資料統計方法分析
Statistical analysis of microbiome dataset
指導教授: 蘇佩芳
Su, Pei-Fang
學位類別: 碩士
Master
系所名稱: 管理學院 - 統計學系
Department of Statistics
論文出版年: 2017
畢業學年度: 105
語文別: 中文
論文頁數: 39
中文關鍵詞: 狄氏多項迴歸狄氏多項分配微生物群系
外文關鍵詞: Dirichlet-multinomial regression, Dirichlet-multinomial distribution, microbiome
相關次數: 點閱:85下載:27
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 微生物資料為從生物體上所收集的細菌、病毒、真菌等微生物的資料,針對微生物資料,本篇論文介紹現有兩種分析該資料的統計方法:假設檢定方法、狄氏多項迴歸。假設檢定方法與狄氏多項迴歸屬於有母數統計方法,皆架構在狄氏多項分配之下,本文應用兩種統計方法比較兩群資料的微生物組成分布是否相同,其中假設檢定方法透過檢定兩群微生物資料的比例參數向量是否相同;而狄氏多項迴歸,在本篇論文將組別當成一個解釋變數,透過檢定迴歸係數,比較兩群微生物組成分布是否相同。除此之外,本篇論文透過模擬的方式,比較多項分配與狄氏多項分配的差異以及比較兩種統計方法在檢定兩群資料組成分布是否相同時的型Ⅰ誤差率(TypeⅠerror rate)及模擬檢定力(Empirical power)。

    The collection of microorganisms, including viruses, bacteria, and some unicellular eukaryotes, that live in and on organisms is microbiome. Two statistical methods have been developed to analyze microbiome dataset. This research presents two statistical methods for the analysis of microbiome data based on a fully parametric approach. In particular, the Dirichlet-multinomial distribution is used. One of the methods perform hypothesis testing, the other is considering the Dirichlet-multinomial regression model. The goal of this research is to apply two statistical methods to compare the composition of two microbiome samples. Moreover, we conducted simulation studies to assess the performance of two statistical methods. In addition, those methods are applied to a real microbiome dataset.

    摘要 i 目錄 x 表目錄 xi 圖目錄 xii 第壹章、 緒論 1 第一節、 資料背景與介紹 1 第二節、 研究目的 5 第貳章、 文獻回顧 6 第一節、 符號定義 6 第二節、 多項分配(Multinomial distribution) 7 第三節、 狄氏多項分配(Dirichlet-multinomial distribution) 7 第四節、 比較多項分配與狄氏多項分配 8 第五節、 狄氏多項分配參數估計 10 第六節、 假設檢定 11 第七節、 狄氏多項迴歸(Dirichlet-multinomial regression) 15 第參章、 模擬研究 16 第一節、 模擬比較多項分配與狄氏多項分配 16 第二節、 模擬比較假設檢定方法與狄氏多項迴歸 18 第肆章、 資料分析 24 第一節、 資料整理 24 第二節、 分析結果 26 第伍章、 結論 30 參考文獻 32 附錄 33

    [1] Human microbiome project consortium. Structure, function and diversity of the healthy human microbiome. Nature 486, 207-214 (2012).
    [2] La Rosa, P. S., Deych, E., Shands, B., and Shannon, W. D. HMP: Hypothesis testing and power calculations for comparing metagenomic samples from HMP. R package version, 1.4.3 (2011).
    [3] La Rosa, P. S., Brooks, J. P., Deych, E., Boone, E. L., Edwards, D. J., Wang, Q., and Shannon, W. D. Hypothesis testing and power calculations for taxonomic-based human microbiome data. PloS one, 7(12) (2012).
    [4] Mebane Jr, W. R., and Sekhon, J. S. multinomRob: Robust estimation of overdispersed multinomial regression models. R package version, 1.8-6.1 (2009).
    [5] Tvedebrink, T. dirmult: Estimation in dirichlet-multinomial distribution. R package version, 0.1.3-4 (2010).
    [6] Zhang, Y., and Zhou, H. MGLM: multivariate response generalized linear models. R package version, 0.0.7 (2015).
    [7] Zhang, Y., Zhou, H., Zhou, J., and Sun, W. Regression models for multivariate count data. Journal of computational and graphical statistics, 26(1), 1-13 (2017).
    [8] 陳安綺 和 陳志洪,結合概念圖與角色扮演遊戲之自然學習系統,科學家村莊。(2013)

    下載圖示 校內:2020-07-31公開
    校外:2020-07-31公開
    QR CODE