簡易檢索 / 詳目顯示

研究生: 林育新
Lin, Yu-Hsin
論文名稱: 台灣地區中老年人長期追蹤調查之左截斷右設限資料分析
Left-Truncated and Right-Censored Data Analysis Based on the Survey of Taiwan Longitudinal Study on Aging
指導教授: 蘇佩芳
Su, Pei-Fang
學位類別: 碩士
Master
系所名稱: 管理學院 - 統計學系
Department of Statistics
論文出版年: 2018
畢業學年度: 106
語文別: 中文
論文頁數: 73
中文關鍵詞: 左截斷右設限資料調查資料Cox模式分層Cox模式中老年資料庫(TLSA)老年人存活因子
外文關鍵詞: left-truncated and right-censored data, Cox model of survey data, stratified Cox model, TLSA, the elderly survival factors
相關次數: 點閱:132下載:39
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 長期追蹤調查資料的樣本相較於一次性觀察能貢獻較多資訊,但抽樣方法可能使這類資料有以下問題。首先,調查資料的抽樣可能有獨特的抽樣設計,所以不適合用簡單隨機抽樣所發展的統計方法來分析。另外,因抽樣條件和長期追蹤特徵,而可能無法蒐集到完整資料來代表母體,例如常見的右設限、或左截斷等特徵就是在描述資料的不完整性。當研究者欲建立不完整資料的迴歸模式時, Cox模式(Cox, 1972)是常用的方法之一。其中,左截斷在Cox模式中是可能被資料使用者忽略的資料特徵,若因為忽略了此特徵而沒用相對應的Cox模式,可能得到錯誤的統計推論。
    本研究以透過「台灣地區中老年身心社會生活狀況長期追蹤調查資料」作為實證資料,並以討論台灣中老年人的存活因子為背景,其中令受訪者的壽命當作反應變數,而在這研究設計下,該資料同時具備左截斷右設限特徵和非簡單隨機抽樣設計。透過模擬分析和實證分析,本研究發現沒用左截斷Cox模式估計迴歸係數時,會發生影響統計推論的偏誤。而沒完整考慮抽樣設計的估計所產生的偏誤在模擬分析中明顯,但在實證分析中對統計推論影響不大。

    Samples collected from longitudinal survey data contribute more information than from once observation. However, these samples have a few issues. First, subjects sampled in fashions of survey data may cause that they have different sampling probabilities within the group. As a result, they cannot be analyzed with statistical methods developed on the basis of simple random sampling. In addition, longitudinal survey is likely to lead to data incompleteness such as left-truncation and right-censorship. If users hope to build regression models with incomplete data, they can apply Cox model (Cox, 1972). In particular, left truncation is subject to be neglected in Cox model, and this would result in biased estimation of model coefficients through misjudging statistical analysis methods.
    Discussing the elderly survival factors based on Survey of Taiwan Longitudinal Study on Aging (TLSA) may confront aforementioned two problems. Namely, the survey data of TLSA features both left-truncation-and-right-censorship and non-simple random sampling in search of survival factors. To see how the two data characteristics impact on Cox model coefficient estimates, the study adopts simulation and empirical analysis. Results from simulation shows that biased estimation in Cox model may occur when left truncation and the sampling design (stratified sampling) are neglected. In addition, empirical results also indicate that biased estimation in Cox model due to neglating left truncation may mislead the statistical inference.

    目錄 第壹章 緒論 1 第一節 研究背景 1 一、背景 1 二、資料介紹 1 第二節 研究目的 2 一、左截斷右設限資料 3 二、調查資料 6 第貳章 文獻回顧 8 第一節 左截斷右設限資料的存活分析 8 一、存活函數和風險函數 8 二、Cox風險等比例模式 10 第二節 調查資料分析 11 第三節 調查資料Cox模式與分層Cox模式 13 第四節 中老年資料庫應用:探討中老年人存活因子 15 第叁章 模擬分析 18 第一節 忽略左截斷特徵估計Cox模式參數 18 一、生成資料 18 二、忽略左截斷特徵的影響 19 第二節 忽略抽樣設計估計Cox模式參數 21 一、生成資料 21 二、忽略抽樣設計的影響 22 第肆章 資料分析 27 第一節 變數介紹 27 一、反應變數 28 二、解釋變數 29 第二節 單一因子Cox模式分析 39 第三節 多個因子Cox模式分析 43 第四節 模式診斷 46 第伍章 結論 49 第一節 研究貢獻 49 第二節 研究限制 50 第三節 未來研究 52 參考文獻 54 附錄 56   表目錄 表格 1:左截斷右設限資料生成條件 19 表格 2:分層抽樣左截斷右設限資料生成條件 22 表格 3:類別變數摘要統計表 30 表格 4:連續變數摘要統計表 30 表格 5:單一因子Cox模式結果 42 表格 6:多因子Cox模式結果 45 附錄表 1:Β=1時兩種Cox模式估計能力比較 56 附錄表 2:Β=2時兩種Cox模式估計能力比較 57 附錄表 3:資料不完整比例參數設定 58 附錄表 4:資料被左截斷比例比例參數設定 58 附錄表 5:B=1時三種Cox模式估計能力比較之一 59 附錄表 6:B=1時三種Cox模式估計能力比較之二 60 附錄表 7:B=2時三種Cox模式估計能力比較之一 61 附錄表 8:B=2時三種Cox模式估計能力比較之一 62 附錄表 9:四個被排除存活因子在多因子模式中的邊際效果檢定 63   圖目錄 圖表 1:六次調查中三個世代完訪個案的人數分佈圖 3 圖表 2:三世代受訪者壽命(X)與進入研究年齡(Y)的散佈圖 5 圖表 3:兩種Cox模式估計迴歸係數能力比較(Rbias) 20 圖表 4:兩種Cox模式估計迴歸係數能力比較(SSE) 21 圖表 5:三種Cox模式估計迴歸係數能力比較(Rbias) 25 圖表 6:三種Cox模式估計迴歸係數能力比較(SSE) 26 圖表 7:多因子Cox-Snell殘差圖 46 附錄圖 1:性別之存活函數估計圖(左)暨對數累積風險估計圖(右) 64 附錄圖 2:種族之存活函數估計圖(左)暨對數累積風險估計圖(右) 65 附錄圖 3:伴侶之存活函數估計圖(左)暨對數累積風險估計圖(右) 65 附錄圖 4:獨居之存活函數估計圖(左)暨對數累積風險估計圖(右) 66 附錄圖 5:定居之存活函數估計圖(左)暨對數累積風險估計圖(右) 66 附錄圖 6:自評健康之存活函數估計圖(左)暨對數累積風險估計圖(右) 67 附錄圖 7:吸菸之存活函數估計圖(左)暨對數累積風險估計圖(右) 67 附錄圖 8:飲酒之存活函數估計圖(左)暨對數累積風險估計圖(右) 68 附錄圖 9:嚼檳榔之存活函數估計圖(左)暨對數累積風險估計圖(右) 68 附錄圖 10:社團之存活函數估計圖(左)暨對數累積風險估計圖(右) 69 附錄圖 11:多因子Cox(以性別分層)之對數累積風險估計暨風險集合變化圖 70 附錄圖 12:多因子Cox(以種族分層)之對數累積風險估計暨風險集合變化圖 70 附錄圖 13:多因子Cox(以伴侶分層)之對數累積風險估計暨風險集合變化圖 71 附錄圖 14:多因子Cox(以獨居分層)之對數累積風險估計暨風險集合變化圖 71 附錄圖 15:多因子Cox(以定居分層)之對數累積風險估計暨風險集合變化圖 72 附錄圖 16:多因子Cox(以吸菸分層)之對數累積風險估計暨風險集合變化圖 72 附錄圖 17:多因子Cox(以嚼檳榔分層)之對數累積風險估計暨風險集合變化圖 73

    Aalen, O. (1978). Nonparametric inference for a family of counting processes. The Annals of Statistics, 701-726.

    Bender, R., Augustin, T., & Blettner, M. (2005). Generating survival times to simulate Cox proportional hazards models. Statistics in medicine, 24(11), 1713-1723.

    Binder, D. A. (1992). Fitting Cox's proportional hazards models from survey data. Biometrika, 79(1), 139-147.

    Carlin, B. P., & Hodges, J. S. (1999). Hierarchical proportional hazards regression models for highly stratified data. Biometrics, 55(4), 1162-1170.

    Cox, D.R. & Snell, E.J. (1968). A general definition of residuals (with Discussion). J. Roy. Statist, Soc. B 30, 248-275.

    Cox, D.R. (1972). Regression Models and Life Tables. Journal of the Royal Statistical Society, Series B34, 187-220.

    Cox, D. R. (2007). Applied statistics: a review. The Annals of Applied Statistics, 1(1), 1-16.

    Fisher, R. A. (1922). On the mathematical foundations of theoretical statistics. Philosophical Transactions of the Royal Society of London. Series A, Containing Papers of a Mathematical or Physical Character, 222, 309-368.

    Heeringa, S. G., West, B. T., & Berglund, P. A. (2010). Applied survey data analysis: CRC Press.

    Kaplan, E. L., & Meier, P. (1958). Nonparametric estimation from incomplete observations. Journal of the American statistical association, 53(282), 457-481.

    Kish, L. (1965). Survey sampling.

    Klein, J., & Moeschberger, M. (2003). Survival analysis: statistical methods for censored and truncated data. Springer, New York.

    Liao, H.-W. (1998). A simulation study of estimators in stratified proportional hazards models. In.

    Lin, D. (2000). On fitting Cox's proportional hazards models to survey data. Biometrika, 87(1), 37-47.

    Nelson, W. B. (2005). Applied life data analysis (Vol. 577): John Wiley & Sons.

    Neyman, J. (1934). On the two different aspects of the representative method: the method of stratified sampling and the method of purposive selection. Journal of the Royal Statistical Society, 97(4), 558-625.

    Sterba, S. K. (2009). Alternative model-based and design-based frameworks for inference from samples to populations: From polarization to integration. Multivariate behavioral research, 44(6), 711-740.

    侯佩君. (2011). 複雜抽樣調查的資料分析及實務應用—以 SAS, STATA 為例✽. 調查研究-方法與應用(25), 90-140.

    孫傳凱. (2009). 婚姻與健康--台灣老人實證研究; Marriage and Health--the Emprical Study of the Elderly in Taiwan. 國立中央大學圖書館,

    李宗派. (2007a). 老化概念 (Ⅰ): 生物科學之老化理論. 臺灣老人保健學刊, 3(2), 1-24.

    李宗派. (2007b). 老化概念 (Ⅱ) 行為科學之老化理論與老化理論研究趨勢. 臺灣老人保健學刊, 3(2), 25-61.

    林正祥, & 劉士嘉. (2012). 影響台灣不同世代老人存活相關因子探討. 臺灣公共衛生雜誌, 31(6), 597-611.

    林正祥, & 林惠生. (2006). 台灣地區高齡人口存活之相關因素探討. 臺灣公共衛生雜誌, 25(5), 351-362.

    林正祥, & 鄭維芬. (2011). 台灣地區老人教育程度差異對死亡率影響探討.

    黃于庭. (2010). 台灣地區中老年身心社會生活狀況長期追蹤調查系列之存活分析. 成功大學統計學系學位論文, 1-85.

    下載圖示 校內:2019-09-01公開
    校外:2019-09-01公開
    QR CODE