簡易檢索 / 詳目顯示

研究生: 段名聰
Tuan, Ming-Tsung
論文名稱: 運用資料探勘技術由健康檢查與生活習慣資料建立冠狀動脈心臟病預測模型
Using Technique of Data Mining on Health Examination and Personal Habits for Building the Predictive Models of Coronary Heart Disease
指導教授: 陳澤生
Chen, Tse-Sheng
學位類別: 碩士
Master
系所名稱: 工學院 - 工程管理碩士在職專班
Engineering Management Graduate Program(on-the-job class)
論文出版年: 2020
畢業學年度: 108
語文別: 中文
論文頁數: 88
中文關鍵詞: 資料探勘冠狀動脈心臟病決策樹類神經網路
外文關鍵詞: Data Mining, Coronary Heart Disease, Decision Tree, Neural Network
相關次數: 點閱:161下載:34
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 全球多數先進國家早已邁入高齡化社會,更有研究指出在未來二十年內,即將出現超高齡社會,人口老化儼然成為國家亟需研擬對策的社會問題,長照及醫療成為政府必須重視且發展的因應措施。潛藏在人口老化內最棘手的則是慢性病。多數慢性病患者需要耗費相當多時間及金錢在長照及門診上,因此醫院常有人滿為患的情形,如何減輕醫療負擔及提倡健康意識非常重要。科技日新月異的進步,便利了人類的生活,人工智慧的功能逐漸強大,應用領域也越來越廣泛,本研究將運用資料探勘的技術來改善上述的問題,期望能減輕醫院的負擔,並且可以提高民眾的健康觀念。
    冠狀動脈心臟病是台灣常見的慢性病,要確認是否罹病需要較精密的檢查以及昂貴的費用,如果可用較為簡易的方式預測,將能替病患省下時間及金錢,並且可以提供醫師輔助診斷,也避免醫療資源浪費。本研究運用資料探勘的技術,從大量健康檢查資料中以決策樹及類神經網路演算法各建立一個疾病預測模型,並且比較預測準確率來提供醫師評估病患是否罹患冠狀動脈心臟病。資料探勘的精神在於從眾多資料內找出潛在的實用資訊,本研究收集最基本的健康檢查報告及生活習慣調查資料,利用R Studio軟體來進行資料探勘,建立冠狀動脈心臟病的預測模型。基本的健康檢查項目雖然不多,但由於本研究運用監督式學習的演算法,在模型建立之時,採用的是已知資料,因此在預測時同樣也只需要輸入相對應的檢查項目,模型就可以即時提供預測結果作為輔助診斷,醫師可以根據健康檢查報告給予受檢人相關建議及健康諮詢,並且讓民眾能更加注意自身的健康情形。

    Recently, aging society has impacted most advanced countries in the world. Some researchers indicated that super-aging society will show up in recent twenty years. Consequently, the government must investigate and plan for aging population and put emphasis on the Long-term care and medical services. Chronic disease is the most troublesome problem hiding behind the aging society since aging is not only an immediate personal issue but also a silent factor in crucial public policies, such as pensions, health and long-term care. Most patients with chronic diseases need to spend a lot of time and money on long-term care, along with overcrowded hospital. Consequently, reducing the burden of medical institutions and do the health promotion are quite important. With the progress of the technology, life is more convenient than before. The functions of artificial technology are widely concerned. In this research, we tried to solve the problems above by using data mining technology, anticipating to releasing the burden of hospital, and make people paying more attention on their health.
    Coronary heart disease (CHD) is a common chronic disease in Taiwan. People always spend much money doing medical examination to check for the disease. If we could predict whether a patient has fallen sick with the coronary heart disease by the proposed simple method, patients can save so much money and time. Moreover, we can decrease the waste of medical resource. Also, the prediction will be supportive diagnosis for doctors to analyze the patient’s healthy examination report. The data mining technique via decision tree and neural network algorithm are used in this research. We established two predictive models based on a great quantity of healthy examinations. We compared the accuracy of the two models, and try to provide information for doctors to evaluate whether patients suffered the coronary heart disease or not. By the detecting and searching skills of data mining, people could discover the needed and potential information from huge database. This research collected a lot of data about the fundamental healthy examination and living habits, and executed data mining to build predictive model of coronary heart disease by R studio software. We used the supervised learning algorithm to build models based on definite data in this research. Because we could only include limited items in the fundamental healthy examination, we input the same categories of data to get the prediction. According to the prediction and general healthy examination report, doctor could provide advice and medical consultation, and remind patients that they should concern much more about their healthy state.

    摘要 I 誌謝 X 目錄 XI 表目錄 XIV 圖目錄 XV 中英文縮寫對照表 XVI 第1章 緒論 1 1-1 研究背景與動機 1 1-2 研究目的 2 1-3 研究範圍與限制 3 1-4 研究流程 4 第2章 文獻探討 6 2-1 冠狀動脈心臟病 6 2-1-1 症狀與病因 7 2-1-2 診斷與治療 12 2-1-3 罹患冠狀動脈心臟疾病的危險因子 18 2-1-4 預防與保健方法 20 2-2 資料探勘簡介 21 2-2-1 資料探勘的定義 21 2-2-2 決策樹簡介 24 2-2-3 類神經網路簡介 25 2-3 資料探勘在醫學領域的應用 28 2-4 本章小結 31 第3章 研究方法 33 3-1 研究架構 33 3-2 資料來源 34 3-2-1 Kaggle網站 34 3-2-2 本研究所用資料 35 3-3 資料探勘軟體 38 3-3-1 R 語言及R Studio簡介 38 3-3-2 R Studio 操作與介面 39 3-4 資料探勘的技術 41 3-4-1 KNN演算法 41 3-4-2 決策樹演算法 44 3-4-3 類神經網路演算法 48 第4章 研究過程與成果 54 4-1 資料預處理 54 4-1-1 匯入資料及資料架構 54 4-1-2 確認遺漏值及填補 56 4-1-3 資料屬性轉換 57 4-2 資料探勘-決策樹 59 4-2-1 機器學習及建立預測模型 60 4-2-2 導入測試資料及預測結果 63 4-3 資料探勘-類神經網路 64 4-3-1 資料預處理 64 4-3-2 機器學習及建立預測模型 67 4-3-3 導入測試資料及預測結果 71 4-4 研究成果說明 74 4-4-1 預測結果之成效 74 4-4-2 資料探勘適合處理的資料類型 75 第5章 結論與建議 77 5-1 研究結論 77 5-2 建議與未來研究方向 78 參考文獻 81 附錄 87 附錄1 KAGGLE網站原始資料 87 附錄2 填補遺漏值後的資料型態 88

    中文部份
    1. 王宗道(2002)。血脂肪異常和冠狀動脈心臟病的分子生物學、臨床醫學、及流行病學研究。國立臺灣大學臨床醫學研究所博士論文,台北市,台灣。
    2. 王宗道(2001)。心臟血管疾病的預防與治療-淺談心肌梗塞。台大醫網,7(9),頁26-27。
    3. 李師毅(2011)。冠狀動脈心臟病檢測及風險評估雲端服務系統建立之研究。輔仁大學資訊管理學系碩士論文,新北市,台灣。
    4. 李俊宏與古清仁(2010)。類神經網路與資料探勘技術在醫療診斷之應用研究。工程科技與教育學刊,7(1),頁154-169。
    5. 李語嫣(2010)。運用資料探勘技術由健康檢查與生活習慣資料建立疾病預測模型-以糖尿病為例。國立成功大學醫學資訊研究所碩士論文,台南市,台灣。
    6. 林溥,莊海華,盧美君,鄭又華與陳昭源(2018)。以腎絲球過濾率估計值 (eGFR)預測醫院工作人員的十年心血管疾病風險-以台灣北部某醫院為例。中華職業醫學雜誌,25(1),頁7-13。
    7. 許莉玲(2003)。冠狀動脈疾病婦女疾病嚴重度、危險因子與健康相關行為之探討。臺北醫學大學護理學系碩士論文,台北市,台灣。
    8. 郭蔚楓(2018)。邏輯斯迴歸與ROC曲線整合應用於探討道路鋪面破壞影響因素—以台26線為例。國立屏東科技大學土木工程系碩士論文,屏東縣,台灣。
    9. 陳彥佑(2015)。倒傳遞類神經網路應用於心血管疾病患者住院天數預測。國立臺北科技大學工業工程與管理系碩士論文,台北市,台灣。
    10. 陳潔(2019/07/03)。科技讓醫療更人性,長庚醫師郭昶甫,AI拉近醫病關係。天下雜誌,676期,頁42-44。
    11. 陳志華,楊子緯,張訓楨與賴永崧(2016)。特徵分析和機器學習方法應用於肝臟疾病檢測。福祉科技與服務管理學刊,4(3),頁417-429。
    12. 黃雅芳(2009)。運用資料探勘方法評估冠狀動脈疾病之研究。高雄醫學大學醫務管理學研究所碩士在職專班碩士論文,高雄市,台灣。
    13. 黃瑞仁(2004)。冠狀動脈心臟病的診斷與治療。警政署日新雜誌,3,頁208-215。
    14. 張慕民(2009)。規律步行運動對冠狀動脈心臟病患者生理指標及生活品質影響之研究規律步行運動對冠狀動脈心臟病患者生理指標及生活品質影響之研究。國立台北護理學院旅遊健康研究所碩士論文,台北市,台灣。
    15. 蔡孟潔(2006)。應用邏輯斯迴歸於冠狀動脈心臟病之研究。元智大學工業工程與管理研究所碩士論文,桃園市,台灣。
    16. 劉信成(2017)。應用多元迴歸及倒傳遞類神經網路預測企業獲利能力之研究。國立清華大學工業工程與工程管理學系碩士論文,新竹市,台灣。
    17. 繆信宇(2011)。應用類神經網路建構腦血管動脈粥狀硬化預測模型。臺北醫學大學醫學資訊研究所碩士論文,台北市,台灣。
    18. 簡禎富與許嘉裕(2014)。資料挖礦與大數據分析(第一版)。台北市,台灣:前程文化。
    19. 蘇顯良(2013)。以社區健檢資料分析發生冠狀動脈心臟病之相關因子。中臺科技大學醫療暨健康產業管理系碩士論文,台中市,台灣。

    英文部份
    1. Atkov, O. Y., Gorokhova, S. G., Sboev, A. G., Generozov, E. V., Muraseyeva, E. V., Moroshkina, S. Y., & Cherniy, N. N. (2012). Coronary Heart Disease Diagnosis by Artificial Neural Networks Including Genetic Polymorphisms and Clinical Parameters. Journal of Cardiology, 59(2), p.p. 190-194, Russia.
    2. Chen, W., Yu, Y., & Glaser, K. (2009). The Knowledge and Attitudes of Coronary Heart Disease Prevention among Middle and Older Aged People in a Community in Taipei. Taiwan Geriatrics & Gerontology, 4(4), p.p. 251-262, Taiwan.
    3. Dawber, T. R., Moore, F. E., & Mann, G. V. (2015). II. Coronary heart disease in the Framingham study. International Journal of Epidemiology, 44(6), p.p. 1767-1780, United Kingdom.
    4. Greenland, P., Knoll, M. D., Stamler, J., Neaton, J. D., Dyer, A. R., Garside, D. B., & Wilson, P. W. (2003). Major Risk Factors as Antecedents of Fatal and Nonfatal Coronary Heart Disease Events. JAMA, 290(7), p.p. 891-897, USA.
    5. Koh, H. C., & Tan, G. (2011). Data mining applications in healthcare. Journal of Healthcare Information Management, 19(2), p.p. 65, USA.
    6. Obenshain, M. K. (2004). Application of data mining techniques to healthcare data. Infection Control & Hospital Epidemiology, 25(8), 690-695, USA.
    7. Soni, J., Ansari, U., Sharma, D., & Soni, S. (2011). Predictive data mining for medical diagnosis: An overview of heart disease prediction. International Journal of Computer Applications, 17(8), p.p. 43-48, India.
    8. Tomar, D., & Agarwal, S. (2013). A survey on Data Mining approaches for Healthcare. International Journal of Bio-Science and Bio-Technology, 5(5), p.p. 241-266, USA.

    網站部份
    1. 中時電子報(2017)。公車女司機心臟病發 拚命靠邊停保全車平安。
    取自https://reurl.cc/XXNgea。
    最後瀏覽日:2019/10/14。
    2. 自由電子報(2018)。公車司機心臟病發昏迷 撞上對向車道汽車嚇壞人。
    取自https://news.ltn.com.tw/news/society/breakingnews/2426301。
    最後瀏覽日:2019/10/14。
    3. 行政院衛生福利部網站(2019)。107年國人死因統計結果。
    取自https://www.mohw.gov.tw/cp-16-48057-1.html。
    最後瀏覽日:2019/08/18。
    4. 行政院衛生福利部國民健康署網站(2019)。認識冠心病。
    取自https://www.hpa.gov.tw/Pages/Detail.aspx?nodeid=632&pid=1188。
    最後瀏覽日:2019/08/18。
    5. 全民健康基金會網站。心血管通不通?256切電腦斷層一看即知。
    取自https://reurl.cc/oD46g3。
    最後瀏覽日:2019/10/21。
    6. 每日頭條網站(2017)。決策樹原理介紹。
    取自https://kknews.cc/zh-tw/news/gva96b9.html
    最後瀏覽日:2020/01/15
    7. 康健雜誌網站(2020)。冠狀動脈心臟病。
    取自https://kb.commonhealth.com.tw/library/7.html?from=search
    最後瀏覽日:2020/05/01。
    8. 康健雜誌網站(2012)。冠狀動脈氣球擴張術。
    取自https://www.commonhealth.com.tw/article/article.action?nid=72124
    最後瀏覽日:2019/12/30。
    9. 程式前沿網站(2018)。人工神經網路簡介。
    取自https://reurl.cc/L1Ya6e
    最後瀏覽日:2020/01/30。
    10. 維基百科網站(2019a)。冠狀動脈疾病。
    取自https://reurl.cc/vn42ga。
    最後瀏覽日:2019/10/10。
    11. 維基百科網站(2019b)。心臟
    取自https://zh.wikipedia.org/wiki/%E5%BF%83%E8%87%9F。
    最後瀏覽日:2019/10/10。
    12. 維基百科網站(2019c)。資料探勘。
    取自https://reurl.cc/5gLv5R。
    最後瀏覽日:2019/11/03。
    13. 維基百科網站(2019d)。決策樹。
    取自https://reurl.cc/md42DW。
    最後瀏覽日:2019/11/03。
    14. 維基百科網站(2019e)。類神經網路。
    取自https://reurl.cc/D1L7oe。
    最後瀏覽日:2019/11/03。
    15. 維基百科網站(2019f)。Kaggle。
    取自https://zh.wikipedia.org/wiki/Kaggle。
    最後瀏覽日:2019/11/03。
    16. 維基百科網站(2019g)。R語言。
    取自https://zh.wikipedia.org/wiki/R%E8%AF%AD%E8%A8%80。
    最後瀏覽日:2019/11/24。
    17. ITREAD網站(2018)。KNN演算法(有監督學習演算法)。
    取自https://www.itread01.com/content/1546211528.html。
    最後瀏覽日:2019/12/25。
    18. R Pubs網站(2016)。R筆記–(8)類神經網路(neuralnet)
    取自https://rpubs.com/skydome20/R-Note8-ANN
    最後瀏覽日:2020/02/18

    下載圖示 校內:立即公開
    校外:立即公開
    QR CODE