簡易檢索 / 詳目顯示

研究生: 丁崇峯
Ding, Chung-Feng
論文名稱: 機器學習演算法應用於地下水位與地層下陷量分析之研究
The Analysis of Groundwater Level and Land Subsidence by Application of Machine Learning Algorithms
指導教授: 徐享崑
Hsu, Shiang-Kueen
黃煌煇
Hwung, Hwung-Hweng
學位類別: 博士
Doctor
系所名稱: 工學院 - 水利及海洋工程學系
Department of Hydraulic & Ocean Engineering
論文出版年: 2006
畢業學年度: 94
語文別: 中文
論文頁數: 206
中文關鍵詞: 指數分類整合演算法(IAIC),類神經網路樹(NNT)地下水相對潛勢指數(RGPI)機器學習總體效能評估指數(OPI)
外文關鍵詞: relative groundwater potential index (RGPI), machine learning, overall performance index (OPI), integrated algorithm for index classification (I, neural network tree(NNT)
相關次數: 點閱:127下載:10
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 本研究旨在探討應用不同學習型態之機器學習演算模型,分析地下水位及地層下陷觀測資料,以從中擷取所需管理資訊之效益,並驗證本研究結合最佳化理論及不同型態演算模型優點所發展新演算模型之實用性,同時評估新模型在計算精度與效率上之提升效能。

    由於目前各領域運用指數判釋研究問題之狀態極為普遍,而一綜合性評價指數通常包括數個獨立變數,往昔指數組成變數之係數及指數判定標準均由研究者主觀給定,然當該指數因自然環境、地域差異而可能改變其組成變數、變數係數或變數值域時,對照判讀指數意義之標準將因而改變,造成該指數無法移地使用之問題。基於上述情況,本研究提出一套結合最大期望概似演算法及目標規劃而發展之指數分類整合演算法(integrated algorithm for index classification, IAIC),以協助管理者依其需要及蒐集資料樣本,建立有效且適用的管理指數。為利驗證IAIC演算法之實用性,且考量地下水為台灣地區重要穩定水源,本研究爰嘗試以地下水利用潛勢評估為題,先由地層涵蓄地下水能力及流通量觀點定義一RGPI指數(relative groundwater potential index),並以台灣地區至2004年止觀測超過20年以上之混層地下水位觀測及水文地質資料加以分析。經IAIC演算法依分析資料集組(data set)各觀測井之空間分布相對特性,自動給定分級界限值及確認台灣地區RGPI計算公式後,即可計算各觀測井之RGPI值而完成類別分析工作,最後再以最大期望概似演算法完成台灣地區各地下水分區之地下水利用相對潛勢評估工作。上述分析結果驗證IAIC演算法可完全依分析區域、國家資料特性,協助建立特定管理指數及相關評估標準之可行性及客觀可操作性,改善以往人為給定指數係數及分級界限值等問題。

    由分析結果顯示位於花東縱谷、屏東平原及嘉南平原之觀測井大多屬於較「高」(優及佳等級)地下水利用潛勢地區;而蘭陽平原、新竹苗栗沿海地區、台中沿海地區與濁水溪沖積扇等地區之評估較偏向於「低」利用潛勢。如以各地下水區內所有分析觀測井之平均結果審視,整體而言,台灣南部沖積平原及東部河谷之地下水利用潛勢較優於北部台地及沿海沖積扇地區。經與經濟部(1970)現場調查評估九大地下水區之地下水特性比對顯示,本研究定義之RGPI指數為地層地下水補注與井出水量能力之相對特性描述,不僅可反映觀測井控制範圍內之長期地下水利用情勢,亦可顯示地下水未來利用潛勢。

    為能比較不同類型機器學習演算法對數值資料分析之能力差異,本研究嘗試利用空間分布密度較高之水位觀測井資料,建立推估地層下陷量之演算模型,並比較其分析精度與效率,以利在已知推估誤差條件下,可於水準點未檢測年度或未檢測區域內進行空間補點工作。本研究選取BPN(back propagation neural network)、KNN(K nearest neighbors classifier)、MT(model tree)等三種不同學習類型之演算模型,以及本研究結合MT與BPN提出之NNT(neural network tree)共四種數值模型進行地層下陷量之推估,除比較各模型由水位觀測井之地下水位變化、地質條件等資料推估地層下陷量之精度及效率外,並探討NNT模型於計算精度與效率上之提升效能。當以年為分析期距時,分析結果驗證以最低月平均水位作為屬性輸入資料較以年平均水位精度佳,顯示壓密行為與水位變化過程之最低水位較為相關。另經以五等分交互驗證及本研究定義之整體效能指數OPI(overall performance index)值選取四種模型之最佳模型,除比較各模型間平均推估效能之優劣外,並進行時間預測與空間內插效能評估,其結果顯示NNT模型之資料擬合效能最佳,約為BPN模型之三倍精度,MT模型之十倍精度,但疊代時間僅為BPN模型之十分之一左右。當以非訓練分析樣本之金湖國小(二)測試各最佳模型之空間內插效能時,亦以NNT模型之推估誤差最小,顯示本研究提出之NNT模型兼具MT模型高計算效率及BPN模型高計算精度之優點。而時間預測(預測下一年度)之精度,則以KNN模型最佳,著重擬合效能之BPN模型及NNT模型因預測範例屬性值超過訓練屬性值域之故,致對某單一含水層之壓密(下陷)量預測效能不佳,因此在輸入資料預處理階段應先檢視預測資料集組與訓練資料集組狀態再現性與一致性,將演算推估過程限定為資料內插問題,以確保機器學習演算模型在時間及空間上均可達良好推估結果。

    本研究建議之OPI值係以計算各待選模型相對於任一效能評估指數最佳值之標準偏差量,並累計每一待選模型對所有評估指數之標準偏差量加以定義,可客觀凸顯各模型相對於最佳模型之偏離程度,對於協助研究者由眾多待選模型中客觀選取最佳模式,為一操作簡單且有用的判定指數。

    The major objectives of this dissertation are (1) to obtain the information for groundwater resources management by using the proposed algorithm named integrated algorithm for index classification (IAIC), and (2) to evaluate the capabilities among different types of algorithms and the proposed algorithm named neural network tree (NNT) that is based on improving both the efficiency and the effectiveness of the algorithmic process. All the illustration and verification of the mentioned algorithms were done through the analysis of the groundwater level and land subsidence monitoring data set.

    The IAIC algorithm was developed to modify and generally reduce the limitations of index classification. To verify the effectiveness of the IAIC, this dissertation utilizes hydro-geological data and groundwater that monitored over a period of twenty years to assess the priority of relative utilization potential among nine groundwater subregions in Taiwan. The potential is defined by the relative groundwater potential index (RGPI) that is founded on the physical concepts of hydrogeology. According to the results we achieved: (1) the defined index RGPI can be used to identify and interpret the relative capacity between yielding rate and recharge of groundwater, and to reflect both the current state and the future utilization potential of groundwater; (2) the RGPI formula for Taiwan is determined through the IAIC algorithm, and depends on the relative priority of RGPI set of selected monitoring wells. The results demonstrate that the Haw-tung valley, Pintung and Chianan plains cluster to relatively higher grades, but the Lanyang plain, Hsin-Miao and Taichung coastal area, Middle (Choshuichi) alluvial fan cluster to relatively lower grades in utilization potential. The proposed algorithm IAIC will be useful in expanding the application of index classifications.

    The NNT algorithm that combines back propagation neural network (BPN) with the model tree (MT) in effort to strength the prediction accuracy and modeling efficiency. The NNT algorithm was compared with all selected numerical algorithms, the MT, the BPN, the NNT and the KNN (K nearest neighbors classifier) in its ability to estimate land subsidence in various groundwater variations and geological conditions. According to the minimum absolute deviation from observations, it shows that the NNT algorithm has the highest accuracy in data fitting, and also effectively reduces the iterations. However, in the temporal prediction (interpolation) process, the NNT algorithm loses its accuracy in data estimation due to the lack of consideration involving the different status between the training and testing data set. It means that analysis of the value interval of every standardized input attribute of predicted instances is essential to confirm the prediction in an interpolation condition.

    This dissertation also proposes the overall performance index (OPI) for determining the optimal algorithm model from many selected models. The index OPI value is the summation of standard deviations from the optimal value to each selected performance index, and it gives researchers a transparent criterion to choose the best option from the selected algorithms.

    目 錄 中文摘要                    I 英文摘要                    III 誌 謝                     VI 目 錄                     VII 表目錄                     X 圖目錄                     XII 符號表                     XV 第一章 緒論 1-1 引言                    1-1 1-2 研究目的                  1-4 1-3 前人研究                  1-7 1-4 研究方法                  1-9 1-5 論文架構                  1-10 第二章 理論解析 2-1 最大期望概似演算法             2-3 2-2 K個最近芳鄰演算法              2-6 2-3 模型樹理論                 2-7 2-4 倒傳遞類神經網路              2-11 2-5 類神經網路樹                2-16 2-6 目標規劃                  2-20 2-7 模型效能評估與驗證             2-21 2-7-1 模型效能評估指數             2-21 2-7-2 交互驗證                 2-22 2-7-3 總體效能評估指數             2-23 2-8 模型應用說明                2-24 第三章 背景資料整理建置 3-1 台灣地區地下水位觀測概況          3-1 3-2 地下水位變化情勢分析            3-6 3-3 台灣地區地層下陷監測概況          3-17 3-4 地層下陷變化情勢說明            3-22 3-5 水文地質概述                3-27 3-6 綜合評述                  3-37 第四章 資料之群聚與類別分析 4-1 研究背景說明                4-1 4-2 地下水利用相對潛勢指數           4-4 4-3 指數分類整合演算法             4-7 4-3-1 群聚分析與最佳群集數決定準則        4-8 4-3-2 最佳化模型建模與求解            4-9 4-4 驗證案例:台灣地區地下水利用潛勢評估    4-10 4-5 結語                    4-31 第五章 數值演算模型效能評估 5-1 研究背景說明                5-2 5-1-1 地層壓密特性               5-3 5-1-2 輸入屬性檢討               5-5 5-1-3 分析資料來源               5-8 5-2 最佳範例型態之測試分析           5-14 5-3 最佳模型與效能分析             5-19 5-3-1 模型樹建模與分析             5-19 5-3-2 最近芳鄰分類演算模型分析         5-21 5-3-3 倒傳遞類神經網路建模與分析        5-23 5-3-4 類神經網路樹建模與分析          5-27 5-3-5 模型擬合效能評析             5-33 5-4 模型預測及推估效能評析           5-39 5-5 時間尺度分析討論              5-45 5-6 結語                    5-53 第六章 結論與建議 6-1 結論                    6-1 6-2 建議                    6-3 參考文獻                     R-1 附錄 地層下陷壓密量推估方法           附-1

    一、論文
    1.林淑貞、李宗仰(1996),神經元傳輸函數在水文時序建模之分析,第八屆水利工程研討會論文集,pp211-218。
    2.孫建平(1996),類神經網路及其應用於降雨-逕流過程之研究,第八屆水利工程研討會論文集,pp1297-1308。
    3.劉新達(1996),類神經網路在水庫操作的應用,國立交通大學土木工程研究所碩士論文。
    4.黃義銘(1997),類神經網路在調配區域水資源之應用,國立成功大學水利及海洋工程所碩士論文。
    5.陳昶憲、楊朝仲(1998),時序類神經集水區洪水預測模式,台灣水利,Vol. 46,No. 1,pp94-98。
    6.蘇苗彬、陳旺志(1999),序率式時間序列分析應用於地下水位與地表沉陷量之模擬,第八屆大地工程學術研究討論會論文集,pp818-832。
    7.黃顯琇(1999),灰色系統與類神經網路在水文過程之預測,國立成功大學水利及海洋工程所碩士論文。
    8.楊朝仲(1999),應用遺傳演算法與可微分動態規劃於地表地下水聯合營運之多目標規劃,國立交通大學土木工程研究所博士論文。
    9.周孟科(1999),灰色理論應用於地層下陷之預測,國立成功大學水利及海洋工程研究所碩士論文。
    10.留英龍(2000),模糊理論應用於地層下陷之預測,國立成功大學水利及海洋工程研究所碩士論文。
    11.許乃文(2000),灰色理論及類神經網路應用於雲林地區地層下陷之研究,國立成功大學土木工程研究所碩士論文。
    12.蔡東霖(2000),區域性地下水超抽導致地層下陷模式之發展與應用,國立交通大學土木工程研究所博士論文。
    13.金紹興、劉豐壽、張國強、李友平、陳京台、俞維昇 (2001),台灣地區地下水補注量及利用量推估之研究,第十二屆水利工程研討會論文集,ppG31-G38。
    14.金孝忠(2001),考慮容量擴張之非拘限含水層水量管理規劃模式,國立交通大學土木工程研究所碩士論文。
    15.吳俊逸(2001),自組非線性系統應用於地層下陷之預測,國立成功大學水利及海洋工程研究所碩士論文。
    16.賴典章、費立沅、呂學諭(2002),嘉南平原地下水分層架構—兼論台灣溪南部地下水區界線,第五屆地下水資源及水質保護研討會論文集,ppA1-A6。
    17.張孝龍(2002),應用卡門濾波理論與遺傳演算法於地下水觀測井網設計,國立交通大學土木工程研究所碩士論文。
    18.賴典章、費立沅、江崇榮(2003),台灣地區地下水分區特性,水文地質調查與應用研討會論文集,pp1-24。
    19.王彥翔(2003),自組特徵映射與學習向量量化神經網路於河川流量之預測,國立台灣大學生物暨環境系統工程所,碩士論文。
    20.陳子立(2003),結合特徵選取與判定係數以建構模型樹之方法,國立成功大學工業管理科學研究所碩士論文。
    21.薛憲文、張晉瑞(2005),資料探勘技術應用於還洋環境資料分析之研究,第27屆海洋工程研討會論文集,pp1036-1042.
    22.丁崇峰、黃煌煇、宋長虹、許榮庭、林政偉(2006),地下水超抽量推估方法之研究—以彰雲地區為例,中國土木水利工程學刊,Vol. 18,No. 1,pp37-49。
    23.丁崇峰、黃煌煇、徐享崑、吳國儒(2006),應用機器學習演算法於地層下陷量推估之研究,第十五屆水利工程研討會論文集,ppF1-F8。
    24.Birtles A. B. (1978), Identification and separation of major base flow components from a stream hydrograph, Water Resources Research, Vol. 14, No.5, pp791-803.
    25.Blum A. L., Langley P. (1997), Selection of relevant features and examples in machine learning, Artificial Intelligence 97, pp245-271.
    26.Berikov V. B. and Rogozin I. B. (1999), Regression trees for analysis of mutational spectra in nucleotide sequences, Bioinformatics, No. 15, pp553-562.
    27.Bertan A., Guvenir H. A. (2002), Clustered linear regression, Knowledge-Based Systems, Vol. 15, pp 169-175.
    28.Babovic V. (2005), Data mining in hydrology, Hydrological Processes, Vol. 19, pp1511-1515.
    29.Chang F. J., Liang J. M., Chen Y. C. (2001), Flood forecasting using radial basis function neural network, IEEE Transactions on Systems, Man and Cybernetics Part C: Application and Reviews, Vol. 31, No. 4, pp 530-535.
    30.Chang L. C., Chang F. J. (2001), Intelligent control for modeling of real-time reservoir operation, Hydrological Processes, Vol. 15, pp 1621-1634.
    31.Chang F. J., Chang L. C., Huang H. L. (2002), Real time recurrent neural network for streamflow forecasting, Hydrological Processes, Vol. 16, pp 2577-2588.
    32.Charnes A., Cooper W. W., Ferguson R. (1955), Optimal estimation of executive compensation by linear programming, Management Science, Vol. 1, pp 138-151.
    33.Ding C. F., Hwung H. H., Hsu S. K., Lai C. J. (2006), An index classification method for assessing relative usage potential of groundwater resources, Water Resources (in press).
    34.Mogheir Y., Lima J. L. M. P., Singh V. P. (2004), Characterizing the spatial variability of groundwater quality using the entropy theory: I. Synthetic data, Hydrological Processes, Vol. 18, pp2165-2179.
    35.Ekasingh B., Ngamsomsuke K., Letcher R. A., Spate J. (2005), A data mining approach to simulating farmers’ corps choices for integrated water resources management, Journal of Environmental Management, Vol. 77, pp315-325.
    36.Fisher D. (1987), Knowledge acquisition via incremental conceptual clustering, Machine Learning, Vol. 2, pp139-172.
    37.Gennai A. (1992), Elaboration d’une carte de resistance a la secheresse des systemes aquiferes libres, Application au Nord de la France, Memoire Dipl. 3eme cycle Centre d’hydrogeologie, Universite de Neuchatel, 117 p, 36 fig., 16 tabl., 3 ann..
    38.Gennai A., Margat J., Collin J. J. (1993), Cartographie de la resistance a la secheresse des systemes aquifers a nappe libre, Rapport inedit BRGM, Orleans, 13 fig., 5 tabl., 5 ann..
    39.Guvenir, H. A., Uysal, I. (2000), Regression on feature projections, Knowledge -Based System, No.13, pp207-214.
    40.Isabelle I., Andre E. (2003), An Introduction to Variable and Feature Selection, Journal Of Machine Learning Research, Vol. 3, pp1157-1182.
    41.Kampichler C., Dzeroski S. And Wieland R. (2000), Application of machine learning techniques to the analysis of soil ecological data bases: relationships between habitat feature and Collembolan community characteristics, Soil Biology and Biochemistry, Vol. 32, No. 2, pp197-209.
    42.Kimmeier F., Bouzelboudjen M., Eisenlohr L., Rossier Y. (2001), Drought risk analysis applied to porous Swiss Aquifers, 3rd International Conference on Future Groundwater Resources At Risk, p1-11, Lisbon, Portugal.
    43.Palmer, W. C. (1965), Meteorological Drought-Research Paper No. 45, U.S., Department of Commerce Weather Bureau, Washington, D.C..
    44.Peter G., Morrissey M.T., Sylvia G., Polte J. (1996), Linear regression, neutral network and induction analysis to determine harvesting and processiong effects on surimi quality, Journal of Food Science, Vol.61, No. 5, pp876-880.
    45.Quinlan J. R. (1992), Learning with continuous classes, Proceedings of the Australian Joint Conference on Artificial Intelligence, pp343-348, Singapore.
    46.Shafer B.A. and Dezman L.E. (1982) Development of a Surface Water Supply Index (SWSI) to assess the severity of drought condition in snow pack runoff areas, Proceedings of the Western Snow Conference, pp164-175.
    47.Sullivan C. (2002) Calculating a Water Poverty Index, World Development Vol. 30, No7, pp1195-1210.
    48.Tamiz M., Jones D.F., Romero C. (1998), Goal programming for decision making: An overview of the current state-of-the-art, European Journal of Operational Research, Vol.111, pp 569-581.
    二、書籍
    1.施澄鐘(1986),數值分析(第八版),松崗電腦圖書資料股份有限公司,台北。
    2.韋鶴平(1986),最優化技術應用,同濟大學出版社,上海。
    3.周政宏(1995),神經網路理論與實務,松崗電腦圖書資料股份有限公司,台北。
    4.張乃斌(1999),環境數學—系統優化原理,茂昌圖書股份有限公司,台北。
    5.葉怡成(2002),應用神經網路,儒林圖書有限公司,台北。
    6.張斐章、張麗秋、黃浩倫(2003),類神經網路—理論與實務,東華書局,台北。
    7.曾新穆、李建億譯(2004),資料探勘,東華書局,台北。
    8.陳文福(2005),台灣的地下水,遠足文化事業公司,台北。
    9.Mitchell T. M. (1997), Machine Learning, McGraw Hill, New York.
    10.Witten I. H., Frank E. (2000), Data Mining, Morgan Kaufmann, San Francisco.
    11.Roiger R. J., Geatz M. W. (2003), Data Ming – A tutorial-bases primer, Addison Wesley, Boston.
    三、研究報告
    1.經濟部水資源統一規劃委員會(1992),台灣地區地下水資源,經濟部水資源統一規劃委員會。
    2.經濟部水資源統一規劃委員會(1994),台灣地區之水資源,經濟部水資源統一規劃委員會。
    3.劉振宇等(1997),桃園地區地下水資源調查分析,桃園農田水利會。
    4.能邦科技顧問公司(2000),屏東平原地表地下水聯合運用初步規劃—屏東平原地下水潛能及運用管理規劃報告,經濟部水利處。
    5.中興工程顧問公司(2002),台灣地區地下水資源管理決策支援系統建置(2/4),經濟部水資源局。
    6.國立成功大學水工試驗所(2003),台灣地區地下水資源圖說明書,經濟部水利署。
    7.李振誥等(2003),台北盆地地下水管制區檢討及土壤液化評估,經濟部水利署。
    8.能邦科技顧問公司(2005),地下水資源綱領計畫,經濟部水利署。
    9.財團法人工業技術研究院能資所(2001~2005),『台灣地區地層下陷之監測、調查及分析』,經濟部水利署。
    10.國立成功大學水工試驗所(2005),地層下陷防治服務團九十四年度工作計畫報告,經濟部水利署。
    11.國立成功大學水工試驗所(2005),台灣地區地下水文圖圖集繪製工作,經濟部水利署。
    四、其他
    1.經濟部水利署網站:水文水資源資料管理供應系統,http://gweb.wra.gov.tw/wrweb/。
    2.經濟部中央地質調查所:岩心資料庫,http://hydro.moeacgs.gov.tw/。

    下載圖示 校內:2007-08-14公開
    校外:2007-08-14公開
    QR CODE