簡易檢索 / 詳目顯示

研究生: 洪詠昱
Hung, Yung-Yu
論文名稱: 基於時間序列與機器學習的台灣住宅價格漲跌研究
A Research on the Change of House Prices in Taiwan by Time Series and Machine Learning
指導教授: 王澤世
Wang, Tse-Shih
學位類別: 碩士
Master
系所名稱: 管理學院 - 財務金融研究所
Graduate Institute of Finance
論文出版年: 2023
畢業學年度: 111
語文別: 中文
論文頁數: 64
中文關鍵詞: 房價時間序列機器學習
外文關鍵詞: House Prices, Time Series, Machine Learning
相關次數: 點閱:404下載:81
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 近年來,台灣的房價問題成為公共議題討論的焦點。過去的研究發現,房價與房屋條件、國內外總體經濟狀況和總體政治環境有關。除此之外,隨著科技進步,機器學習演算法在社會科學和商管領域得到廣泛應用,其預測效果優於傳統統計學模型。然而,在房價研究中,機器學習方法的應用並不常見。因此,本研究使用了傳統統計學模型和經典機器學習演算法,同時考慮多個變數,建立了房價漲跌幅的預測模型,並分析了影響房價的重要因素,最後比較了各種模型的預測效果。
    本研究選取了台北市、新北市和桃園市的54個行政區作為樣本地區,時間範圍為2012年第4季至2022年第4季的41個季度。以各行政區各季度平均每坪價格的季變動率為被解釋變數,以該季度被交易到的房屋的平均物件特徵、國內外總體經濟變數和總體政治變數為解釋變數。在建立模型之前,進行了多道的資料前處理。為了比較預測效果並避免過度配適,使用前80%的季度作為訓練資料集,後20%的季度作為測試資料集,然後根據測試集的表現選擇最佳超參數並比較模型之間的表現。
    在傳統統計學方法方面,本研究進行了變異數膨脹因子分析和單根檢定,然後建立了考慮固定效果的自我迴歸滯後分布時間序列模型。在機器學習方法方面,本研究使用了決策樹、隨機森林和XGBoost三個演算法分別建立模型。最終,本研究成功建立了結合了物件特徵、總體經濟變數和政治變數的房價漲跌幅預測模型。根據分析結果,機器學習模型找出的重要特徵與傳統統計學模型的顯著解釋變數大致相符,但機器學習模型的預測效果優於傳統統計學模型,因為其在測試資料集的RMSE較低,預測誤差較小。研究結果顯示,台灣的房價確實存在明顯的自我迴歸現象,房屋本身的條件對房價的影響非常強烈,總體經濟和政治變數對房價也有一定的影響力,但影響力相對較弱,而且部分總體經濟變數對房價的影響存在滯後效應。

    The house prices have become a prominent public concern in Taiwan. Previous studies have highlighted the connections between house prices and factors such as house conditions, economic situation and political environment. However, most of these studies focused on specific aspects and failed to consider all variables simultaneously. Moreover, while machine learning algorithms have shown superior predictive capabilities in various fields, their application in house price research remains limited. To address these gaps, this study uses both statistics method and machine learning algorithms to develop a comprehensive predictive model for house price fluctuations. This research utilizes data from 54 districts in the northern metropolitan area of Taiwan over 41 quarters, spanning from Q4 2012 to Q4 2022. The average quarterly percentage change in price per square meter is the dependent variable, while house characteristics, economic conditions and political variables serve as independent variables. Rigorous data preprocessing and model evaluation techniques are employed. The results demonstrate that machine learning models outperform traditional statistical models in predicting the change of house price. The significant features identified by machine learning models align with those identified by traditional statistical models. The analysis reveals a pronounced autoregressive pattern in Taiwan's house market, with house conditions exerting a substantial influence on prices. While economic and political variables also impact housing prices, their effects are comparatively weaker, and certain economic variables exhibit lag effects.

    摘要 I 英文延伸摘要 II 致謝 VI 目錄 VII 表目錄 X 圖目錄 XI 第壹章 緒論 1 第一節 研究背景 1 第二節 研究動機與目的 1 第三節 研究方法與架構 2 第貳章 文獻回顧 3 第一節 房價影響因子 3 第二節 模型與方法 5 一、時間序列模型 5 二、機器學習模型 5 第三節 以機器學習方法分析房價之相關研究 8 第參章 研究設計與方法 9 第一節 研究樣本與樣本期間 9 第二節 研究變數與特徵選取 10 一、被解釋變數(被預測變數)—平均每坪單價季變動率 10 二、解釋變數 10 第三節 資料來源與資料前處理 13 一、資料來源 13 二、資料前處理 13 三、研究變數彙總表 15 四、訓練資料集與測試資料集 17 第四節 研究方法與模型 18 一、時間序列模型 18 二、決策樹迴歸器 20 三、隨機森林迴歸器 21 四、XGBoost迴歸器 22 第五節 評估標準 23 第肆章 實證結果與分析 24 第一節 敘述性統計 24 一、敘述性統計報表 24 二、核密度估計曲線 26 三、相關係數矩陣熱點圖 31 第二節 時間序列分析 32 一、變異數膨脹因子分析與變數篩選 32 二、單根檢定之結果 35 三、考慮固定效果的自我迴歸滯後分布模型之迴歸式 38 四、時間序列固定效果ARDL模型之實證結果 39 五、時間序列分析小結 44 六、在測試資料集的模型表現 44 第三節 決策樹模型 45 一、模型使用之特徵(解釋變數) 45 二、超參數調整與最佳參數之挑選 45 三、最佳參數下之模型表現與特徵重要性分析 46 第四節 隨機森林模型 48 一、模型使用之特徵(解釋變數) 48 二、超參數調整與最佳參數之挑選 48 三、最佳參數下之模型表現與特徵重要性分析 49 第五節 XGBoost模型 51 一、模型使用之特徵(解釋變數) 51 二、超參數調整與最佳參數之挑選 51 三、最佳參數下之模型表現與特徵重要性分析 53 第六節 各模型實證結果之比較與彙總 55 第伍章 結論 60 參考文獻 61

    中文文獻
    王佩翎(2015),「房貸利率、消費者物價指數與房價關係之探索-VAR 模型分析」,碩士論文,世新大學經濟學研究所。
    石川聡彦(2021)。必學!Python 資料科學‧機器學習最強套件:NumPy、Pandas、Matplotlib、OpenCV、scikit-learn、tf.Keras(劉金讓譯)。台北,旗標。
    呂旻哲(2018),「房價供需層面變數與信義房價指數、國泰房地」,碩士論文,中華大學資訊管理系。
    李政育(2019),「應用隨機森林預測高雄市房價」,碩士論文,國立東華大學財務金融學系。
    李宗霖(2016),「以類神經網路模式探討住宅房價影響因子之研究」,碩士論文,國立交通大學工學院工程技術與管理學程。
    李惠妍、吳宗正、溫敏杰(2006),「回歸模式與類神經網路在台股指數期貨預測之研究」,經營管理論叢;第2卷第1期(2006),頁83-99。
    林祐毅(2020),「地方政治與人口對房價之影響:分量與區分迴歸的發現」,碩士論文,國立中山大學經濟學研究所。
    林秋瑾、楊宗憲、張金鶚(1996),「住宅價指數之研究-以台北市為例」,住宅學報;第4期(民國八十五年一月),頁1-30。
    林祖嘉、林素菁(1994),「台灣地區住宅需求價格彈性與所得彈性之估計」,住宅學報;第2期(民國八十三年),頁25-48。
    邱司杰(2015),「基於實價登錄的房價模型研究」,碩士論文,國立交通大學資訊科學與工程研究所。
    陳敬筌(2019),「應用深度學習預測區域住房平均價格—以台北市實價登錄為例」,碩士論文,銘傳大學資訊管理學系。
    陳樹衡、郭子文、棗厥庸(2007),「以決策樹之回歸樹建構住宅價格模型-台灣地區之實證分析」,住宅學報;第十六卷第一期(民國九十六年六月),頁1-20。
    陳明吉(1989),「房地產價格變動因素及影響之研究」,碩士論文,國立政治大學地政學系。
    張誌文(2011),「影響房地產價格之總體經濟因素分析」,碩士論文,國立台灣大學經濟學研究所。
    張炳耀、林淑華、葉盛、鍾世靜、鄭麗玲(1993),「住宅價格變動原因之探討」,中央銀行季刊;第15卷第4期,頁18-55。
    彭建文、張金鶚(2000),「總體經濟對房地產景氣影響之研究」,國家科學委員會研究彙刊:人文及社會科學;第十卷第三期(民國八十九年),頁330-343。
    黃佩玲(1995),「住宅價格與總體經濟變數關係之研究:以向量自我迴歸模式(VAR)進行實證」,碩士論文,國立政治大學地政學系。
    劉玉婷(2009),「應用迴歸分析及類神經網路建構不動產估價模式-以台中市住宅為例」,碩士論文,國立雲林科技大學營建工程系。
    謝佩珊(2014),「兩岸房地產景氣之經濟指標研究—以台北、上海為例」,碩士論文,國立中山大學經濟學研究所。
    龎文誠(2020),「數值分析與機器學習在房價預測之應用」,碩士論文,健行科技大學,資訊工程系碩士班。
    實價登錄比王 星編(2020年6月2日)。實價登錄1.0實價登錄2.0差在哪裡還有0.5? 傻傻分不清楚。檢自https://news.houseprice.tw/3014 (2023/01/13)
    Foster Provost, Tom Fawcett(2016)。資料科學的商業運用(陳亦苓譯)。台北,歐萊禮。
    R. Carter Hill, William E. Griffiths, Guay C. Lim(2021)。計量經濟學(黃智聰、梁儀盈譯)。台北,雙葉書廊。 

    英文文獻
    Breiman, L., J. H. Friedman, R. A. Olsen & C. J. Stone (1984). Classification and Regression Trees. CA: Wadsworth.
    Fan, G.-Z., S. E. Ong & H. C. Koh (2006). “Determinants of House Price: A Decision Tree Approach.” Urban Studies. 43(12): 2301-2316.
    Mora-Garcia R-T, Cespedes-Lopez M-F, Perez-Sanchez VR. (2022). “Housing Price Prediction Using Machine Learning Algorithms in COVID-19 Times.” Land 11(11): 2100.
    Milunovich, George (2020). “Forecasting Australia's real house price index: A comparison of time series and machine learning methods.” Journal of Forecasting 39(7): 1098-1118.
    Martins-Filho, C. & O. Bin (2005). “Estimation of Hedonic Price Functions via Additive Nonparametric Regression.” Empirical Economics. 30: 93-114.
    Nelson, C.R. & Plosser, C.R. (1982). “Trends and Random Walks in Macroeconomics Time Series.” Journal of the Monetary Economics. 10: 139-162.
    Quinlan, J. R.(1986). “Introduction of Decision Tree.” Machine Learning. 1: 81-106.
    Said, S.E. & Dickey, D.A. (1984). “Testing for Unit Roots in Autoregressive-Moving Average Models of Unknown Order.” Biometrika. 71: 599-607.

    下載圖示 校內:立即公開
    校外:立即公開
    QR CODE