| 研究生: |
曾健逢 Tseng, Chien-Feng |
|---|---|
| 論文名稱: |
大量資料集之線性迴歸模式的估計問題 Estimation for Linear Regression Model on Large Data Sets |
| 指導教授: |
林共進
Lin, Dennis K. J. 任眉眉 Zen, Mei-Mei |
| 學位類別: |
碩士 Master |
| 系所名稱: |
管理學院 - 統計學系 Department of Statistics |
| 論文出版年: | 2002 |
| 畢業學年度: | 90 |
| 語文別: | 中文 |
| 論文頁數: | 59 |
| 中文關鍵詞: | 參數估計 、大量資料集 、迴歸分析 |
| 相關次數: | 點閱:89 下載:4 |
| 分享至: |
| 查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
資訊科技的重大變革使得資料的蒐集在過去十年間變的更為便利與普遍,現行資料庫的儲存不但可能包含了上百個欄位,而且資料量可能更多達數百億筆。在面對這麼大量的資料集下,傳統的統計方法必須藉由適度的改良與修正,使得資料分析的目的能夠順利完成。根據Li, Lin and Li[5]一文的概念,本研究針對大量資料集提出了估計線性迴歸模式參數的方法。藉由本研究方法,我們可以很容易地計算得到大量資料集的迴歸參數估計值,而且在常態誤差的假設下,本方法所提出的估計量是迴歸參數的不偏估計量。再者,數值分析的結果顯示該估計量的變異數與最小平方法估計量的變異數相當,而且當樣本數愈大,研究方法與最小平方法的估計結果會愈接近。此外,模擬的結果也呈現本研究方法在其他線性迴歸模式的估計問題上亦有不錯的表現。最後的實例分析則說明了本方法在實際應用上的優勢與便利。
none
1. Chao, M.T. and Lin, G.D. (1993), The Asymptotic Distributions of the Remedians, Journal of Statistical Planning and Inference, 37, 1-11.
2. Cleveland, W. S. and Sun, D. X. (2000), Internet Traffic Data. Journal of the American Statistical Association, 95, 979-985.
3. Hand, D.J., Blunt, G., Kelly, M. G. and Adams, N. M. (2000), Data Mining for Fun and Profit. Statistical Sciences, 15, 111-131.
4. Hurley, C. and Modarres, R. (1995), Low-Storage Quantile Estimation. Computational Statistics, 10, 311-325.
5. Li, Runze, Lin, Dennis K.J. and Li, Bing. (2001), Statistical Inference on Large Data Set. Department of Statistics, The Pennsylvania State University Technique Report.
6. Neter, J., Kutner, M. H., Nachtsheim, C. J. and Wasserman. W. (1996), Applied Linear Regression Models, 3rd edition, Richard D. Irwin, Burr Ridge, Illinois.
7. Pearl. J. (1981), A Space-Efficient On-Line Method of Computing Quantile Estimates. Journal of Algorithms, 2, 164-177.
8. Robins. H and Monro S. (1951), A Stochastic approximation method. Ann. Math. Statist., 22, 400-427.
9. Rousseeuw, P.J. and Bassett, G.W. (1990), The Remedian: A Robust Averaging Method for Large Datasets, Journal of the American Statistical Association, 85, 97-104.
10. Tierney, L. (1983), A Space-Efficient Recursive Procedure For Estimating A Quantile of An Unknown Distribution. SIAM Journal on Scientific and Statistical Computing, 4(4): 706-711.