簡易檢索 / 詳目顯示

研究生: 彭季堯
Peng, Chi-Yao
論文名稱: 應用機器學習預測目標客戶–以E公司為例
Apply machine learning to predict target client-A case study of company E
指導教授: 馬瀰嘉
Ma, Mi-Chia
學位類別: 碩士
Master
系所名稱: 管理學院 - 高階管理碩士在職專班(EMBA)
Executive Master of Business Administration (EMBA)
論文出版年: 2022
畢業學年度: 110
語文別: 中文
論文頁數: 55
中文關鍵詞: 機器學習混淆矩陣銷售漏斗
外文關鍵詞: Machine Learning, Confusion Matrix, Sales Pipeline
相關次數: 點閱:229下載:42
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 經理人如果能夠精準預測潛在目標客戶,代表企業可以快速並正確安排為了成交客戶的各項資源投入。但傳統透過業務人員判斷是否為目標客戶之銷售方式,因為不容易有共同的認定標準而無法在組織間推廣,也因為業務人員個性、背景、喜好不同,無從談起預測的一致性和準確性。
    本研究藉由E公司客戶關係管理系統中所記錄的近2年內商機資料,使用機器學習的方法進行資料分析,希望能夠在E公司B2B的商業模式下,建置高品質的潛在成交客戶預測模型。藉由適當的模型推薦潛在成交客戶來取代人為判斷,可幫助經理人對企業資源以及行銷活動加以合理運用及分配,能夠降低營運成本並增加企業獲利。
    本研究將E公司提供之商機樣本資料,經過資料前處理後,使用隨機森林、羅吉斯迴歸、套索迴歸以及支援向量機等機器學習方法,以Python 程式語言建置機器學習模型並比較精確率、召回率、F1-分數等模型績效指標。本研究發現若E公司追求精確率以隨機森林模型績效較佳,若追求召回率則以支援向量機模型績效較佳。由套索迴歸係數顯示影響成交勝算的變數有「所在區域」、「上市櫃資訊」、「員工人數分箱」,所在區域結果顯示客戶為高雄市成交的勝算大於台北市、台北市成交的勝算大於台中市。上市櫃資訊結果顯示客戶為興櫃成交的勝算大於上櫃、上櫃成交的勝算大於一般企業。員工人數分箱結果顯示客戶公司是「員工人數2級」成交的勝算大於「員工人數1級」,「員工人數2級」和「員工人數3級」的客戶成交勝算相近。
    本研究成果顯示,E公司可以採用適當的機器學習模型,在新商機進入E公司客戶關係管理系統中時,第一時間識別潛在成交客戶,除幫助經理人優先投入銷售資源外,E公司更能以此成果為基礎,持續推動數位優化達成數位轉型,建立競爭對手難以模仿的數位優勢。

    If the manager can accurately predict potential target customers, it means that the enterprise can quickly and correctly arrange the investment of various resources for closing customers. This research uses machine learning to predict whether closing a deal for the target clients in company E's business data. The machine learning methods include random forest, logistic regression, LASSO regression and support vector machine. We use them to build models in Python programming language. Model performances are compared by the accuracy rate, precision rate, recall rate and F1-score. The empirical results show that if company E pursues high precision, the random forest model is better; if company E seeks high recall, the SVM model is better. The lasso regression coefficients show that the variables affecting the odds of completing a contract include "company location area", "listed company at OTC information", and "The binning level for the number of employees".

    Based on this achievement, Company E can continue to promote digital optimization to achieve digital transformation and establish a digital advantage that is difficult for competitors to imitate.

    第一章 緒論 1 第一節 研究背景與動機 1 第二節 研究目的 3 第三節 研究架構 4 第二章 文獻探討 5 第一節 機器學習的定義與特性 5 第二節 分類演算法 7 第三節 評估預測模型 11 第三章 研究設計 15 第一節 特徵變數說明 17 第二節 基本敘述統計 17 第三節 遺失值處理與特徵工程 23 第四節 資料不平衡處理(imbalanced data) 29 第四章 實證分析 31 第一節 資料來源 31 第二節 分類模型 32 第三節 模型效能比較與分析 38 第五章 結論與建議 41 第一節 結論 41 第二節 管理意涵 42 第三節 研究限制 42 第四節 未來研究方向 43 參考文獻 44 附錄 A 特徵工程Python 程式碼 47 附錄 B 資料分箱Python 程式碼 49 附錄 C 本研究機器學習Python 完整程式碼 52

    Abaker, M., Abdelmaboud, A., Osman, M., Alghobiri, M., & Abdelmotlab, A. (2021). A Rock-fall Early Warning System Based on Logistic Regression Model. Intelligent Automation and Soft Computing, 28(3), 843-856. doi:10.32604/iasc.2021.017714
    Lee, S., & Moon, N. (2018). Location recognition system using random forest. Journal of Ambient Intelligence and Humanized Computing, 9(4), 1191-1196. doi:10.1007/s12652-018-0679-5
    Ma, L. Y., & Sun, B. H. (2020). Machine learning and AI in marketing - Connecting computing power to human insights. International Journal of Research in Marketing, 37(3), 481-504. doi:10.1016/j.ijresmar.2020.04.005
    McNellis, J. (2019). You’re likely investing a lot in marketing analytics, but are you getting the right insights? Retrieved from https://blogs.gartner.com/jason-mcnellis/2019/11/05/youre-likely-investing-lot-marketing-analytics-getting-right-insights/
    Meixedo, A., Santos, J., Ribeiro, D., Calcada, R., & Todd, M. D. (2022). Online unsupervised detection of structural changes using train-induced dynamic responses. Mechanical Systems and Signal Processing, 165. doi:10.1016/j.ymssp.2021.108268
    Rathore, S., & Park, J. H. (2018). Semi-supervised learning based distributed attack detection framework for IoT. Applied Soft Computing, 72, 79-89. doi:10.1016/j.asoc.2018.05.049
    Shashi, Pandey, V., Rajesh, & Radu. (2020). Machine Learning Approaches to Real Estate Market Prediction Problem: A Case Study. arXiv pre-print server. doi:arxiv:2008.09922
    Zhang, S. T., Wu, J. R., Jia, Y. G., Wang, Y. G., Zhang, Y. Q., & Duan, Q. B. (2021). A temporal LASSO regression model for the emergency forecasting of the suspended sediment concentrations in coastal oceans: Accuracy and interpretability. Engineering Applications of Artificial Intelligence, 100, 13. doi:10.1016/j.engappai.2021.104206
    Zhang, X. Y., Huang, W., Lin, X., Jiang, L. H., Wu, Y., & Wu, C. X. (2020). Complex image recognition algorithm based on immune random forest model. Soft Computing, 24(16), 12643-12657. doi:10.1007/s00500-020-04706-0
    Zhang, Y. (2020). Food safety risk intelligence early warning based on support vector machine. Journal of Intelligent & Fuzzy Systems, 38(6), 6957-6969. doi:10.3233/jifs-179774
    丁美彤(2020). 應用機器學習與空間之鄰域特徵於房價預測. (碩士論文). 世新大學, 臺北市. Retrieved from https://hdl.handle.net/11296/mw3478
    何柏毅(2019). 再探股價溢酬之預測- Lasso模型之應用. (碩士論文). 東海大學, 台中市. Retrieved from https://hdl.handle.net/11296/96abme
    呂昀(2019). 應用隨機森林預測線上飯店之 點閱與預訂. (碩士論文). 國立臺北科技大學, 台北市. Retrieved from https://hdl.handle.net/11296/699b39
    曾政興(2018). 企業財務預警模型 – 以羅吉斯迴歸分析. (碩士論文). 淡江大學, 新北市. Retrieved from https://hdl.handle.net/11296/nsjzuv
    李崧安(2018). 隨機森林建構的台灣加權指數交易策略. (碩士論文). 國立中山大學, 高雄市. Retrieved from https://hdl.handle.net/11296/6k4rxf
    林孟儒(2017). 確認影響手機遊戲App內消費之關鍵因素. (碩士論文). 朝陽科技大學, 台中市. Retrieved from https://hdl.handle.net/11296/rqk9g5
    林延修(2020). 運用非監督式學習強化斷詞系統-以PTT資料為例. (碩士論文). 淡江大學, 新北市. Retrieved from https://hdl.handle.net/11296/qde69w
    游育婷(2021). 運用支持向量機及技術指標分析臺灣50指數的買賣策略. (碩士論文). 銘傳大學, 台北市. Retrieved from https://hdl.handle.net/11296/j34u5m
    蔡承倫(2018). 端到端使用深度強化式學習訓練賽車遊戲AI機器人. (碩士論文). 國立交通大學, Retrieved from https://hdl.handle.net/11296/sq7rv4
    蔡璧光(2018). 機器學習為基礎的產品與顧客區隔之研究- 以化妝品公司為例. (碩士論文). 輔仁大學, 新北市. Retrieved from https://hdl.handle.net/11296/kj95eq
    許凱富(2019). 大數據分析於行銷策略的應用-以高爾夫練習場為案例. (碩士論文). 東吳大學, 台北市. Retrieved from https://hdl.handle.net/11296/r5495w
    許創榆(2020). 使用非監督式學習於偵測新聞框架. (碩士論文). 世新大學, 臺北市. Retrieved from https://hdl.handle.net/11296/6eqmq3
    詹佳芸(2016). 在雲端平台上建立機器學習機制用於資料分析與預測. (碩士論文). 國立臺灣科技大學, 台北市. Retrieved from https://hdl.handle.net/11296/qtb3cb
    邱國祥(2020). 以多元線性迴歸與機器學習模型預估不動產價格-以台中市實價登錄為例. (碩士論文). 國立中興大學, 台中市. Retrieved from https://hdl.handle.net/11296/nd3u33
    郭若宣(2020). 應用資料探勘技術於RFM顧客價值區隔之研究. (碩士論文). 銘傳大學, 台北市. Retrieved from https://hdl.handle.net/11296/qmm393
    鄭翊宏(2021). 基於RGB影像與強化式學習技術以實現機器人室內無地圖導航. (碩士論文). 國立中正大學, 嘉義縣. Retrieved from https://hdl.handle.net/11296/m4wzp9
    陳彥汝(2016). 於不平衡網路借貸資料集中使用機器學習機制預測違約風險. (碩士論文). 國立臺灣科技大學, 台北市. Retrieved from https://hdl.handle.net/11296/2986wx
    陳淑惠(2020). 以監督式學習探討北捷旅運量. (碩士論文). 嶺東科技大學, 台中市. Retrieved from https://hdl.handle.net/11296/wz8w38
    黃上倫(2020). 應用支援向量機選股:台灣股市的實證研究. (碩士論文). 國立東華大學, 花蓮縣. Retrieved from https://hdl.handle.net/11296/c6g832

    下載圖示 校內:立即公開
    校外:立即公開
    QR CODE