學號
密碼
忘記密碼 登 入
×
類別 111~113
標題 集成學習器與對個股漲跌之預測與適用性分析-以生技醫療產業和金融業為例
關鍵字 集成學習、股價預測、統計檢驗
作者群 陳昊瑋、朱傳尹、賴名哲、卓湘芸、莊詠丞、黃捷、指導老師:胡聚男
內文摘要
隨著金融市場的複雜性和數據量的快速增長,傳統的金融分析和交易策略面臨著新的挑戰。機器學習技術的發展為金融領域帶來了新的可能性,使得交易策略的優化和投資決策的精確性得到了顯著提升。本研究旨在比較單一機器學習模型和多個機器學習模型(集成學習算法)在股價預測中的表現,並分析其優劣勢及其適用性。
我們選取產業波動性大(生技醫療股「1734杏輝」)和小(金融股「2886兆豐金」)的兩檔個股作為研究對象,並對影響股價的變數進行篩選和預處理。在資料預處理階段,我們對數據進行了標準化處理,並使用相關性分析篩選出對股價影響最大的關鍵變數。訓練和測試期間選定為2015年至2020年,其中80%的數據用於模型訓練,20%的數據用於模型測試,我們分別應用了支援向量機(Support Vector Machine)、決策樹(Decision Tree)、類神經網路(Artificial Neural Network)、隨機森林(Random Forest)、AdaBoost和XGBoost等六種單一學習器,以及使用Stacking的集成學習算法,並通過交叉驗證對模型進行了優化,Stacking 方法包括兩層模型,在第一層,我們使用上述六種單一學習器進行預測,然後將這些預測結果作為輸入特徵,輸入到第二層模型中,在第二層,我們選用了羅吉斯迴歸 (Logistic Regression, Logit) 作為元學習器 (Meta-Learner),以整合各個單一學習器的預測結果。這種方法可以充分利用各個模型的優勢,提高預測的準確性和穩定性。
實證結果顯示,在高波動的生技醫療股市場中,單一模型中類神經網路的預測準確率最高,達到54%,而集成學習模型Stacking的表現也不錯。但二者之間並未出現顯著差異。相比之下,在相對平穩的金融股市場中,AdaBoost和XGBoost這樣的集成學習模型在準確率、精確率和F1-score等指標上均優於單一模型。
統計檢驗結果進一步證實了這一發現,在高波動市場中,單一模型和集成模型的預測效果沒有顯著差異,而在低波動市場中,集成學習的表現則顯著優於單一模型。
這一結果反映了不同模型在面對複雜市場環境時的特點。在高波動市場中,單一模型已經足夠強大,而在相對平穩的市場中,集成學習能夠更好地融合不同模型的優勢,從而實現更準確的預測。因此,我們建議投資者和研究者根據市場環境的不同特徵,靈活選擇適當的機器學習模型,以提高股價預測的整體表現。