基於強化式學習動態調整風險偏好之投資組合配置
本研究欲探討在強化式學習架構下的模型,針對選定標的組成之投資組合經過模型訓練後會學習到市場的資訊,從而選擇投資或是避險。投資組合之標的為蘋果(AAPL)、特斯拉(TSLA)、 美國銀行(BAC)、可口可樂(KO);資料內容為四檔標的透過計算夏普比率組成之當日開盤價、當日收盤價、當日最高價、當日最低價、當日報酬率、無風險利率,以及當日報酬率與無風險利率之平均值;演算法選擇使用近端策略最佳化為模型主架構。經過實證後發現,確實學習到利用市場資訊來選擇避險或投資。