量化投資選股之多因子選股模型
一、定義與思想
量化投資選股就是利用數量化的方法選擇股票組合,期望股票組合能獲得超越基準收益率的投資行為。多因子模型是運用最廣泛的一種選股模型,基本的原理是采用一系列的因子作為選股的條件,滿足這些因子的股票則被買入,不滿足則被賣出。多因子模型相關比較穩定,因為在不同市場下,總有一些因子會發揮作用。
市場上的投資者,不管是價值投資者,還是投機者,或者短線交易者,都會根據某些因子來判斷股票的漲跌。當一群交易者同時采用某個因子的時候,就會造成該因子有效。
因子選股模型為什么適用?舉一個簡單的例子:如果有一批人參加馬拉松,想知道哪些人能獲得不錯的成績,只需在跑前做一個身體測試即可。測試可以用一個或多個指標。對測試的結果進行排名,排名靠前的運動員獲得好成績的可能性就比較大。因子選股模型的原理與此類似,可以利用某些指標(因子)選擇未來可能表現較好的股票。
二、因子的種類
哪些因子可能成為選擇股票的依據?這主要依賴于金融經濟邏輯和市場經驗。總的來說,因子的來源有三方面:
1)公司層面因子;2)外部環境因子;3)市場表現因子。
(一)公司層面因子公司層面因子來自于公司的微觀結構,與公司的生產經營息息相關,一般來自公司的財務指標,反映了公司的盈利、運營、債務和成長狀況。這些因子主要有:
1)價值類因子,如PE、PB;
2)成長類因子,如ROE、凈利潤增長率;
3)規模類因子,如凈利潤、營業收入;
4)情緒類因子,如預測未來12個月的利潤增長率;
5)質量類因子,如資產負債率、應收賬款周轉率。
(二)外部環境因子政治法律、宏觀經濟、社會習俗和技術發展等外部環境對一個行業和企業來說都是非常重要的。比較重要并且容易量化投資的外部環境因子主要是
1)宏觀環境因子,如經濟增長率、利率等;
2)行業環境,如行業集中度等。
(三)市場表現因子市場表現因子主要體現的是股票在交易過程中的價格和交易量。這些因子主要有動量和反轉類因子、資金流向和各種技術類指標等。
三、建模方法
因子選股模型想法比較簡單,幾乎用不到特別復雜的數學模型。如果從數學的角度來看,因子選股模型僅僅是一個從因子到資金曲線的映射:
f(factors,parameters)=equity
其中f表示交易系統(線性或非線性),實際建模時可以用回歸法或打分法進行簡化處理。Factors是我們篩選出來的一些有效因子,如果這些因子有信息重疊,可以采用多元統計中的主成分分析或因子分析進行降維處理。Parameters是建模時遇到的各種參數,它們包括因子的權重、觀察時間長度和持有時間長度等。Equity是資金曲線,它反映我們賬戶隨時間的變化情況。通過對資金曲線equity的一些再處理,就可以得到一些評價指標(如年化收益率、年化夏普比率和最大回撤等),通過這些指標可以來評價該投資策略的效果。
從上面的模型可以可以看出,因子選股模型最重要的有兩方面:一個是有效因子的選擇,另一個是因子參數的選擇。例如到底是PE有效還是ROE有效;到底是采用1個月做調倉周期還是3個月做調倉周期。這些因子和參數的獲取只能通過歷史數據的回測來獲得。