關于量化投資策略擬合的若干問題的解答
首先要說的是,下文說的策略不包含擇時,所說的都是策略本身
1.克服想當然思想
面對未知事物,尤其是沒有什么經驗的,想當然這種思想是一定要除去的。我先提兩個問題,昨日A股市值最小的30%股票,是小于多少億?A股當日成交額最小的50%股票,成交額是小于多少億?是不是沒什么概念,先想當然回答吧,然后跟數據比較一下,就會發現自己錯的有多離譜。
為什么要克服想當然思想這么重要,這里有個心理學現象,人總是對自己特別自信,一旦你寫下了答案,你就對這么答案的信心一下子提高了,別人的答案很大可能是歪理邪說,總之大概率沒有你自己寫的正確。股市中這個現象特別普遍,也常被提起,一旦你買入某只股票,就對這只股票特別有信心,別人買入的股票,肯定是垃圾,就算你幾天后沒跑贏別人的股票,也會覺得未來肯定是自己的勝出。
寫策略也是,你會對自己寫的策略特別認可,別人的策略如果收益低,那么就是垃圾,如果收益比你高,那么肯定是過度擬合了。
寫策略還有個現象,你想當然的認為兩個權重是1:1,那么是極好的,如果是2:3,就會覺得擬合了。可別忘了,你想當然的八成錯的離譜。你想當然覺得不對的,很可能比你好。
所以這種心理一定要克服,沒有一點根據,參數怎么能隨便寫?
2.擬合怎么來的?
創建策略就是擬合的過程。
創建策略時,第一步有個想法,價值型,成長型,小市值,超跌,小成交額,想法很多,先統統試一遍,發現小市值最好,而且遙遙領先,其次是小成交額。那好,別的策略我不做了,只做小市值和小成交額。相信到這一步還沒人說存在擬合。
開始第二步,我覺得既不能太分散,也不能太集中,我要創建個4個股票的策略,采用模型2,簡單排除漲跌停,不擇時,排名大于等于7賣出,測試發現年化113%,真是感覺棒棒噠。但是這里就產生了一個問題,這個策略有幾個可變參數?雖然這個策略很簡單,但還是存在一個參數,那就是“大于等于7賣出”,為什么是7,而不是5、6、8、9或者更大?我竟然回答不上來,只能說,是我想當然覺得是7。做事怎么能想當然,何況是面對未知事物,沒有任何經驗,想當然這種思想是一定要除去的。于是我一個個驗證,大于等于5賣出,年化95%;大于等于6賣出,年化113%;大于等于8賣出,年化116%;大于等于9賣出,年化117%;大于等于10賣出,年化114%;大于等于11賣出,年化114%。到這里就差不多結論出來了,大于等于9賣出是最好的,于是我就選擇大于等于9賣出。到這一步,擬合就出來了,9就是擬合出來的,但是這個擬合相信大家都是還能接受的,畢竟9跟其他幾個差別不大。
第三步開始就稍微有點技術含量了。剛剛一開始發現,5日成交額也特別好用,我得看看加入策略里會有什么變化,可以加在刷選條件里,也可以加在排名條件里。我這里舉例子就加入在排名條件里,于是這個策略一下子有了3個可變參數,分別是市值權重,5日成交額權重,賣出排名。有三個參數后,策略怎么寫的可能性那就很多了,權重比例可以是任意的,可能性是無限的。于是我先按大于等于9賣出這個條件不變,市值和5日成交額權重比例1:1,一測年化129%,有提高。但是在無數種寫法里,如果我這么隨便一寫,就是最高年化,那真是太天真了。策略做到這里,最好就是用計算機自動測試,做窮舉法,取最優解。作為人類,我稍微試了下,市值和5日成交額權重比例11:10,賣出條件為大于10,年化就到了135%。到這一步,擬合就會越來越多,這還只有三個參數,相信大家的策略參數只會更多,不會更少。
3.為什么參數調動就是擬合,而不是一開始想當然的參數有缺陷?
古代鑄鐵,知道鐵是一個不錯的材料,鐵中摻入碳,就成了鋼,性能就更好了,但是碳加多了也不好,這個比例是一個個試出來的,而不是隨便想出來的。
即便是現在航空合金,也是各種金屬混合比例試出來的,你要說幾個金屬1:1:1最好,這是說笑話了。沒辦法,即便是航空材料,也是不斷試出來的。
但有個區別,做完材料,它是穩定的,未來也不變,但策略未來的好壞難料。
還是討論上面的例子,為什么1:1不是擬合,11:10就是擬合?雖然11:10也很接近1。都是小市值小成交額策略,難道比例變了,本質就變了,邏輯就變了?既然邏輯不變,為什么年化高的就是擬合?
假設上面的例子中,將比例調整為3:1,年化收益能提高50%,那是擬合了?還是原來1:1的參數有缺陷?我認為是1:1的參數有缺陷,畢竟是想當然寫的,能是最好才怪了。
假設上面的例子中,參數3:1,年化180%,參數1:1年化130%,你選擇哪個實盤?這就涉及下一個問題,什么樣的策略可信。
4.什么樣的策略可信?
有個無限的口袋,里面裝滿了紅球白球,沒人知道真正的比例,但先取了2400個球,發現紅球比白球是6比4,你正好要賭球,你怎么下注?肯定下注紅球出現的概率大吧。但事實上未來紅白球比例會不會變化沒人知道,但之前的概率必定會影響你。
這時如果你發現還有另一個賭球,也先取了2400個球,發現紅球比白球是8比2,這時兩個賭球選哪個去賭,相信你更愿意選這個吧。
股市就可以認為是這個無限大的口袋,07年至今2400個交易日不到點,你正在下注,按照你以為的大概率下注。你所謂的大概率也好,經驗也好,都基于歷史的表現。
給你兩個黑箱策略,告訴你邏輯一樣,檢驗都從07年開始,一個年化200%,一個年化250%,你有什么理由非要選擇年化200%的?又憑什么咬定250%的是過度擬合,200%不是水平不行?
未來那個黑箱好,我不知道,但讓我選擇我肯定選年化高的,因為我找不到年化200%未來會比250%好的理由。生活中的經驗多數是,成績好的總是那幾個,工資高的也是那幾個,逆襲確實有,但是少,我總愿意相信過去表現好的。
5.高收益的策略未來一定比低收益的好?
上面說這么多,就是為了說明,都是一樣的邏輯,沒理由去選年化低的策略。至于未來表現哪個好?
可以很負責任的告訴你,策略邏輯一樣,未來誰好誰壞不知道。但邏輯不一樣的策略,未來還是高收益會更好。
盡人事,聽天命