《寬邦科技:2023年度中國量化投資白皮書(196頁).pdf》由會員分享,可在線閱讀,更多相關《寬邦科技:2023年度中國量化投資白皮書(196頁).pdf(196頁珍藏版)》請在三個皮匠報告上搜索。
1、-1-關關鍵鍵數數據據及及發發現現-3-4-1-關鍵數據及發現關鍵數據及發現KEY FINDINGS1.2023 年,A 股“沖高回落、震蕩下跌”,量化進入存量博弈。私募規模擴張趨勢放緩,新備案私募門檻增高,行業格局穩定性增強,已經形成了越來越快的“飛輪效應”:業績好的機構形成口碑和規模,吸引了人才、資金、資源的大幅進入,同時算力、數據、投研等方面不斷積累,資管規模不斷擴大,而資源的增加又促成了良好業績的產生。2023 年,規模 50 億以上機構從 41 家增加至 50 家,占整個量化私募 5%。2.量化機構的投研趨勢之一體現在多資產、多信號、多頻段融合。機構橫跨多個資產類別,高中低頻多個信號
2、頻段。3.TB 級別(41.07%)和 PB 級別(27.38%)是當前主流存儲規模,PB 級別(27.38%)則使得量化開始進入真正的“大數據”機構。低頻量價數據的使用覆蓋度最高(72.62%),其次是基本面財務數據(66.67%)和高頻量價數據(58.33%)。高頻量價數據維度大、噪聲高,數據及因子一般不直接使用,需要進行大量數據清洗和加工,包括利用增量行情自動拼接全量行情,用快照數據重構訂單簿,高頻因子平滑處理等。4.另類數據目前使用面最廣的為分析師一致性預期數據及輿情數據,分析師一致性預期數據的分析主要有 Alpha-Capture賣方預期評價、情緒打分、知識圖譜構建等使用方式。事件、
3、情緒維度的數據由于信息的滯后性則需要關注市場反身性避免形成反指。5.量化機構通過研究經驗、買方靈感、賣方研報、前沿信息獲取研究靈感生成因子,按照因子種類、預測周期、產生背景,當前多因子已經形成非常龐雜的體系,量化機構一般會根據 300、500、1000 指增、中性等各類產品分配不同的因子比重,最常見的為 70-80%量價類因子+20-30%(基本面因子輿情和另類因子),以追求因子之間的低相關性。人工挖掘(覆蓋度77.38%)以邏輯性因子為主,依賴于研究人員的專業知識和直覺,機器挖掘(覆蓋度 59.52%)以統計性因子為主,利用機器學習算法自動識別有預測能力的因子,發現人工方法難以識別的復雜模式
4、和關系。6.過往三年問卷調研數據顯示,當前量化模型技術呈現多樣性、復雜性,沒有任何一種技術在所有環節中都占據絕對的優勢,一個量化策略需要結合多種技術來處理不同問題。數據處理相關的環節模型應用較為集中(如數據清洗、特征提取、模型構建),而在直接的決策制定環節(如策略優化、高頻交易)則較為分散。7.組合優化環節,目前量化機構的優化器呈現更快、更復雜的趨勢。更復雜表現在:除了回報(79.17%)和風險預測(76.79%)是優化的核心常見功能,交易成本(60.12%)、組合限制(48.21%)、業績基準(42.86%)等、融券利率(19.64%)及基差成本(29.17%)等也有機構納入了優化器功能之中
5、。隨著賬戶數量、投資標的和投資邏輯的不斷增加,計算量更大,部分機構實現盤中分鐘級別出交易清單。機構對市值、流動性、分散度、成分股等進行了風控,Barra 模型是目前國內的主流風險控制模型,但在實際使用中有許多局限性,例如預測周期偏長、沒有考慮特異性股池,A 股的特點結合性有待提升等。所以很多機構除了根據其控制因子敞口,對標基準進行行業和風格約束之外,還會進行周期改動等優化調整。-2-8.量化機構會采用股指期貨、融券、期權等多種方式或結合的方式進行對沖,持續跟蹤成本差異,以求得對沖成本、對沖精度的最優解。尋常認知中,公眾對高頻與做空最容易產生誤解,但樣本池內數據顯示,當前公眾對做空策略有相對較為
6、成熟和均衡的看法,能夠認識到做空(占比 83.84%)是市場正常機制的一部分,有助于發現價格泡沫和過高估值。只要不是惡意操縱市場,做空策略應該被允許(占比 65.5%)。9.不同的交易頻率有其適應的市場行情,如果僅僅是擅長某一類因子或者某一個頻段的預測,在多變的市場環境下可能會遭遇逆周期時出現回撤,所以機構需要捕捉市場不同周期收益來源,逐步豐富覆蓋低、中、高多個頻段,全頻段覆蓋及融合的挑戰在于:1.無明顯頻段短板;2.平衡、分配不同預測周期的權重。有的從特征層面融合,有的從優化器層面融合,還有從組合層面融合。10.數據顯示,目前機構認為業績歸因 Smart Beta 超越 Pure Alpha
7、,持倉收益超過交易收益.值得注意的是,1 個億以下規模量化機構(平均分 5.29)和 50-100 億規模機構(平均分 4.55)對自己創造 Pure Alpha 的能力給出了相對較高的評分。11.面向未來一年,量化投研人員對未來市場的預期較為中性,部分因素略偏向樂觀(如市場行情 Beta 走勢、成交量和流動性、科技創新),而對于監管政策及輿論導向和交易、策略集中度則較為擔憂。12.極端行情期間,量化機構調整策略與未調整的人各占一半,主要調整內容包括因子權重(51.18%)、杠桿比率(49.41%)、交易執行(48.82%)、指數成分(45.88%)。調研認為本輪危機中,一些軟性的實力放在了更
8、顯著的位置,排名前 5 的為心理韌性、危機溝通能力、團隊協作、快速響應、合規風控,超越策略本身。13.量化交易對 A 股市場影響方面,大多數公眾認為量化交易對 A 股市場有積極的影響,特別是在提升市場效率(71.18%)、促進市場創新(64.63%)和增強流動性方面(79.91%)。同時,也有一定比例的公眾擔心量化交易可能會增加市場波動,反映了對量化交易影響的復雜性和雙刃劍特性的認識。14.四成的受訪者對量化機構沒有負面情緒,剩下的有情緒的公眾中歸因主要方向是:信息不對稱(31.88%)、量化復雜性(27.51%)、媒體報道(28.82%)。15.面對公眾的質疑,7 成機構選擇了投資教育作為應
9、對公眾誤解的主要策略。但傳播與教育效果并未如預期,公眾教育甚至成為機構名為保持“低調”,實為并不溝通的安慰劑,本質上是一個靜默策略,實際執行過程中,自行組織視頻投教僅為22.35%,部分機構甚至未與任何渠道做過任何溝通,投資者教育活動可能未能達到預期的覆蓋面或深度。16.公眾對于將量化投資策略納入個人投資組合持積極態度。多數受訪者(79.04%)表達了對量化投資的信任,愿意考慮將其作為投資組合的一部分。-3-17.若因子與模型的經濟學意義與人工智能代表兩個相反方向,可以大致對量化機構派別進行劃分為:傳統經濟學派(占比 44.12%)、平衡派(占比 22.94%)及人工智能派(占比 33.53%
10、),預計未來三年,這個比例會調整為 20.59%:18.24%:60.59%。18.大模型當前應用分為創造 Alpha、提升效率以及投資者關系三個方面:其中最明顯的作用在于思維啟發、投研思路拓展(64.71%)。代碼生產、編程輔助或 Debug 占比 34.71%。19.數據質量是限制另類數據使用最核心的因素,包括數據不完整(61.76%)缺少關鍵信息,影響分析的完整性。清洗難度大(48.82%)意味著需要投入更多的時間和資源。供應商雜亂(47.65%)多且標準不一,會給數據采購和質量控制帶來挑戰。20.在應用另類數據的時候,量化機構最核心的還是是否具有強邏輯。量化機構需要尋找邏輯鏈條較短、邏
11、輯清晰、歷史更長的產業鏈數據或行業特有數據,目前另類數據中,結構化數據仍然是最主要的數據來源(權重占比 55.29%),非結構化數據如文字、語音、視頻和圖像還需機構自行清理,所以應用范圍較少,權重占比分別為 18.88%、7.03%、11.78%。-4-數據來源及結構數據來源及結構DATA SOURCE AND STRUCTURE量化機構版量化機構版圖表 機構類型圖表 機構當前管理規模圖表 崗位類別圖表 薪酬區間【總包】圖表 薪酬漲跌幅圖表 投資標的-5-社會公眾版社會公眾版圖表 身份類型圖表 過去一年公眾投資總體盈虧情況數據說明數據說明風險提示:本次問卷受限于問卷設計、樣本獲取、數據整理方式
12、,可能與實際市場情況存在偏差與測算主觀性問題。白皮書涉及問卷數據只能反映受訪者對自己理解程度的主觀評價,并不一定準確反映其實際能力水平。不同受訪者對評分的標準可能存在差異,因此這些數據更多地提供了一個關于受訪者自我認知的總體趨勢,而不是一個嚴格的能力測試結果。本問卷投放暴露于量化行業或者關注量化的社會公眾,其認知與態度可能存在幸存者偏差。-6-第第一一章章背背離離與與博博弈弈-7-0101量化與主流機構的背離1.沖高回落 幾家歡喜1.沖高回落 幾家歡喜“沖高回落、震蕩下跌”,幾乎所有機構面對 2023 年 A 股市場時,都會如此形容。2023 年開年伊始,ChatGPT 橫空出世,引爆相關行業
13、。下半年,俄烏沖突一波未平,巴以沖突又起,全球地緣政治割裂、動蕩,疊加美聯儲持續加息,北向資金出現持續凈賣出。上證指數從年初 3000 點附近一路震蕩反彈,一度攀升至 3418.95 點,隨后二季度開始震蕩起伏,三季度末收盤于 3110.48點。四季度市場一度震蕩下跌,最低跌破 2900 點,達到 2882.0 點,隨后震蕩反彈,12 月底回到 2974.93 點上方,年內小幅下跌 3.7%。圖表 2023 年 A 股市場表現資料數據來源:火富牛2023 年市場先揚后抑,板塊輪動劇烈,中特估、ChatGPT、華為產業鏈、室溫超導、北交所,各類主題曇花一現。僅剩微盤股全年表現一枝獨秀。使得不管是
14、持有型機構還是交易型機構/個人都在市場里備受煎熬。2023 年底,招商證券統計了全 A 個股兩兩相關系數中位數。發現全 A 個股相關性有所降低,這也為量化基金在 2023 年獲得超額收益提供了市場條件。同時可以采用方差比檢驗來考察市場的定價效率,顯示定價效率在 2023 年有所提升,有利于基于歷史數據構建策略以獲得超額收益。公募量化基金 2023 年度盤點:激流勇進,再接再厲2024/01/30 招商證券主題突出、切換頻繁的行情使得市場分化較明顯。主觀基金與量化基金風險承擔和盈虧情況上存在顯著差異。尤其是“大白馬”、核心資產、大盤成長的基金整體表現不佳。從基金產品收益率平均值和中位數上看,主觀
15、基金與量化基金雖然各有盈虧,但量化基金的回撤、集中性表現更好。圖表 2023 年主觀多頭 vs 量化多頭 vs 股票市場中性策略業績分布情況主觀多頭策略量化多頭策略股票市場中性策略公司規模平均值中位數標準差平均值中位數標準差平均值中位數標準差收益率0-5 億5.35%6.88%23.43%2.41%0.59%19.79%6.12%4.83%11.92%5-10 億2.48%5.69%23.31%4.74%3.75%15.71%10.44%8.06%18.39%10-20 億4.84%6.18%18.64%3.69%2.49%10.75%6.96%6.84%9.37%-8-20-50 億2.77
16、%3.57%15.92%4.07%3.76%10.38%6.82%7.55%8.63%50-100 億5.20%-7.94%12.90%5.43%4.69%9.31%8.64%7.66%11.39%100 億+-1.74%6.21%15.97%5.50%4.45%6.55%6.67%5.63%4.83%最大回撤0-5 億-23.65%-21.52%13.89%-15.28%-12.52%10.87%-6.36%3.65%6.99%5-10 億-20.29%-18.95%10.84%-12.64%-10.95%7.05%-3.15%-1.86%5.22%10-20 億-20.11%-18.06%
17、11.57%-12.33%-11.31%6.19%-3.90%-2.11%6.31%20-50 億-19.10%-17.62%10.79%-12.20%-11.74%6.07%-4.73%-1.91%9.63%50-100 億-18.58%-18.32%8.50%-11.09%-10.36%3.49%4.27%-2.13%5.36%100 億+-16.89%-16.62%6.01%-10.32%-9.83%2.85%-2.10%-1.39%2.96%數據來源:白小白的學習筆記在收益方面:量化代表機構(規模 50 億以上)平均值和中位數收益表現更好,在百億私募 TOP20 的榜單上,量化策略16
18、 家上榜,占比 80%。從指數增強超額收益中位數來看,300 指增約 8%,500 指增約 10%,1000 指增超過 15%,量化多頭 2023 年收益分布如下圖,80%收益集中在-5%,14%,收益為正的占比 78%。收益分布的集中度顯著高于傳統多頭,這意味著投資量化多頭產品有更穩定的預期表現。圖表 2023 年量化多頭收益分布圖表 2023 年量化多頭倉位變化圖數據來源:招商私募指數數據庫圖表 公、私募量化基金超額收益業績統計300 指增500 指增1000 指增主動增強公募私募公募私募公募私募公募私募2017-0.21%3.00%11.72%18.12%13.58%14.17%0.36
19、%1.32%20184.82%15.50%11.47%27.40%26.97%43.63%11.78%27.17%20191.23%6.42%4.480%11.96%8.21%20.78%1.79%-1.03%202011.15%10.81%11.17%15.71%14.17%14.57%13.81%8.45%20215.96%13.76%2.65%10.63%4.74%12.12%2.02%11.56%20222.87%10.19%4.66%13.00%8.41%18.77%0.34%13.23%20231.94%5.66%2.18%11.39%7.28%15.06%0.27%7.44%年化
20、收益率4.13%9.11%7.07%15.92%12.81%19.78%4.34%9.73%年化波動率2.49%3.58%3.92%4.26%7.40%4.94%4.55%6.52%-9-夏普比率0.851.991.293.271.463.600.511.19最大回撤-5.01%-3.95%-6.30%-3.82%-11.22%-4.12%-8.98%-7.81%數據統計區間:2017.01.01-2023.12.29數據來源:wind、朝陽永續、國泰君安證券研究在回撤方面:量化多頭策略在所有規模區間的公司最大回撤都比主觀多頭策略小,在不利市場情況下的表現更為穩健。在集中性方面:量化多頭策略的
21、收益標準差普遍比主觀多頭策略低,收益分布更為集中,主觀前后收益分化則更大。這就使得量化基金的投資人在 2023 年能享有更好的投資體驗,誤踩概率更小。同時也使得量化機構遭受資金熱捧,投資占比提升。圖表 私募基金策略占比變化情況時間主觀多頭量化多頭股票中性債券CTAFOF混合類期權2023-138.1%7.2%2.9%7.0%11.7%18.0%12.0%3.00%2023-238.9%7.1%2.9%7.1%11.7%17.6%11.6%3.0%2023-339.2%7.1%3.0%7.2%11.7%17.30%11.3%3.20%2023-439.3%6.9%2.8%7.3%12.1%17.
22、4%12.0%2.3%2023-538.4%6.8%3.1%7.3%11.4%17.6%11.8%3.8%2023-638.1%6.9%3.1%7.4%11.0%17.8%11.8%3.9%2023-738.0%6.8%3.1%7.5%10.9%17.9%11.8%4.0%2023-836.9%7.0%3.1%7.5%10.8%18.1%12.4%4.3%2023-936.6%7.1%3.1%7.6%10.7%18.4%12.3%4.2%2023-1036.3%7.2%3.1%7.7%10.5%18.4%12.5%4.3%2023-1136.4%7.3%3.2%7.7%10.5%18.5%12
23、.0%4.4%2023-1236.1%7.4%3.3%7.7%10.1%18.7%12.1%4.5%數據資料來源:招商私募指數數據庫指增方面:對比往年月度超額,指增超額存在進一步收縮下滑,單月超額超 2%在 2023 年僅為個別月份,往年則相對普遍。年內 1000 指增表現優于 500 優于 300。同時由于近兩年 Beta 較弱,大部分產品凈值沒有突破 2021 年 9 月高點,管理人難以計提業績報酬。中性方面:超額 Alpha 環境友好,疊加對沖成本降低,2023 年中性策略業績平均收益 8.2%,80%收益集中收益區間在(0%,14%),收益為正的占比達到 91.6%,波動率低于 3%。
24、2023 年,IC 跨期基差年化水平在 3%+,相比 2021 年 10%+、2022 年5%+的對沖成本更低。-10-圖表 指數增強平均超額變化趨勢圖表 2023 年股票市場中性收益表現數據資料來源:招商私募指數數據庫公募量化基金方面,2023 年快速擴容,截至 2023 年底,公募量化產品總規模達 3033.49 億元,其中主動量化產品 1015.85億元,指數增強產品 1935.01 億元,對沖型產品 82.64 億元,比 2022 年底增加 527.62 億元。對比主動權益基金而言,收益來源存異,Alpha 呈現較低相關性;對比量化私募,超額差異縮窄,整體相關性呈抬升趨勢。Beta 層
25、面,相較同類產品,績優基金呈現更為明顯的小市值、低估值與低波動特征;策略層面,相較同類產品,績優基金的基本面因子暴露更低,價量因子暴露略高。從產品類型來看,指數增強占據絕對優勢,500 量化產品規模擴張明顯,以中證 1000 和國證 2000 為代表的小微盤寬基指數量化產品也不容小覷,同時主題與行業指增產品正呈現多點開花,逐步抬升趨勢。方興未艾,砥礪前行公募量化市場概況與策略解析中金量化及 ESG,2023-11-28從交易狀態和體感來看,2023 中國量化投資白皮書問卷調研調研了從業者交易心情圖和記憶圖,大家對于 A 股的記憶貼近 A 股交易現實,大部分皆為“沖高回落、震蕩下跌”,但是交易心
26、情卻是震蕩模糊,很難對其歸類。圖表 問卷 A 股交易心情圖-11-圖表 問卷 A 股交易記憶圖數據資料來源:2023 中國量化投資白皮書問卷調研-12-2.方法派系 迥然不同2.方法派系 迥然不同招商證券策略團隊把現有的 A 股投資人分為價值派和市場派,根據持股時間、預期波動以及預期回報分為 9 大類投資人,包括長期價值、逆向投資等。不同類型投資人在強勢期或增量期主導不同市場風格,本問卷也同時邀請各類投資人對自身策略進行標簽。最受歡迎的策略是“自上而下”(36.77%),其次是“資產配置”(32.29%)以及“行業景氣度”(24.66%)。這些策略通常涉及較為宏觀、長期的分析和投資視角。例如自
27、上而下需要識別宏觀環境和產業趨勢確定適用的定價模型確定選擇屬性確認風格指數確認選擇行業用核心指標篩選更有優勢的具體標的定性篩查,最終篩選出標的。這與量化投資的語境截然不同,或許也正因此,在社會輿論中難以在一開始獲得理解。圖表 A 股機構投資者的分類與其主要特點圖表 A 股投資者的標簽屬性持股時間預期波動預期回報流派價值派長高高長期價值長低高深度價值長低低類固收/高分紅中低高逆向投資中高高價值趨勢市場派中低低嚴格交易策略短高高熱點追擊/事件驅動短低低量化套利短低高高頻交易資料來源:A 股投資啟示錄,招商證券數據資料來源:2023 中國量化投資白皮書問卷調研圖表 增量資金投資人主導的風格個人投資者
28、一般情況下,個人投資者會更希望追求更大的價格彈性,個人投資者普遍對于上市公司基本面信息獲取的渠道有限,股票選擇時會更加傾向于敘事宏大、空間大、彈性大的股票,對于容易理解的大產業趨勢相對更加偏好。也就是前面所述,更偏好的 FMvD模型。因此,當個人投資者加速入市,體現為融資融券規模大幅增加時,市場可能會體現為小盤成長風格。公募基金主動偏股公募基金經理普遍對于基本面要求更高,對于 PEG、DCF 模型更加熟悉,基金經理可以通過深入研究調研,分析上市公司的業績趨勢,尋找業績增速和估值匹配的標的;或者通過尋找股價低于內在價值的低估標的,那么公募基金成為主力增量資金時,市場通常會呈現成長風格占優。外資外
29、資尤其是中長期外資,在選擇 A 股標的時,更加看重上市公司經營和長期增長空間,更加愿意用 DCF 模型來看待 A 股的估值,因此,外資占據主導時,通常為呈現大盤風格,大盤價值或者大盤成長。私募基金私募基金有很多種類型,主動股票策略私募與主動公募基金類似,不過近些年規模擴張較快的是量化私募,量化私募更愿意在中小市值公司中尋找價格和基本面信號,量化私募占據主導時,市場呈現小盤風格。保險社保這兩類機構更加追求穩健收益,對安全邊際要求更高,更加偏好低估值高分紅,因此,保險社融占據主導時,市場通常呈現大盤價值風格。從 2013 年開始 A 股的主力增量資金經歷過多輪變遷。資料來源:機構投資者業績突圍的八
30、個思維模式和陷阱A 股投資啟示錄(二十)招商策略研究2022-09-08-13-調研數據顯示,有超過一半(55.61%)的受訪者對量化投資持有負面情緒,主要原因包括信息不對稱、量化復雜性、媒體報道、負面新聞和利益沖突。其中最主要的原因信息不對稱(32.29%),不少受訪者認為量化投資缺少透明度和溝通,導致其不明白量化團隊的操作和決策過程。而量化本身的復雜性(26.01%),涉及高級數學和統計方法,對非專業人士來說較難掌握。僅有一小部分受訪者(11.21%)是因為利益沖突,擔心量化投資會影響到他們的盈利,尤其是在短線交易和高頻交易領域。具體來看,公眾自認為對“策略”這個詞理解程度最高,可能源自策
31、略是量化投資中最直觀和最容易與投資成果聯系起來的部分,也有可能是策略相對于其他更技術性的環節更易于理解和溝通。其次為所有投資人都會觀察和分析的數據。但公眾對于因子、模型、組合優化、交易執行等的理解程度逐步降低,因為相對更為復雜和技術性的環節,通常需要較強的數學、統計學和計算機科學背景,尤其是組合優化,涉及風險管理、資產配置等概念,而交易執行則涉及市場微觀結構、交易成本估計等?!驹斠姳緯谌隆繄D表 回顧 2023 量化三大關鍵詞詞云圖表 展望未來 3 年,量化行業三大關鍵詞詞云圖表 公眾對于量化投資的各個流程理解程度圖表 公眾認為對量化負面印象的成因數據資料來源:2023 中國量化投資白皮書問
32、卷調研-14-3.輿論場域 深度背離3.輿論場域 深度背離正如投資人所說:當下市場很多東西都搖搖欲墜的時刻,每一個“瓜”的出現都會動搖行業可信度的根基,提升未來的溝通成本,讓整個行業多年才逐漸建立起來的認同和美譽度以比建立時快得多的速度崩塌。從 2013 年底,量化關鍵詞搜索指數逐步上升,到 2021 年量化私募進入 1 萬億規模,行業一舉一動都處于媒體探照燈中,百度指數量化關鍵詞咨詢指數呈現脈沖狀,且中性偏負面新聞居多。從 2021 年開始就已經有“全國限電影響量化機構的硬件算力”“百億私募被管理層強平”等謠言。但更屢見不鮮的是“殺一個量化祭天”“量化滾出 A 股”“天天過山車,月月輪動,肯
33、定是量化干的”等發言。過去三年量化在非議中一路發展,時至 2023 年情況越演越烈,量化私募在不斷辟謠、道歉、反思,有的機構認為行業是“背著鍋把錢掙了”,其中辟謠內容方向主要有以下幾種類型:信息謠言型信息謠言型:主要為量化私募“面臨破產”、“老板跑路”、“大幅清盤”等新聞。典型如 2024 年 2 月,盛傳幻方“大幾千億產品清盤、自營盤巨虧 15 億、DMA 欠款 60 億、公司破產”?;ㄟ呅侣勑停夯ㄟ呅侣勑停好襟w對于量化機構的私人生活、高額薪酬保持較高關注。情緒爽文型:情緒爽文型:許多自媒體以迎合情緒為主要目標,在不了解量化策略具體實施的情況下,炮轟量化,將其與其他投資人的虧損或大盤的下跌緊
34、密掛靠起來。如 2023 年 8 月的熱文量化基金,今天砸盤的主力軍,掀起了主觀投資者與量化投資者的論戰。當晚,九坤投資創始合伙人、CEO 王琛在朋友圈轉發一篇名為砸你妹的盤,量化才是大 A 的脊梁!文章,并發表點評稱:“中國量化已經承受了太多莫須有的惡意,說量化砸盤純屬無知,永遠滿倉的中國量化基金,才是大 A 的脊梁”。次日上午,靖奇投資在其官方公眾號發布文章對不起,是量化的錯!稱:“我們是量化,我們是最堅定的做多者,永遠滿倉熱淚盈眶,不背鍋?!钡珡?023 中國量化投資白皮書調研的結果來看:滿倉交易,大 A 脊梁這個觀點所受到的公眾支持度僅為 1/3。量化機構在反駁量化有害時,公眾最為認同
35、的觀點分別是:1.增強市場流動性;2.提升市場效率;3.促進市場創新;最不認同的觀點分別是:1.沒有影響個人投資者;2.滿倉交易,大 A 脊梁;3.全市場統一規則,交易公平。量化機構在反駁量化有害時,公眾最為認同的觀點分別是:1.增強市場流動性;2.提升市場效率;3.促進市場創新;最不認同的觀點分別是:1.沒有影響個人投資者;2.滿倉交易,大 A 脊梁;3.全市場統一規則,交易公平。圖表 百度指數量化關鍵詞搜索指數(2011-2024)圖表 百度指數量化關鍵詞資訊指數(2017-2024)該數據為:互聯網用戶對關鍵詞搜索關注程度及持續變化情況。算法說明:以網民在百度的搜索量為數據基礎,以關鍵詞
36、為統計對象,科學分析并計算出各個關鍵詞在百度網頁搜索中搜索頻次的加權。根據數據來源的不同,搜索指數分為 PC 搜索指數和移動搜索指數。該數據為:新聞資訊在互聯網上對特定關鍵詞的關注及報道程度及持續變化。資訊指數:以百度智能分發和推薦內容數據為基礎,將網民的閱讀、評論、轉發、點贊、不喜歡等行為的數量加權求和得出資訊指數。-15-圖表 百度量化搜索指數-需求圖譜圖表 量化機構在反駁量化有害時,公眾對其觀點認同度該數據:通過用戶在搜索該詞的前后的搜索行為變化中表現出來的相關檢索詞需求算法說明:綜合計算關鍵詞與相關詞的相關程度,以及相關詞自身的搜索需求大小得出。相關詞距圓心的距離表示相關詞與中心檢索詞
37、的相關性強度;相關詞自身大小表示相關詞自身搜索指數大小,紅色代表搜索指數上升,綠色代表搜索指數下降。數據資料來源:2023 中國量化投資白皮書問卷調研圖表 2023 年 1 月-2024 年,量化機構辟謠不完全列表信息謠言型2 月 20 日,市場傳言再起,“大幾千億產品清盤、自營盤巨虧 15 億、DMA 欠款 60 億、公司破產”等涉及幻方、明汯、九坤等多家頭部量化私募相關內容在業內傳開。2 月,北京涵德出現“巨額贖回”的消息引發市場關注。對此,公司第一時間發文回應,本次贖回金額 500 余萬元,贖回金額較小。2024 年 3 月,有市場消息稱,“各家券商及子公司全面梳理排查本單位離職員工是否
38、有到寧波靈均工作的人員”。對此,寧波靈均投資官方表示,消息屬冒充國家機關,惡意造謠、涉嫌違法。近日,有傳言稱“商品期貨市場量化交易被叫?!?,證監會有關部門負責人 1 月 4 日表示,相關市場傳聞為不實消息,關于媒體報道的相關部門將召集量化基金去青島開會,相關制度也將在 10 月份之前出臺的消息,記者對此向數家百億量化機構核實,得到的回復均為“未接到相關通知”。一家百億量化私募機構相關人士對記者表示,我們沒有接到通知,而且為什么召集大家跑去青島開會呢。8 月 28 日,印花稅減半征收落地后,當日 A 股市場各主要指數呈現高開低走震蕩局面,與此同時,一則傳聞在市場中流傳,“考慮到印花稅減半政策對市
39、場流動性的影響,防止對客戶投資造成不利影響,與策略供應商溝通 8 月 28 日暫停量化 T0 算法交易”。就在多家量化私募否認并表示,頭部量化幾乎都是自建系統,很少采購外部供應商系統,該消息或許為部分券商出于安全考慮的小范圍暫停 T0交易的可能。情緒爽文型經濟學家任澤平指出,量化交易利用了散戶所不具備的信息優勢、融券優勢、交易優勢、大規模操縱個股優勢等等,降維收割散戶,不僅不為市場創造價值,還一年吸走 1000 多億,抽血 A 股,量化交易只是利用了 A 股散戶多、波動大的市場特征而已。個別量化“大佬”不僅不為市場和社會做貢獻,還高調炫富,紙醉金迷,造成了很不好的社會影響。量化基金,今天砸盤的
40、主力軍:量化交易策略所鼓吹的紀律嚴明,不受基金經理的心理影響,計算機自動化買賣,讓那規模龐大的量化基金在今天成了最大空軍。而國內的量化策略同質化極其嚴重,大部分基金的策略都大同小異,直接導致其交易出現趨同效應,成了今天堅決砸盤的主力軍,把節奏給帶起來了。昨天四箭齊發的政策,是無法直接帶來增量資金的,一天之內最大的效果就只能是提振信心而已。結果有超過 1 萬億的對手盤絲毫不受政策影響,機械按照股價高低執行了堅決賣出做空的命令。你鼓舞再多的場外資金,短期內也壓不住這群量化基金啊。利好帶來的單日新增買入資金沒有超過量化基金的單日新增賣出資金,所以出現了單邊下跌的情況?;ㄟ呅侣勑桶賰|量化私募被罰,最新
41、回應!掌門人剛拍得“滬上第一豪宅”百億私募穩博投資前員工唐宇在個人直播間向老東家討薪上海銳天投資起訴幻方量化侵害技術秘密糾紛概率投資前員工在個人社交平臺對公司“口誅筆伐”數據資料來源:編寫組網絡綜合-16-圖表 2023 年 8 月底主觀與量化論戰主要文章日期時間文章標題日期時間文章標題8月28日19:03量化基金,今天砸盤的主力軍8 月 29日16:06大佬放狠話:量化基金才是 A 股脊梁21:02砸你妹的盤,量化才是大 A 的脊梁!18:41昨天低走,今天大漲,量化,外資,誰在攪屎棍?21:52聽說,今天有人黑量化21:19打不過量化,就想毀了量化8月29日10:18對不起,是量化的錯!2
42、2:22主觀和量化,誰才是大跌下的軟骨頭?16:11討伐量化,理解量化,加入量化8 月 30日02:15沒有砸盤!頭部量化掌門人“抱團澄清”10:53量化基金:對不起,我又錯了07:18吵翻天!都是量化的錯?11:42勿謂言之不預!對量化砸盤雞精的最后警告!15:08限制量化交易應從制度性不公入手16:01這根陽線!太重要了!昨天“黑”量化的,今天你又怎么說呢?15:11傳說“量化基金”將被規范!16:03量化投資在輿論中天生就是弱者16:23量化:披著科技外衣的追漲殺跌,和成建制的消滅市場有生力量數據資料來源:公眾號量化投資與機器學習-17-0202量化機構間的存量博弈1.行業:擴張趨緩 格
43、局漸穩1.行業:擴張趨緩 格局漸穩2023 年,A 股量化進入存量博弈。這種存量表現在:1.增量資金陷入停滯1.增量資金陷入停滯,從 2021 年后,量化私募規模就停留在 1.5 萬億左右,幾乎沒有較大變化。2.量化私募數量進入滯緩2.量化私募數量進入滯緩,新備案私募門檻增高,2022 年以后成立的私募共 299 家,成長到 10 億以上私募 11 家,占比不到 4%。純量化策略機構 4 家。3.規模分布和結構穩定性增強,3.規模分布和結構穩定性增強,逐漸拉出梯次,機構管理規模更多體現為階梯內排名的變化。2021 年左右,行業主要關注 100 億以上機構,但機構進出頻繁,目前 100 億以上已
44、經分出多個區段,200 億以上機構基本站穩腳跟,主要都是“熟面孔”,形成了越來越快的“飛輪效應”:業績好的機構形成口碑和規模,吸引了人力、資金、資源的大幅進入,同時算力、數據、投研等方面不斷積累,資管規模不斷擴大,而資源的增加又促成了良好業績的產生。2023 年,規模 50 億以上機構從41 家增加至 50 家,形成了越來越快的“飛輪效應”:業績好的機構形成口碑和規模,吸引了人力、資金、資源的大幅進入,同時算力、數據、投研等方面不斷積累,資管規模不斷擴大,而資源的增加又促成了良好業績的產生。2023 年,規模 50 億以上機構從41 家增加至 50 家,數量占量化私募整體約 5%。數量占量化私
45、募整體約 5%。這也與2022 年中國量化投資白皮書問卷調研結果接近,在描述未來 3 年量化行業競爭狀態時,受訪者意見分歧雖大,但接近 40%的受訪者都認為未來量化行業將越來越集中,大型機構將會因規模經濟和更強的資金吸引力而繼續擴大其管理規模。大型機構維持護城河,其投資風格上會更為穩健,更加傾向于追求超額的穩定性,對交易頻率依賴相對較低。如上章數據顯示,過去一年,規模 50 億以上管理人的平均值和中位數收益更為平穩,在微盤股上投資較慎重,年內在 30 億流通市值以下的股票投資占比提升在 1%附近,部分管理人會有更加明確的風控限制。反之,50 億以下的管理人則更激進,有更好的靈活度追求高賠率,增
46、加超額彈性,15-30 億流通市值的股票最新的投資占比接近 17%,相較年初提升了 8 個百分點。4.但這樣的集中度上升,又未達到排斥新晉者的程度4.但這樣的集中度上升,又未達到排斥新晉者的程度,僅有 7.61%的觀點認為量化行業的格局將比較穩定,對于規模在100 億以下的機構而言,未來將更難以取得顯著的突破。圖表 2022 年至今新晉 10 億以上量化私募公司簡稱成立時間管理規模辦公城市核心策略核心人物阿爾法喵私募2022/9/62050 億廣州FOF袁義上海波克私募2022/7/2550100 億上海復合策略楊秋悅、陸思橫上海睿量私募2022/7/710 億20 億上海量化多頭王博、唐嵩松
47、磐松資產2022/6/291020 億上海量化多頭張瀟、吳確、李光、黃大洲、王棟梁北京正定私募2022/2/161020 億北京量化 CTA李曉瀟、蔣林浩齊家私募2022/2/15100 億以上北京量化多頭鐘曉婷、陳韜、李薇、申宏威、齊俊杰亦賦私募2022/1/52050 億杭州復合策略陶曉東、羅韜數據資料來源:私募排排網-18-圖表 2023 年一季度及 2024 年一季度量化核心機構分布資產規模數量2023 第一季度資產規模數量2024 第一季度50-100 億15艾方資產、涵德投資、赫富投資、寬投資產、龍旗科技、洛書投資、蒙璽投資、平方和、千宜投資、乾象投資、銳天投資、思曄投資、仲陽天王
48、星、象限投資、展弘投資50-100 億19艾方資產、白鷺資管、呈瑞投資、國恩資本、赫富投資、寬投資產、量派投資、洛書投資、蒙璽投資、磐松資產、平方和、千宜投資、申毅投資、盛冠達資產、思曄投資、天算量化、圖靈基金、仲陽天王星、象限投資100-150 億8白鷺資管、博普資產、茂源資本、念空念覺、千象投資、穩博投資、致誠卓遠、卓識基金100-150 億14博普資產、進化論資產、龍旗科技、鳴石基金、念空念覺、千象投資、千宜投資、乾象投資、銳天投資、思勰投資、通怡投資、頑巖投資、展弘投資、致誠卓遠150200 億6黑翼資產、金戈量銳、進化論資產、鳴石投資、世紀前沿、思勰投資150-200 億6黑翼資產、
49、金戈量銳、茂源資本、信弘天和、因諾資產、卓識基金200-400 億5佳期投資、寬德私募、啟林投資、天演資本、因諾資產200-300 億5啟林投資、世紀前沿、穩博投資300-400 億寬德私募、天演資本400-600 億3誠奇資產、衍復投資、金锝資產400-500 億5誠奇資產500-600 億九坤量化、靈均投資、明汯投資、衍復投資600 億+4幻方量化、九坤量化、靈均投資、明汯投資600 億+1幻方量化數據來源:公眾號量化投資與機器學習圖表 未來 3 年量化行業競爭狀態圖表 量化私募資管規模分布數據資料來源:2023 中國量化投資白皮書問卷調研數據資料來源:海通證券2023 年度私募基金年度報
50、告2024-2-8公募基金量化是不同景色。近年來,公募量化基金數量、規模穩步增長,截至 2023 年三季度,公募量化基金共 497 只。存續公募量化基金共 3112.51 億元。當前,發行量化產品的公募機構共 109 家。其中,規模在 100 億以上的共 9 家,50-100億的有 12 家。規模頭部公募主要分為兩類,一類是 2015-2019 年規模發展起來的老牌公募;一類是 2021 年以來后來居上的量化新銳。包括博道、西部利得、浙商、萬家、中歐、國金、國君資管等。圖表 量化產品規模排名前列的機構(2023Q3)基金管理人合計規模(億元)各類型規模(億元)規模增長時期指數增強主動量化對沖基
51、金量化固收+富國基金318.5308.76.93.00.02015-2019 年國金基金299.622.7276.90.00.02023 年-19-易方達基金247.6244.23.40.00.02016-2020 年萬家基金191.2158.732.50.00.02020 年匯添富基金177.2134.90.741.60.02018-2021 年華夏基金140.5112.116.312.20.02020-2023 年西部利得基金120.872.048.80.00.02020-2023 年招商基金111.577.534.00.00.02020-2023 年景順長城基金109.866.842.0
52、1.00.02015-2019 年博道基金80.929.551.50.00.02019-2021 年建信基金79.779.10.10.00.52016-2019 年,2021-2023 年天弘基金75.975.90.00.00.02020-2021 年中歐基金73.225.847.40.00.02021-2023 年興證全球基金64.564.50.00.00.02017-2021 年嘉實基金60.136.419.73.01.12017-2021 年國泰基金59.617.442.10.00.02020 年申萬菱信基金58.141.815.70.60.02015-2020 年長信基金57.07.4
53、49.60.00.02015-2016 年國泰君安資管54.833.421.40.00.02021-2023 年浙商基金54.616.937.70.00.02019-2021 年華泰柏瑞基金54.114.139.10.90.02014-2017 年數據資料來源:量化這一年:希望、考驗、突破海通證券 金融工程團隊 2013 年 12 月 11 日如平方和投資演講所說,當前量化策略面臨三大挑戰:1.量化策略的超額收益不斷下降。1.量化策略的超額收益不斷下降。2022 年大量指數增強產品呈現出負收益,2021 年四季度中性產品在集體回撤。長期來看,整個行業的超額收益在持續下跌衰減,策略之間同質化現象
54、明顯,但“長期”多長是一個問號。目前來看國內 500、1000指增超額還能做到 20%、30%以上,A 股依然是具有吸引力的 Alpha 市場,只是變得更困難。超額下降趨勢變化緩慢但不會消失。對于量化私募而言,需要對賽道的選擇和投研方法進行一些改變。橫向對比美股,Alpha 衰減到個位數可能是量化的最終歸屬。2.量化策略存在規模容量挑戰。2.量化策略存在規模容量挑戰。隨著管理規模突破萬億,很多策略容量上限被撐破,對策略造成負面影響,降頻和業績下滑,導致大規模贖回。圖表 量化策略的三個挑戰策略挑戰技術提升產品設計超額下降超額下降倒逼技術進步個股多空策略能顯著增加收益量化策略同質化現象明顯同漲同跌
55、問題似是而非打新紅利仍然存在規模容量的影響策略容量魔咒可以破解增強策略的配置數據資料來源:平方和投資超額的下降倒逼了機構技術的進步以延緩下降。目前市場平均水平與技術領先的管理人會有較大差距。針對于同質性問題,排除掉指增 Beta 因素或者中性基差可以發現,不同頻段、不同策略的 Alpha 會有相對較低的相關性,高中低頻的 Alpha 策略,其漲跌路徑、依賴條件并不一樣。通常來說,例如市場低迷時,波動率策略會艱難;當市場出現小市值行情的時候,基本面策略會比較困難。策略的容量、穩定性、收益率不可能三角互相制約、此消彼漲,所以 2021 年行業規??焖僭鲩L之后,量化機構多次出現-20-封盤,避免超額
56、收益顯著銳減,包括幻方、進化論、金戈量銳、啟林、明汯、星闊等,2023 年機構陸續解封,或者是部分機構的策略有所升級,自認可以容納更多資金,所以展開募集?;蛘哒J定未來市場會更趨于活躍,或交易成本更低,給交易策略更多空間。-21-2.投研:AI、高頻數據 匯聚主線共識2.投研:AI、高頻數據 匯聚主線共識2021 年年初大盤股抱團瓦解,資金重新分配,隨后進入了量化掌握定價權的小市值賽場。2023 年行業熱點及風險聚集也就主要體現在小市值上。當任何一個投研新方法論或者風格暴露會帶來 Alpha 甚至 Smart Beta 之時,機構就會蜂擁而上,涌向同一處 Alpha 源,甚至買盤成為 Alpha
57、 本身。但實際上過去三年,人工智能、高頻數據以及另類數據才是 Pure Alpha 真正的投研主線。圖表 2023 年展望未來三年,行業三大關鍵詞圖表 2022 年展望未來三年,行業三大關鍵詞數據資料來源:2022-2023 中國量化投資白皮書問卷調研圖表 2023H2 券商人工智能選股研究券商標題主要方法券商標題主要方法建投基于循環神經網絡的選股模型初探GRU國盛基于深度學習的指數增強策略不同數據+多個 GRU+等權民生深度學習如何利用公募持倉網絡優化選股效果?基金持倉矩陣分解(微軟亞研院)東方DFQTRA,多交易模式學習因子挖掘系統TRA(微軟亞研院)建投資金流向相似性圖譜與圖神經網絡圖神
58、經網絡長江神經網絡因子挖掘-TCN 日頻量價因子TCN建投基于領域知識生成的基本面因子挖掘框架遺傳規劃+枚舉建投ModelZooTransformer 變式廣發基于深度學習的高頻數據因子挖掘全連接華泰自適應網絡:從削足適履到量體裁衣門控自適應網絡東方基于殘差網絡的端到端因子挖掘模型ResNet浙商基于 Transformer 因子挖掘的指增策略Transformer建投基于循環神經網絡的選股模型改進MOE、SkipConnection、多任務華創GRU 網絡在風格自適應中的創新與應用GRU海通多顆粒度特征的深度學習模型,探索和對比多粒度網絡(微軟亞研院)+BiAGRU華泰基于全頻段量價特征的選
59、股模型不同數據+多個 GRU+多任務學習民生從傳統策略到深度學習的可轉債投資GRU 轉債版建投基于時序神經網絡的選股模型初探多類時序模型民生基于可見性圖嵌入的滬深300 深度學習增強策略對時間序列做GraphEmbedding(微軟亞研院)東方基于抗噪的 AI 量價模型改進方案對抗訓練、異常信號因子-22-建投基于 TiDE 及其改進的因子融合模型TiDE(Google)招商多模型集成量價 Alpha 策略相同數據+多個模型+ICIR 集成數據資料來源:中國量化投資季刊2023 冬圖表 公私募量化對比類別公募基金私募基金規則交易限制交易限制多,主要依托恒生 O32 下單,執行速度慢、日內反向限
60、制。交易限制較少,執行速度較快。交易成本原先一般為萬 8,降傭后為 4。相對較低,萬 1 至萬 2。指增成分股要求持倉 80%為成分股,日均跟蹤誤差通常要求不超過0.5%。無成分股和跟蹤誤差限制,可以在全市場范圍內選股,或者大比例買入深度貼水的股指期貨。風控要求風控要求較高,對跟蹤誤差、回撤、因子敞口等通常有較嚴格的控制。有時,可購買的股票通常需要在公司的股票池內。風控要求較低。先天優勢調研和產業資源較豐富,在基本面研究上具有優勢。數據和系統配置上的資源投入較大,技術具有領先優勢。交易限制交易限制多,無法做到純自動化,主要依托交易員下單,執行速度慢、日內反向限制。交易限制極少,執行速度極快。投
61、研因子以基本面因子為主,以人工挖掘為主以量價因子為主,部分機構用機器挖掘交易較少使用算法算法應用度高指增做法圍繞指數成分股做收益增厚無成分股要求,全市場范圍內選股,通過風險敞口控制跟蹤誤差衛星策略打新策略T0 策略選股域偏向大中盤,產品最初也以 300 增強為主逐漸拓展到 500增強、1000 增強偏向中小盤,產品以 500 增強為主,近年來 1000 增強發行較多數據資料來源:量化這一年:希望、考驗、突破海通證券,編寫組-23-3.產品:尋路出海 產品創新3.產品:尋路出海 產品創新從產品結構層面來看,2023 年市場討論最多的是股票多空和 DMA 產品。多空策略被稱為“增強型市場中性”,原
62、因在于對沖精度、資金使用效率更高、成本更低、自由度更廣、機構間差異更大:1.融券對沖的對沖精度高:1.融券對沖的對沖精度高:相比股指期貨一攬子對沖,融券對沖可以在全市場選股,通過買賣個股實現多空組合的完全匹配,更好消除市場風險,具有更高的 Alpha 能力。2.融券成本相對固定:2.融券成本相對固定:不受股指期貨貼水波動的影響,使得組合波動率、夏普率等收益指標更為優秀;股指期貨只有三個標的,所有策略都在此體現自身供需,所以波動非常大,甚至一年之內能相差 10 個點。但融券券源有幾千個,每只個股的需求都不一樣,反映的是更真實的供需。3.自由度更大:3.自由度更大:中性策略本質上做空股指期貨一攬子
63、股票,拆開之后也是個股,但個股之間的關系被確定了,可選擇范圍小,導致產品同質化相對嚴重;多空策略則突破了這種強制綁定的關系,自由度就會更大,不同管理人的選股模型差別較大,例如有的多空兩端為同一個模型,有的則做不同模型,信號越強,能夠騰挪的空間就越多。同時打破要對標基準指數而產生的行業、風格約束,可以全市場選股,收益空間更大。4.融券對沖的資金使用效率更高:4.融券對沖的資金使用效率更高:倉位可達到 100%,甚至有 1-1.2 倍杠桿,綜合考慮收益與成本(成本由融券成本、個股折算率、融資融券比例限制、產品費率結構四部分構成),多頭年化收益率約 15%。進一步考慮空頭端市值增強作用,能夠產生的增
64、強收益約為總資產的 5%左右,費后約 3.5%。然而,因為券源的限制,策略模型難度、組合優化難度、交易難度、券源實時管理能力均高于量化指增和市場中性策略,使得策略門檻較高,同時 2024 年 1 月 28 日,證監會重磅出手。為了進一步優化融券機制,加強對限售股出借的監管,全面暫停限售股出借,將轉融券市場化約定申報由實時可用調整為次日可用,對融券效率進行限制。滬深交易所也同步決定,暫停戰略投資者在承諾的持有期限內出借獲配股票?!靖鄡热菰斠?023 中國量化投資季刊冬刊-多空新元年】同時 2023 年 10 月 14 日,監管發布新規,規定每家券商的 DMA 頭寸不能超過 10 月 8 日的頭
65、寸,雖未禁止做 DMA,但不能再擴大規模。另外政策也對場內融券有較大限制,限制了保證金比例和大股東出借,隨著 2024 年的 2 月風暴,DMA 與多空策略更是漸漸淡出主流觀察視野。出海也是市場熱議的主題,很多國內團隊來自全球最頂尖的對沖基金,同時擁有全球視野以及本土的多年深耕與積累,所以即便面對全球化的國際競爭者在投研的廣度和時間上的歷史沉淀,國內量化機構也總是想與國際機構掰一掰手腕。幾乎每家頭部量化機構都把“建立國際一流的量化基金”寫進官網。另外一方面,海外市場由于良好的 Beta、低相關的 Alpha 以及人才戰略儲備的目的,諸多量化機構通過獲取牌照、設立辦公室、投資海外標的、招聘人才等
66、具體行動開啟了海外征程,尤其是頭部、具備海外資源背景的機構更有余力。一般情況下,中國香港是境內管理人開展離岸業務的典型目的地,其次為新加坡和美國。本問卷調研數據顯示:分別有 17.14%和 13.71%的比例正在研究或已涉足港美股標的,積極探索全球多元化投資機會。從量化私募委托金融階的數據來看,當前招聘海外市場主要為海外市場/渠道、產品經理、資深策略投研等崗位。中國在量化投資領域的優勢在于更深刻地了解本土國情、產業趨勢和政策,在進行海外投資時,新的司法管轄區會面臨新的監管框架,銷售運營、辦公空間和人才招聘等現實狀況也會存有差異,所以戰略和擴張計劃一般比國內緩慢,且面臨諸多挑戰:-24-1.整個
67、市場宏觀的分析:1.整個市場宏觀的分析:不要僅僅關注于投資基本面,思維方式比認知更加重要。在不熟悉的市場中,細節會對投資收益形成影響,因此需要不斷調整思維方式,規避風險。2.策略投研本身:2.策略投研本身:投資者結構的不同會導致投資偏好最終影響價格特征。目前海外市場優勢在于工具更齊全,但機構化嚴重也使得定價誤差更小 Alpha 更難獲取,目前從國內跨境投資的基金評估來看,在港基金較難獲取超額收益。3.監管框架:3.監管框架:涉及境外投資合規、資金安全退出等運營問題。另外還包括投資杠桿比例,海外的中性產品通常會加杠桿。雖然管理的是平層資金,但底層資金可能自帶杠桿,這就在交易和波動的限制上需要做很
68、大讓步。4.負債端管理:4.負債端管理:國內私募如果業績亮眼可以迅速起規模。但海外投資人盡調要求更為復雜,除了投資策略之外還注重公司治理、內控機制和運營流程。導致盡調的周期和復雜程度遠超國內,盡調和考察周期從半年到一年不等,因此規模擴張更為循序漸進。5.技術框5.技術框架:架:根據阿云材料顯示,量化機構通常需要將各種數據傳輸回本地進投研,同時海內外員也有加速訪問辦公絡的需求,快速實現境內 IT 環境與海外之間的互聯互通成為了量化機構最為關注的解決案。主要于辦公投研、實盤交易等的絡互聯場景。量化機構尤其關注新加坡、中國港、本、美國等跨境鏈路絡之間的絡時延、建設周期、組操作便捷性三個技術指標?;?/p>
69、以上現狀,前在出海業務中,多數量化私募會優先考慮基于云供應商的進快速的絡建設。以便捷解決全球組復雜度、互聯可、傳輸低延時的問題。通過構建跨境絡互聯,實現云下辦公與云上絡的互聯;通過對應加速,保障全球化融商品市場的數據訪問穩定性。圖表 國內量化機構紐約擴招崗位表機構辦公室資管規模機構辦公室資管規模明汯投資上海/紐約/北京/香港600+億寬德投資上海/北京/深圳/珠海/紐約300-400 億佳期投資上海/北京/紐約300-400 億信弘天禾上海/北京/紐約100-150 億數據資料來源:編寫組整理圖表 部分機構香港 9 號牌照獲取情況機構名稱獲得牌照日期機構名稱獲得牌照日期天馬資產2009 年 9
70、 號牌照鳴石投資2021 年 9 號牌照金锝資產2016 年 9 號牌照2021 年 2 月提交美國證監會天演資本2021 年 9 號牌照富善投資2016 年 9 號牌照進化論資產2021 年 9 號牌照喜岳投資2017 年 9 號牌照佳期投資2021 年 9 號牌照幻方量化2019 年 9 號牌照金戈量銳2023 年 9 號牌照明汯投資2020 年 9 號牌照千象資產2023 年 9 號牌照九坤投資2021 年 9 號牌照數據來源:香港證券及期貨事務監察委員會、量化投資與機器學習-25-圖表 量化機構 2023 年投資研究標的圖表 量化機構 2022 年投資研究標的數據資料來源:2022-2
71、023 中國量化投資白皮書問卷調研圖表 量化機構 2023 年投資研究標的選項2022 年比例選項2023 年比例A 股78.68%A 股股票79.76%期貨53.81%期貨58.33%期權31.98%期權36.31%債券28.93%債券32.14%港股18.78%港股16.67%美股14.72%美股13.1%新興市場股票(印度、越南等)7.61%新興市場股票3.57%數字貨幣14.72%數字貨幣5.36%其他3.05%場外衍生品25%(空)3.05%其他6.55%數據資料來源:2022-2023 中國量化投資白皮書問卷調研-26-4.市場:周度披露 持續內卷4.市場:周度披露 持續內卷從 2
72、022 年,周度的各類信息披露就成為量化機構的緊箍咒,這些信息顆粒度極細,主要在業績以及相關度比較,極少涉及策略解釋。從表面上看,對于投資人而言,這種披露使投資人得以在及時性、透明度方面獲得控制權,更高頻的披露數據可以增加數據豐富度,投資者可以更快地了解自己投資的表現,有助于及時作出調整或決策,或更好地監測和管理底層基金的風險。但這對于量化管理人來說亦有矛盾:一方面,周度表現卓越的量化基金可以更快嶄露頭角,也可以躲避投資人對于策略細節的追求,指導投資人直接查看凈值投資。但高頻度的信息披露也使得市場更加短視,機構為了維持短期表現,可能會采取更加積極甚至激進的交易策略。對于投資人過于頻繁的報告可能
73、導致投資者關注短期波動,對其過度反應,而非關注長期表現,尤其是目前量化機構長周期負債端/資金端,高凈值個人投資者占比仍然較多的情況下。在難以理解策略的情況下,投資人情緒較不成熟,而波動的市場也會放大投資人和管理人的情緒。國內部分頭部機構選擇通過多年鎖定期的產品設計,形成一個更長的投資觀測期,盡量避免投資人因無序擇時最終又踏空的情況。也有機構認為國內量化機構非常需要向海外學習負債端的管理,目前很多海外機構只會進行月評,從而保護管理人自身也優化資產端,減少博弈帶來的摩擦成本,也減少客戶因短期情緒波動而影響負債端。2023 年 11 月 14 日,一則“百億 FOF 私募華軟新動力踩雷”的傳聞引起軒
74、然大波,使得市場業績披露發生巨大變化。證監會表示,相關人員控制杭州瑜瑤、深圳匯盛等多家機構,多層嵌套投資、虛假宣傳、報送虛假信息、違規信披等情形,還可能涉嫌違法犯罪行為,使得行業遭受重創。此事件引發了全市場對 FOF 和量化私募的信任危機,自此事件之后,許多 FOF機構要求底層估值表從原來的二級改為要求穿透至四級,除了各類標的建倉成本和損益,還包括股票明細,并且要求托管方蓋章。對此,許多資方與管理人仍存在分歧。有機構主動上交四級估值,例如磐松資產就直接在微信公眾號公示披露政策:1.常規四級估值表,支持由機構客服遞延一個月發送;2.數據脫敏版四級估值表,可由支持此功能的托管平臺生成后即時發送。-
75、27-第第二二章章阿阿爾爾法法的的生生命命力力-28-量化行業的發展迭代經歷了一段先慢后快的過程,中間經歷幾個關鍵發展節點:2008 年,美國金融危機,中國推出 4 萬億的財政政策,迎來華爾街量化人才歸國浪潮,主要加入公募量化團隊。2010 年,滬深 300 股指期貨推出。2015 年,股指期貨受到限制,量化遭遇首次危機,之后負基差較大,量化機構發展受阻。2018 年后,量化與主觀多頭表現一正一反,讓市場意識到量化策略的優勢和配置可能。同時 2018 年股指期貨政策轉向,量化進入一個逐漸放松的軌道。2021 年,量化私募行業規模破萬億。2024 年初,量化踩踏。圖表 量化行業發展迭代重要時間點
76、數據來源:平方和投資不同的市場環境之下需要不同的策略和技術,總體而言行業與策略經歷了三個不同的階段:量化 1.0(2010 年-2015 年):量化 1.0(2010 年-2015 年):股指期貨面世后,機構陸續布局量化,此時市場競爭較少,策略收益又高又穩。整體來說機構做多小盤、做空大盤就能夠有一個非常好的超額收益。如九坤王琛所說,彼時中國量化行業的痛點是如何把知道賺錢的策略變成能夠賺錢的執行。當時機構主要面臨的挑戰是數據和基礎設施問題:1.擁有策略后,需要拿到服務器、對接接口,并解決機構賬戶、募資等問題,因為此時許多投資人對于量化還相對陌生。2.策略層面 A 股歷史數據偏少,基于不夠充分的樣
77、本進行統計決策,做出的決策受到數據限制,存在偏差。策略層面,機構主要根據量價數據、技術指標、財務指標,建立經典因子庫,做因子檢驗、行業市值中性化、因子正交、因子合成模型構建。量化 2.0(2016 年-2018 年間):量化 2.0(2016 年-2018 年間):2016 年開始,市場風格就徹底切換成大盤股行情了,疊加股指期貨限倉及高額貼水,Alpha 必須扛過負基差才有正收益,量化市場進入艱難階段,市場上出現了“Pure Alpha”的呼聲,即量化必須控制住大小盤、行業風險,并且獲得穩健的高水平超額收益。2017 年之后大量高頻、偏 T0 策略出現,量化進入“高頻指增時代”,量化管理人也開
78、始新老交替,2018 年,隨著“北九坤南幻方”以及“量化四大天王”出現進入了新一輪快速擴張期。策略層面,機構開始涉及高頻量價及另類因子、分析師預期,同時由線性回歸逐步到機器學習,特征選擇算法自動做特征檢驗,超越傳統因子檢驗流程,便于超高維因子庫。量化 3.0(2019 年-2021 年):量化 3.0(2019 年-2021 年):量化行業飛速發展,規模不斷增加,領域技術加速更新迭代,典型的表現就是 AI 化。對量化機構技術路徑、技術棧、業務組織架構、團隊構成等產生很大影響。量價策略和機器學習技術的紅利得到釋放,人工智能技術在量化行業的應用更是催生了很多的小型量化私募,形成彎道超車。2020
79、年之后量化私募規模暴漲,明汯、靈均、幻方均率先突破千億規模,但遭遇規?!霸{咒”后回撤。-29-策略方面,機構深入應用 AI,包括自動化特征工程、神經網絡結構設計、端到端學習、因子挖掘和因子合成使用同一目標函數進行優化、從維護因子庫進化為維護模型庫,有機構通過深度學習構建高維高頻模型庫,自動化挖掘量價規律量化 4.0(2022 年至今):量化 4.0(2022 年至今):量化進入了分化、再平衡的階段。行業規模突破萬億策略容量趨近飽和,量化私募開始思考怎么消解多余的需求,其投研趨勢之一體現在多資產、多信號、多頻段融合。高頻策略在降頻提升容量,中頻機構在中頻策略基礎上,不斷向高頻和低頻擴展,提升業績
80、穩定性和策略容量,同時在量價、基本面、另類策略齊頭并進。圖表 量化私募機構的典型策略迭代時間段階段特征某量化私募 1某量化私募 22014 年量化 1.0 時代從傳統多因子模型出發,采用線性因子組合,主要以挖掘中低頻因子為主,在這一階段奠定了公募基金更注重基本面因子,私募基金更注重挖掘量價因子的格局線性模型2015 年機器學習應用2016 年日線級別數據開發線性多因子量價類策略。分鐘線級別數據2017 年量化 2.0 時代中高頻交易,量化市場擁擠度增加,高頻因子在擁控度和超額穩定性方面均有一定提升,主動封盤控規模+開發低頻或超高頻策略基于 Tick 級數據人工、機器挖掘多因子量價類策略。中小盤
81、市值中性2018 年算法交易、機器挖掘非線性多因子量價類、輿情類策略。Tick 級數據2019 年迭代到機器學習中高頻策略,儲備高頻,低頻、輿情類策略。T0 和 Alpha 獨立運作2020 年量化 3.0 時代人工智能算法和更強的 IT 軟硬件以支持更高的策略迭代速度;人工智能算法在數據挖掘和開發非線性模型方面都有用武之地機器學習、深度學習、多因子方法論研發多信號、多頻段策略。程序化 T0 和 Alpha 策略有機融合 300+500 輪動策略因子豐富度提升2023 年數據、底層策略開發迭代、機器學習策略組合,持續迭代中.資料數據來源:海通證券研究所整理、量化機構材料-30-0101趨勢 1
82、 多資產:多策略多資產指的是投資組合不局限于單一市場或資產類別,包括股票、債券、商品、期貨、期權、ETF 等高流動性、多樣化的工具。通過不同資產的組合來分散風險、優化回報、提高資本效率和適應不同的市場環境。調研數據顯示:2022-2023 年,A 股股票、期貨、期權、債券仍然是量化機構投資最主流的資產類別,另外場外衍生品占比 25%。小眾如新興市場股票(印度、越南等)等量化機構也有所涉獵。對比兩年變化來看,2023 年投資者對更傳統和穩健的投資(如 A 股、債券)的覆蓋度更高,而對高風險或波動較大的投資(如數字貨幣、新興市場股票)的覆蓋度耕地。此外,場外衍生品的出現占比顯著,表明量化投資機構在
83、尋求更多樣化和定制化的投資工具。需要注意的是,覆蓋比例的減少并不絕對意味著投研該類別的機構減少,一般而言,量化機構在投入實盤交易之前會進行嚴格的歷史回測和市場研究,一旦確定某個標的符合其策略且具有長期盈利潛力之后,機構會持續監控和調整策略,并不會輕易退出,更多是資金分配上的差異,所以機構研究標的數據可能是樣本由于投資偏好的偏差,并非實際的投資額變化。圖表 量化機構 2023 年投資研究標的選項2022 年比例選項2023 年比例A 股78.68%A 股股票79.76%期貨53.81%期貨58.33%期權31.98%期權36.31%債券28.93%債券32.14%港股18.78%港股16.67%
84、美股14.72%美股13.1%新興市場股票(印度、越南等)7.61%新興市場股票 詳細3.57%數字貨幣14.72%數字貨幣5.36%其他3.05%場外衍生品25%(空)3.05%其他6.55%數據資料來源:2022-2023 中國量化投資白皮書問卷調研多資產研究也并不一定意味著實盤,面對比較復雜的建模任務時,使用全量數據進行訓練可能會帶來意想不到的效果。例如金戈量銳、衍復等機構在路演或其材料中都提到,公司策略研發雖然投資 A 股市場,但實際在進行新策略開發時,并不是僅僅盯著 A 股市場做研究,而是研究全球股市,希望從不同國家的股市里研發出新策略,并行之有效地運用到 A 股市場?;蛘?A 股策
85、略挖掘之后在全球多個國家市場進行測試,以提升模型普適性。以促進不同資產類別相互啟發,資產之間存有共性。例如期貨會給股票市場提供信息,例如包括黑色系、山東發現金礦金價下跌等對資源類股票有很大的幫助。當前許多機構涉足多資產投研,然后在產品層進行權重投資,或者做反向波動投資組合,主要通過均衡風險配置來降低不確定性。國內量化機構許多都已涉足多策略多資產,以因諾為例,除了包含套利、Alpha、選股、CTA、債券 5 大類標的子策略。還會根據實際情況分配權重,以期在保持中低波動的前提下,靈活配置多種策略,提升收益風險比。-31-圖表 多策略配置比例變化2015 年70%套利+5%AIpha+15%選股+5
86、%CTA+5%債券2019 年0%套利+80%Alpha+15%選股+0%CTA+5%債券2016 年5%套利+5%Alpha+20%選股+20%CTA+50%債券2020 年0%套利+70%Alpha+20%選股+0%CTA+10%債券2017 年5%套利+35%AIpha+20%選股+20%CTA+20%債券2021 年0%套利+60%Alpha+20%選股+5%CTA+15%債券2018 年5%套利+70%Alpha+5%選股+5%CTA+15%債券2022 年0%套利+55%AIpha+20%選股+5%CTA+20%債券數據資料來源:因諾投資多配置主要還是為了抵抗極端尾部風險。同樣以因
87、諾為例,其極端環境下的策略歸因如下:圖表 極端環境下的收益歸因時間段關鍵指數表現策略歸因15/6/12-15/7/8(股 1.0)上證:-32.1%套利策略彌補其他損失15/8/17-15/8/26(股災 2.0)上證:-26.7%套利策略彌補其他損失15/12/25-16/1/28(股災 3.0 熔斷)上證:-26.8%選股策略虧損,套利和 Alpha 基本無法運行,CTA 盈利彌補所有虧損16/4/21-16/5/24(商品大反轉)申萬商品:-8.6%商品連續暴漲后突然暴跌,造成 CTA 趨勢策略大幅回撤,套利和 AIpha 策略無法運行,選股策略也沒有好機會,產品出現回撤,但幅度小可控1
88、6/11/14(商品黑色周五)申萬商品:-4.1%商品連續暴漲后 1 小時暴跌,諸多品種砸至跌停 CTA 趨勢策略損失嚴重,但CTA 套利策略和選股策略盈利,當日盈利16/10/28-16/12/20(債災)中證全債:-3.4%產品債券頭寸不高,幾乎無影響20/2/3(新冠疫情暴跌)上證:-7.7%資產均勻配置幾乎無影響數據資料來源:因諾投資但國內量化機構較少從宏觀層面進行配置,因為一般宏觀量化對沖難度大、耗費人力,具有一定壁壘。海外目前許多機構也會探索復雜的數學模型來識別價格形成/關系和市場趨勢的關鍵驅動因素,構成投資組合并生成交易信號。重點往往放在宏觀經濟、地緣政治、政策變化和系統性風險等
89、因素上,如 GDP、通貨膨脹、利率、匯率、進出口、增長、資本流動、市場數據等,將以上因子納入模型和風險管理框架中。美國宏觀量化長期平均夏普比率在 0.8-0.9 左右。倉位往往更偏向于相對價值,盈利與虧損交易的比率往往非常低。宏觀量化會隨著市場動態變化而動態調整投資組合規模。其他更成熟的基金可能會尋求采取各種市場狀態識別措施來調節交易信號和總風險偏好。例如流量數據、天氣分析、關鍵指數的波動性、跨資產關系/相關性。典型如 Bridgewater,總共 1500 億美金的管理規模分布在兩個策略里,一個是 1000 億的 Pure Alpha,目標波動率為 18%,一個是 500 億的 All We
90、ather,目標波動率為 12%。其全天候模型也類似地將經濟劃分為不同的周期,并根據資產表現來優化資產配置。半夏投資作為國內宏觀對沖代表,主要方式是通過宏觀環境擇時判斷,靈活配置股票、債券和商品,尋求在任何市場環境里都能獲得超額回報。其宏觀對沖方式為主要通過利率、盈利和風險偏好這三個宏觀因子去判斷是做債券、商品還是股票策略:(1)利率因子可以看市場資金供應和需求從而影響債券/股票的價格。(2)盈利因子看實體供應和需求影響股票/商品價格。(3)風險偏好因子看實體經濟增長預期、金融風險預期影響股票價格。(4)逋過這三個因子指標組合觀察,可以大致分析出全年的資產價格走勢。-32-0202趨勢 2 多
91、信號:大數據、強因子多信號策略是指在進行資產的買賣決策時,不依賴單一的市場指標或模型,而是結合多個信號(或因子)來驅動投資決策。量化機構普遍儲備多個低相關子策略,通過模型動態調節子策略權重,以應對不同的市場行情。目前國內主要使用股票多因子策略為核心,搭配其他量化策略以提供多種風險收益組合選擇,以此形成更為完整的策略體系。圖表 子策略數量儲備:10+個圖表 子策略相關系數:0.40 以內數據資料來源:復熙資產再如天演資本其投資策略體系如下:圖表 量化機構投資策略體系日內回轉策略通過全市場選股策略構建股票底倉,提供券源供日內策略交易進行收益增厚統計套利策略用數理統計方法對投資標的歷史數據構建模型,
92、捕捉市場失效帶來的價差套利機會事件驅動策略預測市場中事件性機會發生的時點和市場可能的反應,提前布局獲取收益新股申購策略對新發行的股票價格進行研究,參與新股網下申購以增厚收益管理期貨策略通過基本面和趨勢類量化方法,判斷中短期期貨價格走勢,進而配置多空倉位數據資料來源:天演資本很多機構也會將以上部分策略定義為衛星策略來為主策略做收益增厚。典型就是打新、日內、算法交易策略。1.數據1.數據經過幾個代際的發展,量化已經打磨了策略各個流程的細節,形成規范。通常而言,量化投研步驟分為數據、因子、選股模型、策略、交易、風控、歸因 7 大關鍵步驟。同時大型機構越來越多地采用精細化的研發生產流水線模式來實現策略
93、,例如寬德投資形容其研發流程即如下:第一步:大數據管理團隊(識別獲取海量數據+存儲預處理原始數據)第二步:因子團隊挖掘建模(基于技術面和基本面提煉數據+挖掘大量因子,測算因子收益貢獻+因子疊加,AI 訓練多因子模型)第三步:投資團隊構建資產組合(設計交易信號,構建并持續優化因子組合,策略疊加+策略團隊回測歷史勝率)第四步:交易算法團隊優化嚴控(采用中央優化器尋找最優價:超低成本極速交易+亞微秒級別超低延遲策略交易執行平臺+異常人工介入)-33-圖表 量化策略基礎流程數據資料來源:阿里云數據資料來源:玄元投資其中,數據是量化策略尋找市場預測性信號的基礎,量化機構使用歷史數據來構建和回測其策略,預
94、測未來的市場表現。數據的質量、數量和多樣性直接影響模型的準確性和策略的有效性。金融數據與其他行業的數據不同,較為復雜。主要體現為低信噪比,意味著數據中噪音比例高,提取有效信號的難度比較大。模型在學習過程中,如果調整不夠得當,就容易學習“噪音”。由于這一特性,在模型環節尤其強調避免過擬合。同時處理金融數據時要非常注重邏輯。以 A 股為例,不同的股票具有不同的漲跌停規則,另外新股上市以及復牌等行為,這些都要特殊處理。所以要在邏輯的基礎上,對信息進行合理挖掘、過濾、組合。圖表 常見數據處理流程圖表 常見數據主要分類數據資料來源:穩博投資問卷調研顯示:數據存儲量級的差異主要由數據的更新頻率、歷史深度、
95、細節程度和多樣性影響。從數據量級上來看,調查數據顯示,TB 級別(41.07%)和 PB 級別(27.38%)是當前量化機構的主流存儲規模,PB 級別(27.38%)才算真正的“大數據”量化機構。TB 級別(41.07%)和 PB 級別(27.38%)是當前量化機構的主流存儲規模,PB 級別(27.38%)才算真正的“大數據”量化機構。隨著機構的資產管理規模增長,對于高級別數據儲存的需求也呈現出增長的趨勢。大型機構需要大量的數據來支持其復雜、多元化的投資策略,并且為了保持競爭力,不斷增加對高頻、多源和高維度數據的利用。目前來看,1-10 億級別機構就會漸漸從 TB 級別過渡到 PB 級別,數據
96、分析上的深度和寬度有所增加。隨著資產規模的增長,機構可能需要處理更多的數據以支持更復雜的交易策略。100-300 億規模區間,大多數機構(60%)都在使用 PB 級別的數據存儲。而到 300 億及以上 EB 級別及以上的占比相對較高(總計 33.34%)。在數據獲取、存儲和處理上的能力遠遠超過絕大多數競爭對手。這些機構能夠分析廣泛的數據集,包括高頻數據、另類數據等,來發現和挖掘 Alpha。-34-圖表 量化機構目前數據儲存量級圖表 資產管理規模與數據儲存量級比對數據資料來源:2022-2023 中國量化投資白皮書問卷調研機構當前使用的數據類型多樣,調研數據的使用覆蓋度表明,低頻量價數據的使用
97、覆蓋度最高(72.62%),其次是基本面財務數據(66.67%)和高頻量價數據(58.33%)。這些數據被廣泛應用于量化投資模型中,因為它們能夠提供市場趨勢、公司表現和宏觀經濟狀況的關鍵指標。圖表 量化機構目前使用的數據:圖表 量化機構目前數據儲存量級:圖表 隨著量化機構規模增長,數據儲存量增加圖表 資產規模與數據使用數據資料來源:中國量化投資白皮書問卷調研圖表 量化數據分類和規模市場量價類數據交易所市場價格、成交量等日內訂單簿基本面數據上市公司公告數干萬條記錄財務報告數據500 萬條時間序列研究報告100-200 萬條另類數據個股新聞數千萬條記錄商品相關數據20 萬條-35-宏觀數據35 萬
98、條產業相關數據140 萬條個殷指標數據10 方條物流數據0 萬條電商數據數萬條供應鏈數據十萬條持續增長中數據資料來源:九坤投資基本面數據(66.67%)基本面數據(66.67%)用于評估公司的內在價值和經營狀況,是許多策略的輔助支撐,更多是從業績預期,或者是股價空間進行博弈。量價則是基于市場波動,更偏短期、市場情緒研究,兩者相關度較低。量化機構將基本面數據提取為多類因子,例如盈利能力、成長能力、營運效率、盈余質量、安全性因子、公司治理、估值因子、分析師因子、股東和規模因子等,基本面量化因子目前在量化許多機構策略中占比約為 20%-30%,也有機構深耕此賽道,稱之為基本面量化?;久鏀祿m然在
99、2010 年代就開始在國內被量化使用,但其作用遠不如量價穩定、效果好。原因在于第一代基本面量化:1.信息時效性較差:1.信息時效性較差:右側交易是基本面量化天生難以克服的問題,基本面量化則更多受數據的驅動,當交易機會出現時,無論是財報、盈利預期、輿情、資金等層面,數據均滯后于主觀認知,早已被市場消化。因為信息已經體現在價格中,當某個研究員調高了預期時,市場上的主觀研究者可能早就察覺到了變化。2.用法粗糙:.用法粗糙:很多機構把基本面數據直接用因子的研究方法放到研究體系里面,但純粹基本面因子堆砌難以獲得效果,所得結果既與主觀認知背離,也難有收益彈性,難以向市場提供收益預期差,需要更為系統性的分析
100、,找到驅動的核心邏輯。所以量化交易需要通過結合主動研究、宏觀研究以及行業配置層面的研究,盡可能地彌補右側弱勢的缺陷。目前基本面量化的實踐方式主要有:1.基金經理深度推票:目前基本面量化的實踐方式主要有:1.基金經理深度推票:由基本面研究員推票形成股票池,再通過量化模型從中擇股。這方面公募量化擁有相當優勢,例如中歐基金量化投資部身靠基本面研究團隊,提供深度研究,全年實地調研總計 912000 公里,全年上市公司上門路演專家訪談、實地調研等總計超 20000 場,公司 FIELD 深度研究覆蓋 A 股市場 40%的公司(按市值計算)。這是普通量化私募難以啟及的信息優勢。圖表 專家洞見:某行業周期,
101、經驗投資人員提出行業核心指標,通過回測模型,印證指標的有效性信號 1 取值正負 1,1 代表看多,-1 代表看空。擇時凈值代表模型在指數上進行多空擇時后得到的累計收益率,統計區間:2000 年 1 月-2020 年10 月。數據資料來源:中歐基金量化投資部2.另類數據引入:2.另類數據引入:大數據部分使得信號更左側,隨著基本面數據的密度、豐富度、覆蓋度不斷提高,信息更加及時,公-36-司公告、業績預告、分析師報告、新聞報道以及行業研究報告中包含大量非結構化數據,能體現公司基本面的邊際變化、業績驅動以及未來風險。經過重新加工降低無效換手,即可提高策略容量,同時帶來更豐富的差額,提高超額的確定性。
102、3.構建垂類模型:3.構建垂類模型:將量化聚焦范圍縮小到細分行業上,分行業構造垂類模型。但這種方式同樣存有挑戰:1.有效且持續迭代基本面邏輯難度高,需要具備權益投資稟賦。2.成本很高,單條另類數據的年成本需要幾到幾十萬,需要資源持續投入。另外,對于相對低頻的基本面數據和相對高頻的量價數據的處理,一種思路是將高頻量價數據生成的高頻因子低頻化;另一種思路則是對低頻的基本面數據進行填充,從而保證在一個截面上可以用到研究需要的多類型數據。圖表 當前基本面數據的使用傳統基于財務報表的基本面量化基本面量化 2.0數據來源公司的財務報表相關公司公告、業績預告、分析師報告、盈利預期、新聞報道、行業研究等非結構
103、化數據結構化數據頻率和時效性季度報表數據日頻、日內,豐富度和覆蓋度越來越好時效性較弱往往已經被市場消化無增量信息更加及時更加本質分析方法及建模方式依據傳統財務分析方法構建財務因子,使用線性回歸或多因子模型等建模采用自然語言處理技術對文本信息進行分析和結構化處理,采用深度學習模型,從大量未標注的數據中學習數據的規律和特征,并且通過多模態融合識別復雜關系,通過自學習、自升級和演化的方式不斷學習市場變化、提高模型的性能數據資料來源:思源量化圖表 基本面與量價的差異對比傳統基于財務報表的基本面量化基本面量化 2.0數據來源公司的財務報表相關公司公告、業績預告、分析師報告、盈利預期、新聞報道、行業研究等
104、非結構化數據結構化數據頻率和時效性季度報表數據日頻、日內,豐富度和覆蓋度越來越好時效性較弱往往已經被市場消化無增量信息更加及時更加本質分析方法及建模方式依據傳統財務分析方法構建財務因子,使用線性回歸或多因子模型等建模采用自然語言處理技術對文本信息進行分析和結構化處理,采用深度學習模型,從大量未標注的數據中學習數據的規律和特征,并且通過多模態融合識別復雜關系,通過自學習、自升級和演化的方式不斷學習市場變化、提高模型的性能量價基本面容量持倉周期日內到周頻周頻到月頻持倉數量數百只至上千只300 只至 500 只收益策略邏輯重視統計規律重視主觀邏輯收益來源情緒&波動好公司&好價格波動風險控制敞口控制策
105、略配置超額穩定性相對較低接近于“空氣”指增,介于主觀和指增之間數據來源:煜德投資調研數據顯示:量價數據方面,低頻量價數據(72.62%)低頻量價數據(72.62%)最為基本,包括日 K 線、周 K 線、月 K 線數據,高頻量價數據(58.33%)高頻量價數據(58.33%)是近幾年的主要賽道,研究中主要使用的是滬深交易所提供的 Level2 行情數據,即快照類數據和逐筆類數據???37-照類數據每隔 3s 對目前市場交易狀況“拍照”,記錄這一時刻的市場。逐筆類數據則是會對每一筆訂單進行逐筆記錄,刻畫的是更細膩的交易結構和交易行為,從 2016 年開始就已經有大量機構開始實踐,并結合人工智能算法
106、一起使用。原始的高頻行情數據一般不能直接用作選股因子,在處理和分析之前,需要進行大量的數據清洗工作。在實際使用中,高頻量價數據還會面臨諸多挑戰,例如:如何利用增量行情自動拼接全量行情,利用逐筆數據自動還原出頻率更低的快照數據重構訂單簿,從而獲得任意時刻的全部買賣盤口信息,以及如何實時跟蹤到訂單簿的全貌,以此“對齊數據的顆粒度”等。同時,機構為了降低因子換手率,會對所有的高頻因子進行月度頻率的平滑處理。逐筆成交數據是關于股票每筆成交明細的數據,包括成交量、成交價格、買方編號、賣方編號、買賣標志等信息。重構訂單簿利用編號將相同買方或賣方編號的成交數據進行合并,可以還原得到完整的買賣單信息,并由此識
107、別大單,構建大單成交金額占比、早盤大單買入占比等大單因子;根據買賣標志,可判斷每筆成交屬于買方或賣方主動成交,從而構建開盤主動買入占比、凈主動買入與滯后或超前收益率相關性等因子。高頻量價數據優勢主要體現在:體量明顯大于低頻數據,因此擁擠度相對較低、相關性較低、因子更具多樣性。高頻數據開發的因子一般調倉周期較短,意味著在檢驗因子有效性的時候,同一段測試期內具有更多的獨立樣本。例如,在一年的測試期內,只有 12 個獨立的樣本段用于檢驗月頻調倉的因子,與之相比,有約 50 個獨立的時段用于檢驗周頻調倉因子,有超過 240 個獨立的時段用于檢驗日頻調倉的因子,而獨立樣本的增多有助于檢驗高頻因子的有效性
108、。但這樣也就帶來諸多挑戰:1.有些高頻量價加工的因子的邏輯比較難以解釋,只能經過嚴謹的統計檢驗之后方能使用;2.數據維度大、噪聲高,可能掩蓋真正的市場信號,導致誤判。3.量大且復雜,容易出現數據缺失、不一致或錯誤。4.同時儲存及調用如此大體量數據也面臨技術挑戰,如從 2018 年以來的全市場 level2 數據來說,所需儲存空間就可達幾十 TB,這相對于日度指標來說有約至少萬倍的體量差距,對信息處理能力和處理效率的要求較高。圖表 Level2 行情數據數據類型更新頻率數據描述包含的具體數據數據類型更新頻率數據描述包含的具體數據快照類數據更新頻率為 3秒;若數據無變化,則順延至下一個周期發布。也
109、即行情切片數據,記錄證券交易所某一時 刻的 靜 態 數據 信息,包括現貨(股票、基金、債券等)快照、期權快照、大宗交易快照、指數快照等。開盤價、收盤價;逐筆成交類數據實時推送記錄交易撮合系統中成交的逐筆記錄。連續的成交序號當前時刻的現價;買方訂單號、賣方訂單號截至當前時刻的最高價、最低價成交價格、成交數量、成交類型、成交金額等區間成交筆數;逐筆委托類數據記錄市場中實際訂單的委托情況。委托序號截至當前時刻的成交量、成交額、委托買入量、委托賣出量、買入撤單量、賣出撤單量等委托時間,委托類型等十檔行情深度信息:買賣前 10檔的委托量、委托價、委托單數等委托價格,委托數量,委托方向等買一檔、賣一檔的前
110、 50 筆委托明細逐筆合并類數據僅上交所使用,將單只股票的所有委托和成交信息合并推送。消息序號逐筆成交類數據逐筆委托類數據注:上交所和深交所推送的信息在委托類型、委托價格、業務序號、撤單記錄等方面的數據定義都有所差異,這也需要在數據接收之后進行及時有效的處理。資料數據來源:龍旗科技-38-宏觀經濟數據(49.4%)一般根據經濟增長、通脹、利率、信用、匯率、期限利差等構建宏觀風險因子,因子的上/下行是影響資產收益率的主要矛盾。宏觀風險因子之間一般存在聯動關系,許多機構從美林時鐘出發識別大類資產的波動規律。但挑戰在于:因子動量法在宏觀環境發生切換時反應過于遲鈍,而且宏觀視角需要解決的難題是建立動態
111、的宏觀-行業映射關系。圖表 宏觀、產業、另類數據的映射數據資料來源:中歐基金量化投資部圖表 初始宏觀指標庫詳細構成增長:實體經濟的“量”通脹:實體經濟的“價”經濟總量:GDP、工業增加值、PMI.生產:發電量、汽車產量、貨物周轉量.投資:房地產開發投資、基建投資.消費:社會消費品零售、叉車銷量.進出口:進口、出口、港口貨物吞吐量.收入:公共財政收入、工業企業利潤總額價格指數:CPI、PPI、RPI、CGPI商品指數:CRB 現貨指數、南華商品指數、柯橋紡織指數、Mylpic 礦價指數:綜合.單一品種:大宗價:豬肉、平均價:豆油、平倉價:動力煤、螺紋價格指數、期貨結算價:布倫特原油、平均價:銅.
112、信用:廣義流動性貨幣:狹義流動性貨幣政策目標:M1、M2、社融存量.貨幣政策手段:央行逆回購凈投放.貨幣政策傳導:M1-M2、M1-PPI、金融機構:新增人民幣貸款、金融機構:各項貸款余額、金融機構:企業存款余額.交易:滬深兩市成交額、商品房銷售額.貨幣市場利率:SHIBOR、銀行間質押式回購加權利率、回購定盤利率.資本市場利率:國債到期收益率、企業債到期收益率、國開債到期收益率.利差:期限利差、信用利差、中美利差.交易:銀行間質押式回購成交量.其他資產價格:上證綜指、深證成指、恒生指數、70 個大中城市二手住宅價格指數.外匯:官方儲備資產:外匯儲備、中間價:美元兌人民幣、人民幣:實際有效匯率
113、指數資料來源:華泰金工問卷調研顯示:金融衍生品數據(41%)、事件型數據(28.57%)、另類數據(32.14%)和公司關系型數據(19.64%)使用場景也較為廣泛,只是有的場景更為特定。-39-許多機構把衍生品當成高杠桿或者對沖工具,或者將其當作獨立或者混合產品收益增厚當中的一部分。數據顯示金融衍生品數據(41%)使用較為廣泛,但目前指導股票投資的公開資料較少。另類數據廣義上理解就是區別于量價和財務報表上的數據以外的新型數據,目前使用面最廣的為分析師一致性預期及輿情數據。分析師一致性預期數據的分析主要有以下幾種方法:方法 1(Alpha-Capture):方法 1(Alpha-Capture
114、):直接找到所有券商的行業研究員,讓其定期給量化機構發送行業研究數據,投研報告業績驅動、數據清晰,適合量化管理。所以大量的對沖基金和資產管理公司涌入,用人工決策或量化分析管理這些投研報告,人來挖掘 Alpha,而不是挖掘股票。Two Sigma,Mashall Wace,GSA Capital 等都是其中代表。方法 2(賣方預期評價):方法 2(賣方預期評價):通過評估賣方研究員對于公司評價、預期盈利、預期增長等相關預期的變化以及相關預期的一致性和差異性,建立研究員評價體系,用以分配不同權重;區別于簡單市場預期,研究員預期以及預期變化(邊際變化)對于 A 股短期會有明顯催化效果。圖表 賣方分析
115、師預期評價預期盈利研究員預期未來 1-3 年盈利均值研究員預期未來 1-3 年盈利方差研究員預期未來 1 年盈利均值變化:1周/1 月/2 月/3 月變化情況證券評級研究員覆蓋個數研究員評級均值研究員評級方差研究員評級變化:1 周/1 月/2 月/3月變化情況研究員評級調整加權均值預期成長按照研究員預期未來 1-3 年盈利計算成長率均值按照研究員預期未來 1-3 年盈利計算成長率方差按照研究員預期未來 1-3 年盈利計算成長率均值變化:1 周/1 月/2 月/3 月變化情況預期估值按照研究員預期未來 1-3 年每股收益計算市盈率均值按照研究員預期未來 1-3 年每股收益計算市盈率方差按照研究員
116、預期未來 1-3 年每股收益計算市盈率均值變化:1 周/1 月/2 月/3 月變化情況目標價格研究員預期目標價格均值研究員預期目標價格方差研究員預期目標價格變化:1 周/1 月/2 月/3 月變化情況研究員預期目標價格調整加權均值數據資料來源:玄元投資方法 3(情緒打分):方法 3(情緒打分):直接用原始的語料(如研報文本)送入 NLP 模型(如 BERT)中預測情感得分,并在歷史上進行衰減加權,從而獲得情緒因子。用于預測未來收益率。其背后的邏輯是,分析師報告中的一些信息,雖然可能并不是通過數字傳遞出來,但會從文本中一些詞匯和結構中隱晦地體現出來。因為詞向量中包含詞頻以及其他 TF-IDF 信
117、息,模型可以利用這些信息進行預測,并將預測結果用于未來收益率的估計。但是由于年報中正面情緒的出現頻率遠高于負面情緒,因此在情感分析方案中,模型的偏向性會比較大。方法 4(知識圖譜構建):方法 4(知識圖譜構建):對量化來說最缺的是對一個行業的知識圖譜的構建,通過 NLP 對研報進行分析,然后把所有的信息抽取出來,得到在時間序列上研究報告在歷史上所出現的二維結構?;谶@樣的二維結構可以對其中很多指標進行驗證,看其是否對上市公司盈利的結果或者股價的結果有影響,是長期的影響還是短期的影響。第一步,如果把左邊的研究報告變成右邊的樣式,就是非常典型的自然語言處理手段,左圖很多是 PDF 格式的文件,要對
118、它進行結構分段處理。在這個過程中,會得到一個與所有行業相關的研究指標或者研究框架體系。在時間序列上把各種多模態的另類數據來源進行交織,最后形成對價值的預測能力。-40-圖表 行業的知識圖譜的構建圖表 研報及新聞文本的處理數據資料來源:九坤投資數據資料來源:思源量化2022 年發現市場上大量的分析師超預期因子失效,引發市場質疑,許多機構認為這部分的研究需要機構更為深入依托宏觀層面的認知,以及配置層面的框架,形成管控能力。事件、情緒維度的數據主要包括股東、管理層增減持、定增發行、解禁、高送轉、分紅除權、可轉債發行、大宗交易、核心指數成份股調入、調出、權重變化、機構持倉動態、北向資金動態、輿情等等,
119、由于信息的滯后性,這類數據也會需要關注市場反身性,例如九坤投資就曾指出:重大重組、重大合同簽署等利好信息發布后一般會迎來下跌。因為重大利好之前股價已經經過了一波快速上漲,所以新聞數據最終結果可能是一個反指。圖表 文本數據的事件提取,不同市場環境下的事件影響力數據資料來源:九坤投資另類數據具備強即時性、覆蓋樣本廣、信息量大等多種優勢。目前,行業內另類數據的使用正在增多,寬德投資就購買了全球 10 萬+品種行情數據庫,還有 1000+另類數據源;另外例如龍旗科技 2022 年累計產出超過 1400 個基于另類數據的因子,數據源主要為:熱度、招聘、新聞、專利等。這類數據更新頻率不太一致,部分機構用做
120、 5-20 天的中長周期預測。-41-圖表 另類數據使用類別圖表 另類數據使用介質公司關系型數據(19.64%)一般用來做更前置的投資指引。例如亙禹資產就談到,對 A 股來說不同板塊的標的表現是有特色、有規律的。如果以寬基指數作為一個整體去回測,就會發現有很多數據和研究出來的結果對比看似有效,但是表征性不強。所以亙禹利用過渡因子的方法,先于市場判斷當前是處于趨勢行情還是動量反轉,在不同的市場結構下(上升、下降或是震蕩)對市場的表征因子做研究,找到當下的最優解。其因子挖掘的方式是首先根據行業把股票分類,通過產業鏈框架地圖輔助細化全市場股票的分組,分組后的產業圖譜目前積累 40 多個;隨后再對分組
121、后的數據進行研究來挖掘因子。另外通過衛星、無人機拍攝、熱成像、船舶 AIS 信號等現代科技手段獲取的數據也部分應用于投資,尤其是 CTA 策略中。例如原油產業與貿易鏈條較為復雜,因此投研與交易對于數據廣度和深度的要求極高。傳統方式下對于石油市場基本面(供應、需求、庫存、貿易)的跟蹤主要倚仗官方機構的統計,雖然具有較好的權威性與準確性,但存在更新頻率低、較為滯后、且數據精細度不足等顯著缺陷。機構借助新手段從上游開采、中游運輸倉儲、下游煉化、終端消費等一系列活動進行跟蹤,能夠提供更加精細和高頻的信息支持。例如華泰期貨通過 AIS 信號、衛星數據等方式來跟蹤全球海上航行油輪的動向,具體到該船目前所處
122、的位置(海域/經緯度)、當前的航速、當前裝載的貨物種類和數量、始發港/目的地、過去的行動軌跡等。對這些數據進行整合后,可以推算出油輪未來的運動軌跡,從而預測油輪抵達目的港的具體時間。此外借助衛星實時拍攝庫中浮頂罐的照片,結合模型可以獲取實時的石油儲存量,從而提升商品供需分析的精細度和即時性,更好地進行價格發現。以上高頻量價數據中“高頻”容易引起爭議,尤其是高頻量價數據、因子、策略、交易以及程序化交易。其實五者大有不同?!靖鄡热菰斠娭袊炕顿Y季刊 2022 冬刊-高頻交易篇】圖表 高頻相關定義辨析高頻數據高頻量價數據是指以非常短的時間間隔(如秒或毫秒級)記錄的市場交易數據,包括價格變化(買入
123、價和賣出價)和交易量的信息。高頻量價數據可以揭示市場在非常短的時間范圍內的動態變化,全市場可通過公開購買方式獲得。高頻因子高頻因子是指在高頻數據上構建的預測性信號或屬性,用于捕捉短時間內價格變動的規律。例如,某個高頻因子可能是基于最近幾秒或幾分鐘內的價格動量或交易量的變化計算得出。但這些因子在交易時通常也會進行低頻化處理,如前所述,例如通過逐筆數據重構訂單簿,使用快照數據來合成分鐘級別的 K 線數據。高頻策略交易次數多,單筆盈利少。最終盈利取決于股票的日內波動和流動性。周期短、勝率高、盈利穩定,基本不受宏觀和大盤影響。主要分為趨勢性策略、價差策略、做市策略等。趨勢策略:趨勢策略:往往投資于一個
124、證券品種,運用技術分析或數學工具預測其未來價格走勢,并據此確定建倉和平倉時點。只要預測方法能夠保證一定的準確率并能抓住大的價格波動,那么這樣的策略就有可能獲得較好的累積收益。該類策略在商品期貨和股指期貨市場上已經得到廣泛運用。價差策略:價差策略:往往會投資多個具備某種共性的證券品種,并認為這些證券之間的價差應該維持在一個均衡水平,不會偏離太多。如果發現市場上某些證券之間的價差過大,那么該策略便會做空那些高估證券,同時買入低估證券,直至價差回復到均衡水平再同時清掉多、空頭倉位,賺取價差變動的收益。做市策略做市策略:是因為其采用了類似于做市商提供買/賣報價(bid/ask price)方式,賺取買
125、賣價差(bid-askspread),但其本身的目的-42-并不是要做市,給市場提供流動性。這種策略通常需要對逐筆成交和掛單報價做建模分析,從海量數據中挖掘定量模式,掛單和撤單之間的時間間隔可能在毫秒之間(1 毫秒=0.000001 秒),因此也是技術要求最高的一種交易模式,通常也稱作超高頻交易(UHFT,UltraHighFrequency Trading)。鑒于國內法規、硬件設施、交易費用的限制,該類策略在國內尚且無法實施高頻交易高頻交易是一種算法交易的形式,其中交易指令以極快的速度被執行,通常是毫秒甚至微秒級別。高頻交易者利用先進的技術和算法來捕捉市場上的瞬息機會,并且通常會在一天內進行
126、大量的買賣。目前,國內證券交易所對高頻交易的篩選標準是,每秒最高申報速率 300 筆以上,或者單日最高申報 2 萬筆以上。從篩選結果看,高頻交易賬戶數量總體不多,但交易金額較大,約占程序化交易額的60%。接下來政策導向為:1.額外報告機制;2.重點監管;2 差異化收費:對行情使用費、流量費等相關費用做出差異化安排,適當提高交易收費標準,并可能收取撤單費等其他費用。程序化交易根據 2024-05-15證券市場程序化交易管理規定(試行),程序化交易為通過計算機程序自動生成或者下達交易指令在證券交易所進行證券交易的行為。規定要求:證券交易所依法建立程序化交易報告制度。程序化交易投資者應當真實、準確、
127、完整、及時報告以下信息:(一)賬戶基本信息,包括投資者名稱、證券賬戶代碼、指定交易或托管的證券公司、產品管理人等;(二)賬戶資金信息,包括賬戶的資金規模及來源,杠桿資金規模及來源、杠桿率等;(三)交易信息,包括交易策略類型及主要內容、交易指令執行方式、最高申報速率、單日最高申報筆數等;(四)交易軟件信息,包括軟件名稱及版本號、開發主體等;(五)證券交易所規定的其他信息,包括證券公司、投資者聯絡人及聯系方式等。程序化交易投資者報告信息發生重大變更的,應當及時進行變更報告。證券交易所對程序化交易實行實時監測監控,對下列可能影響證券交易所系統安全或者交易秩序的異常交易行為予以重點監控:(一)短時間內
128、申報、撤單的筆數、頻率達到一定標準,或者日內申報、撤單的筆數達到一定標準;(二)短時間內大筆、連續或密集申報并成交,導致多只證券交易價格或交易量出現明顯異常;(三)短時間內大筆、連續或密集申報并成交,導致證券市場整體運行出現明顯異常;(四)證券交易所認為需要重點監控的其他情形。程序化交易異常交易監控標準由證券交易所規定。截至去年底,全市場報告程序化交易賬戶 11.9 萬個,程序化交易不一定是高頻的;它既可以應用于高頻交易,也可以應用于日內交易甚至長期投資策略。數據資料來源:編寫組整理問卷調研顯示:公眾對上述這些概念的理解正變得更加細致和準確。公眾對上述這些概念的理解正變得更加細致和準確。雖然有
129、一定比例的公眾認為高頻交易提高了市場流動性,但也有不少人擔憂它可能會帶來市場波動和公平性問題。同時,認識到量化投資與高頻交易之間區別的人數占比也較高,公眾多元化的看法表明對于高頻交易的影響,需要更全面和平衡地討論。圖表 公眾如何看待高頻交易圖表 如何看待做空策略-43-2.因子2.因子量化機構通過研究經驗、賣方研報、信息搜集等獲取研究靈感,生成因子。因子是量化投資策略的基礎,用于模型構建和風險管理,并能夠幫助量化投資者識別和利用市場中的系統性預測性信號。多因子,顧名思義,是龐雜的一個因子體系。多種類型、多個低相關的因子組合在一起能平滑收益曲線,最大化收益來源。當前因子主要有以下幾種分類方法:圖
130、表 量化因子分類因子種類低頻量價、高頻量價、基本面、另類因子因子預測周期日內:日內高頻(1-3min)、日內波段(10-15min)、日內長線(30-60min)日間:高頻 1-3 天;中頻 3-10 天;低頻 10 天以上因子產生背景人工挖掘(投資邏輯、數理統計、研究報告)機器學習挖掘Barra市值因子等Alpha 因子與風險因子容易倒換,常見的 Alpha 因子已逐漸演變為風險因子。例如 2019 年以來,無論是成長類基本面因子和價值類基本面因子的多空收益都不穩定。2019-2020 年,市場偏向成長風格,成長型基本面因子在這個階段表現較優,價值型較差;近 3 年,隨著市場風格轉向,兩類因
131、子的收益出現反轉。按因子種類,按因子種類,在實操中,量化機構一般會最終在根據 300 指增、500 指增、1000 指增、中性等各類產品分配不同的因子比重,最常見的為 70-80%量價類因子+20-30%(基本面因子另類因子)。圖表 頭部私募機構量化策略的因子構成機構因子組成因子挖掘方式機構 1量價 70%、基本面 20%、另類因子 10%。以機器挖掘為主。機構 2傳統量價(中低頻)70%,其余 30%。傳統量價均為人工挖掘的理性因子。Al 對挖掘因子、組合優化貢獻度約 40%。機構 3量價因子 90%、基本面 5%、事件驅動因子 5%以機器學習為主。機構 4包括中低頻價量因子(60%)、事件
132、驅動因子、基本面因子、日內因子和高頻因子以人工挖掘為主。機構 5中低頻量價 70%、基本面及另類因子不到 20%。因子挖掘人工為主。機器學習少量參與,Al 挖掘的因子會進行人為歸因。機構 6以中低頻量價因子為主,基本面因子和另類因子起輔助作用。以人工挖掘為主。機構 7以量價為主,量價中中低頻占比高Al 挖掘因子占比在 50%以上機構 8量價 75%、基本面 25%。量價以中低頻為主。因子挖掘為純機器學習,因子邏輯偏統計學,金融學邏輯較弱。機構 9量價因子 70%左右,其余為基本面、另類因子。主要由機器學習挖掘因子。機構101000 指增,量價因子 70%、基本面因子+另類因子 30%;500
133、指增,量價因子 60%,基本面因子+另類因子 40%。因子 80%以上為機器學習挖掘,其余為人工挖掘資料來源:私募排排網,Wind,海通證券研究所高頻量價因子是量化機構研究的重點,各家機構分類較多:-44-圖表 高頻因子分類情況成交分布類主要包括成交量或成交額日內分布統計指標,用于反映成交日內分布情況;不同條件下成交占比用于刻畫投資者交易行為或交易意圖。收益分布類主要包括價格或收益率的日內分布統計指標,用于反映股價日內分布、買賣壓力等情況。波動跳躍類利用高頻數據刻畫股價日內波動和跳躍情況??坍嬃斯善眱r格或股票收益在過去一段時間的不確定性程度,高波動率通常反映其不確定性程度較高,未來收益表現可能
134、相對較弱。動量反轉類主要對應日內動量和日內反轉,利用高頻數據增強動量效應和反轉效應。包含三個細分類型:分段動量、量能動量和 QRS 動量因子。資金流類對成交單數據進行大中小單、主動買入賣出、資金流入流出等維度的劃分,通過計算不同維度下成交占比等方式刻畫資金流向、買賣壓力、買賣意愿、追漲殺跌羊群行為、知情交易等情況。主要可分為以下三類:交易單量資金流向因子、開盤/尾盤資金流向因子和收益率成交占比因子。資金流因子反映了不同類型資金流向的信息,該類因子的核心思路是捕捉“聰明資金”的流向,采取跟隨策略,以期獲得基本面改善帶來的超額收益。流動性類主要利用 Tick 數據,從寬度、深度、彈性等方面衡量市場
135、流動性,追蹤投資者交易意圖。包含兩類:價格彈性因子和集合競價因子。量價相關性類主要基于成交量和股價的相關關系刻畫成交量和價格雙方走勢的背離或一致程度,以及一些量價復合因子??煞譃閮深悾簝r量同步因子和領先滯后因子。量能領先階段往往是信息擴散的初期,但日內量價相關因子基本與未來收益負相關,高階特征通過分鐘級別價格數據計算出日內收益率的偏度與峰度,該類因子刻畫日內價格分布以及快速變化的特征?;I碼分布可分為以下兩類:籌碼分布形狀因子和籌碼占比因子?;I碼分布旨在刻畫股票持有人的持倉成本分布情況。擁擠度使用 30s 快照成交量序列構建了傅里葉變換機構擁擠度指標,原理是機構拆單下單形成的周期性可以被傅里葉變
136、換后的更顯著波形振幅占比捕捉,使用周期性成交占比表征機構參與度占比。訂單侵略性訂單薄性質的變化,體現了多空力量的動態變化,是未來價格走勢的重要體現,一個訂單的執行概率和訂單薄的厚度、參與者對即將到來的訂單的預期有關;買盤越厚,一個潛在的買家下 market order 的概率更大;這套說法對賣方同樣適用;bid ask 的厚度體現了看漲和看跌者的相對力量。買家掛單越接近 bid1,越激進;賣家掛單越接近 ask1,越激進;體現了買家/賣家完成交易的迫切程度。通過整個訂單薄,可以知道所有買家整體的激進程度和所有賣家整體的激進程度,從而構建一系列因子了。此外,買賣侵略性的差異,也是一系列因子。訂單
137、薄形狀訂單薄平均形態是有一塊隆起的地方,離不開幾種情況。1.頂點不同;2.可能是雙峰的,甚至是多峰;3.可能是沒有峰,就是矩形分布 4.可能就在某些檔位有分布;5.可能是單調的,比如從第一檔往后幾乎單調上升或者下降,單調的函數可以是線性的,也可以是 concave 或者 convex;頂點的位置可以作為一個因子。比如,買單的頂點位置,是位于 0-10%、10-20%等的哪個位置;此外,還需要關注這個頂點位置隨時間的遷移。例如訂單薄斜率,描述訂單薄上的價格和該價格處的掛單量之間的關系。撤單撤單行為,不僅反映了交易者的觀點的變化,還會影響其他交易者;根據買賣雙方各自的撤單量、撤單金額、撤單價位、大
138、單超大單的撤單情況,可以構建很多因子。除了正常交易情況下撤單去追跑掉的價格外,還有訂單為欺騙對手的作用,掛單者想制造假象,以誘導其他投資者。事件聚集例如撤單、掛買一單、超大買賣單出現,然后在一段時間內統計事件發生的頻率,可以構建很多個系列的因子。這是高頻數據低頻化的常見思路。一些事件具有聚集的特性原因有:交易者拆分大單來掩蓋交易意圖;交易者之間的模仿;不同交易者對新聞的先后反應;為了在競價上擊敗其他交易者。逐筆數據主動買賣判斷一筆交易屬于主動買還是主動賣,通常以一筆交易的買賣雙方的訂單到底先后順序來定,生成日內累計主買率、日內累計資金凈流入、日內累計大單資金流入率、日內累計小單資金流入率等等;
139、數據資料來源:量化投資與機器學習、中金多因子手冊、中環狙擊手-45-圖表 穩博投資日間因子分類及其收益占比圖表 穩博投資日內因子分類及其收益占比數據資料來源:穩博投資日內量價類因子對于提升超額收益的穩定性貢獻較大,但是在成交量低迷的時期日內因子可能會受到影響;然而長線的基本面、新聞和另類數據因為換手率相對較低,不受市場成交量影響,在交易量和波動率較低的市場環境中其對超額收益有較大的貢獻,與量價類因子形成互補。因子多樣性使得在不同的市場環境下,都能夠有相對穩定的超額收益,同時具備較好的控制超額回撤效果。如赫富投資 2022 年做了大型升級,從 85%量價依賴降低到 70%,同時提高基本面和另類的
140、比例,從15%提高到 30%。部分機構會對因子進行重新定義,例如靈均的因子包含 30%基本面因子+35%傳統交易邏輯因子+35%新型價量類因子;石鋒量化因子庫中 15%為概念題材類因子,以把握短期主題概念機會。但本質上仍基本分為以上三大類,并且比例也較為接近。圖表 穩博投資日間因子分類及其收益占比圖表 穩博投資日內因子分類及其收益占比數據資料來源:穩博投資按預測周期:按預測周期:許多機構從分鐘到季度都有分布,例如世紀前沿直接根據頻率將因子分為高中低頻三大類因子:其中高頻最重要的作用是交易執行,能夠低成本甚至負成本實現中低頻信號的超額收益,高頻因子收益貢獻占比 10-15%。中頻的價值主要體現在
141、相對艱難的市場環境下,能夠在風格快速切換時更快地適應變化,中頻因子收益貢獻占比 40-45%。根據因子產生的背景:根據因子產生的背景:目前量化機構在因子挖掘上采用了多元化的方法,結合人工智能和機器學習技術的機器挖掘與傳統的人工挖掘相結合,以在競爭激烈的市場中尋找到獨特的 Alpha 源。圖表 量化機構因子挖掘方式:數據資料來源:2023 中國量化投資白皮書問卷調研人工挖掘(77.38%)和機器挖掘(59.52%)是最常見的因子挖掘方式。一般而言,前者以邏輯性因子為主,依賴于研究人員的專業知識和判斷,包括可能影響資產價格的各種宏觀和微觀變量。其中典型代表如 World Quant,該機構進行工廠
142、流水-46-線式的生產,在全球雇傭了成千上萬人來做策略,然后由總部 100 個左右基金經理將策略進行融合,在過去 10 年積累了超過1000 萬個金融信號,但隨后出現了邊際效用遞減。機器挖掘(59.52%)以統計性因子為主,利用機器學習算法自動識別可能有預測能力的因子,發現人工方法難以識別的復雜模式和關系。有的機構將之稱為 Quant 3.0 時代。機器挖掘出的因子也不會直接喂入模型,一般同樣會通過人工進行邏輯可解釋性審核。圖表 統計性因子及邏輯性因子的使用條件統計性因子邏輯性因子基本面因子統計時長不低于 10 年T0 因子統計時長不低于 6 個月兼顧長期歷史有效和當下市場環境有效檢測每次邏輯
143、成立時,對應的勝率以及極端情況下勝率和表現因子提交后,在預設時間內通過樣本外數據驗證,統計學上顯著有效,最終被采納因子通過檢驗時長 1 個月-1 年不等數據資料來源:穩博投資目前因子挖掘主要分為兩種方式:啟發式算法和深度學習。啟發式算法即在一些既定規則的基礎上,不斷生成一些新的規則,但就像生物進化、基因變異不一定是向更好的方向,相對來說不那么高效。深度學習的特點是明確圍繞損失函數最小化的目標,用梯度向量技術去不斷迭代參數的最優化學習方法。最優化算法的目標明確,不需要人再去定義一些規則,網絡可以做得高度復雜,搜索空間很大,效率也相對較高。這兩類技術都有各自的生存土壤,啟發式算法最后會給出一些既定
144、因子、規則,所以可能更適合追求可解釋性的資管機構,而基于深度學習的方法,可能會更加激進。研報復現(50.6%):研報復現主要是通過查閱公開的券商賣方、學術研究報告,嘗試復現報告中提到的因子。同業觀點(27.98%)、績效歸因反饋(27.38%)、量化軟件自帶因子(13.69%)、外部采購(19.05%)也能幫助量化機構不斷拓展因子的類別及數量。圖表 穩博投資日間因子分類及其收益占比圖表 穩博投資日內因子分類及其收益占比數據資料來源:穩博投資圖表 2024 年 Q1 賣方金融工程熱點研報東北證券基于 CNNTransformer 的深度學習模型探究海通證券深度學習因子的“模型動物園”東方證券基于
145、異構圖神經網絡的股票關聯因子挖掘華安證券加速換手因子,“適逢其時”的換手奧秘DFQHIST,添加圖信息的選股因子挖掘系統基于殘差因子分布預測的投資組合優化周頻多因子行業輪動模型高成交量回報溢價與經濟基本面基本面因子的重構探索股價動態關聯,捕捉屬性敏感的動量溢出自適應時空圖網絡周頻 Alpha 模型基于端到端神經網絡的風險預算與組合優化東吳證券換手率切割刀 CTR 因子 CutletsofTurnoverRate,換手率的異質信念華泰證券經濟周期實證、理論及應用交易者結構對動量因子的改進GPT 因子工廠,多智能體與因子挖掘-47-換手率分布均勻度,基于分鐘成交量的選股因子如何捕捉長時間序列量價數
146、據的規律宏觀風險因子構建與大類資產配置應用華鑫證券基于技術面量化的指數基金絕對收益策略重拾自信選股因子更新從過度自信到重拾自信開源證券訂單流系列,撤單行為規律初探廣發證券基于融資融券因子研究KyFactor 特色因子體系與應用可轉債高頻因子探索大小單資金流為核心的綜合行業輪動方案國海證券DMA 策略帶來的小微盤股風險釋放及前景展望行業動力學模型的周頻應用國金證券基于日內高頻博弈信息的商品 CTA 策略百億量化私募 2023 年業績盤點追上投資熱點基于 LLM 的產業鏈圖譜智能化生成民生證券紅利策略優化,“高股息陷阱”與股息預測高頻因子跟蹤 Sora 模型有望進一步提升投研生產力從增量學習到元學
147、習,深度學習訓練新框架機器學習全流程重構細節對比與測試邁向價值之路,競爭壁壘分析框架下的選股邏輯國聯證券雪球敲入對市場影響研究太平洋證券基于交易異常的廣義反轉因子基于遺傳規劃的對傳統量價因子的優化思路西南證券聚沙成塔,微盤股行情解析與微盤股投資策略國泰君安行業指數如何擇時,通過估值、流動性和擁擠度構建量化擇時策略多維探究黃金定價邏輯,定量擇時配置有章可循大類資產配置策略落地方法研究信達證券雪球敲入是否給市場帶來壓力?國信證券高頻訂單成交數據蘊含的 Alpha 信息雪球陸續敲入,基差全面貼水個股與行業的共振,聯合動量因子興業證券年度復盤&展望三選股策略篇浙商證券多因子量化投資框架梳理長江證券交易
148、行情高頻因子收益來源數據資料來源:公眾號量化投資與機器學習通過梳理上述 2024 年的熱門研報,可以提煉出量化投研領域的幾個共性趨勢:1.人工智能技術的廣泛應用:1.人工智能技術的廣泛應用:多個研報提到了基于深度學習模型,如 CNN、Transformer 等。異構圖神經網絡、圖信息的加入、自適應時空圖網絡等在研報中的頻繁出現,顯示了量化研究者在探索和利用復雜網絡結構和關系數據方面的興趣,以尋找公司之間的關系或資產之間的相互作用。2.多因子策略與選股因子的持續創新:2.多因子策略與選股因子的持續創新:報告中提到了因子的重構和優化,量化研究者在尋找更有效的因子組合和更新的選股邏輯。3.宏觀量化與
149、大類資產配置:3.宏觀量化與大類資產配置:涵蓋了從宏觀風險因子構建到具體的資產配置應用等多個方面。4 高頻數據的深入研究與利用:4 高頻數據的深入研究與利用:高頻因子、高頻訂單成交數據等數據。更多、更快、更強,因子發展總不免圍繞此路,但比起因子池,實盤池可能更能代表機構目前風格。50 個以內(27.38%)實盤因子占比最高,表明有相當一部分量化機構傾向于維持一個較小、較為精細的因子庫,更加注重因子的質量而非數量。當前的實盤因子組中 1000 因子以上的占比略少(20.58%),但代表的是截然不同的方法論與投資哲學,機構進行大規模的機器挖掘,利用機器學習和人工智能技術來生成和測試大量因子,比如茂
150、源投資就在其資料介紹道因子數量超過 10 萬個,并且每月增加或更新 10%的因子。-48-圖表 量化機構目前的實盤因子數量:圖表 因子挖掘方式與實盤因子數量關聯關系數據資料來源:2023 中國量化投資白皮書問卷調研需要注意的是,因子的數量并不直接等同于投資策略的成功。一個精心挑選和優化的較小因子集合也可能比一個大而不精的因子庫更有效。因此,量化機構在因子挖掘和實盤應用時需要平衡因子廣度和純粹性,確保因子的可解釋性和穩定性。避免加入非常多的因子之后,反而發現組合噪音不可控。圖表 因子檢驗方法比較方法優勢劣勢ic 信息系數IC IR含義簡明;計算簡便。只能反映因子值與股票收益的線性相關性,未考慮非
151、線性部分:無法從選股角度反映因子頭部選股能力。Rank-ICRank-ICIR分組測試分十組測試直接考察組合收益與波動分布:反映因子多頭與空頭收益輔助判斷因子在時序上的表現。用回歸取殘差的方式無法做到完全中性;受市場風險及其他因子的影響:市值行業分層打分直接考察組合收益與波動分布:反映因子多頭與空頭收益;保持市值和行業中性;輔助判斷因子在時序上的表現受行業股票個數影響,分組組數受限;無法剔除其他因子和風險因子的影響?;貧w法因子收益 FM-檢驗檢驗因子在時間序列上是否有顯著收益;輔助判斷因子在時序上的表現。無法反映因子在組合中的表現;受回測時間窗口選取的影響純因子組合能靈活控制風險因子對待檢驗因
152、子的影響,提純因子表現:與風險模型、組合優化聯系緊密。無法判斷收益來自多頭還是空頭:純因子組合不具可投資性,與實際投資組合存在差別;嚴格控制其他風險暴露為 0,可能因子走勢常有出入數據資料來源:華泰研究因子構建完成之后,機構會先觀察其收益、夏普率與其他因子的相關性,同時進行有效性和邏輯性校驗,使得因子可解釋性強、特征性強、新增低相關。同時許多機構也會分觀察庫、實盤庫等多個優先級別,同時在因子失效之后剔除,建立剔除標準。1.邊際貢獻度:1.邊際貢獻度:包括 IC、累計收益率、IC_Rank 等。新因子一般會需要半年左右的時間去檢驗有效性,如果因子確實表現好就納入實盤,對于長時間表現不佳的舊因子會
153、適時予以剔除。2.邏輯性檢驗:2.邏輯性檢驗:包括通過邏輯進行假設,并驗證假設,進一步確認信號的合理性或者改進信號。也以此明確信號賺錢的邏輯,在信號失效時做出準確判斷。-49-3.相關性檢驗:3.相關性檢驗:有的因子之間相關性較低、放在一起使用預測效果更好,同時有的因子之間相關性很高、即使放在一起也和單個因子差別不大。若新開發的因子與已有因子相關度較高時,將對已有因子進行融合升級,若該因子與現有因子相關性較低,則將其納入因子庫。圖表 復熙資產因子在相關性頻譜分布圖表 因子因果推斷數據資料來源:復熙資產數據資料來源:配邦私募-50-3.算力3.算力“算力是設備根據內部狀態的改變,每秒可處理的信息
154、數據量?!?018 年諾貝爾經濟學獎獲得者 Willam D.N Ordhaus 在計算過程一文中對算力進行如上定義。個策略回測任務往往需要遍歷多個標的、多個參數、多個周期。隨著標的的增加、從 level1 到 level2 高頻數據的應用、人工智能算法的復雜度增強、另類數據的引入并清洗,量化進入 3.0 時代之后,對算力帶來了更高的要求和挑戰,以便駕馭更加復雜的模型和海量參數,同時提升實時大樣本信息處理能力。這些挑戰包括技術框架、算力部署以及其他硬件系統。圖表 大量數據儲存、多模態數據、復雜的算法催生了量化機構的算力軍備競賽圖表 小型機構及經濟學派別算力部署更為克制人工智能和短周期量化機構派
155、別對數據則更為積極圖表 量化策略和數據處理中的首要需求數據資料來源:2023 中國量化投資白皮書問卷調研AMD 也在對客戶的走訪調查中發現,量化機構對服務器的性能要求多種多樣,并行計算能力(85.71%)是量化策略和數據處理中的首要需求。并行化計算將計算任務分割成若干個子任務,同時在多個計算單元上進行計算,最后將計算結果合并得到最終的結果。相對于串行計算,它具有計算速度快、效率高、可擴展性好等優勢。同時擁有更高的計算精度,在處理大量數據和復雜計算任務時非常關鍵。高的 CPU 核心數(65.71%)在于更多的核心數可以支持更多的并行任務,包括多個交易策略、風險管理計算以及多個市場的同時監控等。在
156、高頻交易場景中,處理器主頻往往優先于核心數,而在中低頻交易或復雜策略計算中,多核并行能力也非常重要。過半數的受訪者認為內存帶寬(55.43%)也是一個重要的因素。高內存帶寬可以確保數據在處理過程中快速傳輸,減少因內存瓶頸導致的延遲,有助于快速處理大量數據結構(如訂單簿、K 線數據、指標計算結果等),尤其是在進行大量數據篩選、排序、聚合等操作時。內存性能對于實盤交易系統的穩定性、響應速度和策略計算效率也至關重要。而 NLP 自然語言-51-處理以及因子挖掘等人工智能類業務,它們對內存帶寬的要求則更高,其中涉及復雜的統計計算、相關性分析、特征工程等操作,這些任務都需要在內存中進行大規模的數據移動,
157、內存帶寬的高低直接影響著數據處理的速度。高主頻(52.57%)盡管在調研中的占比相對較低一些,但高主頻的處理器可以在單線程任務中提供更快的計算速度,能夠在短時間內完成更多的計算任務,這對于快速計算交易信號、執行交易邏輯、處理市場數據流至關重要。此外,支持向量指令集(如 AVX、AVX2、AVX-512 等)的處理器能夠加速文本處理中的向量化操作,如批量字符編碼、矩陣乘法等,進一步提升計算效率。核心技術框架優化方面,例如 2017 年初,念空開始進行深度學習和機器學習的測試與迭代,終于在 2019 年 3 月推出了第一個穩定版的機器學習策略模型。與此同時,念空科技也建立了一個具有跨時代意義的模型
158、平臺,從一個封裝化的多因子挖掘平臺轉變到一個封裝化的全流程策略平臺超級信號工廠(TFOT)。這是一個一站式體系化的策略研發閉環。整個工廠由以下四個部分組成,包括特征工程(Terms)、擬合工程(Fitting)、優化器(Optimization)及交易算法(Trade)。策略在各個流程化標準化模塊的配合下,經過層層檢驗,被生產出來。念空科技做過一個這樣的測試,將過去 5 年全部 4000 只 A股的特征值,即 24 萬億個數據點保存在一個文件里,一個未經優化的算法給出的時間是 18 小時,而在并沒有增加任何服務器的情況下,念空通過算法重構后,給出答案的時間是 1.5 小時。再如數據方面,任何模
159、型的訓練都是基于海量的歷史數據。而大模型由于訓練成本較高,需要的數據量巨大,無法做到實時或準實時地將最新數據納入模型的迭代更新中。因此,NVIDIA 使用了檢索增強生成(RAG,Retrieval Augmented Generation)技術,通過外掛知識庫的方式,可以將最新的實時數據導入到 LLM 的應用當中。而除了基于文本的 RAG,還出現了基于 Graph的 RAG 技術,利用 Graph 對非結構數據的信息抽取能力,以及跨文檔的關系建立能力,再結合常規的向量和關鍵詞檢索,進一步提升了檢索增強生成的能力。算力部署方面,一般而言,策略方向影響了量化機構的基礎設施主張,大型算力在中短期、中
160、高頻大量股票的投資上,更有優勢。人工智能派別機構會在算力部署上更為積極,經濟學意義派別則會將其掌握在合適范圍之內,認為機構之間算力的差距微乎其微,更重要的是找到更好的 Alpha 來源,算力配備只是解決策略投研人員的后顧之憂。對于人工智能和短周期量化機構派別而言,傳統的技術框架無法滿足量化行業對海量數據存儲、分析計算、策略迭代的性能要求,為便次性加載更多歷史數據到內存,量化機構往往需要不斷采購、擴容內存服務器滿需求。近年來,隨著量化私募在國內的蓬勃發展,許多百億量化私募逐漸加大在硬件上面的投入。一些公司在算力方面的開銷呈幾何級增長,每年近千萬的算力和硬件支出使其產生了自建超級計算集群的想法。一
161、些公司則配備了高性能 GPU 集群的服務器,滿足龐大的數據處理需求。明汯就談到,國內量化從簡單的幾臺 CPU 服務器,到目前大規模高性能計算集群,只經歷了不到 10 年時間。與 CPU 相比,GPU 擁有更多的計算核心,一般在幾百個到上千個之間。因而 GPU 可以通過并行計算的方式同時處理多個任務,相比于 CPU 有著更加特殊的并行計算層次結構,因此在處理大規模數據時比 CPU 更快、更高效。-52-圖表 CPU 和 GPU 的芯片資源分布示例資料來源:CUDA C Programming Guide,NVIDIA圖表 當前部分量化機構算力存儲公司簡稱設置九坤2020 年,九坤搭建了人工智能方
162、向的技術團隊,成立了 AI 實驗室,建立起北溟超算集群,完成在人工智能方向上的技術突破。2021年,九坤設立了三大實驗室,數據實驗室(DATA LAB)、人工智能實驗室(AI LAB)、水滴實驗室(主要用于優化一些軟硬件基礎架構的性 能優化)?;梅?019 年,幻方量化成立 AI 公司,投資 2 億元自主研發深度學習訓練平臺“螢火一號”,搭載了 1100 塊 GPU。投入近 20 位工程師歷時 2 年自建完成。主要解決 AI 投資的兩大難題:模型更大、更復雜支持超大型神經網絡訓練,一個 4 億參數的大型經濟分析模型,在幻方上一代高性能集群(4 臺 DGX-2,100G-IB 互聯)上訓練需要
163、2 個月時間,而“螢火一號”僅需 84 小時。數據量更大其算力匹敵 4 萬臺個人電腦?;梅健拔灮鹨惶枴背阏嫉孛娣e相當于一個籃球場,功耗 400KW,由一個存儲集群和一個計算集群組成。存儲集群提供每秒 1.3 億次 IO 響應、4.1Tbps 讀寫帶寬以及 1.2PB 容量。計算集群搭載 1100 張高端顯卡,每秒可以進行 1.84 億億次浮點運算(18.4PFLOPS,32 位精度),相當于 4 萬臺個人電腦算力。所有節點通過 200Gbps Infiniband 交換機進行互聯。2021 年,幻方量化對“螢火二號”的投入增加到 10 億元,并且搭載了約 1 萬張英偉達 A100 顯卡。以分
164、時調度共享 AI 算力,彈性運行超大規模深度學習訓練,目前 96%集群使用率,85%GPU 使用率,8.0TB/s 讀,500GB/s 寫。明汯2021 年,明汯自有的高性能計算集群已經位居世界超算排名 TOP500 榜單前列。預計到 2023 年底,計算集群將擁有 1500 張 GPU卡,3 萬 CPU 核、1Pb 內存以及 5Pb 磁盤存儲,在金融數據的應用場景下 AI 算力達到 400P Flops(每秒浮點運算次數)。靈均投資2020 年大力發展超算集群。近三年每年靈均投資在人才引進和硬件設施建設(比如機房建設、GPU、服務器、數據庫)等方面的資金投入超 1.5 億人民幣。2022 年
165、,籌建數據異地雙中心,引入世界先進算力資源。上海天演建大數據平臺,每秒能完成 10 的 13 次方次計算,每年科技投入經費超 1 億元。寬德投資已建立高性能存儲系統(存儲速度可以達到 200Gb/s)和高并發策略研發平臺。啟林啟林近一年投入 1 億元進行超算集群的搭建,構建較為強大的算力支撐體系。在算力中心迭代之后預計在股票上可做到每五分鐘動態配置,未來計劃做到每一分鐘動態配置,且結合短期基本面不同策略沖擊以調整策略。數據資料來源:編寫組整理目前算力部署機構會采取本地部署和上云兩種方式:國內量化機構并未全使分布式計算框架,投研員更多采單機并的式進回測。受限于單臺服務器配置上限等主要原因,量化業
166、普遍出現回測效率慢,投研員排隊等資源的痛點場景。借助云上限算,越來越多量化機構在云上開始逐漸引HPC、Kubernetes 等技術,構建分布式架構集群。類似技術案可以幫助機構顯著縮短策略回測時間,提投-53-研團隊作效率。解決了龐大數據量對傳統量化 IT 架構的挑戰與沖擊。前多家私募量化機構已經在策略回測、策略研發(AI模型訓練)等場景下探索出云上成功落地的最佳實踐。據阿里云透露,某量化機構在阿云上按需運回測任務,每最任務數量可達上萬個。借助阿云的彈性實例,投研團隊可以快速獲得回測結果。阿云數字融解決案負責趙慶元提及,“當前量化機構普遍存在基于單機和 slurm 調度的回測框架;這與年前動駕駛
167、等業極其相似,但這類客戶最后都逐漸過渡到了 kubernetes 等案上。市場會看到越來越多的量化機構擁抱云計算,繼續向更先進的 IT 架構演進,提投研效率?!北镜夭渴鸱矫?,多家機構開始逐漸布局適配中國市場的算力芯片。例如 AMD EPYC 系列處理器,采用了先進的制程工藝,在單顆處理器上集成最多128個物理核心,主頻高達4.1GHz;在內存支持方面,AMD處理器支持多達12通道的DDR5 4800MHz內存,提供遠超市場平均水平的內存帶寬.同時能夠支持完整的 AVX256/AVX512 指令集,助力量化機構各類業務快速發展。特別是針對大模型的任務場景,在業務上線后,量化機構會需要更多的算力來
168、支撐高并發和低延遲的業務推理要求。具體來說 GPU 的顯存大小,決定了其可以承載的模型大小和能夠支持的上下文長度。當模型大小超過單一 GPU 的顯存大小時,就需要使用模型并行的方式對模型進行拆分,并通過多 GPU 之間的協作,進行分布式推理。而進行分布式推理時,上層的推理框架需要對底層的算力設備具備很好的適配程度。目前主流的推理框架包括 NVIDIA TensorRT LLM 以及 vLLM 等,這些推理框架都包含了對 LLM 計算過程中的算子優化,并且 TensorRT LLM 還支持 FP8 的計算精度。這些優化都需要建立在對底層硬件設備的架構與特性完美適配的情況下,才能發揮出其應有的威力
169、與價值。在 LLM 訓練方面,NVIDIA NeMo 和 Deepspeed 通過模型并行和 Zero 等策略,可以支持 LLM 模型訓練過程中較大的參數量,并優化模型訓練過程中的顯存占用。此外,NVIDIA MeMo 還支持 sequence 并行和選擇性激活重計算,來進一步優化訓練過程中的中間變量的劃分與存儲。-54-4.組合4.組合量化模型一般通過因子及權重設置后對預測收益率進行從高到低的排序。模型在不斷經歷復雜度逐漸遞增的迭代過程,在早期簡單的線性模型即可表現出色。隨后,隨機森林、Boosting 算法用于量化投資,其模型復雜度、參數相比傳統統計學習模型有了很大的提升,預測效果也更好,
170、基于決策樹的集成模型已經成為量化機構的標配,很多機構更是把 Boosting 模型作為研究員拿到超額獎金必須戰勝的基準線。再到后來的深度學習模型,復雜度進一步擴展。量化機構的模型會根據實際情況混合使用并保持更新迭代,例如鋒滔鑫起點 2 號為 50%線性模型+50%非線性模型(800只票左右),鋒滔指數增強 2 號為 100%非線性模型(600 只票左右),行業偏離度均控制在 15%以內。為盡力避免機器學習帶來的過度擬合風險,其還在非線性模型中增加了一些懲罰項。再如金戈量銳模型每半年迭代 15%左右,力爭適應多變的市場環境。有的量化機構對多個目標進行建模預測,例如磐松就會對個股、行業、市場同時建
171、模,從其實踐來看,個股模型因子預測值分布廣,對產品業績的貢獻度最大,約占 80%;行業因子預測值離散度較小,行業配置對業績貢獻約 20%;市場對整體市場漲跌的預測誤差大,需要嚴控擇時。預測目標除了收益率,近年也有機構將最終預測目標設置為夏普比率,以期在收益與回撤之間取得平衡。過往三年問卷調研數據顯示,當前量化模型:1.技術呈現多樣性:1.技術呈現多樣性:2021 年數據顯示 MLP(多層感知機,47.29%)和 LSTM(長短期記憶網絡,46.93%)的使用率最高。但總體而言量化投資領域需要多種技術的組合來應對不同問題。雖然一些技術在某些環節中比較突出,但量化投資領域仍然沒有形成一個關于哪種方
172、法最優的普遍共識。這可能是因為市場本身在不斷變化,策略和技術需要適應這些變化才能維持效果。不同的團隊和個人可能會根據他們的經驗、資源和投資理念采用不同的方法。乾象投資在其資料里面就強調了當前其模型使用的多樣性,包括強化學習、自動機器學習(AutoML)、監督學習、微分動態規劃(Differentiable programming)、transformer。2.實踐中的復雜性:2.實踐中的復雜性:在實際操作中,一個量化策略可能需要結合多種技術來處理不同的問題。例如,在數據預處理和清洗階段使用聚類模型來識別異常值,在特征選擇階段使用樹模型來確定重要的輸入變量,在預測階段使用神經網絡來建立預測模型,
173、在執行階段使用強化學習來優化交易決策。數據顯示,在高頻交易這一要求實時處理能力的環節中,所有技術的應用比例都相對較低,這可能表明在該領域仍存在技術上的挑戰。3.高比例的應用通常出現在數據處理相關的環節3.高比例的應用通常出現在數據處理相關的環節(如數據清洗、特征提取、模型構建),而在直接的決策制定環節(如策略優化、高頻交易)則較為分散。具體而言:.集成學習和樹模型在幾乎所有環節中都表現出較高的應用頻率,這可能是因為它們的魯棒性和泛化能力使它們在多種場景下都非常有效。.神經網絡則在收益預測、市場模式識別、衍生品定價、組合構建、策略優化、高頻交易等多個環節中的應用率較高,尤其是在模型構建和收益預測
174、中,使用比例超過 40%。.聚類模型在數據清洗、另類數據處理和產業鏈聚類中的應用較為突出,這表明它們適合于探索性的數據分析和模式識別任務。.圖模型在市場模式識別環節中較為常用,可能是因為它們能夠很好地捕捉市場參與者之間的相互作用。.強化學習在策略優化和高頻交易中的應用率相對較高,在策略優化和高頻交易中的應用比例分別為 22.34%和 25.89%。但過去兩年最火熱的 Transformer 和 Diffusion 模型因故未進入統計量。-55-圖表 2022 年人工智能模型在各個投研環節的使用圖表 2021 年機構主要使用的人工智能模型數據資料來源:2023 中國量化投資白皮書問卷調研上述模型
175、很多來自人工智能領域,在量化投資的實際應用過程中可能存在缺陷,需要做進一步的改進。例如玄元投資 2023年在中國量化投資白皮書研討會北京場就討論過:目前 AI 訓練的主要優化方式是梯度下降,其基本思想是在每個點處通過計算函數梯度來確定下一個移動方向,以逐步接近最優解。這種方法雖經典,但實際上也會存在問題。仔細分析后發現它們會對訓練產生很大的影響,一是可能找不到全局最優解,二是花費的成本高昂。使用梯度下降方法可能找不到全局最優解的原因在于 1.目標函數通常是非凸的;2.目標函數可能不可導;3.在現實中,目標函數經常存在大片導數為 0 的區域;4.使用梯度下降會遭遇維度詛咒;5.GPU 太貴。所以
176、公司考慮利用不基于梯度下降的全局算法 MARS(Model-based Annealing Random Search)來彌補梯度下降算法的缺陷。MARS 算法是一種基于模型的隨機搜索算法,它使用分布采樣來尋找最優解。與傳統的隨機搜索算法不同,MARS 算法不僅局限于局部搜索。簡單來說,MARS 算法通過實驗來考察樣本點的表現,然后更新采樣函數,利用樣本構造一個 Boltzmann分布,以尋找更優的點。如果某個樣本點表現良好,附近領域的點的表現也應該不錯,領域里含有全局最優點的概率更大。通過不斷迭代,MARS 算法最終找到最優解,即?()。也有機構認為人工智能模型的成功實踐對量化最大的啟示不是
177、可以產生更多因子,而是其建模的過程和思路。在倍漾的投研方法論中,數據、預測、決策、執行是最核心的四件事,在內部搭建較為通用的底座,在底座的支撐上對于四個環節使用機器學習來自動化。使用機器學習方法進行因子挖掘以及預測,而后決策的核心在于形成對未來的某種預測后,如何進行資產的組合優化以及風險管理。從算法復雜度的角度來看,在有限的時間內很難找到確定的解決方案。然而,機器學習可以實現實時向相對理想狀態的逼近。執行環節中拆單以及代碼的執行效率變得至關重要。AI 編譯器可以用來把源碼變成機器代碼執行,但是目前所有傳統的機器學習、神經網絡,或者各種樹模型的編譯過程都面臨著一些問題。編譯器比較注重通用性,對于
178、一些特定場合的支持不夠好,比如面對低延時需求或者流式數據的時候,傳統的 AI 編譯器很難滿足高性能代碼的編譯要求。-56-圖表 倍漾低延時 AI 編譯器關鍵技術資料來源:倍漾量化倍漾自主開發的波塞冬 AI 編譯器,第一個特點是能夠實現自動混合精度加速。模型從輸入到輸出的過程中包含大量算子,不同算子在不同設備上所需的最優精度各異,有時需要 Bfloat16,而有時僅需 int8。精度選擇對于提速至關重要,可以利用強化學習技術等各種數據驅動的方法進行選擇。第二個特點是端到端的延時優化。傳統 AI 編譯器需要預先載入許多并非立即需要的程序,會占用一定的內存空間。波塞冬 AI 編譯器則不要求預先載入,
179、從而實現內存占用為零,此外還采用了一些強化學習技術,能夠實時自適應地在編譯過程中對問題進行優化。圖表 倍漾低延時 AI 編譯器關鍵技術資料數據來源:倍漾量化-57-0303趨勢 3 多頻段:組合、風控1.組合優化1.組合優化量化模型一般可以給出成百上千只股票的預測收益率,并對預測收益率進行從高到低的排序。但僅有排序是不夠的,還需要把模型預測的結果轉化成實際的股票倉位,這就會涉及組合優化,具體來說需要在優化模型里加入各種各樣的約束條件,在收益、風險與成本之間進行取舍調整。以風險管理條件為例,包括剛性約束與柔性約束。剛性約束即出于交易規則和合規要求所必須遵循的原則,例如將最高申報速率限制在每秒 3
180、00 筆以下。另一類柔性約束,例如指數增強策略會根據對標指數對行業或個股的偏離度、持倉集中度給出限制等。在一系列風險、成本的約束限制條件之下,優化器便會根據預測收益率排序,選擇買入排序靠前的股票,這就生成了實際交易所需的股票倉位。圖表 目前量化機構所使用的組合優化器功能圖表 磐松組合優化器功能示意圖數據資料來源:2023 中國量化投資白皮書問卷調研數據資料來源:磐松資產目前量化機構的優化器呈現更快、更復雜的趨勢。目前量化機構的優化器呈現更快、更復雜的趨勢。更復雜表現在:除了回報(79.17%)和風險預測(76.79%)是優化的核心常見功能,交易成本(60.12%)、組合限制(48.21%)、業
181、績基準(42.86%)等、融券利率(19.64%)及基差成本(29.17%)等也有機構將其納入了優化器功能之中。磐松資產公開介紹過其組合優化器邏輯:目前量化機構都是多產品同時運行,每個產品都有各自的投資目標,而不同的產品賬戶之間存在流動性競爭,由于機構幾乎只有一套預測模型,假設一只股票預期回報非常高,每個產品都會有很強的動機買入這只股票,如果每個產品獨立優化,那么都可能大量買入這只股票,嚴重低估所有產品共同造成的市場沖擊。如果簡單分配流動性限制,每個產品對單個股票的交易,再對每個產品獨立優化,則無法將流動性物盡其用。對于產品共用的融券額度也是類似的邏輯,因此優化器要求每個產品既考慮到單一產品需
182、要怎么樣交易,又能看到其他產品的影響,從而控制對市場造成的整體沖擊。綜合考慮不同產品的投資目標,公平合理地分配流動性和融券額度。所以投資組合優化的本質就是在限制范圍內找出讓效用函數最大的交易決策,而效用函數是一個多賬戶、多周期的函數,會綜合考慮每個賬戶每個周期的超額收益、風險、風格偏離和交易成本等,在合理的限制下追求穩健的超額收益。多期限優化,則能夠讓優化器在投資過程中智能地做出更有遠見,更符合全局利益的交易決策,多賬戶多期限的優化系統能更加深刻合理地刻畫投資問題,而代價則是龐大的問題規模和緩慢的求解速度。更快求解要求體現在更快求解要求體現在:隨著賬戶數量、投資標的和投資邏輯的不斷增加,優化器
183、所面臨的問題規模也會日益增長。目前-58-磐松的優化問題中有超過 1000 萬個變量和超過 1000 萬個組合限制,在不添加任何加速邏輯的情況下,求解這樣巨大的數學優化問題可能需要幾天時間。因此其研究團隊投入了大量精力,在幾乎不損失求解精度的情況下,大幅提高求解速度,精準縮小可行域,深度利用并行計算等方式方法,將問題的求解時間控制在分鐘級別,讓調倉具有時效性,確保優化器能夠穩定承載盤中不斷增加的管理規模。啟林投資也介紹過,其優化器可實現盤中 5 分鐘出交易清單。乾象也有很多不同頻率的信號,短周期的量價類信號大約到分鐘頻,長周期的基本面類信號大約可以到年頻,每 10-30 分鐘乾象會跑一次流程,
184、包括從產生信號到投資組合優化器再到最后輸出目標倉位,所產生的短信號與長信號進行多信號周期疊加從而實現收益。風險預測(76.79%)方面,2023 年尾至 2024 年初,量化機構的風控及風險預測被放在了市場極高關注的位置。目前幾乎所有量化機構都將風控分為事前、事中、事后三個環節,以下是量價機構的典型風控設置:圖表 機構典型風控環節設置機構 1機構 2事前結合歷史回測結果,對倉位、交易量、浮動盈虧、可用資金及風險敞口等關鍵指標設置閾值,嚴格遵循交易所和券商合規要求1)策略內嵌風險模塊,依據過往十余年歷史數據統計歸納,包含風險預警指標,自主研判市場是否處于常態。2)合理評價策略的適應度、風險度、預
185、期收益和替換效益,在此基礎上動態優化事中系統性地通過在報單前植入檢測邏輯,確保所有委托價格,數量均在合理范圍,避免報錯單。系統實時對賬,不斷從交易所查詢盈虧,檢查是否和交易系統自算信息完全匹配,確認交易系統運行的正確性1)自建含極限虧損比例、最大下行風險、流動性、回撤幅度等核心指標的風險管理系統,有效實現盤中實時、程序化自動監控。2)過程管理、損益管理、部位審核相結合的多層次風險管理系統事后通過復盤交易流水方式,對交易系統每日表現進行系統性分析,確認每日無異常交易行為。1)自建完善的績效評估體系,每日復盤。2)體系包括策略效果評估和交易管理評估,重點考察投資結果與設計目標的差異、投資結果與理論
186、模型的差異在風險控制環節,絕大部分機構都稱不做主觀風格暴露、不做擇時,強調在更長的時間尺度而不針對某單一年份去做優化,不主動開放風險敞口。流動性及 Barra 體系中行業敞口、市值敞口、成分股占比最能量度當前 A 股市場風險。機構主要做以下敞口控制:市值敞口控制市值敞口控制:A 股目前 5000 多只股票,量化管理人在用模型打分之前,通常會根據一些條件剔除掉一部分股票,例如ST 股票、市值較小、流動性較差的股票,股票池跨度的覆蓋范圍差異比較大,多則 4500 少則 3500,大部分量化管理人是在4000 只左右股票里選擇。一般選股數量少的,通常市值選擇下限就高一些,例如將前置篩選條件設置為 3
187、0 億市值或者前 5%分位以上。也有機構會根據實際情況調整風險暴露,如大巖量化會將模型分為低波動和高波動,其中低波動模型的風格偏離 0.35;高波動模型風格偏離 0.75;另外行業偏離+/-1.5%,個股偏離+/-0.5%;流動性2.5%全市場成交量;換手率:50-100 倍;分散持倉:500-800 只股票;個股波動率:5%。以量價為主的量化機構大多都會持有一定程度的小票,一方面是基于分散投資的考慮,另一方面也是因為近年來小市值風格相對大市值在 Beta 上更強勢,加之小票波動性大、流動性也有顯著上升,機構投資人參與較少,獲取錯誤定價產生的超額能力也相對較強,這也是市場化趨勢選擇的結果。流動
188、性敞口控制流動性敞口控制:許多機構會根據不同的指增產品做不同的持倉流動性配置。例如星闊投資空氣指增為了使策略充分獲取放松風格約束后帶來的收益提升,在市場上行階段有更強的收益彈性,其流動性放得最開;但其他指增產品 9 成持倉則在-59-全市場流動性最好的 50%股票中。圖表 不同指增產品流動性分配產品持倉流動性分配產品持倉流動性分配300指增接近滿倉在全市場流動性最好的 50%股票中9 成持倉在流動性最好的 20%股票中1000指增9 成持倉在全市場流動性最好的 50%股票中5 成持倉在流動性最好的 20%股票中500指增9 成持倉在全市場流動性最好的 50%股票中6 成持倉在流動性最好的 20
189、%股票中空氣指增7 成持倉在全市場流動性最好的 50%股票中3 成持倉在流動性最好的 20%股票中數據資料來源:星闊投資分散度控制分散度控制:機構避免在低流動性股票中暴露自身策略,也會對持股分散度進行限制,一般而言持股數在 500-1000 只,多的能達到 2500-3000 只,最大個股持倉偏離度 1%-2%左右。持股分散有利于進一步降低交易沖擊成本,提升策略容量。成分股控制成分股控制:成分外選股是否為風險一直存在爭議,公募指增持倉要求 80%以上成份股,私募指增一般實為全市場選股,極少機構嚴格限制其掛鉤指數的成分股,或對主要指數成分股進行限制,例如衍復會對三大指數 1800 只成分股進行總
190、的要求。圖表 不同指增的成分股分配策略產品持股數成分股超額歸因300 指增500-1000滬深 300 指數成分股占比約 70%中證 500 和中證 1000 指數成分股占比約 20%1800 以外股票占比 10%。量價類因子占比 50%,基本面貢獻度占比 30%,新聞輿情和另類數據各占 10%1000 指增2500-3000滬深 300、中證 500 指數成分股占比約 20%,中證 1000 指數成分股占比約 40%,三大指數 1800 只成分股以外的股票占比為約 40%主要是量價類因子貢獻,占比在 80%以上,因為中證 1000 以小盤股為主,波動彈性更好,更利于量價類策略盈利。數據資料來
191、源:衍復投資Barra 模型是目前國內的主流風險控制模型,但在實際使用中存在許多局限性,例如預測周期偏長,沒有考慮特異性股池,A 股的特點結合性有待提升等。所以很多機構除了根據其控制因子敞口,對標基準進行行業和風格約束之外,還會進行例如周期改動等措施,以期在短周期組合構建中更好地發揮作用。除了固定 Barra 約束,也有機構采用滾動約束,如天算量化在近期策略迭代了三個方向:嚴控行業敞口-組合優化器對風險敞口的動態調整,風控組合優化器嚴格控制行業暴露在 4%以內,大部分都在 2%以內。行業輪動策略-策略嚴控行業風險,同時動態暴露有限敞口捕捉輪動收益。市值輪動策略-策略嚴控行業風險概念,同時動態暴
192、露有限敞口捕捉輪動收益。c-60-2.中性對沖2.中性對沖相較于敞口風險,所有機構面臨最大的風險實際為市場風險。2010 年,首個股指期貨 IF 合約(滬深 300 股指期貨)在中金所上市,量化基金具備了可行的對沖工具,開啟國內股票量化對沖基金的時代,但量化與對沖并非絕對相等,量化進化至今代表整個投研方式與體系,而對沖僅是其面對市場波動風險所采取的避險措施。我國股指存在明顯的“大漲大跌”現象,短期內漲跌行情切換頻繁,上漲的收益和下跌的風險并存,機構將這部分風險定義為 Beta 風險。為了使得量化策略收益曲線較為平滑,若整個收益量化全市場選股多頭 Alpha-市場 Beta/空頭 Alpha-融
193、券成本,則波動較小、夏普率較高。一般而言,量化機構會采用股指期貨、融券、期權、收益互換等單一或結合的多種對沖方式,持續跟蹤成本差異,以求得對沖成本、對沖精度的最優解。圖表 不同對沖方式優劣勢對沖方式優勢劣勢期貨對沖期貨市場交易量大,流動性好,可以靈活調倉。波動性較高,過去多年貼水較深,對沖成本較高(2022 年下半年開始貼水逐漸收斂,近期貼水較淺)。融券對沖對沖成本均攤至每期勻速支付,對產品凈值波動影響較小,降低對沖端對股指期貨基差波動的敏感程度。具備對沖精度、資金使用效率更高、成本更低廉、自由度更廣、機構間差異更大等優勢。融券市場交易量相對較小,流動性較差、融券的額度也往往有限;融券操作需要
194、滿足一定的資產凈值和交易規模要求;管理人需要具備較強的風險和流動性管理能力。收益互換讓中性產品凈值更加平穩。收益互換空頭交易存在一定的流動性風險。收益互換交易需要與機構投資者進行協作,不同的對手方可能存在不同的信用評級和償還能力,需要嚴格控制對手方風險。期權對沖期權交易流動性較好,操作靈活、可以通過期權市場實現靈活的對沖策略,另外期權具有非線性的特點,期權的買方和賣方權利義務不對等,有類似保險的功能。用期權盈虧不對稱的特點,替代股指期貨對沖股票現貨可以一定程度節省成本,甚至帶來額外收益。期權市場交易成本較高,需要支付權利金和手續費;期權價格受到市場波動、時間價值等因素的影響,存在一定的價格風險
195、;需要對管理人對于期權市場有一定的了解和操作能力,對專業要求更高。數據資料來源:衍盛投資,編寫組整理股票量化對沖策略的收益存在一定的周期性,也受市場環境(例如一九行情、抱團行情、成交活躍度、嚴重負基差)等的影響,但其中大部分因素都難以準確的預判,只能作事后的解釋;即使專業投資者也很難持續準確擇時,在對沖比例上,目前市場分完全對沖(即市場中性)、部分對沖和靈活對沖,其中完全對沖類產品的規模占絕對主導,不留多空敞口。少數機構會加入擇時,例如 2018 年,九坤投資發布靈活對沖多空產品,其目的是在高風險、高收益的指數增強策略,與低風險、低收益的中性策略之間,找到集兩種策略優勢于一體的平衡點。所以在策
196、略加入擇時因子使得空頭端敞口更為靈活,降低對沖成本的同時收獲上漲收益;從收益及回撤來看,九坤多空也確實介于指增與中性產品之間。多頭端選擇 85%的基金滿倉持有 500 指增,持倉股票幾千只,對股票流動性進行風控,如單只股票近 20 日流動性交易均值的 5%作為持倉上限??疹^端則采用 15%資金用股指期貨做杠桿交易,空頭敞口按照指數走勢、波動率、基差成本三個方向做監控,根據模型擇時信號決策不斷調整風險敞口做“不完全對沖”,以使得凈多頭敞口保持在 0-80%之間浮動,例如在上漲市中降低期貨空頭的頭寸,獲得市場上漲收益和超額收益;在下跌市中提高期貨空頭頭寸,控制風險,獲得對沖市場風險后的超額收益,并
197、利用量化擇時模型以規避市場風險賺取雙重超額收益。適合預期收益高于中性產品,但是不想承擔指增高波動的客戶。-61-圖表 九坤靈活對沖多空產品介紹夏普比率1.63波動率10%15%收益2018 年-2023 年 6 月,累計收益 123.27%,年化收益 18.12%風險特征中高風險,定位風險度低于指增策略,但收益預期高于對沖策略策略邏輯利用量化擇時模型不斷調整風險敞口,承擔市場波動基礎上力爭穩健超額收益多頭構造85%資金做 500 指增股票多頭,不擇時滿倉持有空頭構造15%資金利用股指期貨做杠桿交易,控制空頭敞口比例上下浮動多頭部分減掉空頭部分所謂的凈多頭敞口可以在 080 之間浮動對沖敞口擇時
198、指標指數走勢、波動率、基差成本數據資料來源:九坤投資艾方的做法是以指數增強為“多”,以看跌期權保護為“空”,既有上漲進攻性的同時又兼具尾部風險保護。通過持有看跌期權截斷權益資產的尾部風險,從而降低組合風險和波動率,主要實現方式是自建市場風險評分系統,進行期權擇時對沖,其對沖水平根據市場環境動態調整,期權年化對沖成本3%。圖表 期權策略對沖注:數據截止 2023.3.31.數據來源于 wind,艾方資產-62-3.全頻段融合3.全頻段融合過去量化策略以高頻段為主,即通過較高頻率地買入賣出捕捉資產短時間內的買賣價差。高頻的好處在于,對未來資產價格的預判周期相對較短、獨立預測的次數多,策略整體勝率相
199、對較高,尤其適用于高波動或高成交量的市場行情。高頻的劣勢在于其需要進行頻繁交易,加上參與者逐漸增加,投資機會轉瞬即逝,策略容量相對較小。從 2021 年 9 月開始,因量化規模增長帶來的巨大沖擊成本,促使量化私募開始降頻以擴充策略容量,2023 年 9 月,滬深交易所發布公告,將重點監控最高申報速率達到每秒 300 筆以上,或者單日最高申報筆數達到 2 萬筆以上的交易行為,這對于高頻交易(尤其是持倉極為分散的高頻量化策略)造成了較大沖擊。以量化中性策略為例,平均年化單邊換手由 47 倍降至 2024 年 2 月份的低點 28 倍,50 億以上的頭部管理人更是低至 20倍以下。目前一些主流的股票
200、量化私募策略的年化換手率已經逐步下降至 30-60 倍左右,細分子策略里偏短周期量價策略的占比也相應下降,相反,基本面策略的占比相應提升。圖表 股票市場中性年化單邊換手變化趨勢圖表 不同換手產品收益表現數據來源:招商私募指數數據庫圖表 量化私募換手率標簽機構年化雙邊換手率年化換手率預估區間機構占比標簽機構年化雙邊換手率年化換手率預估區間機構占比低頻機構 A40-80 倍50 倍以下(以30 倍-50 倍居多)7.92%中頻機構 E50 倍左右50-80 倍24.32%機構 B40-50 倍機構 F80 倍機構 C30-50 倍機構 G70 倍以上機構 D30 倍機構 H30-50 倍高頻機構
201、I80-120 倍80-200 倍18.03%超高頻機構 L200-300 倍200 倍以上2.19%機構 J80-100 倍機構 M600-1000倍機構 K150 倍多種頻率47.54%數據資料來源:國泰君安研究一方面量化私募在降頻,但另外一方面,隨著交易費率的降低,AI 及相關技術的興起,公募量化開始采用基于 AI 的算法,交易頻率從傳統的月頻提升到周頻甚至日間級別。從方法論層面和交易層面來看,公募量化產品私募化已經呈現出一定的苗頭,具體表現在提高了機器學習和高頻因子的應用。據統計,公募量化產品的換手近幾年也出現了逐年提升的趨勢;此-63-外,一些公司的量化產品交易獲得了對反向交易的豁免
202、,在交易層面進一步給公募量化產品松綁。整體公募量化呈現出了一定的私募化趨勢,涌現出了一批業績不輸量化私募的量化公募產品??偟男盘栴l段只是結果,目前量化領域競爭越來越激烈,不同的交易頻率都有其適應的市場行情,如果僅僅是擅長某一類因子或者某一個頻段的預測,在多變的市場環境下可能會遭遇逆周期時出現回撤,更全面的頻段覆蓋有利于降低超額收益的波動,例如成交量萎縮對于換手率較高的高頻策略影響就會更大一些,可以依靠中低頻交易實現收益。再如 T0 策略適合日內波動高、交易活躍的股票,但是拉長周期來看,這類股票相對指數有明顯的負 Alpha。所以機構需要捕捉市場不同周期的收益來源,逐步豐富覆蓋低、中、高多個頻段
203、,從分鐘級別到月頻、季頻等,使策略變得更豐富以及穩定。同時機構可以結合不同信號產生不同策略和產品,但在信號割裂的體系中,可能會發生信號互搏。以日內信號為例,A股處于 T+1 的交易環境下,日內與日間通常具有反轉效應。所以一般用日間選擇多空,而用日內選擇入場時間點。一般日間與日間例如 1 天與 5 天相對更容易結合,可以認作 5 天的底倉、1 天做擇時。但這樣的融合,局限性在于非常依賴長周期的判斷,以長周期做決定短周期做微調。這也就類似圖表界的實用口訣:月線看趨勢、周線看方向、日線看買賣。再如開盤之前日頻的模型就確定好了當天要買入的倉位,要買入 A 股票、賣出 B 股票。結果 A 高開 5 個點
204、,B 低開 5 個點,割裂的策略會追高買入 A、殺跌賣出 B,沒有用到實時信息形成損失。策略融合現階段市場上比較主流的組合模型是 Alpha+T0 模型,可拆解為:Alpha 模型是通過大量因子組合篩選出具備超額的股票組合,旨在跑贏指數。在 Alpha 模型調倉完成后,T0 模型再在底倉的基礎上進行高拋低吸,增厚收益。但這種模式當前也面臨挑戰,需要在 Alpha 收益和 T0 收益上做出取舍。即選擇 Alpha 收益高,但是 T0 表現不好的底倉;還是 Alpha 收益低,T0 收益高的底倉。過往 A 股波動率較高,T0 收益足夠豐厚,足以彌補割裂體系帶來的超額損失。但近年來 T0 收益衰減嚴
205、重,傳統模式下的 T0 收益在超額中的貢獻越來越微薄,T0 的收益并不能覆蓋掉高波動帶來的 Alpha 的損失。圖表 T0 策略基本概況定義T0 策略又稱日內交易策略,持倉時間較短,基于對未來短期股價走勢的判斷,低位買入,高位賣出,以此來獲得價差收益,買入賣出交易在日內完成。分類按策略邏輯 1:融券 T0 利用融資融券的方式變相實現 T0 交易,管理人首先在券商創立兩融賬號,并在券商的兩融名單基礎之上選取適合進行日內交易的股票名單進行交易,買入股票的同時利用融券賣出,以此來變相實現 T0 交易,所以融券 T0 的主要成本在于兩融利率。按策略邏輯 2:底倉 T0 則完全復制或部分復制指數構造出底
206、倉,之后利用底倉進行日內交易,而為了避免底倉的凈值波動導致產品凈值出現波動,底倉 T0 利用股指期貨或指數 ETF 融券等方式進行對沖,因此底倉 T0 對基差走勢較為敏感,投資者在選擇底倉 T0 時也需要對基差進行合理的判斷。按交易方式 1:人工 T0 則聚焦于幾十只股票,收益彈性更強,但是會受到交易員的影響,成熟的交易員往往收益更加穩定。人工 T0策略成本更高,對股票的要求較高,收益彈性更強,規模受制于交易團隊人員數量。按交易方式 2;機器 T0 又稱為程序化 T0,通過提前設定好的規則,采用程序化方式進行日內交易,優勢在于利用高頻數據可以對全市場股票進行監測,成交次數多,持倉分散,但是相較
207、于交易員,缺乏對市場的靈活應對。一般來說,程序化 T0 策略收益較為穩定,但是彈性較低,策略運營成本更低,可覆蓋股票數量更多,規模上限更高,適宜行情市場換手率市場波動率日內振幅當市場處于高換手狀態時,T0 策略收益較好當市場波動率處于高波狀態時,T0 策略整體表現更好當日內振幅處于高位時,T0 策略收益表現最好風險點融券 T0 對券源的依賴程度較高,因此建議關注以下 3 個方面:1-券源的穩定程度:融券 T0 對券源的要求較高,因此需要明確管理人與券源提供方是否有長期的合作關系。按策略邏輯分類2-融券的數量和規模:融券的數量對策略的容量有較為直接的影響,一般而言,融券的數量和規模越高,3-3-
208、差源的利率水平:適合做日內交易的票息較高,因此需要交易團隊根據自身能力特點選擇特定的票-64-底倉 T0 由于需要使用股指期貨或 ETF 融券進行對沖,建議關注以下 3 個方面:1-基差:如果使用股指期貨對底倉對沖,則需要關注基差的變化情況,避免因基差劇烈波動導致策略收益出現較大程度波動。關注的風險點2-底倉構成:有些管理人會采取部分復制底倉,以此來選取更多適合進行日內交易的股票,部分復制底倉的產品相較于完全復制底倉的產品凈值波動也會更大。3-收益拆解:一般而言,底倉 T0 的收益由三個部分組成,對沖成本、跟蹤誤差以及 T收益,其中 T0 策略的收益才是對管理人日內交易能力的直觀反映其中人工
209、T0 依賴于交易員的交易,且多采用融券形式進行日內交易,可以從以下 3 個方面進行考慮:1-產品間的業績差異:部分私募管理人,可能不同的交易員負責不同的產品,產品間的收益存在差距。2-交易員數量:交易員數量對 T0 策略規模會有較大的影響,一般而言一個交易員管理的資金規模不會很大,因此需要多位交易員一起進行交易來擴大產品的規模。3-交易員限額:交易員限額對 T0 策略的風控有重要影響。一般而言,管理人會對交易員的交易規模以及最大回撤進行限制,比如:1%虧損提醒,2%虧損強制平倉。機器 T0 由于完全由系統對全市場個股進行監控與下單,多為程序 T0,因此應當關注量化系統,可以從以下 3 個方面進
210、行了解:1-交易系統:交易系統是機器 T0 日內交易能力的基礎,一般而言,單獨 T0 策略的產品會有自主研發的交易系統,而部分將 T0 作為收益疊加的產品采用的可能是交易商提供的交易系統,相比較而言,自主研發的交易系統綜合能力更強。2-預測周期:按照預測周期的不同,可以分為 Tick 級別、分鐘級別、小時級別等等,一般而言預測周期越短,勝率越高,策略容量也越小。3-風險管理:機器 T0 的風險管理也同樣重要,主要涉及對于風控以及換倉頻率的要求,當市場環境不佳時是否會減少開倉頻率,而當市場環境表現較好時增加開倉的頻率,降低一風險的同時增加收益?!睌祿Y料來源:公眾號白小白的學習筆記圖表 T0 策
211、略和市場中性策略業績表現情況2018 年2019 年2020 年2021 年2022 年T0 策略年化收益率8.81%10.00%17.28%8.87%5.70%最大回撤-0.25%-0.35%-0.15%-0.23%-0.21%夏普比率7.535.016.275.764.56卡瑪比率35.1528.41112.7138.1226.70市場中性策略年化收益率8.44%9.79%8.15%3.42%4.19%最大回撤-1.28%-1.07%-1.60%-3.43%-1.57%夏普比率2.522.762.460.571.00卡瑪比率6.599.135.111.002.66數據資料來源:私募排排網,
212、華寶證券研究創新部注:2023 年截至 6 月 25 日全頻段覆蓋的難點在于:首先將不同頻段的策略進行融合得無明顯頻段短板,市場上很多其他管理人仍處于超額有“瘸腿”的狀態,即專門擅長某部分頻段,部分頻段收益一般;其次如何平衡、分配不同預測周期的權重是其中攻克難點。所以現在量化機構部分會做信號融合,做法百花齊放。有的是從特征層面融合,有的從優化器層面融合,還有的是直接從組合層面融合。白鷺投資在 2022 年底到 2023 年初即將手頭的所有信號頻段以及頻段內所有信號進行整合,從而實現最優倉位,其是從組合層面融合。卓識也在不斷的策略迭代過程中,形成了“多頻融合調倉+微趨勢算法”的高頻交易特色。多頻
213、段融合調倉通過不同預測頻段,結合日內連續調倉,充分挖掘超額收益。概率投資的多頻段融合系統則將信號簡單分為日內和日間兩部分,日內信號本質上是在為日間信號做增強或削弱,即增-65-強同向的信號,削弱反向的信號。最終融合得到的調倉信號同時用到了日內和日間的信息,更能將底層的預測能力發揮到極致。圖表 概率投資多頻段融合模型數據資料來源:概率投資圖表 組合優化多信號日內信號日間信號預測周期30 分鐘、2 小時5 天、20 天常用數據截面數據、逐筆數據、資金流數據eod 數據、基本面數據、另類數據因子類型日內量價因子、復合因子日間量價因子、基本面因子、另類因子常用模型神經網絡模型樹模型數據資料來源:概率投
214、資半鞅接下來的研發目標也是所有信號頻段以及頻段內所有信號進行整合,從而實現最優倉位。從 2018 年開始,公司即開始機器學習模型測試,是行業內最早運用機器學習取代傳統多因子模型的機構之一?,F在半鞅已實現工業流水線級投研流程,端到端全流程優化,以提升整體性能為目標,輸入為原始 Level2 量價數據,使用批流一體引擎以毫秒級延遲聚合成不同尺度的特征,通過統一的端到端深度學習模型進行多周期、多目標的建模,具備全天候任意時間點的毫秒級預測和決策能力,不受限于定時定點決策,更好適應市場變化。端到端除了省去因子層這一環節,半鞅在其他環節也在不斷優化流程,例如機器學習方面做多尺度、多周期動態建模,大規模分
215、布式訓練,自動化機器學習;策略方面做多周期融合、多決策點融合。同時 Alpha 策略進行多策略自適應疊加,每個子策略從預測周期、數據輸入、模型類型、預測目標 4 個維度打標簽。上層策略配置模型根據市場環境、產品特性來配置子策略權重,綜合考慮收益和風險,靈活換手,最終實現穩健的收益輸出。單策略的深度決定了收益率,策略的廣度決定了波動率,半鞅力求在單個策略的深度和廣度上都做到最優,以提供給客戶更好的風險調整后的收益。同時公司持續灰度上線新的端到端模型,抵抗原有策略的衰減?!靖鄡热菰斠姳緯诹伦罴褜嵺`-半鞅投資】-66-4.交易執行4.交易執行從調查問卷的結果來看,量化私募大部分采用自建的交易系
216、統(275/366),占比 75%。百億私募中(27 家有相關標簽)也僅 1 家表示采用外部采購的交易系統。相比私募,公募絕大部分還是采用外部采購的交易系統。低延遲或高頻受市場重點關注,實際上目前有兩個應用方向:1.高頻策略交易;2.算法交易下單。圖表 是否采用自建交易系統的量化私募的數量對比(家,2023 年)資料來源:私募排排網,海通證券研究所低時延的追求是一個持續不斷的過程,全鏈路時延競爭正在行業內全面展開。國際交易所、對沖基金和投行都在不斷推進其在低時延領域的步伐,與此同時,國內的交易所和券商也在不斷提升系統的交易延遲,以提升市場競爭力。交易所層面,以深交所為例,2016 年上線的新一
217、代交易系統,即采用流式報盤,交易回路時延可以到 1.5 毫秒左右。即使后來深交所將機房從從竹子林數據中心遷移至南方中心,增加了鏈路的物理延時,后續也通過優化控制在了 2-3 毫秒。而上交所此時仍采用輪詢的報盤方式,50 毫秒一輪詢,交易回路時延達 100 多毫秒,與深交所存在一定差距。直到 2020 年,上交所從期權系統開始,改用流式報盤網關,期權交易回路時延降低到 10-20 毫秒。到 2021 年的時候有了更多的變化,上交所新債系統上線,采用流式報盤,并在底層采用分布式架構,債券交易回路時延降到了 1.5 毫秒左右。再到 2022 年,上交所現貨競價平臺進行了內部優化,通過數據庫報盤節省流
218、失,并重新規劃內部撮合,現貨交易回路時延從 100 多毫秒降低到 20多毫秒。近幾年,國內越來越多的券商投入到極速交易的軍備競賽。少數券商采用自研的方式構建極速交易系統,例如中泰證券、華鑫證券等,大部分券商則通過采購技術廠商的系統構建自身極速交易的技術服務能力。華銳技術作為該領域市占領先的技術廠商,已為國內 30 多家券商提供相關系統,并實現了頭部前 20 券商的全面覆蓋。全鏈路時延競爭在行業內全面展開,從交易所到券商再到量化機構,在基礎設施、技術架構和應用系統三個維度上持續優化提升?;A設施層面,全球最新的硬件設備,例如超頻服務器、FPGA 卡、低時延交換機等,已在行業內實現了成熟的應用。技
219、術架構層面,底層基本采用分布式架構為主。因其可以提供高可靠、高并發、低時延的消息傳輸能力,并可以支持上層應用輕松實現水平擴展。應用系統層面,在操作系統、資源占用等細節上也有多種手段來進行跟蹤優化。但在追求低時延的過程中,保障系統的安全可靠仍是一切手段的前提。2022 年 7 月,中國證券投資者保護基金有限責任公司向行業通報了 3 起證券經營機構極速交易系統和集中交易系統出現異常的案例,主要包括“虛增”客戶資金、客戶使用“虛增”資金后賬戶出現透支、多扣收客戶融券紅利資金等問題。其中部分是由于極速交易系統與集中交易系統信息交互出現異常導致。-67-圖表 國內證券交易所的低時延演進之路數據資料來源:
220、華銳金融科技研究所第一代傳統算法在上世紀八十年代于海外產生,直到 2000 年海外三方算法公司方才進入中國市場。而第一代智能算法于2011 年左右誕生,從被動、機械的算法,到智能化算法,中間相隔了近三十年。2017 年國內第三方技術廠商開始涉獵智能化算法,飛速拉近了國內與海外的技術差距。隨著近幾年市場格局發生變化,賽道熱度、認可度、規范化程度進步良多。算法交易的賽道發展可以分為幾個階段:從最早階段的人工交易,發展到以 TWAP/VWAP 為核心的第一代被動機械算法,追求執行效果和降低市場沖擊;第二代主動機械算法,以執行價差為核心,關注交易成本和風險;第三代交易算法Iceberg算法,主要目標聚
221、焦在尋找流動性、隱藏交易意圖。AI 技術的應用,正在為算法交易帶來新技術范式。圖表 算法交鏈易在產業的位置及作用數據資料來源:卡方科技高頻策略交易當前主要是基于 Level2 行情數據,通過多路優選、硬件加速等形式,拿到交易所低延遲的逐筆和盤口切片數據,且按照交易所的撮合規則按需生成高頻切片數據,挖掘到市場上較全較新的量價指標。結合實時市場行情和交易員選擇的策略及參數等,利用計算機程序和數學模型來決定交易下單的時機、價格和數量。其主要目的在于:1.降低交易成本,通過拆母單,擬合市場成交量分布,戰勝市場均價。2.減少對市場的影響,采用特殊目的算法,有效保護交易意圖,避免引起市場異動。3.降低人力
222、成本,使用自動化交易算法交易策略,大幅提高交易員效率。4.降低監管及合規性風險,內嵌風控閾值檢查令交易更安全,嚴格符合監管要求。5.減少手工誤差,減少因市場發生快速變化或交易任務過多造成的人工失誤。-68-其使用場景,除了服務量化機構一次交易成百上千只股票,減少頻繁交易的滑價、提高交易效率之外;對于主觀基金、減持解禁等交易場景,也可以實時追蹤市場流動性情況,合理地拆分交易指令,提升大金額場景下的調倉效率,減少執行難度。幾種常見算法有 TWAP、VWAP、POV。TWAP:在設定的時間范圍內勻速下單,降低市場沖擊,最小化與市場 TWAP 的偏差。VWAP:在設定的時間范圍內對根據對市場成交量分布
223、的預測進行下單,降低市場沖擊,最小化與市場 VWAP 的偏差。POV:多用于減持相關,價格不敏感,市場沖擊可控的情況下,按照市場參與度,盡可能快而多地完成交易。在這一環節,海外機構經歷過人工手動交易研究,程序化交易再變成現在的 AI 程序化交易。國內則省略中間步驟,直接從手動到現在 AI 下單。第三方算法交易平臺提供了豐富的算法交易類型,提升了算法執行效率。量化機構有的是自建算法交易,也有的使用第三方算法,直至 2023 年市場仍然不斷有新的算法廠商嶄露頭角,年內某券商招標,共有 23 家機構報名,包括自誠、皓興、啟能達、非凸、迅投、卡方、麗海弘金、金納、躍然等。一般情況下,智能算法能幫助量化
224、機構降低 3-5BP(基點)的交易損耗。參考上海股市流動性和市場沖擊成本分析中的數據滬市平均人工交易成本是 60 個基點(60/10000),普通算法的沖擊成本是 10 個基點(10/10000),而主動智能算法拆單交易目前甚至能做到高于平均價凈賺 6 個基點(6/10000)。按照 10 億規模、一年 100 倍年化換手率的私募產品來估算:第一種情況人工交易,會產生 6 億的沖擊成本。10 億100(60/10000)=6 億;第二種情況普通算法拆單交易,沖擊成本是 10 個基點,也就是 10 億100(10/10000)=1 億,相對于人工交易可以節省 5 個億的沖擊成本,每年節約 5 億
225、,大約可以提升 50%的產品業績;第三種情況主動智能算法拆單交易,目前的算法下不僅沒有沖擊成本還能額外創造出 6 個基點的業績,也就是 10 億100(-6/10000)=-0.6 億的沖擊成本,相對于人工交易來說節約 6 億之后還賺了 0.6 億,大約可以提升 66%的產品業績。使用人工智能方法的核心優勢是,當數據量足夠大、有很好的性價比的時候,更復雜模型的非線性性質能夠更好地挖掘數據價值,更好地服務于流動性提升、增效市場反饋與價格發現。人工智能方法通過類似于人腦學習的方式不停迭代反饋,不斷優化模型,對于不同主體、不同交易量、不同訂單不會千篇一律地做選擇。圖表 不同特征對收益的影響特征因素績
226、效調倉時間全天上午9:30-10:30正常10:30-11:30負影響(一般)下午13:00-14:00負影響(嚴重)14:00-15:00負影響(一般)周期30 分鐘負影響成交額占比3%正常3%-5%負影響(一般)5%-10%負影響(嚴重)高低價股低價股5 元負影響(嚴重)個股特征中證 500、滬深 300、上證 50正常-69-換手率低、成交額低的個股負影響正常:指的是某因素對績效不造成影響;負影響:指的是某因素會降低績效(程度:一般、較大、嚴重)。資料來源:非凸科技-70-5.業績歸因5.業績歸因許多時候量化機構會將業績歸因為各類因子為業績所帶來的貢獻,但從 2021 年開始,各類 FO
227、F 機構等開始質疑量化機構創造 Alpha 的能力,尤其是到達一定規模之后。問卷調研顯示,投資人的質疑與量化機構的自我認知其實較為接近。Pure Alpha(平均分 4.25):Pure Alpha 是指策略相對于市場基準的超額回報,與市場波動無關。數據表明,量化機構普遍認為 Pure Alpha 對業績的貢獻是有限的,這可能是由于市場效率提高,導致純粹的 Alpha 機會變得更加稀缺。Smart Beta(平均分 4.79):Smart Beta 評分較 Pure Alpha 略高,量化機構認為自身通過 Beta 因子暴露獲得了一定回報。從 2014 年小市值暴露,到 2021 年嚴控風格到
228、逐漸放開,至 2023 年小市值暴露的回歸,量化的風格暴露呈現脈沖式,量化機構這部分收益也在逐漸走向成熟。在進行風格研究時,機構會深入理解暴露的風格是什么,在市場上的表現如何,以及暴露風險是否可控,在可控范圍內是否可以帶來更多的 Alpha 收益等。此外,機構還需考慮客戶對暴露風險的接受程度。Pure Beta(平均分 4.2):Pure Beta 通常與市場指數的表現掛鉤,反映了市場整體的回報。量化機構給出的評分表明,市場回報依然是整體業績的一個重要組成部分。值得注意的是,1 個億以下規模的機構(平均分 5.29)和 50-100 億規模的機構(平均分 4.55)對自己創造 Pure Alp
229、ha 的能力給出了相對較高的評分。一般而言,隨著機構規模的增加,對持倉收益的依賴增強,而對 Pure Alpha 和交易收益的依賴減弱。反映了量化機構在不同規模下的策略調整和風險管理的差異。2022 年中國量化投資問卷調查發現,現在量化機構資產管理規模/最優容量比例的平均值為:47.27%,最優容量指的是量化策略能有效管理并保持預期收益的最大資本量。平均值為 47.27%意味著在對所有參與調查的量化機構進行平均后,他們當前的資產管理規模大約為最優容量的一半左右。整體對于規模和收益之間的平衡持謹慎態度。這意味著,市場整體仍然存在增長空間,同時量化機構在風險管理方面持謹慎態度,傾向于保持較低的資產
230、規模,以避免因超出最優容量而帶來的額外風險。圖表 量化認為當前行業業績總體歸因應為圖表 各規模區間自認為其創造 Pure Alpha 的能力數據資料來源:2023 中國量化投資白皮書問卷調研圖表 各規模區間以及業績歸因規模Pure AlphaSmart Beta持倉收益交易收益規模Pure AlphaSmart Beta持倉收益交易收益1 個億以下5.295.485.676.1050-100 億4.5546.644.181-10 億4.104.555.954.86100-300 億4.15.77.34.810-50 億4.244.716.164.42300 億及以上4.275.036.034.
231、63數據資料來源:2023 中國量化投資白皮書問卷調研-71-如前所述,近年量化機構在不斷降頻,基于規模擴大、監管環境變化、交易成本影響等,傳統認知上,量化機構會通過短期買賣價差獲取收益,但問卷調研數據顯示并非如此,體現在量化機構對持倉收益、交易收益和配置對業績貢獻的評估上:目前持倉收益(平均分 5.99):指的是資產長期持有產生的收益。數據顯示,量化機構認為持倉收益對業績的貢獻是最高的,這可能意味著機構更加重視長期投資而非頻繁交易,且可能傾向于更加穩健的投資策略來實現收益。交易收益(平均分 4.75):來自短期的買賣操作。相對于持倉收益,量化機構認為交易收益對業績的貢獻較低,這可能反映出機構
232、正在減少頻繁交易的策略,轉向更少頻率的交易以降低成本和市場沖擊。配置(平均分 4.84):配置收益來自資產間分配的優化決策。量化機構認為配置對業績的貢獻比交易收益高,這可能表明機構在資產間的分配和調整上花費了更多精力,以提高整體投資組合的效率。擇時一向被認為是量化投資中比較難的部分,預測市場最佳時機頗具挑戰,許多機構在公開資料中表示不參與擇時,但從業績歸因看,量化機構仍然給予了選股(平均分 5.53)擇時(平均分 4.22)一定比重。目前來看少量機構在靈活對沖產品中會進行擇時,這種策略并非在多頭倉位擇時,而是在空頭倉位進行擇時對沖。大多機構在做的是空頭端擇時,極少機構在 Alpha 端做擇時。
233、思勰的策略模型有擇時信號,會在上漲下跌環境采用不同Alpha 模型:當市場上漲時,通過分散投資,做穩定 Alpha,會持倉 700-1000 只票;在市場下跌時,更傾向去做超額 Alpha,控制回撤,持有 300-500 只票。這也是因為思勰為高頻 CTA 起家,擅長做市場趨勢方向判斷,后沿用到了股票策略里,以用量價數據做擇時信號觸發,做更靈活的操作。北京豐潤恒道擁有 40 多個擇時模型,獨立發出擇時多空信號;根據策略邏輯性以及歷史表現賦予相應權重;根據策略多空信號以及權重得到總體市場判斷,分別判斷上證 50、滬深 300 和中證 500 多空。圖表 業績歸因與機構關注的策略特征之間的對比數據
234、策略特征PureAlphaSmartBeta持倉收益交易收益策略特征PureAlphaSmartBeta持倉收益交易收益成單率4.334.895.954.91勝率4.034.705.924.79跟蹤誤差4.354.925.974.80與其他機構的異質性4.284.966.274.78收益率4.254.825.964.84在不同市場環境下的適應性4.2256.174.79波動率4.194.885.814.98抵抗回撤與極端風險的能力4.064.725.954.69容量4.274.786.074.76模型的可解釋性4.265.036.114.78擁擠度4.335.116.094.93其他3.554
235、.455.186數據資料來源:2023 中國量化投資白皮書問卷調研在歸因時,策略失效是量化機構需要面臨的永恒命題,目前許多基金經理都表示過,策略失效越來越快。穩博投資使用歸納法和演繹法對其進行解釋。歸納法使用風險解釋模型來解釋超額波動原因,后者則尋求市場或者策略失效的本質、外因、內因。-72-圖表 策略失效控制方法策略失效原因風險解釋因子:行業、成長性、估值、動量、市值、分析師等本質,新的市場環境和歷史規律有較大變化內因,超出容量,因子擁擠外因,大體量資金投資偏好轉變策略失效辦法求解優化方程:最大化:優化目標=組合目標收益-組合風險暴露扣分-交易成本約束邊界:單因子暴露邊界最大個股持倉偏離度個
236、股最大換手規模風控方式:核心邏輯:不干預策略運行,爭取屏蔽確定性高的回撤。規避風險:因子擁擠度檢測和剔除,滾動訓練,控制管理規模。觀測市場,主動降低風險度。風險處理:出現無法解釋的回撤幅度/時間長度,優先降低各類已知的風險敞口,防范風險擴大。數據資料來源:穩博投資-73-0404市場競爭1.機構競爭1.機構競爭“百億擴容,新老分化”2022 年問卷調研有人如此形容接下來的行業競爭態勢。如第一章所述:2023 年,A 股量化進入存量博弈。這種存量表現在:1.增量資金陷入停滯;2.新備案私募門檻增高;3.從規模分布和結構上看逐漸拉出梯次,量化私募行業在過去幾年已經形成了越來越快的“飛輪效應”:業績
237、好的機構形成口碑和規模,吸引了人力、資金、資源的大幅進入,同時算力、數據、投研等方面不斷積累,資管規模不斷擴大,而資源的增加又促成了良好業績的產生。大型機構維持護城河,其投資風格上會更為穩健。機構競爭力影響市場募資。而量化投資機構的核心競爭力是多方面的,需要在技術、人才、研究、風險管理等多個領域綜合施策。隨著市場的發展和技術的進步,這些競爭力因素也在不斷地變化和升級。核心競爭力通常體現在以下幾個關鍵領域:數據處理能力、研發和模型構建、技術和算法優勢、風險管理、投資研究、策略多樣化、適應性和迭代更新、人才隊伍。但作為一家商業機構又體現得更為多元,包括行業發展前瞻度、資本市場認可度以及創始人/核心
238、 PM 自身的影響力。綜合來看,量化機構普遍認為自己在配置能力、市場交易經驗、迭代能力和團隊管理與協同能力方面具有較強的競爭力。同時,數據也揭示了量化機構在產業資源、頂尖人才吸納和資本市場認可度方面可能需要進一步提升。這些競爭力評分可能與機構的業務焦點、市場定位和內部資源配置有關。圖表 量化機構競爭力(2023)圖表 量化機構競爭力(2022)20232022配置能力3.49選股能力3.56產業資源2.89交易能力3.56數據廣度及深度3.25配置能力3.78策略豐富度3.15規模敏感度3.50市場交易經驗3.44完整的投研體系3.56迭代能力3.45多元數據挖掘&清洗3.49規模紅利3.2硬
239、件投入3.13行業發展前瞻度3.47行業發展前瞻度3.71-74-團隊管理與協同能力3.49團隊管理與協同能力3.61資本市場認可度3.17創新與變革能力3.57創始人/核心 PM3.44資本市場認可度3.50頂尖人才吸納3.03創始人/核心 PM 背景名人效應3.30數據資料來源:2022-2023 中國量化投資白皮書問卷調研接下來,機構為了維持競爭力,不斷投入精力進行策略研究,如果把所有的研究分為進攻端和防守端,前者尋找和利用市場機會以創造收益;防守端則是管理和控制風險,確保資本的安全和策略的持續性。據數據顯示,進攻是最好的防守,機構仍然更重進攻而非防守。防守端(風控和避免類似事件)的綜合
240、得分低于進攻端(創造收益)??赡茉从陲L險管理復雜性、收益驅動偏好、資源分配偏差、合規和監管環境的不確定性等,盡管風控至關重要,但在競爭激烈的市場中,機構需要展示其能夠創造收益的能力,以吸引和保留投資者。而監管環境的快速變化可能使得量化機構在監管層面的研究得分較低,因為監管政策的不確定性使得機構難以準確預測和適應。進攻端(創造收益):因子(綜合得分 8.68):模型(綜合得分 8.3):數據(綜合得分 8.02):人工智能(綜合得分4.6);交易執行(綜合得分 3.72):多周期融合(綜合得分 3.66)。防守端(風控和避免類似事件):風控(綜合得分 6.2):組合優化(綜合得分 6.13):監
241、管層面研究(綜合得分 2.26):行業層面比較(綜合得分 2.18)。圖表 未來一年,預計大幅精力投入及研究的環節【排序題】圖表 未來一年,預計大幅精力投入及研究的環節為與規模交叉比較數據資料來源:2023 中國量化投資白皮書問卷調研以 50 億為分界線,將數據合并為兩個組,數據顯示不同規模的量化機構在研究重點上存在差異,其中 50 億以下的機構可能更傾向于在進攻端投入,尋找提升收益的新機會和策略,而 50 億以上的機構可能更加聚焦于防守端,通過風控和組合優化來保護資產并提高策略穩健性。這種分布可能反映出機構規模對研究方向和資源分配決策的影響。-75-2.機構榜樣2.機構榜樣連續兩年,問卷都邀
242、請量化機構填寫其心中的海內外的三家量化機構榜樣,這些機構作為隱含了其行業標準制定者、技術創新引領者、市場影響力塑造者身份。聲譽建設是一個多維度的過程,涉及業績、創新、品牌建設、市場參與和個人影響力等多個方面。但業績與規模仍然是行業內部聲譽第一性的存在,部分機構即便在過去 3 年深陷社會負面輿情,但作為榜樣力量仍然被多次提及,2022 年最為突出的機構為九坤與幻方,2023 年新增的機構為衍復投資,三家機構在行業中以斷檔式存在,在 455 次有效提及中,幻方(68)、衍復(63)、九坤(58)、寬德(36)、明汯(33)、靈均(13)、佳期(12)、穩博(8)、誠奇(6)、鳴石(6)名列前茅,目
243、前這些機構均為 150 億以上。在社會公眾方面,658 次有效提及 117 家機構,最為知名的機構分別為:九坤(118)、幻方(110)、衍復(73)、明汯(54)、靈均(45)、寬德(44)、穩博(20)、黑翼(14)、聚寬(9)、天演(8)、世紀前沿(7)、啟林(7)、誠奇(6)、鳴石(6)。2.未來挑戰2.未來挑戰將量化機構面臨的挑戰為監管與市場環境、策略與研究、投資者關系與人才三大類,數據顯示:監管政策(平均分 3.82):被放在了首要位置,甚至超越策略研究(平均分 3.61),反映出量化機構對監管環境的不確定性。擔心監管政策的改變可能導致交易成本增加,限制某些交易策略,或要求機構增加
244、合規和風控的投入。市場風格(平均分 3.59)的極端變化可能會導致量化模型失效,以及隨著行業的成熟行業競賽(平均分 3.51)走向更高的差異化和專業化使得量化機構更多壓力。面向未來一年,總體來看,量化投研人員對未來市場的預期較為中性,部分因素略偏向樂觀(如市場行情 Beta 走勢、成交量和流動性、科技創新),而對于監管政策及輿論導向和交易、策略集中度則較為擔憂。量化機構可能需要在維持創新和適應市場變化的同時,加強風險管理和合規能力,以應對潛在的市場挑戰。量化人心理預期積極的類目為:市場行情 Beta 走勢、成交量和流動性、科技創新中性預期:超額 Alpha、研究新方法論、其他行業發展因素悲觀預
245、期:監管政策及輿論導向、交易和策略集中度圖表 未來一年量化市場包含哪些挑戰圖表 量化人員對下一年度行業前景的預期類目平均分流動性枯竭:市場極少增量資金3.25監管政策:交易規則修改及監管與合規風控3.81市場風格:市場風格極端演繹、變化,超越模型3.59全球經濟:衰退、貨幣政策、地緣政治等3.31策略研究:方法論過于集中、差異化較小、Alpha 獲取難度加大等3.6行業競賽:行業到達一定階段,后發機構難以突圍等3.52凈值壓力:募資壓力以及投后凈值壓力3.46投資人信念喪失:投資人對量化持懷疑態度3.29-76-人才招聘:招聘及人才培養的投入過多2.98市場 Beta:指增掛鉤寬基指數大幅回撤
246、3.09基差波動:對沖成本較難控制3.08小計小計3.3數據資料來源:2023 中國量化投資白皮書問卷調研-77-第第三三章章風風暴暴中中的的我我們們-78-0101回顧:雪球敲入 引發 Beta 對沖 Alpha 連續三殺本書雖定位回顧 2023 中國量化投資市場,但幾乎很難對 2024 年春節前的量化崩塌視而不見:2024 年 1 月下旬-2 月初,雪球大量的敲入誘發負面情緒,之后市場經歷“市場量價下跌,主觀基金凈贖回優先賣出小票雪球集中敲入引發基差快速擴大對沖成本快速增加導致 DMA 虧損平倉DMA 多頭部分平倉導致小微盤股踩踏暴露在小微盤的主動增強基金回撤進一步加深回調資金入場拉升 5
247、00/1000ETF 導致市值分布不均的指增超額收益回調DMA 直接干預,管理人無法管理風險獲許調倉后緊急避險加劇賣出”連鎖反應多個階段。圖表 2023 年 12 月-2024 年 2 月量化流動危機演變世紀前沿的情況說明梳理了時間節點的情況:3 年前,也就是 2020 年末-2021 年年初,市場多次出現單日千億資金搶購一只基金首發的瘋狂盛況。但經過三年大熊市的煎熬,其中部分三年期封閉基金在 12 月底面臨開放,疊加市場持續負反饋狀態,以大盤成長股為首的主觀股票基金持續凈贖回,跑得越晚虧得越多的心理在投資者心中逐漸蔓延。在流動性遞減的情況下,規模較大的管理人通常會選擇賣出小票以應對負債端的贖
248、回壓力。市場情緒進一步脆弱化,避險情緒提升,指數的下跌逐漸蔓延到中小市值。一月首兩周的市場普跌后,500 和 1000 指數在第三周(1 月 15 至 19 日)接近雪球的敲入密集區(編者注:據測算,中證 500 雪球的集中敲入區間在 4300 點至 4900 點之間,中證 1000 雪球的集中敲入區間在 4600 點至 5300 點之間)。為應對雪球結構敲入,券商交易臺需要減倉其作為對手方持有的股指期貨。與此同時,國有銀行、中字頭國企等避險板塊在資金支持下企穩拉升,對市場產生虹吸效應,進一步加重市場避險情緒,中小市值指數繼續加速下跌。大量的集中敲入導致中證 500和中證 1000 股指期貨基
249、差貼水快速持續擴大,基差擴張到年化 20 點以上的罕見水平。-79-圖表 中證 500 雪球在不同指數點位的敲入合約規模估算(億)圖表 中證 1000 雪球在不同指數點位的敲入合約規模估算(億)數據資料來源:信達研究國內的量化產品由于調整被限制,無法進行應對。而在海外的外資量化資金則利用此次機會平倉中性產品,導致股票倉位被賣出,但此時流出量沒有特別大,小票流動性尚存,影響有限。該周量化私募的 500 指增超額基本在正負 1%以內,中位數約為-0.3%。自 1 月 18 日開始大量資金開始買入滬深 300ETF,使得滬深 300 穩定在 3200 點以上水平,而 500 和 1000 指數則因為
250、雪球敲入帶來的賣盤影響下加速下跌。此時的市場已在恐慌情緒中。市場參與者基于觀察到的情況普遍形成了 300 指數是安全的共識,大量拋售小票而買入 300 成分股。這個共識在 22 至 26 日逐漸形成,并在 1 月 29 日至 2 月 2 日迅速強化。在大小盤風格出現極致分化的情況下,量化私募的 500 指增超額在前一周表現還較穩定,中位數約為 0%。而后一周的超額中位數則到了-4%,基本破了各家機構單周回撤的歷史記錄。從以上信息可見,量化產品自 1 月中起就一直面對資金面的不利影響,而且是逐漸加速的。量化策略本身有吸收資金面波動,穩定市場截面的作用,因此前兩周(1 月 15 日-26 日)的超
251、額影響有限。但當市場風格一直走極致的單邊行情時,量化的吸收能力被耗盡,隨后市場的流動性迅速消失,量化超額也開始出現加速虧損。市場整體進入極度悲觀甚至恐慌的狀態,小微盤股票流動性開始枯竭,這些壓力在最后一周內變成現實。2 月 5 日-7 日,大量資金買入 500 和 1000 的指數 ETF,正好對應了絕大部分量化資金的對沖或對標端,指數相對非成分股票大幅跑贏,導致量化超額進一步出現大幅虧損。同時再進一步引發中證 2000 等小市值股票的流動性缺失,市場的微觀結構出現失衡,成分股持倉比例不足成為超額回撤的核心原因。在此期間,部分避險資金會選擇將大/小市值股票切換為中市值(中證 500 及中證 1
252、000指數)成分股,進一步形成資金踩踏。圖表 1 月 22 日-2 月 2 日滬深 300 與滬深 300-中證 2000 指數收益差指數漲跌幅滬深 300中證 2000中證 500中證 1000滬深 300-中證 2000 指數收益差1 月 22 日-1 月 26 日1.96%-1.41%0.17%-0.70%3.37%1 月 29 日-2 月 2 日-4.63%-16.78%-9.23%-13.19%12.15%數據資料來源:世紀前沿圖表 節前兩周的市場漲跌幅數量和指數變化情況上漲數量下跌數量主板跌停數上證 50滬深 300中證 500中證 20001 月 29 日474459183-0.
253、43%-0.90%-1.97%-3.49%1 月 30 日228485287-1.45%-1.78%-2.29%-3.19%1 月 31 日3064765184-0.73%-0.91%-2.45%-5.26%2 月 1 日1078394799-0.27%0.07%-0.39%-1.06%2 月 2 日3684704108-0.86%-1.18%-2.47%-4.47%-80-數據資料來源:靈均投資連續經歷以上 Beta 端、對沖端、Alpha 端“三殺”連續經歷以上 Beta 端、對沖端、Alpha 端“三殺”,啟林也談到 2024 年 2 月 5 日至 2024 年 2 月 8 日,國家隊開
254、始買入500ETF 救市,市場迎來反彈,但偏中小市值股票依舊承壓,量化超額進一步大幅虧損無法賣出,部分管理人的 DMA 產品被追保,或被迫減倉甚至穿倉被強平,同時不少量化管理人為避免超額進一步回撤,通過買入成分股來平衡組合市值因子暴露,給權重股帶來新的買盤增量,其他個股則越來越弱,導致超額虧損進一步擴大,這些操作造成了量化行業的擠兌和恐慌。圖表 雪球發行方股指期貨倉位運作示意圖圖表 雪球與對沖交易的相互影響#注:藍色曲線為雪球產品對應標的物走勢模擬圖數據資料來源:國泰君安證券研究數據資料來源:中國量化投資季刊2022 夏穿透雪球圖表 風暴時期主要寬基指數 ETF 成交額日期滬深300ETF中證
255、500ETF中證1000ETF中證2000ETF日期滬深300ETF中證500ETF中證1000ETF中證2000ETF1/232.717.19.53.11/22151.118.66.60.91/336.512.492.21/2344.816.26.81.21/456.7158.61.61/2473.7176.90.81/558117.31.31/2554.517.67.611/858.215.56711/2672.7156.911/937.911.76.711/2933.69.96.20.81/1032.11150.81/3061.99.45.50.61/1142.514.37.80.81/
256、3161.616.87.40.81/1228.312.76712/160.916.710.611/1530.38.34.90.52/280.71811.31.21/1659.312.66.31.62/584.4160.8872.31/1742.810.34.70.72/665.648.6544.21/18152.624.19.40.92/7115.167.939.26.71/19120.816.49.80.62/880.286.829.655.7*滬深 300ETF 為(510300);中證 500ETF 為(510500);中證 1000ETF 為(512100);中證 2000ETF 為(
257、563300)數據資料來源:龍旗2 月 5 日378470413681.18%0.65%-2.26%-9.49%2 月 6 日358614641352.82%3.48%7.75%2.02%2 月 7 日213229322821.09%0.96%6.32%-2.80%2 月 8 日467140070.36%0.64%0.80%8.75%-81-圖表 風暴期因子脈沖式變化數據資料來源:火富牛圖表 量化私募總結 2024 年初行情寬德1 月中下旬隨著雪球產品敲入,市場結構出現了反轉。2 月 5 日起,群體恐慌中很多非理性的操作出現。行業擠兌踩踏,流動性崩毀。世紀前沿擠兌性賣出和調倉引發的短期流動性危
258、機等多重市場風險事件的連鎖反應導致衍復雪球大量的敲入誘發負面情緒,導致指數下跌、基差擴張,間接導致中小市值股票被拋售,隨后指數 ETF 凈買入量異常放大,超額虧損嚴重繼續造成量化機構恐慌式擠兌卓識市場大幅波動,風格極致反轉、流動性踩踏、宏觀限制,就像一場未有預警的風暴,中證 2000 及之后股票的流動性缺失、資金踩踏等多種情況,多空力量開始失衡靈均雪球集中敲入,融資盤爆倉,中小盤殺跌導致許多管理人調倉,引發踩踏行情。黑翼非指數成分股流動性嚴重短缺,個股分化嚴重,同時伴隨著對沖成本提升,在多種不利因素影響下,量化股票策略承受較大壓力。九坤A 股市場走出了連續的、超過歷史極值的大小盤極端分化行情。
259、春節前一周市場迎來反彈,但主要漲幅集中在幾大寬基指數成分股內、偏中小市值股票依舊承壓?;梅骄S穩資金進行強力干預,量化 DMA 平倉調倉導致小市值股票劇烈下跌,出現流動性危機,量化行業強化了風控。收緊小市值持倉比例。加劇了資金從小盤流向中盤股票。啟林各指數板塊間極端分化,雪球敲入導致股指平倉。資金輪番買入各寬基成分股,量化觸發風控,換成分股,引起市場的流動性踩踏和非成分股和成分股之間的分化。穩博寬基大幅走強,引發量化對沖絕對收益/指數增強的超額出現大幅回撤,不少管理人更換成分股,加劇中小市值走弱。明汯小票急跌波動率放大因諾500 和 1000 指數出現反常暴漲。量化機構普遍大幅回撤,迫使各機構紛
260、紛拋售小盤股,買入 500 和 1000 成分股,從而形成了負向反饋。乾象短促且劇烈的大小盤分化,疊加流動性影響,使得全市場選股的量化策略難以獲得正超額。金戈量銳微盤股經歷跌停潮,同時 500 及 1000 指數成分股大幅走強?;爻份^大的產品可能會追加權重股、成分股,微盤流動性困境,股指期貨基差巨幅波動,大小盤走出劇烈的剪刀差風格。致誠卓遠1 月中下旬雪球大量敲入誘發了負面輿情,中小盤股票遭到拋售,股指期貨出現大幅貼水,政府大額買入 500 和 1000ETF,部分 DMA產品被迫減倉并調至成分股內,加劇超額虧損。蒙璽市場風格發生急劇風格切換,尤其在大市值和小市值之間的分化。由于指數的嚴重分化
261、,疊加上市場流動性風險,市場環境的不利因素使得產品業績上均遭遇一定的回撤。鋒滔1 月下旬中小盤下跌引發大量雪球產品敲入,基差擴大到歷史極值。中性產品、DMA 類產品為鎖定基差進行大規模平倉,誘發了負面情緒,2 月 5 日寬基指數反彈,中小市值依舊承壓,部分管理人增持權重股,其他個股走弱信弘主力資金入場拉升指數,市值嚴重分化,全市場杠桿性產品線回撤中小股票踩踏引發流動性風險。而后量化資金逐漸開始布局成分股。龍旗從 0118 開始,在市場一路下跌后主力資金開始救市。0129-0202,市場的小票開始持續走低,超額出現回撤。0205 開始,主力救市資金,轉移到了 500 和 1000,小票發生踩踏,
262、出現流動性危機。-82-念空市場不準凈賣出且國家隊大舉托市,狂拉滬深 300 和中證 500 指數最終造成了中小市值板塊的流動性擠兌進而引發了本次量化指增的 Beta 和 Alpha 的雙暴跌。寬投面對持續下跌爆倉風險,各機構加速收緊敞口,非理性競相賣出,加速多空力量的失衡。誠奇雪球敲入導致股指期貨貼水上升小微盤股下跌,疊加杠桿的影響出現了踩踏跡象。聚寬市場風格急轉直下,流動性受到嚴重考驗,寬基指數快速拉升,中盤股整體收益率高于其他股票。概率雪球敲入、股指期貨巨額貼水,負面情緒導致中小股集體拋售,大盤寬基大幅拉升。同溫層股指深度貼水,市場交易結構極度分化,大市值股票表現顯著優于小市值股票。微盤
263、股抱團瓦解等因素引發市場流動性風險。仲陽雪球集中敲入,各策略減倉,拋售小微盤,小市值股票流動性枯竭。玄信此次市場環境,是匯聚了長期下跌,雪球、基差、大小盤極致價差、流動性等多重因素的結果橡杉政策壓力以及市場的各種哀嚎此起彼伏,中小盤流動性枯竭以及監管政策疊加市場情緒導致的踩踏,致使眾多量化資產出現較大回撤。鳴熙大小風格極度偏離,存在很強非線性,觸發了流動性崩潰。尊和隨著雪球產品陸續敲入,市場波動率加劇,出現了結構性反轉的行情。指數分化明顯,風格轉換的情況,微盤股遇到流動性風險,出現了連續數天的踩踏行情。半鞅寬基成分股開始爆拉,股指期貨貼水急劇收縮,外部的突發力量改變了 A 股的微觀結構、交易習
264、慣。羅維盈安指數下跌觸發雪球敲入、DMA 產品爆倉,中證 500 和中證 1000 指數因救市措施急劇拉升。無隅除市值風格暴露外,指數大幅上漲,DMA 資金的踩踏也起到一定作用??〉ば∥⒈P股交易過度擁擠,賽道脆弱,外部因素打破小票抱團,必然出現踩踏式離場。天算雪球集中敲入,使得股指期貨基差擴大,進一步引起量化中性以及 DMA 產品的平倉,導致了中小盤股票流動性的集中踩踏。茂源市場各板塊極端分化,小微市值流動性危機,多空力量失衡。大量資金為了避險,踩踏性地把大市值和小市值的股票轉換為 500 和1000 的成分股,鏈式過程不斷加劇。子午市場增量資金匱乏,尾部風險事件主推,量化同質策略遭遇基差和負
265、超額共振后的流動性踩踏。數據資料來源:各量化投資管理人信-83-圖表 2024 年初部分量化機構回撤數據資料來源:公眾號大白話-84-0202應對:模型失效 調整派堅守派各占一半如第二章所述,量化機構一般執行較為嚴格的、系統性的風控體系,通常不會主動人為介入。但由于 2 月初市場行情極端,中證 2000、中證 1000 與滬深 300 指數之間的收益率差距多次超過 3 個標準差,尤其是在 2 月 5 日達到了 7 個標準差,春節前最后一周非線性市值因子收益超過了歷史均值+15 倍標準差,屬于非常典型的極端行情。在這種情形下,成分股的權重占比已然超過了所有因子的貢獻。圖表 春節前最后一周非線性市
266、值因子收益超過了歷史均值+15 倍標準差圖表 非線性市值因子波動日度標準差情況數據資料來源:方正研究注:橫坐標為標準差,縱坐標為頻次(一天為一頻次),紅框處為本周非線性市值因子情況,可以看出近 4 年該因子波動都在5 標準差以內,該因子到了 15-20標準差,極為罕見。數據資料來源:靈均投資由于量化投資是基于歷史數據挖掘和統計學規律來開發策略,挖掘正常市場行情下的錯誤定價,為市場有效性作出修正。短時間內,市場環境的大幅變化,股票之間的價格關系持續被打亂,過往數據就不再具有指導意義,模型只能失效且持續發出錯誤信號。世紀前沿指出,這種失效具體在:以量價為主的量化策略,在小票極端下跌的情況下會判斷其
267、后續反轉概率較大,同時由于市值的波動,在歷史上并不突出,二者疊加使得組合在極短的時間內,會重新偏向小票風格。所以世紀前沿對風控模型做出了調整,適當地收緊了模型的波動率約束,調整迅速地反映到了各個產品線上,使得超額回撤保持在了相對可以接受的范圍內。本問卷調研了 2024 年初極端行情期間,量化機構策略進行了何種調整。數據顯示:調整策略與未調整的機構各占一半,調整的類目最主要的是未明其他(66.47%),另外包括因子權重(51.18%)、杠桿比率(49.41%)、交易執行(48.82%)、指數成分(45.88%)。圖表 2024 年初極端行情期間,量化機構的策略調整題目選項沒有調整調整題目選項沒有
268、調整調整交易倉位62(36.47%)108(63.53%)模型優化68(40%)102(60%)指數成分78(45.88%)92(54.12%)交易執行83(47.43%)87(51.18%)杠桿比率84(49.41%)86(50.59%)其他113(66.47%)57(33.53%)因子權重87(51.18%)83(48.82%)小計575(48.32%)615(51.68%)數據資料來源:2023 中國量化投資白皮書問卷調研-85-例如靈均就在投資人信中分享了其截至 2024 年 2 月 7 日,策略持倉成分股分布、Barra 風格控制及收益來源拆解情況如下:圖表 靈均投資持股變化情況中證
269、 500 指增中證 1000 指增風格特征:中證 500 指增中證 1000 指增持倉數量約 2500 只約 2500 只市值因子0.2 個標準差0.1 個標準差權重占比:收益來源占比:滬深 300 成分股40%10%純超額 Alpha 貢獻占比65%65%中證 500 成分股16%14%小市值貢獻占比20%15%中證 1000 成分股14%40%其他貢獻占比15%20%中證 2000 成分股及之后30%36%數據資料來源:靈均投資是否調整策略是一個關鍵又沉重的選擇,決策過程是對管理人的極致考驗,市場快速演繹甚至使得有的機構被小市值反復打臉。進入到 2 月 5 日,龍旗科技繼續評估策略,發現部
270、分子模型正在愈發抄底超跌的小票,于是降低了偏量價因子和高波動的子策略權重,提高了在極端行情下回撤更小、更穩健的子策略權重,收緊了流動性和市值的約束,希望通過市值因子的約束降低超額的回撤。本著少做人工干預的原則,龍旗科技繼續保留了讓模型在全市場選股,并未做太多選股域與期貨端的切換。但春節最后幾天的行情遠比預想的更為猛烈,從2月5日開始,主力救市資金轉移到了500和1000。當周前三個交易日中證500拉漲11.97%,大量的資金拋售小市值股票,轉而持有 500、1000 成分股。小票發生踩踏,出現流動性危機,個股中位數跌幅達-6.82%。中證 500 指數和中證 2000 指數的收益差(用除法計算
271、相對走勢后再按復利計算)急劇反轉,從 0.7 迅速降到了 0.2,在幾天之內回到了 21 年初的低點。這是過去十多年從來沒發生過的情況,也導致原有的風控體系無法起到控制超額回撤的效果。從歸因結果來看,NLSize非線性市值這個風格在 2 月 6 日和 7 日達到了史無前例的負向顯著性,偏離度達到了 40 多個標準差,造成了超過 8%的風格負收益。在這種情況下,只有把選股域限制在成分股內,才能起到控制回撤的效果。但龍旗在 2 月 5 日到 7 日一直堅持沒有人工干預模型的選股域,導致龍旗的超額出現了巨大的回撤。在堅持了 3 天之后,龍旗科技在 2 月 7 日下午評估當前的行情過于極端,出于風控的
272、考慮不得已收緊了一部分的選股域,同時對風格因子做了非常緊的約束。卻沒想到市場的風格切換如此急劇,8 日主力資金開始拉中證 2000ETF,中小票報復性反彈,中位數上漲 7.35%,而前期強勢的 500 指數與 300 指數反而處于尾部 10%分位數,前一日的風控措施讓其錯過了大幅的反彈空間,最后導致 2 月 8 日當周的超額表現非常差?;仡櫞汗澢皟芍?,龍旗認為公司預判到行情的極端程度,導致在最被動的時候才不得不人工干預,出現了大幅的負超額。應該在風控上更加主動地去預警,更早地切換選股域去應對結構化行情。在這種十年不遇的行情下,應對非常不佳,也不得不非常被動地做一些調整,最終造成了非常差的結果。
273、調整策略的機構大多并非一蹴而就,天算量化總結了風暴集中期的操作:周一(2 月 5 日):流動性危機開始,市值因子控制到 0.1 附近,量化對沖繼續降低到 30%-40%倉位。-86-周二(2 月 6 日):流動性危機繼續,國家隊入場拉指數,天算調整 30%策略倉位為成分內避險。周三(2 月 7 日):流動性危機加劇,非成分股無差別大幅跑輸指數,天算繼續調整 50%倉位到 80%成分股。周四(2 月 8 日):周三收盤后證監會領導更替,周四資金流入中小盤股,流動性危機暫時解除天算成分內選股策略降低到 60%。受調問卷中幾近一半的機構幾乎未做任何調整,部分機構認為即便再大的沖擊也將會暫時性的。衍復
274、選擇不調整策略的原因與底氣在于:根據美股歷史上的幾次 Alpha 流動性危機和 A 股 2014 年底 Alpha 集體大幅回撤的經驗,只要產品不因為爆倉、觸及止損線等原因被動終止運作,且不人為干預量化模型,最終超額將會在不長的時期內自然修復。當流動性危機一旦解除,市場恢復正常狀態后,前期因恐慌而不惜代價奪路而出的交易者(主觀和量化)又將重新調回正常模型或正常交易行為,屆時將加速推升超額的修復。類似 2 月 6 日、2 月 7 日兩個指數的反向逼空行情也會出現在其他的股票身上,2 月 8 日中證 2000 指數及其他小市值風格指數的表現就是例證。因此公司深知在這種情況下不進行人工干預是正確選擇
275、。寬德 2 月 5 日當周制定了相應的計劃,但并未觸及設置的干預閾值,所以沒有做過多的人工干預。寬德認為主觀調整持倉對于點位的判斷要求較高,會帶來一定的人為干擾,本質上也增加了不確定性,因此 2 月 5 日那周內沒有做選股范圍的切換。對于中性策略,由于外部的限制和主觀考量,也沒有在基差擴張的時候減倉。-87-0303判斷:風暴之中 軟性實力凸顯韌性極端時期究竟是否能展現量化機構的特殊能力?問卷數據顯示,量化投資機構認為,本輪回撤在很大程度上可以證明機構在策略底層、大市研判、快速響應、流動管理、基差管理、壓力測試等投研底層硬性能力。但可以發現本輪危機中,一些軟性的實力被放在了更顯著的位置,排名前
276、 5 的為心理韌性、危機溝通能力、團隊協作、快速響應、合規風控。圖表 本輪回撤多大程度能證明量化機構的能力策略底層:底層 Pure Alpha 的穩定性、策略學習能力及優化速度3.67大市研判:快速理解市場和監管變化,預判潛在影響3.66快速響應:迅速調整交易敞口,尋找低影響投資機會3.75流動管理:管理現金流和資金使用效率的能力3.61基差管理:靈活的基差管理3.51壓力測試:模型極端市場預演及應對3.89危機溝通:市場透明和開放的溝通,解釋市場、公司應對以及長期策略3.79合規風控:透徹理解監管要求,避免因違規而受到額外的財務或法律懲罰3.75心理韌性:保持冷靜和專注,面對市場的波動和壓力
277、,維持機構投資原則3.9團隊協作:所有成員都能同步工作并作出迅速反應3.77數據資料來源:2023 中國量化投資白皮書問卷調研在所有選項中,心理韌性得到了最高的評價(平均分 3.91)。這表明在市場波動和壓力下,保持冷靜和專注,堅持投資原則被認為是機構強大實力的最重要體現。心理韌性得到了最高的評價(平均分 3.91)。這表明在市場波動和壓力下,保持冷靜和專注,堅持投資原則被認為是機構強大實力的最重要體現。例如涵德投資合伙人顧小軍就提到,其 2006 年入行加入 WorldQuant,2007 年美國經歷了量化崩塌,WorldQuant 創始人Igor Tulchinsky 迅速砍倉,三天內將所
278、有倉位全部清完,兩周之內又全部加回來,決策又快又準。但開始交易后發現這樣的決策其實極其艱難?!靖鄡热菰斠姷诹潞峦顿Y最佳實踐】市場透明和開放的危機溝通(平均分 3.79)排名第二,這其實更大層面表現投資者關系的處理,在危機時期與投資者保持清晰溝通,有效傳達機構的應對措施和長期策略,是非常關鍵的能力。歷史上,Citadel 經歷的最大回撤為 2008 雷曼倒閉的那一個月,最大回撤 20%、全年回撤 55%,Citadel 當即要求暫停投資者贖回,2008 年之后 Citadel 全面改變了風控,所有的交易都考慮到因子暴露,并堅持分散投資,以達到杠桿率、收益和波動之間的穩態,第二年基金即反彈
279、62%?!靖鄡热菰斠娭袊炕顿Y季刊 2023.冬刊】事實上,本輪教訓中還最需關注的有合規風控,透徹理解監管要求并避免違規而受到額外的財務或法律懲罰。2 月 20 日,上交所和深交所發布公告稱,靈均投資集中大量下單賣出,影響了正常交易秩序,從 2 月 20 日起至 2 月 22 日暫停其交易,并啟動公開譴責紀律處分的程序。隨著監管趨嚴,不少量化機構便開放了合規相關崗位招聘,配合落實監管部門對私募基金的合規管理工作要求。-88-0404優化:因子約束 宏觀判斷2024 年春節,量化機構無人能眠。諸多機構在春節期間加班加點上線了控制風險的子模塊,從優化措施的排序中可以看出,量化投資機構在極端行情
280、之后更加注重風險管理和策略的穩健性。包括加大風格因子約束(65.29%)、宏觀風險因子(56.47%)、加強流動性風控(55.29%)、因子擁擠度測算(47.65%)以及加強基差管理(38.24%)。圖表 極端行情之后,策略將進行何種優化?圖表 替代本輪踩踏之中,量化行業最該學習成長的#數據資料來源:2023 中國量化投資白皮書問卷調研問卷以“回顧本輪踩踏,您認為量化行業最該學習成長的是”為題進行了文本類調研,要求列出三個關鍵詞,數據顯示量化機構認為最該學習成長的領域圍繞著對風險的敏感性、對市場變化的適應性、對策略的創新性,以及對監管環境的理解度等方面展開。因其信息含量較大,編寫組作以下全文刊
281、載:關鍵詞 1關鍵詞 2關鍵詞 3關鍵詞 1關鍵詞 2關鍵詞 3輿論監管合規性對商業模式的理解對產品的理解對風控的理解提高風控模型的重要性增加超額來源,提高分散度加強與監管和投資者的溝通風險管理技術技能量化模型和策略策略多樣性因子暴露管理流動性監測宏觀流動性國家政策對超額是屬于 Alpha還是Smart Beta 的判斷對極端情況下市場的前瞻判斷和投資者的溝通風控風控風控方法論的更新迭代對于 Alpha和超額的理解聽媽媽的話風格因子暴露度的控制杠桿的合理使用交易擁擠度的把控如何應對監管如何應對風控如何應對科技變化減少抱團跟著趨勢減少操作行業整體的風格集中度加深監管理解無科技提升風控能力科技提升
282、策略計算和迭代能力科技管理團隊績效風格暴露數據迭代同質化問題快速響應及時止損風險控制數據行業標的策略避免過度押小盤股控制好尾部風險關注流動性風險做好自己超越自己頂峰相見風控執行人性踩踏因子的研究與監管的溝通機制與公眾的溝通機制宏觀理解監管和政策導向策略和模型的穩定性風險控制策略多樣迭代嚴格風控模型嚴謹不盲目跟風宏觀風險分析風格因子約束極端流動性風險的防范風控約束風格同行擁擠因子儲備杠桿不用緊盯政策導向加大策略的個性化研究,防范趨同性一致導致的無對黑天鵝時刻保持警覺極端情況下的應對對模型恢復的信心-89-踩踏提高預警風險評估能力做好倉位靈活管理做好投資品種的風險對沖風格暴露度情緒控制市場理解政策
283、敏感度人工干預模型做好雙邊分析模型優化風險預警能力對于政策的學習和執行更靈敏地優化模型低調盈虧同源高杠桿只適用高風險收益偏好資金卷超額可能最終把行業卷沒了人工智能數學政治立場擁擠度杠桿率投研能力監管要求擁擠度市場主流衍復寬德佳期風控市場風險監管政策市場壓力穩定合規變化大市判斷對宏觀風險及政策的研判和解讀極端行情下的交易模式革新杠桿的限制關注政策時機風險極端行情應對反思量化本質追逐的是什么更靈活優質的策略注意因子暴露控制杠桿、對沖等工具配合監管進一步規范算法的有效性重視監管控制倉位宏觀研判趨勢跟蹤情緒跟蹤主觀思維長期價值監管策略多樣化投資渠道多樣化流動性約束方面需要加強衍生品對沖宏觀經濟/因子大
284、類資產配置更貼近市場,監控風險儲備策略風險事件應急機制對監管的理解如何避免策略同質化如何做好投資者教育關注監管關注宏觀分散策略加強政策學習關注模型通過極端行情考驗的能力強化風險管理加強與投資人交流溝通重視封控合規探索不同市場可能性合規風控策略多樣化危機應對管理減少市值風格暴露加強人才培養加強風控不要過分追風格,幾年一輪動好好做 Pure Alpha好好約束各種持倉風格,不僅僅是 Barra 和行業策略風控探索差異化別賭別賭別賭控制風險政策研究黑天鵝事件概率組合優化風險模型Alpha 因子的適配度不能抱有僥幸心理行業輪動是一定存在的順勢而為風控監管政策輿論模型的把控監管的風控技術的調優人工干預是
285、否必要?如何引導投資人不過度比較?暫時沒想到極端行情風控監管政策感知流動性監控風控控制敞口提升 Alpha 能力及時操作擇良組合優化宏觀把控能力板塊輪動的特異化分析中頻交易的新策略明確策略風格定位敬畏市場規范化管理流動性擁擠度監管宏觀擇時衍生品對于國內政策底層邏輯的理解策略差異化與監管的溝通風控投研方法論跟蹤新技術模型優化人才引進數據分析策略同質化交易擁擠模型風控政策研究能力風險管理能力交易擁擠度監控能力敞口管理壓力測試交易計劃策略同質化嚴重保持初心深度理解市場肥尾效應觀察因子擁擠度對市場作出快速反應監管預判負債端管理能力策略相似度Pure Alpha 能力風險控制策略創新風格暴露風格約束對監
286、管影響判斷極端環境流動性估算政策法規流動性風控投研服務投資者教育適應監管收緊風控控制管理規模降低收益預期,控制風格偏離重視因子模型的邏輯及回撤控制避免異常交易認識流動性風險不要過于集中產品不要設置清盤線監管風控負債端管理對政策環境的學習和預判對模型的迭代對市場的敬畏-90-關注監管動向關注同行超額相關性關注策略的趨同性輿論監控風控擇時控制風險敞口行情失效時止損多學習下極端行情迭代總結繼續對行情的宏觀把控對歷史行情的細致復盤更好的風控和抗壓能力危機應對擁擠度研究輿論因子擇時模型漂移情況因子擁擠度擇時擇時擇時合規性大勢判斷防御型策略研究風險管理市場溝通合理超額流動性風險評估因子暴露控制慎用杠桿監管
287、政策導向中國特色金融文化一致預期的感知不要卷業績要敬畏市場不要閉門造車策略底層基差管理其它交易擁擠度監測交易行為學習風控宏觀風險流動性枯竭時的應急預案提供情緒價值因子差異關注基差多策略風控監管動向模型迭代對底層策略的認識度對交易細節的把握度對宏觀政策的了解度政治周期監管策略擁擠擁抱虧損擁抱市場擁抱自己風格相關性危機管理預案極端行情應對措施擁擠度相關性永遠保持對市場的敬畏差異化發展風險管理流動性預判監管嚴格程度要重視嚴格執行模型不要人工干預回撤風控因子數據、特征、因子、模型的強可解釋性和強因果性行業輿情的快速有效發現和反應人工智能在行業中應用的進一步發展策略的把控監管動態的掌控風控的調節對敏感性
288、的風格加強監控無無尾部風險識別非人云亦云做好自己風險控制極端應對模型調整風控深入到模型人多的地方少去不要加杠桿快速反應風險第一策略儲備策略趨同風控N/A市場微觀結構衍生風險風控模型對于量化策略的監管態度及導向哪怕市場很弱,也別過于集中在某幾類策略上增強策略的差異化異構策略百花齊放流動性監控宏觀風險資產配置交易風險控制因子擁擠度宏觀風險控制調整的及時性投資的心態市場信息梳理風控手段預測因子行業動態掌握宏觀周期配置風險交易底層邏輯事前風險控制對風格暴露的敬畏模型繼續優化多策略疊加自身能力提升和持續迭代過度的風險暴露需要謹慎對待敬畏市場宏觀尾部風險管理市場交易通道指數負相關嚴謹獨立客觀面對極端事件的
289、應對宏觀風險的把控倉位的管理尊重科學重新認識 Alpha 和 Beta減少虛假宣傳注重配置的力量,低相關和可解釋性的重要意義防止抱團,注重機構異質不要一邊承擔過度的風險賺取短期相對業績的同時,加大銷售,加劇抱團和后續的踩踏,影響行業合規對投資者透明注重風險管理監管政策影響風格暴露控制尾部風險模型政策風控模型調整合規風控壓力測試策略調整豐富子策略加強風控極端環境下策略回撤控制模型加入做空時融券費率和約束對市場主流產品(雪球)的潛在影響分析包括市場情緒預判資產分散化全天候策略研發不要過多暴露于某風格基差管理模型設計極端行情應急操作指南策略管理做細做精團隊精細化管理體系對策略加速優勝劣汰的制度極端行
290、情下的研判與處超額暴露的豐富度與分衍生品在極端行情下的預測預測預測-91-置能力散保護運用差異化言行一致勇于認錯不要反復橫跳說到做到知行合一極端行情下的風險管理和控制因子輪動轉換的把控無加強風格因子約束提高策略豐富程度提高監管政策變動敏感度風控風格模型優化流動性管理策略多元化走出國門政策政策政策風格均衡心態因子廣度基本面因子政策風險普及風控減少人為干預分散底層資產流動性的保持策略底層 Pure Alpha 的優化交易倉位的把控分散投資市場交易時點觀察區分 Alpha 和 Beta數據資料來源:2023 中國量化投資白皮書問卷調研對于后市的判斷,有量化機構認為 2 月超額回撤事件有多項催化劑,包
291、括中小市值股票在春節前流動性枯竭,國家隊大量買入 500ETF,市場交易環境變化導致不少量化機構出現恐慌式擠兌等。以上催化劑缺一不可,才會導致超額的歷史性回撤。因此這一回撤在未來幾乎不會復現。但有幾點高確定性變化屬于行業共識:1.行業出清。1.行業出清。經歷這次行情后,量化行業的整體規模會有所收縮。一些量化資金的贖回、DMA 規模的大幅下降,都會降低量化策略之間的競爭,讓超額比之前更好做。2.風險釋放。2.風險釋放。隨著節前量化的踩踏和超額的回撤,量化策略在過去多年里積累的風險已經大幅釋放,甚至超跌。未來量化策略的運作將會輕裝上陣,迎來相對較好的市場環境。從中長期看,隨著政策發力預期提升、市場
292、風險逐步出清,成交量有望逐步回暖,情緒逐漸回歸理性,機構堅定看好后市指數和超額的表現。-92-0505因子擁擠度測算:中周期因子與日內因子行情極致演繹、模型的必然選擇,使得 2023 年小微盤強勢。根據招商數據統計,30 億以下微盤股貢獻了 12%的收益,整個 75 億以下小市值貢獻 43%。使得一部分行情適應程度高、小微盤配比高的量化管理人獲取極為亮眼的超額收益,也引發了市場擔憂,如果市場風格發生轉向,低流通市值的股票容易發生踩踏,市場對于量化業績尤其是小微盤高配比管理人的潛在風險的擔憂也愈加濃烈。最后在 2024 年 1 月底 2 月初風險集中兌現爆發。圖表 量化私募各流通市值股票平均配比
293、情況時間1515-3030-5050-7575-110110-150150-200200-500500-10001000-20002000+年初3.40%10.30%13.00%10.50%9.10%7.40%5.90%17.70%9.20%6.20%7.20%12 月底4.70%13.30%17.10%12.30%8.60%6.00%6.00%13.10%7.70%5.90%5.10%變化1.30%3.00%4.10%1.80%-0.50%-1.40%0.10%-4.60%-1.50%-0.30%-2.10%資料來源:招商私募指數數據庫圖表 市值分布因子分年度表現情況統計年份累計收益率回撤幅
294、度最大回撤開始時間結束時間最大回撤持續天數夏普比率20097.69%-3.56%2009-01-052009-02-23490.7820101.21%-2.99%2010-07-052010-09-1471-0.20201110.20%-1.95%2011-01-252011-02-23292.8620127.18%-1.42%2012-02-012012-03-13411.9020133.00%-1.14%2013-03-132013-05-31790.4320148.86%-1.99%2014-01-132014-02-18362.37201515.88%-3.99%2015-01-052
295、015-06-021482.28201620.10%-1.61%2016-03-162016-04-06214.72201717.78%-0.84%2017-07-172017-07-31148.32201811.02%-1.09%2018-02-012018-03-05324.7220192.93%-2.52%2019-01-312019-03-12400.4120204.08%-3.69%2020-04-012020-07-131030.6720213.30%-1.72%2021-10-132021-11-29470.5020228.87%-3.13%2022-04-262022-08-1
296、81142.0920236.06%-1.64%2023-10-232023-11-20281.6720241.78%-3.88%2024-02-052024-02-0831.66數據資料來源:國泰君安研究由于中盤股,也就是非線性市值因子,歷史表現較為一般,量化基金持倉市值一般分布在大小兩端,較少買入中間市值部分股票,例如組合等權配置滬深 300 與中證 2000,并不會等于配置了中證 500,50%300+50%2000 100%500 市值,市值因子暴露不大,但是在極端市場情況下,也會形成超額回撤,節前資金在底部通過 ETF 進場,500ETF 和 1000ETF 屬于中市值股票,與量化基金
297、持倉相悖,市場結構對量化影響極大形成“牛跌”。量化機構通過控制 Size 敞口是無法應對這樣的市場行情的。例如,卓識投資在復盤 1 月市場大跌之時,就談到其風控體系主要依賴于歷史數據規律,追求投資組合在各個特征的數學解角度和對標基準保持類似。以市值為例,過往通過市值加權來控制組合敞口暴露,在持有一定大市值股票的同時,持有一定小市值股票,在數學角度是可以同時持有大小市值股票的方式來對沖市值風格風險做到中性,這個風控措施在歷時 4 年-93-多的實盤中并未暴露出很大風險,在更長數據中也沒有顯示出過高的波動,且在美國市場是長期有效的。但是,在大量資金集中買入中證 500ETF 和中證 1000ETF
298、 的行情里,市場的風險已經變成了是否持有足夠多的成分股,放大了成分股持股這個風險因素的影響,如果持有的 500、1000 成分股不夠高,那么就會帶來巨大的超額回撤。而與市值因素低相關的其他超額來源在這兩周的極端踩踏環境中也沒能帶來其他 Alpha 收益。據招商證券測算,2023 年底,量化策略投資的股票流通市值范圍集中在 30-50 億,占比達 17.1%,市值區間提升顯著,超 4%;其次是 15-30 億占比 13.3%,整個 75 億以下的股票投資占比達 48%,小微盤幾乎占據了一半,2023 年 8 月中旬市場下行趨勢明顯,策略在小微盤占比尤為抬升,11 月有所回落,12 月再次回升。其
299、中:50 億以上頭部的量化機構投資市值分布變化會更為平滑,小市值票增長幅度更小,大市值的縮減幅度更緩慢,微盤股的投資上更慎重,年內 30 億流通市值以下的股票投資占比提升在 2%附近,部分管理人會有明確的風控限制。相反 50 億以下管理人相對更激進一些,15-30 億流通市值的股票最新投資占比 16%,比年初提高了 7.6%。圖表 不同規模區間量化私募各流通市值股票平均配比情況組別因子選擇(輸入)-算法設計篩選機制評價多維度;篩選多標準;深度與廣度并重篩選機制定量標準+定性標準+優勝劣汰更新頻率核心庫月頻;備選庫周頻;試錯庫日頻更新頻率核心庫雙周頻;備選庫周頻;試錯庫日頻數據資料來源:天算量化
300、天算合伙人劉駿洲談到,2017 年作為第一批開始用人工智能的機構,得益于市場擁擠度低,天算超額做到了 35%40%。2018 年下半年隨著市場變得擁擠,超額變得比較平,如何突破成了關鍵問題。在此之前天算的交易邏輯是每天收盤之后給未來的股票數據做預測進行打分,得到一個持倉列表,這種方式優勢在于靜態數據,易于收集且對處理時長要求不高,在此之后公司做出的突破是將日間交易改為日內交易,難度在于如何通過技術輸出流動數據并給出預測。從日間預測改為日內之后,天算超額又上來并在 2019 年獲得了金牛獎。天算的方法論在于將每天的 Alpha 進行拆解,分為 pureAlpha 與 risk Alpha。ris
301、k Alpha 就是行業和風格暴露帶來的收益。因為深度學習模型會選擇超跌行業,天算沒有主動對行業和風格做出約束,在半導體芯片行業和中證 500 指數在行業的配比相比超配 15%,導致 2021 年天算第四季度回撤 10%,規模也有一定程度下降。而在這一波回撤中,天算發現其回撤主要來自Risk Alpha。于是從 2022 年 2 月份開始,天算加入了優化器,把行業敞口控制在 2%以內,開始用主動工具嚴格約束,風格因子除市值之外都控在 0.4 以內,本質上改變了 Risk Alpha 的走勢。超額及回撤都取得了不錯的效果。圖表 策略換代前后:行業敞口對比圖表 策略換代前后:風格敞口對比-157-
302、0303風控升級、預測升級和組合升級天算 2022 年做了三大升級:風控升級,組合升級(將 5 位 PM 的子信號進行加權線性融合),以及最重要的預測升級。因為優化器這一主動工具雖然可以把整體的行業敞口控制住,敞口變小后穩定性會提高,但超額收益也會受損。預測升級上,除了傳統 Alpha 模型對未來股票收益進行打分之外,天算額外對行業收益率以及市值強弱打分,最終把這三個打分表進行結合,前者權重占比 80%,后兩者權重占比 15%20%。也可以理解為市值輪動和行業輪動?!笆兄狄蜃悠鋵嵑苡幸馑?,它有一定延續性,在 A 股一般來說大小市值進行切換后會延續一段時間?!边@部分的測算是偏長周期的預測。具體實
303、現是把過去 10 年數據按大小市值分組,可以預測出到底幾天作為周期的延續概率大,模型一旦捕捉到這樣的趨勢就用來投資,以最快速度實現大小票趨勢策略切換。這也是天算在市值的處理上做的創新,從而它跟百億量化間的平均相關性低于 0.5。行業輪動同時也是基于行業收益率目標給全市場來打分,包含行業間資金流向因子、行業龍頭股強弱因子、行業內各股票相關性因子等。例如,當預測未來銀行股更強,就會在所有銀行股股票上做更多權重。國內目前行業因子涉及很多基本面研究,圖神經網絡也在此有相當一部分應用。天算的行業因子同樣涵蓋較多基本面和量價,“行業間相關性是重要因子,最終目標是把無序的行業波動變得相對有序。這一部分我們除
304、量價之外基本面也會應用,從換手率就可以體現出來,天算升級之前換手在年化 120150 倍,升級之后換手只有 40 倍?!弊罱K天算模型現在每天都會進行收益拆解歸因,例如會用濾波器把行業劃為兩個點,在回撤里看每個行業因輪動賺錢的情況,最終加權成一條線,體現所有因為行業暴露帶來的收益。目前天算會在控制市值風格的同時做輪動模型,把風格因子控在 0.4,市值因子控在 0.5 以內。但并不總是穩定小市值,當大市值強的時候也會暴露大市值?!叭袌?5000 多股票,市值配平是挺難的一件事兒,”劉駿洲談到,目前整體行業敞口是在2%左右,大部分小于 3%。而最早用 Barra 模型來做風控的一家管理人,用自建的
305、風險數據庫去做風險模型,風格因子暴露之前是1%左右標準差,現在嚴格控制到0.4%左右。對天算整個 2023 年的收益歸因的話,80%左右收益來自 Pure Alpha,20%左右來自 Risk Alpha。2023 年行業主題較突出,例如上半年 AI 主導的行情。劉駿洲也坦誠,由于量化持倉很分散即便超配了 AI,但在這種權重股領漲行情下確實不利于量化發揮?!靶袠I輪動畢竟也是難的事情,我們并不是把它當成收益主要來源,只是個輔助功能,哪怕預測夠準也只會超配 2%?!?404創新的人才體系與窘境不管是 AI 的運用、還是行業與市值的輪動,都根植在天算的 DNA 中。與之相伴的是相匹配的人才培養機制和
306、產品商業體系。天算的投研體系自定義為積木式投研體系,公司采用流水線和基金經理結合的方式,同時以內部培養為主,外部招聘為輔。目前 5 個基金經理有 4 個都是自己培養,最初從因子挖掘開始搭建全流程的培養體系,因子環節能很好地驗證個人數據處理能力、編程能力。因子挖掘之后天算一般會讓其著手做風控,通過 Barra 體系和 A 股的特點做風險約束模型。最終再讓其進行因子組合的嘗試,一整個流程下來我們會很清晰地知道大家的能力點在哪里,有的人適合短周期,有人適合長周期,有的人優化器做得-158-好,其他同事就不必在此領域發力更多,每個基金經理小組可以單獨挖也可以用公司的因子,可以自己做優化器也可以用公司的
307、優化器,眾人拾柴火焰高,“我們稱其為積木式投研體系,通過這樣的體系來進行相關性低的配置分流?!眲ⅡE洲認為,同事之間就需要兩樣東西,情緒價值與物質價值。通過這種感情基礎與融洽的氛圍,以及合理的分配機制使得大家的向心力更強。目前天算基本上會把業績報酬 50%分給管理團隊,核心員工都有股份,是非常偏平臺化的機構。但創新總是面臨很多窘境,雖千萬人吾往矣是一種豪邁,也是當前量化面臨的現實。在天算看來,一方面量化需要提升自身透明度,另外一方面確實也需要公眾的支持。天算呼吁量化能夠透明,因為現在量化模型已經較為復雜,很難通過估值表的信息倒推出模型,例如天算現在是 5 個基金經理小組,估值表最終體現大概 30
308、 個線性策略加權結果,并且進行獨立風控。所以如果一個管理人不敢提供他的估值表,可能并不是擔心策略暴露,而是因為言行不一。目前天算向合格投資者提供投前的月度估值表和投后的周度估值表?!艾F在有太多路演、太多故事,我希望量化不要講太多故事,而是用數據說話,有多少超額、是在什么樣的風格下暴露出來的都可以從數據觀測到。投資人可以看到量化持倉對于量化未來發展是很核心的,既然公募可以、主觀配合,那量化一樣可以提供?!?159-09圖靈基金:90 后掌門人的七十二般變化09圖靈基金:90 后掌門人的七十二般變化歷史能不能代表未來?算法是不是越復雜越好?魯棒性檢驗該怎么做?在圖靈基金的 PPT 最后一部分風險控
309、制上,他提了如上三個問題,并推薦了一本書失靈“盡量在概率的適用范圍做事情,同時請為不可預測的小概率事件做好預案?!蓖鮼喢?,一個 90 后量化創始人,經過近 10 年的量化市場周期,對于這個市場仿佛有一種無限的求知欲。010190 后量化掌舵人 從高頻跨越 Alpha2014 年,90 后王亞民從倫敦大學學院(UCL)金融數學碩士畢業后,先后在摩根士丹利、瑞士信貸,從事外匯高頻和交易行為的大數據分析?!捌谪浝弦慌山灰讍T雖然沒有采用嚴肅的量化方法,但當時確實也非常賺錢,有些期貨公司的朋友詢問我是否可以回國嘗試一下?!蓖鮼喢衲玫綌祿蠛唵嗡惴ㄅ芰艘幌?,發現在回測的角度確實可以賺錢。經過三個月的策略開
310、發之后,從 2015 年 3 月開始實盤,此次小試牛刀讓王亞民看到了國內量化的潛力。2015 年底,圖靈成立。從 2016-2018 年,圖靈開始時主要以高頻商品期貨為主,后端提成很高,而且沒有營銷成本,量化工作很是愜意。但 2018年市場格局開始發生變化,四大天王百億私募開始出現?!盎剡^頭想,那時候剛畢業沒幾年,自己還是太年輕了,只有二十六七歲,有些缺乏遠見,只想著眼前的交易策略,沒有考慮長遠的大趨勢?!蓖鮼喢癫槐苤M彼時的青澀,以及對量化前輩的贊嘆。2016 年左右,量化選股的商業思路都是如何進行量化對沖,但就有前輩提出指數增強會成為量化規模最大主菜單,并進行早期的賽道布局和開拓。有早期機構
311、用最原始自有資金自購,5 年不計提業績報酬,拿著自己業績報酬與客戶共同承擔市場波動,在市場上換得信任。這以后 5 年量化行業快速發展,到 2021 年,500 指數增強賽道沉淀幾千億級別資金,布局比較早的機構許多都成為了后來的頭部管理人。這個過程,體現了機構在長遠商業趨勢上的前瞻性。一些頭部機構引領技術革新,愿意開拓進取,在人工智能等領域做非常多前瞻性投入,這都是非常值得全行業驕傲的。量化行業快速發展,王亞民有著自己的節奏,大概年輕,他并不一味追求商業利益,而是更關注研究邊界的拓展和進化。在此期間,圖靈開始從高頻跨越到股票研發?!斑@其實是有很多痛苦的,我們以為在期貨市場做得不錯的策略或許可以直
312、接遷移到股票這邊,但事實并非如此?!蓖鮼喢窠忉尩?,高頻更多的是“點突破”,不需要太大的數據量,只要掌握一種交易技巧或交易思路就可以嘗試去做,而在選股策略中,股票的底倉換倉風險是沒辦法用高頻高勝率的方式解決,因為當天只能換一次。在期貨市場中可以采用短時間內大量重復的方式來做好風控?!耙粋€勝率 70%的模型,每天預測 1000 次,那么這 1000 次樣本總和為正的概率也差不多是 100%。但股票并非真正意義上的 T+0 產品,這是兩者之間的本質性差別。在當下預測接下來一天的股票收益率是一件很麻煩的事情,存在太多信息不透明導致不確定性因素。但是在截面上看,這些風險因子都被抵消掉了。在長周期上,資產
313、間的 Beta 會互相抵消,噪音會被過濾,相對收益的可預測性要比絕對收益可預測性更高。因而在預測周期拉長后,截面模型的重要性尤為凸顯?!?160-“行業內很少有人能夠同時兼顧高頻時序和截面 Alpha 兩套研究框架,所以很多做高頻的公司后期轉型都是找到另外一個策略合伙人?!蓖鮼喢癞敃r也是這樣的想法,當時市場流行的是老少搭配,有一定江湖閱歷和行業地位或者資本金積累的資深人,再尋找年輕策略合伙人,而自己作為一個 90 后要招聘合伙人會面臨諸多挑戰?!暗迷?,年輕的時候至少有機會可以把一切推倒重來?!痹?2018 年下半年,王亞民及其團隊開始自己做選股,從“高頻時序”奔赴“中頻截面”。從 0 到 1
314、 的過程是很痛苦的,那段時間王亞民經常半夜打車去辦公室“推電閘”:“先是算力跟不上,加了服務器之后又遇到散熱問題,辦公樓中有很多是中央空調,不能控制單獨房間的空調。于是我們又搬到了郊區中環附近,可以獨立控制空調的辦公樓。但當服務器加到第 20 多臺,機柜加到第 3 個,雖然散熱沒有問題,但是會跳閘。寫字樓的供電標準跟不上了,所以經常夜里要過去開電閘?!弊罱K,經過反復試錯后,圖靈把大量算力都放到了專業的數據中心進行運維(IDC)。團隊一起走來,一起經歷過所有困難?!?021 年 500 指增超額回撤 3.5%,當時我們內心非常痛苦,剛拿到資管牌照募集了 10 億左右,大多數初始資金是在高點直接回
315、撤,沒有任何安全墊。雖然客戶沒有埋怨,2021 年 10 月份,一家券商自營電話聯系我,不要壓力太大。另一家反映他們回撤已經到 5%、7%,而我們這邊在 10 月的回撤只有 2%+,已經很好,但是實際上客戶確實也虧了錢,我們內心壓力非常大,覺得非常對不起客戶?!敝链?,公司全體投研更加注重風控在各個環節及各個產品線上的滲透,“我們內部很多想法和理念都非常統一,也有充分的沉淀,投研人員極度穩定,因而早前的市場經驗與教訓,一直被繼承下來?!?202一年新增 50 億 客制化精細賽道2023 年圖靈規模新增 50 億規模,到達 70 億總量,但公司并非只關注主流 500 指增賽道,而是客制化程度非常高
316、的細分賽道,甚至包括如科創 50 指增、中證紅利指增等。做指增并非挑選出一攬子的 Beta,而是一種精細的雕刻。王亞民認為,500 的問題在于其中位數市值大約為 260 億,為中盤。而市值這個風險因子的收益率,在全部 A 股的各個區域的變化非常大,并不能被經典的線性(Size)或者非線性(Nonlinear Size)所很好地刻畫,從 2022 年到 2023 年跌幅來看,滬深 300、中證 500 以及中證 1000 的跌幅只有幾個點的差異,即市值 100 億左右的公司和市值 1000 億以上的公司相比收益率沒有大的差別,但從 80 億以下開始,小市值風格的收益率開始瘋狂“上翹”?!澳銘撚?/p>
317、什么樣的思路做東西?應該用什么樣的選股域?”實際上很難決定。如果全 A 選股做指增,選擇持有一部分市值 30-50 億的上市公司,在這幾年肯定是占到極大好處。但這與 500 主要中樞是否一致?王亞民曾經進行過研究,沒有任何選股技巧的情況下,可以直接以每隔 20 億左右市值范圍計算區間做等權指數,類似萬得小市值指數的編制算法。實際上在60 億以下市值范圍,例如 40-60 億等區間,其等權指數已經強于中證 500 至少年化率有 20 個百分點?!拔覀儽容^排斥模糊,無論對內做研究還是對外做客戶溝通,確定賽道的真實標準很重要。例如:實際選股域、實際基準、風控參數,這些都是很重要的。這樣可以與客戶進行
318、更加透明的溝通,對內也能取得真實的研究進展。對外和對內,都要真實?!敝凶C 500 已經是一個擁擠的賽道,有 170 多家管理人,在這樣的市場背景下,圖靈著重全市場指增和滬深 300 指增。滬深 300 和全市場指增的思路比較明確,滬深 300 采取成分內選股的極端方式,能夠做到年化超額 9-10%,在別家機構出現單周 1%回撤時,圖靈的回撤只有 0.1%;全市場指數的市值本就是 50-60 億左右,有一半以上都是 60 億以下的,自然納入了一部分 60 億左右的股票,并可以獲得不錯的彈性?!傲炕ぞ呤且环N實現商業價值的技術手段。并非盲目地追求誰算力最強,誰超額最高,而是尊重客戶需求。這并非在-
319、161-制作奧賽題,沒有標準答案。真正唯一的答案只是客戶是否滿意。在當前社會中,安全性、穩健性和理性預期會逐步變得越來越重要。在這種情況下,經營思路和理念確實應該發生改變。脫離原來銷售理念,現在我們更多的是追求實打實地把資產做好?!痹谕鮼喢窨磥?,當前環境下,可以預測到未來資產和資管將發生巨大顛覆性改變。未來帶給資管的是全新問題,即如何真正意義上創造不是剛兌、定制化資產,甚至是全天候資產。這些目前對資管還有很多挑戰,機構需要在新挑戰上實現自己的價值,這也是圖靈的重點?!岸唐谝幠S肋h會有波動,也許今年增加幾十億,也許下降幾十億,但是公司安全邊際也較高,因為公司人均創收、人均管理規模較高,在這種情況
320、下,我們愿意花費很多耐心研究新產品、新問題、新邊界,短期規模并不重要,這是對未來展望和經營理念,希望在時代中能夠真正解決痛點。在這段時間中,能夠為行業扎實地創造價值?!眻D靈的機構資金占比高達 90%,這些資金更加追求穩定性及信息溝通的透明性。按照客戶的需求行事非常重要,客戶自己選擇的模式可以更好地接受其收益并配置組合風險,機構要做的是保持充分透明的溝通。為了提高溝通效率,圖靈此前甚至會把各個賽道、所有產品的中位數持倉市值直接公布給機構客戶。滬深 300 選擇全成分股的方式也是基于對客戶負責的考慮,若允許 20-30%的部分在滬深 300 以外選股,理論上的長期年化收益會更高,但是目前銀行、保險
321、、券商等機構資金存在的痛點是久期不夠長,因此長期的年化 2%-3%的提升,如果意味著短期最大回撤會因此放大同樣的幅度,那么意義并不大?!?0 年小票跑贏 8 年,拉長后沒有問題。問題在于如果今年考核無法通過,可能投資人就不會持有到我們想要的時間。你與他談論 5 年或者 10 年沒有意義?!睘榱四軌蚋闷ヅ淇蛻粜枨?,圖靈會與客戶進行充分溝通,包括歷史收益及回撤、預期收益及回撤、資金久期等,并依此在自研的流水線因子組合及風控層面進行調整,制定高度定制化的產品。以科創 50 指增為例,圖靈曾接收到了一筆 1 億的券商自營定制單,在持有期內,年化收益 8%左右、最大超額回撤 1%左右。因為基準指數只有
322、 50 只股票,科創 50 指增很難進行風控,“這是因為 Barra 在設計的時候沒有考慮特異性股池,進行回歸時,100 個樣本點或者 200 個樣本點與 5000 個樣本點,最后回歸出來的風險因子的收益率肯定不一樣,有時候甚至因子收益率的方向會相反?!眻D表 圖靈各指增線風控標準全市場3001000小市值業績基準全市場等權指數*滬深 300中證 1000萬得小市值指數成分股占比100%100%40-50%90%持股數量800-1200 只250-300 只800-1200 只800-1200 只換手倍數80-100 倍80-100 倍80-100 倍80-100 倍Barra 風險因子0.3
323、標準差0.2 標準差0.3 標準差0.3 標準差行業偏離3%2%3%3%個股偏離1%0.5%1%1%運行起始時間2022/92023/52023/52023/50303七十二般變化 圖靈的因子構建方法論圖靈的優勢在什么地方?王亞民回答非常干脆直接,“量價的基本功也是非常扎實,因子數量及因子挖掘的流程、效率在行業內都做得不錯?!?162-最早做高頻的時候,王亞民很少與同行見面的,因為高頻更多的是技巧性的東西,很難共享。而中低頻與資管了解市場需求和未來發展方向,以調整研發思路,對于多因子的研究,許多機構諱莫如深,但王亞民的分享充滿著細節。他說最近公司在研究一個新品標的,花費兩個月時間生產了大概 3
324、700 多個因子?!皥D靈因子庫的因子的構造方式有許多種,例如常規高頻 k 線統計算法、偏度、峰度等涉及許多統計算法,不同構造方式當中又存在許多可變化的算法,因而可以用一個比較相似的邏輯構造出上百種不同形式?!崩绺哳l K 線的選擇可以是 1 分鐘/3 分鐘/5 分鐘,偏度選擇上行/下行/全盤,統計時段選擇全天/半天/開盤/收盤,平滑函數選擇 average/min/max,平滑周期選擇 5 天/10 天/20 天,包括大單,有些機構按全年分位數計算,有些機構則按絕對單量計算,存在許多變化的可能性,不能說這是機器的因子,因為大單邏輯或者 K 線偏度邏輯本身具有金融意義,不同單量則有不同信息含量,
325、代表某些具體的交易行為,因此每一個選擇都自有其內在的邏輯意義,具體選擇哪個指標要看測試結果,不能輕易認為 2 萬元訂單為大訂單,實際上 20 萬元或者 200 萬元訂單是最顯著。一個大的邏輯之下會產生許多低相關的因子,這便是考驗算力的時候。當前圖靈量價因子占比 70%-90%,在王亞民看來,信息最終都會在量化當中最終呈現。圖靈目前使用的模型有很多,包括線性模型、決策樹模型、神經網絡模型等,不同模型的策略類型存在差異,但總體更加傾向于高頻。對于日頻以下的頻位段會使用機器學習的方法,在整體偏線性的大模型之下會包括權重不那么高的非線性子模型。0404量化小市值的風險聚集與情景預演“歷史能不能代表未來
326、?算法是不是越復雜越好?魯棒性檢驗該怎么做?”過擬合,量化機構似乎已經極少再去思考這個問題,但王亞民還在思考。目前整個 A 股在使用機器學習算法時,要求這些金融數據的“獨立同分布”屬性。然而目前在實際數據上存在很大的結構化差異。例如,市場長期風格、交易制度、各類投資者占比,尤其是量化交易自身在某些股票區域的占比,都存在很大差異。例如 2017 年前幾乎沒有大量化公司,現在有接近 1 萬億資金每天在交易,即使平均單邊換手 10%、雙邊換手 20%,也即年化 50 倍換手率,那么每天也相當于有 2000 億量化在交易,而這段時間 A 股正常交易額為 6000 億或者 7000 億,其中量化占比就能
327、達到接近 1/3,尤其是在中小盤區域,這個占比可能會達到 40%-50%。對于選股流動性沖擊遠比直觀能看到的要大。當下做量價的會更喜歡中小票,因為中小票的對手方更多的是個人投資者,相對而言博弈的確定性會高很多,而滬深 300、中證 500 所代表的大票越來越難做,在做寬基指增時,若不把選股往后拉,很難獲取 Alpha,但整個投資結構在不斷分化。而這些信號大多數聚焦在中小票上,因此對真實選股流動性沖擊不止如此。在這種情況下,數據與以前結構會發生很大改變?!斑@個形勢終有一天會發生逆轉,我認為這對國內量化會是一個很大考驗。對于個體單位來說,所有做算法交易人都有這種經驗:如果股票已經占據全市場股票日均
328、交易量 5%甚至 10%,算法交易的績效就很難跑贏 VWAP?!蓖鮼喢褡隽艘环蒲荩耗壳?A 股流動性第 2000 到第 4000 這部分區域(接近中證 2000)股票平均交易金額正常情況下約為 5000 萬元,這已經不算太小票,至少不屬于微盤股。如果計算盡量不超過 5%交易額占比,實際上為 250 萬元。如果某量化機構持倉這個區域的 1000 支票,250 萬1000 支票是 25 億。也就是說,要不影響算法交易的績效,該區域的股票一共只能承載 25 億。如果該機構偏小市值的賽道中,有一半的股票屬于該區域,則反算賽道最佳容量只有 50 億。-163-“所以我們面臨如何平倉?”這樣的擁擠問題在
329、量價上面并未很快顯現,擁擠度也并不會立即給出反饋結果,某只股票不斷上漲,擁擠度逐漸升高,不斷購買時反而會不斷推高股價,需要等這個正反饋一直到達極限,再一次性反饋。所以一方面圖靈在利用海外資產集中度比較高的樣本數據做情景預演,同時更加強調因子的平衡性。在極端區間表現極端的因子都不會去采用,雖然它可能在近段時間表現特別好,但是會對它在某些測試區間里表現單獨制定指標進行排除。如果某個因子在某一年表現非常好,其他年份則是報廢的情況,圖靈就不會采用這個因子?!皥D靈更為看重因子的穩定性,此外在組合方法上做好分散。有差異也會有共性,歷史上總會有一些風險在不斷復現?!?164-10穩博投資:模糊的正確與量化的
330、精確10穩博投資:模糊的正確與量化的精確思想的碰撞。投資的直覺。技術的專注。這是穩博投資對于策略誕生的總結。0 01 1思想的碰撞 模糊的正確與思維的演繹同寢室創業,鄭耀和殷陶是量化行業的佼佼者。2014 年,兩人畢業正好趕上 A 股小牛市,聽說炒股挺賺錢的,于是寫點程序、注冊個公司,有了穩博。2015 年從 0 自創高頻交易、統計套利;2018 年疊加深度學習算法;2020 年融合 Alpha 橫截面方法論,2021 年持續創新迭代,成為今日穩博。上下求索,今日方成。在穩博看來,投資策略誕生首先源于思想的碰撞。碰撞來源于不同,今日的穩博在招募各類不同背景的人:海外基金經理、公募基金經理甚至包
331、括經濟學家除此之外,公司每年還會組織多期招募組織訓練營進行交流?!罢心疾煌尘昂头椒ㄓ懻摮鰜砣?,認知才會有所不同,即使是海外大廠也會有截然不同的研究體系,有的講究因子數量和差異性,有的就一兩百個因子講究研究深度,發揮極致。市場變化很快,我們需要尋找新研究方法,不僅是研究某個領域,而是如何進行研究,如何組織到一起工作,這也是公司保持競爭力的核心點?!惫緞撌既肃嵰忉尩?。這種碰撞也牽引著穩博的組織變革。2019 年之前鄭耀和殷陶兩人配合寫策略,手把手帶出第一批人才,穩博就變成了多 PM 架構。但兩人隨后發現,團隊往往朝著同一個賺錢的方向研究,很難橫向拓展到其他高潛方向,而對于機構來說,這是投研儲
332、備工作的必要。因此穩博重組結構,將 Alpha 部分稱為核心組,采用流水線制,由殷陶、鄭耀帶隊,涵蓋國內數據投資先行者與多位人工智能專家。高頻部分則設為多 PM 制,由國際知名量化對沖基金經理、公募明星基金經理、經濟和統計專家共同組成,專注顯著的超額收益實力和策略研究創新。公司策略方面則講究攻守兼備:“在長周期上講邏輯,在短周期上講求機器學習、算法預測?!碑斍?,穩博把因子分為統計性因子和邏輯性因子,其中統計性因子入庫標準為:低頻因子統計時長不低于 10 年,T0 因子統計時長不低于 6 個月,以此兼顧長期歷史有效和當下市場環境有效。邏輯性因子則會檢測每次邏輯成立時,對應的勝率以及極端情況下勝率
333、和表現,因子提交后,在預設時間內通過樣本外數據驗證,統計學上顯著有效,最終被采納,因子通過檢驗時長 1 個月-1 年不等。鄭耀把投資方法分為歸納法和演繹法,量化機構里少見的,2021 年穩博開始招聘經濟學方面人才?!皞鹘y的歸納法有一個弊端,市場上常常發生歷史上未曾出現過的事件,這時候難免遇到策略失效或產生巨大風險點,通過演繹法可以一定程度上緩解該問題,從更加宏觀的視角去看待正在發生的或即將發生的事情?!?165-落足到投研的實際,這批經濟學人才主要為公司提供宏觀因子,同時也會為投研以及風控尋找方向。例如是挖掘中證 1800以內的 Alpha,還是挖掘價量 Alpha。偏基本面還是更偏向公司治理,偏微觀還是宏觀,判斷市場資金偏成長還是價值,判斷下一步應該研究哪個方向更容易成功。也有機構招聘主觀類研究員或基金經理,但主要方式為自下而上挖票,穩博更多是從上至下的研判。鄭耀通過大量例子來說明這個問