機構行為視角下的債券交易領先因子探尋與神經網絡收益率預測

機構行為視角下的債券交易領先因子探尋與神經網絡收益率預測
2024年10月22日 16:29 市場資訊

  摘   要

  機構行為研究對債券投資交易策略制定及風控具有重要意義。本文主要分析了機構投資者在債券市場中的交易行為及其對市場動態的影響。利用中國外匯交易中心的日頻現券交易數據,本文首先識別了機構投資者的交易偏好,隨后通過測算交易勝率來評估其市場預測能力。最后,本文構建了基于神經網絡的預測模型,輸入現券交易數據,對債券收益率變動進行預測。研究結果不僅為理解機構行為提供了新的視角,也為債券投資者制定投資策略和防范風險提供了一定參考。

  關鍵詞

  債市機構行為 現券交易領先指標神經網絡債券收益率預測

  引言

  機構投資者憑借其規模優勢、信息獲取能力以及高效的信息處理能力,在資本市場中扮演著日益重要的角色。在債券市場中,這一現象尤為顯著,因為機構投資者是市場流動性的主要提供者和交易的主導力量,所以機構行為已成為債市的關鍵觀察指標。機構投資者的交易策略、風險偏好和市場預期等行為特征,對債券收益率曲線、市場流動性以及價格發現機制都有著深遠的影響。過去,受限于交易明細數據的可得性,相關研究通常依賴于月頻的托管數據,時間相對滯后。隨著金融科技的發展和市場基礎設施的完善,現券交易數據的顆粒度得到提升,使得市場對機構行為的研究越來越精細和深入。本文主要依據中國外匯交易中心發布的日頻現券市場交易數據,首先通過對債市參與機構凈買入數據的分析,把握機構的投資交易行為偏好;其次對機構的交易勝率進行測算,進而探尋部分機構行為領先因子;最后在機構交易數據的基礎上運用神經網絡模型對債市收益率的變動進行預測,以期在債券投資上能提供一些有益的參考。

  銀行間債券市場參與機構交易行為概覽

  我國的債券市場主要分為銀行間市場和交易所市場。根據中國人民銀行數據,截至2024年6月末,銀行間市場債券托管規模約為144萬億元,占比達87.5%。銀行間市場依然是債券交易的最主要場所,因此本文主要依據現券交易日報對銀行間市場的機構交易行為進行分析。

  現券交易日報數據包括機構、交易日期、債券期限、券種和凈買入規模五個維度。機構主要包括12類,分別是國有大行/政策性銀行(以下簡稱“大行”)、股份行、城商行、農商行、外資行、券商、基金、貨幣基金、保險、理財、其他產品1和其他機構2

  從各機構凈買入數據可見,銀行間市場上的凈買入機構和凈賣出機構劃分整體較為穩定。凈買入機構主要包括農商行、基金、理財、保險、其他產品、其他機構和外資行,凈賣出機構主要包括股份行、城商行和券商(見圖1)。大行和貨幣基金凈買入穩定性較弱。凈賣出機構主要受到其在一級市場認購、二級市場分銷的影響,因此呈現出持續的凈賣出行為,對分析該類機構的真實交易偏好有所干擾。下文集中在對凈買入規模較大的主要凈買入機構的分析上,具體包括農商行、基金、理財、保險和其他產品,其他機構由于2022年中口徑發生變化暫不考慮。

  各機構交易行為偏好原因分析

  機構行為偏好背后的根源是負債來源,同時疊加了監管約束和考核機制不同的影響,因此本文著重從負債角度分析機構行為偏好原因。各機構分券種及特定券種分期限平均買入量占比請見圖2、圖3、圖4。按現券交易日報分類,券種分為國債、政策性金融債(以下簡稱“政金債”)、地方政府債、中票、短融、超短融、企業債、資產支持證券、其他和同業存單。為便于分析,本文將中票、短融、超短融、企業債、資產支持證券和其他統一歸類為信用債。

  (一)農商行

  分券種來看,農商行偏好買賣國債、政策性金融債和同業存單。具體到期限,國債主要偏好10年期和30年期,政策性金融債偏好10年期。從負債角度看,銀行的負債以存款為主,規模相對穩定,通過同業存單等方式也可以快速補充。此外,銀行受資本充足率及流動性比率的約束比較大。較為穩定的負債以及對高度安全性的追求對銀行的債券資產配置特點有所影響。一方面,銀行自營風險偏好較低,更多配置資本占用少的利率債及流動性較好的同業存單;另一方面,銀行的債券資產規模較大,并且大部分是持有至到期賬戶,需要配置長久期的債券獲取票息收益。

  (二)基金

  分券種來看,基金偏好政策性金融債和信用債。具體到期限,政策性金融債10年期買入占比最高,信用債以3年期及以下的短久期券種為主,其次是10年期及以上的長期和超長期券種。從負債角度看,基金以債券型基金的占比最高,債券基金的資金來源主要是機構投資者,尤其是銀行自營和保險。因此,基金的負債穩定性相對較弱,對流動性和相對收益的要求較高,決定了基金需要通過加杠桿、拉久期和資質下沉等策略提高收益水平,在市場上更多表現為交易型資金。體現在債券資產配置上,基金需要更多地配置絕對收益較高的信用債;利率債方面,由于其他機構投資者通過基金投資政策性金融債的利息收入具有免稅效應,因此利率債投資以政策性金融債為主。久期上,資本利得是相對收益的重要來源,因而多選擇交易長久期的利率債,信用債則在綜合考慮風險收益的情況下多選擇短久期,長期和超長期信用債多為其他類信用債(含銀行二級資本債)。

  (三)理財

  分券種來看,理財偏好信用債和同業存單。具體到期限,信用債以3年期及以下短久期為主。從負債角度看,理財的資金主要來源于個人投資者,風險偏好較低,對虧損的容忍程度一般,一旦發生破凈就傾向于選擇贖回。另外,對相對收益的考核要求也影響了理財的債券資產配置。理財需要投資絕對收益較高的信用債和同業存單,考慮到流動性和控制回撤,久期上多選擇中短久期。

  (四)保險

  分券種來看,保險在地方債、國債、信用債和同業存單上的買入較為平均。具體到期限,政府債以超長期為主,信用債以10年期和超長期占比最高。從負債角度看,保險的資金主要來源于壽險的保費收入,負債期限長,穩定性強,收益要求高于存款和短久期資管。因此,資產配置上,保險會選擇長期和超長期品種,在兼顧流動性和收益的情況下對利率債和信用債均衡配置。

  (五)其他產品

  分券種來看,其他產品同基金和理財一樣,信用債占比最高,利率債占比則介于基金和理財之間。具體到期限,類似于基金和理財,其他產品的信用債也是3年期及以下期限占比最高,超長期信用債占比高于基金和理財,利率債主要偏好長久期。從負債角度看,以券商資管為例,過去由于資管新規的影響,券商資管的通道業務迅速下降,存量規模呈下行趨勢,但在2024年4月打擊手工補息后,存款資金部分流向券商資管,這部分資金對流動性和相對收益率要求較高,資產配置上對超長信用債的需求也更大。

  機構交易勝率測算和領先因子探尋

  (一)機構交易勝率測算

  為衡量各類機構在債市交易表現如何,本文引入勝率這個指標。勝率的定義為:若買入后若干交易日期間利率下行,或賣出后若干交易日期間利率上行,則計為一次成功操作,反之則反。由于信用債收益率變動的趨勢基本與利率債一致,因此本文以主要利率債交易品種10年期國債為例按年份進行交易勝率測算。機構的二級市場交易行為變動對債券收益率的影響可能更偏短期,中長期的利率走勢或更多與宏觀經濟基本面有關,因此本文主要測算短期交易勝率,測算區間分別選擇5個交易日(見圖5)和10個交易日(見圖6),勝率按年份進行統計,2021年從7月初起算,2024年截至6月末。

  通過前述對機構的交易勝率的測算,本文發現,測算區間為5天時,機構交易勝率相對分化較大,基金的勝率相對偏低。這可能和基金的交易風格有關,基金的杠桿操作使其傾向于動量交易,容易出現超買和超賣的現象,短期內或放大收益率波動,導致市場情緒出現反轉。除基金外其余主要買入機構的勝率基本在50%以上,一方面意味著各機構能識別和利用市場機會,另一方面可能也和機構投資風格相對穩健有關。

  當測算區間調整為10天時,各主要買入機構的勝率分化現象有所收斂,包括基金在內的主要買入機構的勝率基本在50%以上,顯示在該區間內,基金的動量交易的收益或更加穩定。另外也在一定程度上說明,買入機構總體上可以對市場短期趨勢進行有效識別,通過機構交易數據的挖掘,能夠發現債市趨勢或反轉信號,從而輔助進行交易決策。

  (二)領先因子探尋

  債券收益主要有以下兩種來源:一是票息收入,二是資本利得。拉長久期和加杠桿是可以放大以上兩種來源的工具。久期越大,杠桿越高,可以獲得的票息收入越多,資本利得的波動也越大。因此,在利率下行階段,機構通常使用拉長久期和加杠桿來增厚收益。通過分析二級市場的現券交易數據,我們可以對久期和買賣強度進行測度。這些指標不僅有助于評估市場交易情緒,還能為預測未來債券收益率的走勢提供重要參考。

  因此,針對久期以及買賣強度,本文主要觀測3個因子:一是長久期債券交易活躍度,主要以各機構10年期以上國債的買入量占所有國債買入量的比重作為衡量活躍度的觀測指標;二是買賣強度,凈買入量較大實際上代表了機構的買入強度高,短期情緒較好;三是經久期調整的買賣強度,由于考慮到機構合計凈賣出會使得加權久期產生誤導性的結果,因此本文采用各期限債券久期的總量度量,即使用各期限的債券凈買入量與相應久期相乘之和。它顯示了在一定時期內,投資者傾向于購買哪些期限的債券,以及這種傾向的強度。相較長債交易活躍度,該因子考慮了機構偏謹慎時短久期策略的運用以及買入的強度;相較買賣強度,該因子考慮了久期的影響,整體來看結合了前兩者的優點。在當前債券中樞整體下行的背景下,市場更為關心階段反轉的信號,而市場情緒的演繹更易由交易型資金來主導。因此本文以基金為例檢驗3個因子與30年期國債收益率的關系(見圖7)。為便于觀察,本文對3個因子進行了等比縮放處理。

  可以發現經久期調整的買賣強度因子(因子3)與買賣強度因子(因子2)的走勢較為一致,并且通常對因子2的極值有放大的作用,能夠更好反映市場情緒的極端變化。根據歷史數據規律,極值的定義為最近3個月內因子的絕對值達到最大并且超過近3個月均值的3倍。因子1對債券收益率變動方向有一定指示作用,但在收益率快速下行階段表現可能會有所鈍化,無法準確反映市場情緒的極端變化。綜合而言,因子3對市場情緒的反應更為靈敏,當因子3處于極大值時,通常意味著當前市場的樂觀情緒達到極致,利率到達階段低點,短期內收益率多有上行;因子3處于極小值時,短期內收益率延續上行趨勢或進入震蕩行情。對這個規律的解釋可能有以下幾點:一是前期基金積累了較多的浮盈,市場的微小變動容易引發止盈情緒的快速增加,可以看到極小值通常跟隨著極大值出現;二是基金對組合久期的快速調整可能顯示資金面有所收斂、政策風險加大或基本面出現改善跡象,基金交易的靈活性使其具有一定領先性;三是基金的大量賣出代表市場恐慌情緒較重,短期內由于慣性驅使會繼續上行。

  盡管因子3能為我們指示某些時段內的市場動向,但其局限性也不容忽視,如因子對時間窗口具有敏感性,以及單因子難以反映市場的多重影響。為了增強預測的魯棒性并捕捉更全面的市場行為,我們進一步采用更為前沿的方法——基于現券交易數據的神經網絡模型。

  基于現券交易數據的神經網絡模型預測債券收益率變動

  傳統的債券收益率預測方法,如時間序列分析、回歸模型等,雖然在一定程度上能夠捕捉到收益率的變化趨勢,但它們往往受限于模型的線性假設,難以充分捕捉市場數據的非線性特征和復雜動態。隨著人工智能技術的發展,尤其是神經網絡算法在金融領域的應用日益廣泛,為債券收益率的預測提供了新的思路和工具。神經網絡是一種強大的非線性模型,能夠通過學習大量歷史數據中的復雜模式和關系,對債券收益率的變動進行建模和預測。通過構建適當的神經網絡架構,可以有效地處理和分析歷史機構凈買入數據和國債收益率數據,從而探索機構行為對債市收益率的影響。

  (一)模型原理

  神經網絡模型(見圖8)通常可以分為輸入層、隱藏層和輸出層,其中隱藏層和每個隱藏層中的神經元數目均可以有多個。為了尋找輸入數據X和真實數據Y之間的關系,需要初始化輸入層到隱藏層神經元的權重和偏置,再經過非線性函數激活、加權求和,最終到達輸出層。由于激活函數是非線性,使得模型可以描述X和Y之間更復雜的關系。此時模型輸出的Y’和真實數據Y尚存在差距,這個差距會通過目標函數來衡量,目標函數越小,代表Y’越接近于Y。之后,模型根據設置的學習率不斷迭代更新初始權重和偏置,并采用隨機梯度下降算法求解目標函數局部最小值,即達到對Y的最優預測。

  (二)數據預處理

  具體數據選擇上,本文的輸入數據主要使用當日(t日)和歷史的國債收益率曲線,以及各機構國債的凈買入數據,期限選擇上包含短期、長期和超長期,以涵蓋久期變化的信息,輸出為預測期10年期國債收益率變動。國債收益率來源于萬得(Wind)數據庫,凈買入數據來源于中國外匯交易中心。根據前述機構行為偏好分析以及調參驗證,最終本文的歷史國債收益率曲線選擇10日前(t-10日),期限包括1年期、10年期和30年期,預測期選擇10日后(t+10日),機構選擇農商行、保險和基金。考慮到數據量與市場條件的平衡,本文做了兩組訓練,組一訓練區間選擇2021年7月—2023年12月,回測區間為2024年1—6月;組二訓練區間為2021年7月—2024年3月,回測區間為2024年4—6月。另外,由于近兩年處于債券利率下行期,債券收益率數據存在漲跌分布不均的問題,會影響模型預測的魯棒性。本文對訓練數據做了均衡化處理,在目標函數里對收益率向上和向下分別賦予不同的權重以應對該問題。

  (三)模型構建和預測結果

  模型構建上,本文根據訓練數據實際情況對神經網絡模型做了適應性調整。一是根據數據量選擇適合的層數和神經元個數以防止過擬合;二是模型激活函數根據任務性質選擇了Sigmoid非線性函數,解決了階躍函數在0點無偏導數的問題;三是在目標函數中加入了正則項,以提高數值穩定性和模型的泛化能力。

  訓練過程中,本文首先嘗試了不同的模型參數的初始化方法,發現區別不大,選擇比較常見的對稱區間均勻隨機取值,避免程序收斂不穩定的問題;其次,對于參數的更新采用Adam方法,有助于調整不同參數的學習率,加速收斂并減少震蕩;最后,對于訓練的次數,本文發現數值越大一定程度上越收斂,通過多次隨機來增強模型穩定性,提高準確度,而訓練次數較少則容易陷入局部最優的困境。

  通過上述模型預測10天后國債收益率,結果如圖9所示,組一回測區間的最優準確率達到64%,組二達到75%,并且對于上行樣本和下行樣本的預測準確率均達到60%以上,表明模型具有一定的預測能力和穩定性,能夠在不同市場條件下提供相對一致的預測,也說明機構交易行為可能對短期內國債收益率的變動具有領先性。

  兩組回測準確率的差異主要有以下幾點:一是時間跨度不同的影響,組一回測區間的時間跨度更長,可能包含了更多的市場變化和不確定性,對模型的學習和泛化能力提出了更高的要求;二是組二訓練區間更長,可能捕捉到了市場的新趨勢;三是組一回測區間包含了收益率快速下行階段,組二回測區間收益率呈震蕩走勢,或表明組二的訓練模型在識別震蕩期間的短期變動方面更為出色。

  除了準確率之外,本文進一步采用精確度和F1分數對模型的預測性能進行了綜合評估。其中,精確度指的是模型預測收益率上行/下行的樣本中實際上行/下行的概率,F1分數則是準確率和精確度的調和平均數。由于F1分數綜合考慮了精確度和準確率兩個方面,避免了單一指標可能帶來的問題,因此對模型性能的衡量更加全面。分析結果表明,模型對收益率上行和下行的預測精確度均達到60%以上,組二的預測精確度高于組一,體現出和準確率類似的特征。其中模型對下行趨勢的預測表現更好,其精確度略高于上行情況。同樣,模型的F1分數也高于60%(見圖10)。這些指標的一致性表明了模型在不同市場變動下具有一定的穩健性。

  總結

  本文首先從負債、監管約束和考核機制等角度簡要分析了主要凈買入機構的券種和期限偏好。一方面,特定機構在特定期限券種上的定價權更大,偏好分析有助于明確特定期限的主要影響機構,在投資分析中抓住重點,在相應期限券種的交易上準確跟蹤影響力較大的機構行為趨勢和變化,并作出相應判斷;另一方面,不同機構的交易風格不一,負債端更穩定的機構是市場中配置型資金的主要來源,市場情緒的演繹更易由交易型資金來主導,偏好分析為選擇合適的市場情緒觀測機構奠定了基礎。

  其次,機構的短期交易勝率的測算結果一方面反映出機構能夠識別短期債市趨勢;另一方面機構的交易偏好變化一定程度上預示著市場情緒和預期的變化,通過挖掘交易數據信號,有助于投資者預測市場動向。在此基礎上,本文構造經久期調整的買賣強度因子,綜合考慮了久期和買入強度這兩個關鍵指征,發現基金的該因子極大值和極小值對判斷債券收益率階段底部和上行趨勢是否結束有一定的領先意義。需要注意的是,機構行為的影響主要作用于短期,在基本面、資金面和債市供需未出現較大變化的情形下,交易型資金采取跟隨策略較好,配置型資金則可以在因子極小值出現后逐步介入。

  最后,為緩解單個因子存在的局限性和更全面地反映各主要機構交易行為的綜合影響,本文采用更為前沿的方法神經網絡模型研究了機構交易數據和收益率變動之間的關系。結果顯示神經網絡模型具有一定的預測能力和穩定性,對上行樣本、下行樣本以及不同的市場條件均有較高的準確率和精確度。模型的預測結果一方面可以幫助投資者識別市場趨勢,作為投資時機選擇和優化資產配置的參考,從而提高短期投資回報;另一方面也有助于投資者更好地管理投資組合的風險,比如通過調整久期或使用衍生品進行對沖。需要注意的是,受限于訓練數據的樣本量,模型的泛化能力、準確率以及精確度仍有提升空間。后續研究可以從以下幾個方面開展,一是通過引入更多數據和市場情景,豐富訓練集多樣性,提高模型的適應性;二是本文主要考慮了微觀因素的影響,未來可通過加入高頻宏觀數據,進一步提高模型的預測能力;三是加強對收益率變動幅度的預測,以更好地助力投資決策。

  注:

  1.其他產品包括證券公司的資產管理業務、信托公司的金融產品、企業年金、期貨公司的資產管理產品、其他投資產品、社保基金、養老基金。

  2.其他機構包括財務公司、信托投資公司、民營銀行、資產管理公司、金融租賃公司、期貨公司等。

  參考文獻

  [1]傅雄廣,侯國棟. 金融機構視角下的債券收益率影響因素與市場機制[J].金融市場研究,2022(4).

  [2]類承曜,陳禮清. 中國債券市場的可預測性和分割性研究[J].經濟理論與經濟管理,2021,41(1).

  [3]潘水洋,劉俊瑋,王一鳴. 基于神經網絡的股票收益率預測研究[J].浙江大學學報(理學版),2019,46(5).

  [4]王瓊. 基于切比雪夫正交基神經網絡的中國十年期國債收益率預測[J].甘肅金融,2020(4).

  [5]朱瑩瑩. 債券市場行為短期化的成因及影響分析[J]. 債券,2022(4). DOI: 10.3969/j.issn.2095-3585.2022.04.019.

  ◇ 本文原載《債券》2024年9月刊

  ◇ 作者:南京銀行資金運營中心 鄧露

  ◇ 編輯:丁杭超 鹿寧寧

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:趙思遠

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 10-25 健爾康 603205 --
  • 10-22 科拜爾 920066 13.31
  • 10-21 強達電路 301628 28.18
  • 10-18 拉普拉斯 688726 17.58
  • 10-18 科力股份 920088 7.32
  • 新浪首頁 語音播報 相關新聞 返回頂部