基于機器學習算法的債券流動性預測

基于機器學習算法的債券流動性預測
2024年08月23日 16:30 市場資訊

  摘   要

  對投資者而言,標的資產的流動性變化對制定投資策略、防控風險具有重要意義。本文主要關注債券在未來一段時間的流動性,創新性地融合先驗知識,使用債券的動靜態特征信息,訓練出可解釋的概率分層決策鏈模型,實現對流動性的預測。此外,本文提出基于投資組合的未來流動性分數指標,實現在不同投資組合之間的流動性排序,并可以觀測在連續時間窗口下的未來流動性的變化。資產管理人也可對不同流動性等級的債券設置變現比例,根據債券當日市值完成對資產組合的可變現金額測算,進一步提升流動性管理能力。

  關鍵詞

  債券流動性 債券組合流動性 機器學習 貝葉斯統計

  引言

  從債券市場看,較好的流動性是指在合理的價格范圍內有大量債券可供交易,且大額交易不會對價格造成較大沖擊。從投資者角度看,較好的流動性意味著債券可以合理的價格迅速變現。預測未來流動性,可以提前測算債券資產的可變現比例,對做好資金流動性規劃有一定作用。

  受限于債券的發行主體、方式、規模、產品條款、投資者特征等多重因素,傳統的基于人工預測流動性的方法缺乏時效性和智能化,也無法及時捕捉到市場的動量信息和非線性規律。近年來隨著機器學習的發展,市場開始引入復雜模型來預測流動性,但無法直接結合先驗知識。雖然不同債券流動性的差異較大,但存在一定的共識,即研究人員普遍認為信用債流動性弱于利率債。如果把這些先驗知識融入機器學習模型,將大大提高預測模型的精度和可信度。

  在預測流動性過程中,結果的可解釋性非常重要。傳統機器學習模型雖然精度較高,但缺乏可解釋性。像XGBoost等內部黑盒的模型無法直接被人類理解,即使給出預測值,預測邏輯也未知。

  資產管理領域中,以債券資產為主的投資組合較為常見。除組合收益率外,組合流動性量化也值得研究。如果我們對市場中所有存續債券的未來流動性進行量化,將預測結果映射到任意債券投資組合中,計算出綜合流動性量化分數,便可比較不同的投資組合,為流動性風險定價提供實證依據。

  基于上述挑戰,本文對債券流動性預測提出新的解決方案,結合專家經驗設定可變現比例,對投資組合的可變現能力進行量化。創新點有三方面:一是構建清晰可解釋性的決策模型,二是動態調整預測模型,三是建立投資組合流動性評價能力模型。

  流動性預測基本模型

  (一)問題定義與預處理

  度量債券流動性的指標一般包括即時性、寬度、深度。即時性是指一定時間內的成交量;寬度是指買賣價差,買賣價差越小,流動性越好;深度指標一般使用換手率,即債券在一定規模下的成交量大小。

  買賣價差數據獲取難度較大,寬度被排除。新債和老債的換手率閾值不同,無法統一比較。成交量可以綜合判斷債券流動性,成交量越高,流動性越大。基于上述原因,本文將以即時性作為衡量流動性的維度,用未來30天的日均成交量作為流動性能力的度量指標,即模型的目標變量(Y)。

  個券的特征(X)分為靜態特征和動態特征。靜態特征主要是債券的自有屬性,比如資產類別、發行場所、付息方式等。動態特征是會隨時間變化的特征,比如信用評級、存續期限、過去30天交易量、到期收益率等。類別型數據無法直接入模,在此我們根據專家經驗做預處理,轉化為數值型數據(見表1)。對于缺失特征的個券,我們的填充策略是使用眾數進行填充。處理完輸入特征數據后按照對應的時間關聯個券未來30天的日均成交量,形成完整的數據集。

  (二)模型介紹

  遞減規則列表模型(FRL)是一種監督預測模型,可用于預測個券未來的流動性。該模型由Futong Wang和Cynthia Rudin于2015年提出,類似一棵向右生長的二叉樹,優點是可以學習到與人工經驗類似的評價方式。先用關聯分析的方法來挖掘規則,形成規則池,接著使用貝葉斯方法在規則池中挑選后驗概率最大的規則,可以產出預測結果的規則列表。

  (三)模型產出

  FRL模型結構和專家的判斷邏輯非常相似,對于債券的流動性預測模型,先構造出歷史訓練集。債券的流動性(Y)使用未來30天的日均成交量描述,相關債券特征(X)包括存續期限、發行方式、資產類別等。訓練完FRL模型結構如圖1所示。

  為展現訓練好的模型預測邏輯,以下對單個債券樣本的預測路徑進行描述。假設當天有1只剩余期限為1年且私募發行的信用債,經過圖1的二叉樹,第一層規則判斷的是債券的剩余期限,該債券的剩余期限為1年,不滿足規則的閾值(小于6個月),因此自動落入第二個判斷節點來預測發行方式。該債券屬于私募發行,不滿足第二層判斷規則,因此繼續落入右邊子節點,進行第三層的判斷邏輯,即資產類別。該債券屬于信用債,不屬于同業存單或者利率債,繼續落入右邊子節點,也就是模型的葉子節點,得到了最終的流動性分數。

  實證研究

  本文將對常配置的債券類投資組合進行分析,以展示如何對組合型資產的可變現能力進行預測。

  (一)數據處理與模型訓練

  數據選取市場中未到期的債券樣本,并加工動靜態特征。按照表1的編碼方式,將類別型特征轉換為數值型特征,并對缺失特征進行填充,確保數據的準確性和一致性。

  建模階段,對于時序類數據,按照前后的時間窗口來劃分訓練集和測試集,確保無數據穿越問題。將訓練集輸入FRL模型,生成模型的預測成交量。訓練集選擇2023年8月24日—11月24日期間的存續債券,目標變量是債券未來流動性(即時性指標)。基于專家經驗,如果日均成交量大于100手,則認為債券流動性較強,并標記為1,否則為0。特征方面則是當日可以獲得的債券信息。

  得到個券未來30天的流動性預估分數之后,將其映射為3個等級(0~2),轉化為多分類模型,展示債券之間的相對流動性。具體規則如表2所示,預測分數越大代表流動性越好。

  (二)模型預測

  模型訓練結束后在測試集上進行評價,以2023年11月25日—12月25日為測試集時間窗口,用訓練好的模型對存續的104萬樣本進行預測,并轉化為預測的流動性等級。真實的流動性等級根據專家經驗設置,小于100手等級為0,在100手至10000手之間等級為1,大于10000手等級為2(見表3)。本文使用機器學習模型常用的準確率、召回率、精確率這3個指標來評價:

  a.準確率是預測正確的個券樣本數/全部的樣本數;

  b.召回率是根據上述3個得分來單獨計算,每個分數檔的召回率=該分數檔下預測正確的樣本數/真實為該分數檔的樣本數;

  c.精確率是根據上述3個得分來單獨計算,每個分數檔的精確率=該分數檔下預測正確的樣本數/預測為該分數檔的樣本數。

  測試集中預測準確的樣本有87萬只,準確率為83.3%。

  FRL模型在高流動性和低流動性的債券組中召回率較高。在低流動性債券中的精確率最高,說明模型在預測低流動性債券中效果較好。

  對預測出的各流動性等級下的債券,計算不同屬性下每個債券池中的平均交易量,記為交易活躍度指數(單位為萬手),數值越大,代表流動性越強。

  如表4所示,各維度的統計結果表明預測的流動性等級越高,真實的平均交易量越高。且滿足市場對債券流動性的共識,比如利率債的交易活躍度明顯高于信用債,公募債的交易活躍度顯著高于私募債,隨著存續期限的增加交易活躍度降低。從到期收益率來看,高流動性組中收益率在[2%,3%)的債券交易活躍度最高。此外,債券市場上永續債的交易活躍度指數高于非永續債,因為永續債大都為信用風險低的金融永續債,整體上交易較活躍。

  表5、6、7分別展示3個流動性組中部分債券樣本。在每個流動性等級池中,公募發行、存續時間在6個月以下的債券更活躍。中低流動性組中,非利率債、永續債較活躍;高流動性組中,利率債、非永續債較活躍,到期收益率分布穩定,信用評級較高。歷史流動性對未來流動性的影響也較大,一般過去流動性越好,未來流動性也會越高。如債券7與債券10,基本屬性類似,均為公募發行且存續期限在6個月以下的利率債,到期收益率的差異較小,但過去流動性差距較大,模型及時抓住該動態信息并反饋到最終的流動性等級分類中。

  (三)預測結果的應用

  1.個券的流動性評價

  對模型預測的個券流動性等級,按照流動性等級0~2來分組分析。如果發現有潛在流動性風險,則可以參考模型預測的未來流動性排名來進行處置。

  2.債券投資組合的流動性評價

  本文提出3個指標評價債券組合的流動性。一是基于算術平均的未來流動性綜合分數(FLI)。二是基于市值加權的未來流動性綜合分數(WFLI)。三是基于持倉金額的可變現金額(RA)。具體的計算公式如下:

  (1)FLI:

  ranki,其中ranki代表第i個債券的流動性等級排名,n為債券個數。

  (2)WFLI:

  wi×ranki,其中wi代表第i個債券的市值在投資組合中的權重,ranki代表第i個債券的流動性等級排名,n為債券個數。

  (3)RA:

  valuei×ri,其中valuei代表債券投組對第i個債券的持倉市值,ri代表第i個債券的可變現比例,n為債券個數。

  FLI的范圍為0~2,WFLI的范圍為0~2。RA的范圍為

  valueirmin代表最小可變現比例)。3個指標的數值越大,代表組合的流動性越好。

  valuei×rmin~

  基于FRL模型的預測結果,可以預測個券在未來流動性的等級。設置對應的可變現比例并計算債券資產組合的可變現金額。依據專家經驗,對流動性等級為0、1、2的債券分別設置為0.3、0.6、0.9。

  對表8的債券投資組合進行流動性指標計算,FLI為1.25,WFLI為1.5,RA為6600萬元,占總市值的66%。

  3.投資組合之間的流動性矩陣

  應用上述FLI可以對投資組合的流動性進行比較。每個債券投資組合的FLI范圍為0~2,由于個券的屬性每天變化,可從橫向和縱向兩個角度來觀測債券投資組合的未來流動性變化,形成觀測矩陣。

  表9展示債券投資組合的未來流動性觀測矩陣,橫向角度可以看到在某一時間段下不同債券投組的FLI。縱向上,可以觀測同一債券組合的未來流動性變化,比如債券投組1的未來流動性先下降后上升。此外,還計算了在特定時間窗口下投組的平均值和標準差,比如債券投組4在2023年12月1日至12月4日的平均流動性最高;但是債券投組3的流動性標準差最低,說明該組合流動性比較穩定。

  結論與展望

  本文基于可解釋的機器學習模型和專家知識,形成評價債券投資組合的FLI,加權WFLI和可變現金額RA。從橫向和縱向角度,對不同債券投資組合進行評價,為投資者提供了債券資產及其組合的流動性風險管理依據,對自營業務、資管業務均具有借鑒意義。未來可進一步優化模型層。FRL模型雖然可解釋性較好,但是規則限制性較強, 可以加強對交叉規則的挖掘,對不同流動性債券進一步細分。

  參考文獻

  [1]焦健,張雪瑩. 債券違約對流動性影響的傳染效應研究[J]. 證券市場導報,2021(1).

  [2]王振瀚、唐瀚明,投資視角看信用債流動性“潮汐”——對券種、信用資質和期限的流動性分析[EB/OL]. https://h5.drcnet.com.cn/docview.aspx?version=finance&docid=7376621&leafid=15102&chnid=3945.

  [3] 趙洋. 交易所國債市場流動性影響因素的實證研究[J]. 生產力研究,2009(3).

  [4]周舟、李鴻禧, 我國國債市場流動性影響因素研究(上篇)[EB/OL].https://www.sohu.com/a/472844599_121123914.

  [5]Wang F, Rudin C. Falling rule lists [C]. Artificial intelligence and statistics. PMLR, 2015.

  ◇ 本文原載《債券》2024年7月刊

   ◇ 作者:螞蟻集團信貸事業群何悅 王海洋 王一博 李天明

  ◇ 編輯:高蘭蘭 陳森 鹿寧寧

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:趙思遠

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時

  • 08-26 富特科技 301607 14
  • 08-23 速達股份 001277 32
  • 08-23 益諾思 688710 19.06
  • 08-20 成電光信 920008 10
  • 08-19 佳力奇 301586 18.09
  • 新浪首頁 語音播報 相關新聞 返回頂部