机构行为视角下的债券交易领先因子探寻与神经网络收益率预测
- 体育
- 2024-10-22 17:06:09
- 360
摘 要
机构行为研究对债券投资交易策略制定及风控具有重要意义。本文主要分析了机构投资者在债券市场中的交易行为及其对市场动态的影响。利用中国外汇交易中心的日频现券交易数据,本文首先识别了机构投资者的交易偏好,随后通过测算交易胜率来评估其市场预测能力。最后,本文构建了基于神经网络的预测模型,输入现券交易数据,对债券收益率变动进行预测。研究结果不仅为理解机构行为提供了新的视角,也为债券投资者制定投资策略和防范风险提供了一定参考。
关键词
债市机构行为 现券交易领先指标神经网络债券收益率预测
引言
机构投资者凭借其规模优势、信息获取能力以及高效的信息处理能力,在资本市场中扮演着日益重要的角色。在债券市场中,这一现象尤为显著,因为机构投资者是市场流动性的主要提供者和交易的主导力量,所以机构行为已成为债市的关键观察指标。机构投资者的交易策略、风险偏好和市场预期等行为特征,对债券收益率曲线、市场流动性以及价格发现机制都有着深远的影响。过去,受限于交易明细数据的可得性,相关研究通常依赖于月频的托管数据,时间相对滞后。随着金融科技的发展和市场基础设施的完善,现券交易数据的颗粒度得到提升,使得市场对机构行为的研究越来越精细和深入。本文主要依据中国外汇交易中心发布的日频现券市场交易数据,首先通过对债市参与机构净买入数据的分析,把握机构的投资交易行为偏好;其次对机构的交易胜率进行测算,进而探寻部分机构行为领先因子;最后在机构交易数据的基础上运用神经网络模型对债市收益率的变动进行预测,以期在债券投资上能提供一些有益的参考。
银行间债券市场参与机构交易行为概览
我国的债券市场主要分为银行间市场和交易所市场。根据中国人民银行数据,截至2024年6月末,银行间市场债券托管规模约为144万亿元,占比达87.5%。银行间市场依然是债券交易的最主要场所,因此本文主要依据现券交易日报对银行间市场的机构交易行为进行分析。
现券交易日报数据包括机构、交易日期、债券期限、券种和净买入规模五个维度。机构主要包括12类,分别是国有大行/政策性银行(以下简称“大行”)、股份行、城商行、农商行、外资行、券商、基金、货币基金、保险、理财、其他产品1和其他机构2。
从各机构净买入数据可见,银行间市场上的净买入机构和净卖出机构划分整体较为稳定。净买入机构主要包括农商行、基金、理财、保险、其他产品、其他机构和外资行,净卖出机构主要包括股份行、城商行和券商(见图1)。大行和货币基金净买入稳定性较弱。净卖出机构主要受到其在一级市场认购、二级市场分销的影响,因此呈现出持续的净卖出行为,对分析该类机构的真实交易偏好有所干扰。下文集中在对净买入规模较大的主要净买入机构的分析上,具体包括农商行、基金、理财、保险和其他产品,其他机构由于2022年中口径发生变化暂不考虑。
各机构交易行为偏好原因分析
机构行为偏好背后的根源是负债来源,同时叠加了监管约束和考核机制不同的影响,因此本文着重从负债角度分析机构行为偏好原因。各机构分券种及特定券种分期限平均买入量占比请见图2、图3、图4。按现券交易日报分类,券种分为国债、政策性金融债(以下简称“政金债”)、地方政府债、中票、短融、超短融、企业债、资产支持证券、其他和同业存单。为便于分析,本文将中票、短融、超短融、企业债、资产支持证券和其他统一归类为信用债。
(一)农商行
分券种来看,农商行偏好买卖国债、政策性金融债和同业存单。具体到期限,国债主要偏好10年期和30年期,政策性金融债偏好10年期。从负债角度看,银行的负债以存款为主,规模相对稳定,通过同业存单等方式也可以快速补充。此外,银行受资本充足率及流动性比率的约束比较大。较为稳定的负债以及对高度安全性的追求对银行的债券资产配置特点有所影响。一方面,银行自营风险偏好较低,更多配置资本占用少的利率债及流动性较好的同业存单;另一方面,银行的债券资产规模较大,并且大部分是持有至到期账户,需要配置长久期的债券获取票息收益。
(二)基金
分券种来看,基金偏好政策性金融债和信用债。具体到期限,政策性金融债10年期买入占比最高,信用债以3年期及以下的短久期券种为主,其次是10年期及以上的长期和超长期券种。从负债角度看,基金以债券型基金的占比最高,债券基金的资金来源主要是机构投资者,尤其是银行自营和保险。因此,基金的负债稳定性相对较弱,对流动性和相对收益的要求较高,决定了基金需要通过加杠杆、拉久期和资质下沉等策略提高收益水平,在市场上更多表现为交易型资金。体现在债券资产配置上,基金需要更多地配置绝对收益较高的信用债;利率债方面,由于其他机构投资者通过基金投资政策性金融债的利息收入具有免税效应,因此利率债投资以政策性金融债为主。久期上,资本利得是相对收益的重要来源,因而多选择交易长久期的利率债,信用债则在综合考虑风险收益的情况下多选择短久期,长期和超长期信用债多为其他类信用债(含银行二级资本债)。
(三)理财
分券种来看,理财偏好信用债和同业存单。具体到期限,信用债以3年期及以下短久期为主。从负债角度看,理财的资金主要来源于个人投资者,风险偏好较低,对亏损的容忍程度一般,一旦发生破净就倾向于选择赎回。另外,对相对收益的考核要求也影响了理财的债券资产配置。理财需要投资绝对收益较高的信用债和同业存单,考虑到流动性和控制回撤,久期上多选择中短久期。
(四)保险
分券种来看,保险在地方债、国债、信用债和同业存单上的买入较为平均。具体到期限,政府债以超长期为主,信用债以10年期和超长期占比最高。从负债角度看,保险的资金主要来源于寿险的保费收入,负债期限长,稳定性强,收益要求高于存款和短久期资管。因此,资产配置上,保险会选择长期和超长期品种,在兼顾流动性和收益的情况下对利率债和信用债均衡配置。
(五)其他产品
分券种来看,其他产品同基金和理财一样,信用债占比最高,利率债占比则介于基金和理财之间。具体到期限,类似于基金和理财,其他产品的信用债也是3年期及以下期限占比最高,超长期信用债占比高于基金和理财,利率债主要偏好长久期。从负债角度看,以券商资管为例,过去由于资管新规的影响,券商资管的通道业务迅速下降,存量规模呈下行趋势,但在2024年4月打击手工补息后,存款资金部分流向券商资管,这部分资金对流动性和相对收益率要求较高,资产配置上对超长信用债的需求也更大。
机构交易胜率测算和领先因子探寻
(一)机构交易胜率测算
为衡量各类机构在债市交易表现如何,本文引入胜率这个指标。胜率的定义为:若买入后若干交易日期间利率下行,或卖出后若干交易日期间利率上行,则计为一次成功操作,反之则反。由于信用债收益率变动的趋势基本与利率债一致,因此本文以主要利率债交易品种10年期国债为例按年份进行交易胜率测算。机构的二级市场交易行为变动对债券收益率的影响可能更偏短期,中长期的利率走势或更多与宏观经济基本面有关,因此本文主要测算短期交易胜率,测算区间分别选择5个交易日(见图5)和10个交易日(见图6),胜率按年份进行统计,2021年从7月初起算,2024年截至6月末。
通过前述对机构的交易胜率的测算,本文发现,测算区间为5天时,机构交易胜率相对分化较大,基金的胜率相对偏低。这可能和基金的交易风格有关,基金的杠杆操作使其倾向于动量交易,容易出现超买和超卖的现象,短期内或放大收益率波动,导致市场情绪出现反转。除基金外其余主要买入机构的胜率基本在50%以上,一方面意味着各机构能识别和利用市场机会,另一方面可能也和机构投资风格相对稳健有关。
当测算区间调整为10天时,各主要买入机构的胜率分化现象有所收敛,包括基金在内的主要买入机构的胜率基本在50%以上,显示在该区间内,基金的动量交易的收益或更加稳定。另外也在一定程度上说明,买入机构总体上可以对市场短期趋势进行有效识别,通过机构交易数据的挖掘,能够发现债市趋势或反转信号,从而辅助进行交易决策。
(二)领先因子探寻
债券收益主要有以下两种来源:一是票息收入,二是资本利得。拉长久期和加杠杆是可以放大以上两种来源的工具。久期越大,杠杆越高,可以获得的票息收入越多,资本利得的波动也越大。因此,在利率下行阶段,机构通常使用拉长久期和加杠杆来增厚收益。通过分析二级市场的现券交易数据,我们可以对久期和买卖强度进行测度。这些指标不仅有助于评估市场交易情绪,还能为预测未来债券收益率的走势提供重要参考。
因此,针对久期以及买卖强度,本文主要观测3个因子:一是长久期债券交易活跃度,主要以各机构10年期以上国债的买入量占所有国债买入量的比重作为衡量活跃度的观测指标;二是买卖强度,净买入量较大实际上代表了机构的买入强度高,短期情绪较好;三是经久期调整的买卖强度,由于考虑到机构合计净卖出会使得加权久期产生误导性的结果,因此本文采用各期限债券久期的总量度量,即使用各期限的债券净买入量与相应久期相乘之和。它显示了在一定时期内,投资者倾向于购买哪些期限的债券,以及这种倾向的强度。相较长债交易活跃度,该因子考虑了机构偏谨慎时短久期策略的运用以及买入的强度;相较买卖强度,该因子考虑了久期的影响,整体来看结合了前两者的优点。在当前债券中枢整体下行的背景下,市场更为关心阶段反转的信号,而市场情绪的演绎更易由交易型资金来主导。因此本文以基金为例检验3个因子与30年期国债收益率的关系(见图7)。为便于观察,本文对3个因子进行了等比缩放处理。
可以发现经久期调整的买卖强度因子(因子3)与买卖强度因子(因子2)的走势较为一致,并且通常对因子2的极值有放大的作用,能够更好反映市场情绪的极端变化。根据历史数据规律,极值的定义为最近3个月内因子的绝对值达到最大并且超过近3个月均值的3倍。因子1对债券收益率变动方向有一定指示作用,但在收益率快速下行阶段表现可能会有所钝化,无法准确反映市场情绪的极端变化。综合而言,因子3对市场情绪的反应更为灵敏,当因子3处于极大值时,通常意味着当前市场的乐观情绪达到极致,利率到达阶段低点,短期内收益率多有上行;因子3处于极小值时,短期内收益率延续上行趋势或进入震荡行情。对这个规律的解释可能有以下几点:一是前期基金积累了较多的浮盈,市场的微小变动容易引发止盈情绪的快速增加,可以看到极小值通常跟随着极大值出现;二是基金对组合久期的快速调整可能显示资金面有所收敛、政策风险加大或基本面出现改善迹象,基金交易的灵活性使其具有一定领先性;三是基金的大量卖出代表市场恐慌情绪较重,短期内由于惯性驱使会继续上行。
尽管因子3能为我们指示某些时段内的市场动向,但其局限性也不容忽视,如因子对时间窗口具有敏感性,以及单因子难以反映市场的多重影响。为了增强预测的鲁棒性并捕捉更全面的市场行为,我们进一步采用更为前沿的方法——基于现券交易数据的神经网络模型。
基于现券交易数据的神经网络模型预测债券收益率变动
传统的债券收益率预测方法,如时间序列分析、回归模型等,虽然在一定程度上能够捕捉到收益率的变化趋势,但它们往往受限于模型的线性假设,难以充分捕捉市场数据的非线性特征和复杂动态。随着人工智能技术的发展,尤其是神经网络算法在金融领域的应用日益广泛,为债券收益率的预测提供了新的思路和工具。神经网络是一种强大的非线性模型,能够通过学习大量历史数据中的复杂模式和关系,对债券收益率的变动进行建模和预测。通过构建适当的神经网络架构,可以有效地处理和分析历史机构净买入数据和国债收益率数据,从而探索机构行为对债市收益率的影响。
(一)模型原理
神经网络模型(见图8)通常可以分为输入层、隐藏层和输出层,其中隐藏层和每个隐藏层中的神经元数目均可以有多个。为了寻找输入数据X和真实数据Y之间的关系,需要初始化输入层到隐藏层神经元的权重和偏置,再经过非线性函数激活、加权求和,最终到达输出层。由于激活函数是非线性,使得模型可以描述X和Y之间更复杂的关系。此时模型输出的Y’和真实数据Y尚存在差距,这个差距会通过目标函数来衡量,目标函数越小,代表Y’越接近于Y。之后,模型根据设置的学习率不断迭代更新初始权重和偏置,并采用随机梯度下降算法求解目标函数局部最小值,即达到对Y的最优预测。
(二)数据预处理
具体数据选择上,本文的输入数据主要使用当日(t日)和历史的国债收益率曲线,以及各机构国债的净买入数据,期限选择上包含短期、长期和超长期,以涵盖久期变化的信息,输出为预测期10年期国债收益率变动。国债收益率来源于万得(Wind)数据库,净买入数据来源于中国外汇交易中心。根据前述机构行为偏好分析以及调参验证,最终本文的历史国债收益率曲线选择10日前(t-10日),期限包括1年期、10年期和30年期,预测期选择10日后(t+10日),机构选择农商行、保险和基金。考虑到数据量与市场条件的平衡,本文做了两组训练,组一训练区间选择2021年7月—2023年12月,回测区间为2024年1—6月;组二训练区间为2021年7月—2024年3月,回测区间为2024年4—6月。另外,由于近两年处于债券利率下行期,债券收益率数据存在涨跌分布不均的问题,会影响模型预测的鲁棒性。本文对训练数据做了均衡化处理,在目标函数里对收益率向上和向下分别赋予不同的权重以应对该问题。
(三)模型构建和预测结果
模型构建上,本文根据训练数据实际情况对神经网络模型做了适应性调整。一是根据数据量选择适合的层数和神经元个数以防止过拟合;二是模型激活函数根据任务性质选择了Sigmoid非线性函数,解决了阶跃函数在0点无偏导数的问题;三是在目标函数中加入了正则项,以提高数值稳定性和模型的泛化能力。
训练过程中,本文首先尝试了不同的模型参数的初始化方法,发现区别不大,选择比较常见的对称区间均匀随机取值,避免程序收敛不稳定的问题;其次,对于参数的更新采用Adam方法,有助于调整不同参数的学习率,加速收敛并减少震荡;最后,对于训练的次数,本文发现数值越大一定程度上越收敛,通过多次随机来增强模型稳定性,提高准确度,而训练次数较少则容易陷入局部最优的困境。
通过上述模型预测10天后国债收益率,结果如图9所示,组一回测区间的最优准确率达到64%,组二达到75%,并且对于上行样本和下行样本的预测准确率均达到60%以上,表明模型具有一定的预测能力和稳定性,能够在不同市场条件下提供相对一致的预测,也说明机构交易行为可能对短期内国债收益率的变动具有领先性。
两组回测准确率的差异主要有以下几点:一是时间跨度不同的影响,组一回测区间的时间跨度更长,可能包含了更多的市场变化和不确定性,对模型的学习和泛化能力提出了更高的要求;二是组二训练区间更长,可能捕捉到了市场的新趋势;三是组一回测区间包含了收益率快速下行阶段,组二回测区间收益率呈震荡走势,或表明组二的训练模型在识别震荡期间的短期变动方面更为出色。
除了准确率之外,本文进一步采用精确度和F1分数对模型的预测性能进行了综合评估。其中,精确度指的是模型预测收益率上行/下行的样本中实际上行/下行的概率,F1分数则是准确率和精确度的调和平均数。由于F1分数综合考虑了精确度和准确率两个方面,避免了单一指标可能带来的问题,因此对模型性能的衡量更加全面。分析结果表明,模型对收益率上行和下行的预测精确度均达到60%以上,组二的预测精确度高于组一,体现出和准确率类似的特征。其中模型对下行趋势的预测表现更好,其精确度略高于上行情况。同样,模型的F1分数也高于60%(见图10)。这些指标的一致性表明了模型在不同市场变动下具有一定的稳健性。
总结
本文首先从负债、监管约束和考核机制等角度简要分析了主要净买入机构的券种和期限偏好。一方面,特定机构在特定期限券种上的定价权更大,偏好分析有助于明确特定期限的主要影响机构,在投资分析中抓住重点,在相应期限券种的交易上准确跟踪影响力较大的机构行为趋势和变化,并作出相应判断;另一方面,不同机构的交易风格不一,负债端更稳定的机构是市场中配置型资金的主要来源,市场情绪的演绎更易由交易型资金来主导,偏好分析为选择合适的市场情绪观测机构奠定了基础。
其次,机构的短期交易胜率的测算结果一方面反映出机构能够识别短期债市趋势;另一方面机构的交易偏好变化一定程度上预示着市场情绪和预期的变化,通过挖掘交易数据信号,有助于投资者预测市场动向。在此基础上,本文构造经久期调整的买卖强度因子,综合考虑了久期和买入强度这两个关键指征,发现基金的该因子极大值和极小值对判断债券收益率阶段底部和上行趋势是否结束有一定的领先意义。需要注意的是,机构行为的影响主要作用于短期,在基本面、资金面和债市供需未出现较大变化的情形下,交易型资金采取跟随策略较好,配置型资金则可以在因子极小值出现后逐步介入。
最后,为缓解单个因子存在的局限性和更全面地反映各主要机构交易行为的综合影响,本文采用更为前沿的方法神经网络模型研究了机构交易数据和收益率变动之间的关系。结果显示神经网络模型具有一定的预测能力和稳定性,对上行样本、下行样本以及不同的市场条件均有较高的准确率和精确度。模型的预测结果一方面可以帮助投资者识别市场趋势,作为投资时机选择和优化资产配置的参考,从而提高短期投资回报;另一方面也有助于投资者更好地管理投资组合的风险,比如通过调整久期或使用衍生品进行对冲。需要注意的是,受限于训练数据的样本量,模型的泛化能力、准确率以及精确度仍有提升空间。后续研究可以从以下几个方面开展,一是通过引入更多数据和市场情景,丰富训练集多样性,提高模型的适应性;二是本文主要考虑了微观因素的影响,未来可通过加入高频宏观数据,进一步提高模型的预测能力;三是加强对收益率变动幅度的预测,以更好地助力投资决策。
注:
1.其他产品包括证券公司的资产管理业务、信托公司的金融产品、企业年金、期货公司的资产管理产品、其他投资产品、社保基金、养老基金。
2.其他机构包括财务公司、信托投资公司、民营银行、资产管理公司、金融租赁公司、期货公司等。
参考文献
[1]傅雄广,侯国栋. 金融机构视角下的债券收益率影响因素与市场机制[J].金融市场研究,2022(4).
[2]类承曜,陈礼清. 中国债券市场的可预测性和分割性研究[J].经济理论与经济管理,2021,41(1).
[3]潘水洋,刘俊玮,王一鸣. 基于神经网络的股票收益率预测研究[J].浙江大学学报(理学版),2019,46(5).
[4]王琼. 基于切比雪夫正交基神经网络的中国十年期国债收益率预测[J].甘肃金融,2020(4).
[5]朱莹莹. 债券市场行为短期化的成因及影响分析[J]. 债券,2022(4). DOI: 10.3969/j.issn.2095-3585.2022.04.019.
◇ 本文原载《债券》2024年9月刊
◇ 作者:南京银行资金运营中心 邓露
◇ 编辑:丁杭超 鹿宁宁
发表评论