首页 理论教育 数据选取的详细解释与优化方案

数据选取的详细解释与优化方案

时间:2023-07-17 理论教育 版权反馈
【摘要】:为了便于比较分析,沪深300指数和恒生指数两个市场的时间段选取相同,样本数据未作删除处理。在稳健性分析的过程中,将同时运用这两个市场指数的1分钟高频数据作为代表,进一步分析研究结论的稳健性。香港股市每天上午9:30至12:00、下午13:00至16:00共计交易5.5小时,66个5分钟高频数据,330个1分钟高频交易数据。

数据选取的详细解释与优化方案

本书主要从高频数据视角,对我国股票市场的高频波动率展开建模研究,并据此对我国股票市场的风险预测进行实证分析。根据以上阐述,在本书的实证研究中,将同时选取上海证券交易所、深圳证券交易所香港证券交易所对应的股票指数作为研究对象。因此,本书以包含了上海证券交易所和深圳证券交易所信息的沪深300指数以及香港恒生指数为新兴和成熟市场的代表。本书将我国股票市场选定为新兴市场的主要依据是:中国是世界第二大经济体,是最大的发展中国家;我国股票市场成立时间相对较短,目前还有很多制度诸如涨停板、大小非解禁等尚待完善之中;沪深股市在2018年6月被正式纳入了MSCI新兴市场指数;从具体市场价格来看,我国内地股票市场也常常发生较为剧烈的波动。因此,我国内地股票市场虽然总体市值已经较大,但仍频繁表现出“跳跃”“非对称”等波动的显著特征。故本书着重对此进行识别和计量,以期能够对我国股票市场已实现波动率进行准确建模。而我国香港股票市场,具有与国际接轨的T+0制度、无涨跌板的限制、国际投资者的比重占50%左右、香港股市的资金可以自由流动以及法律监管鲜明,信息披露透明,停牌制度灵活等特点,相比内地股票市场是更为成熟的股票市场。同时,从具体的市场价格变动来看,也较为稳定。因此,本书将我国香港股票市场作为成熟市场的样本展开研究,重点是为了对比分析本书所构建的刻画“跳跃”“杠杆效应”等特征的HAR模型(第3章)、HARQ模型(第4章)、HARQ-EVT-VaR模型(第5章)的效果,以增强研究结论的稳健性和普适性。

在研究对象的时间上,由于沪深300指数的起始时间为2005年,因此本书确定研究的具体样本周期为2005年1月1日至2017年12月31日。为了便于比较分析,沪深300指数和恒生指数两个市场的时间段选取相同,样本数据未作删除处理。

本书以股票市场的高频交易数据为具体的研究对象,那么具体什么样的数据才能够代表高频数据呢?在目前的研究中,既有以1分钟交易信息为高频数据的文献,也有以5分钟交易信息为高频数据的文献。在选取高频交易数据过程中需要注意的是,抽样频率和价格包含的噪声成反比关系,也就是说当一天的抽样频率越高意味着其抽样的时间间隔短,其抽样的次数将增多,但与此同时其交易价格本身所包含的噪声就会更大,最终导致由此所得出的分析结论可靠性降低,从而所得出的相关结论也不再有稳健性和可靠性。Andersen等(1998)在研究外汇交易波动时证实,其5分钟交易频率的数据有利于在时间频率(也就是精确性)和规避噪声两方面取得一个理性的效果,其用288个5分钟交易数据的平方和对外汇波动进行度量取得了较好的结果。另外,Andersen等(2001)、唐勇(2012)、叶五一和缪柏其(2012)、田凤平和杨科(2016)、马锋等(2017)、周思娟等(2017)学者在实证分析过程均采用5分钟交易数据,证明了利用5分钟交易数据作为高频数据的精确性和可靠性。基于以上分析,为了得出研究结论的稳健性,本书在实证分析过程中首先对沪深300指数及恒生指数均采用5分钟交易数据作为高频交易数据的代表,然后在此基础上计算各市场的已实现波动率(Realized Volatility,RV)并对其运用各类HAR模型进行建模分析。在稳健性分析的过程中,将同时运用这两个市场指数的1分钟高频数据作为代表,进一步分析研究结论的稳健性。同时,需要注意的是,内地股市和香港股市每一天的交易时间安排有所差异,每天的高频数据量不同。沪市和深市每天上午9:30至11:30,下午13:00至15:00共计4个小时,48个5分钟高频数据,240个1分钟高频交易数据。香港股市每天上午9:30至12:00、下午13:00至16:00共计交易5.5小时,66个5分钟高频数据,330个1分钟高频交易数据。据此得到2005年1月1日至2017年12月31日间,沪深300指数具有交易日3 159天,港市具有交易日3 203天,这一期间具体的市场价格日数据走势如图3-1所示。(www.xing528.com)

图3-1 恒生指数和沪深300指数样本期内日数据价格走势

从图3-1中可以发现,这一样本期间,各市场经历2006至2007年的剧烈上涨,同时又受到2008年次贷危机的影响,具有较大的波动,而内地股市则在2015年同样再次经历了股价的剧烈波动。因此,对整个包含了股价上涨、下跌及剧烈变化不同市场行情下样本期内波动率的研究,和现实市场行情更加吻合,相关的研究结论将更加具有可靠性。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈