contact@digquant.com.cn
400-1860-552
官方群:463071731
从数学建模角度来讲讲股票预测

本文来源:超级数学建模


说起股票,想必每个人都知道。


股票市场在我国产生依赖并不断地成长,逐步成为证券业乃至整个金融业必不可少的组成部分,并且未来将受到越来越多投资者的关注,因而对股票市场走势的分析和预测都有重大的理论意义和可观的应用价值。


那么,股票真的可以预测吗?如果可以预测,应该采取怎样的技术和方法预测?预测的精度如何?


超模君决定从数学建模的角度来讲讲股票预测这回事。


先说说股票预测的可能性


耶鲁大学的Robert J.Shiller教授曾经做过这样的实验:他用excel画出了取了对数之后的美国不到两百年的标准普尔指数(S&P 500)的时间序列图,并且他随机生成了一条带漂移项和波动项的随机游走的样本轨道,这两者居然相差无几!(紫色为随机生成的随机游走样本轨道)




虽然总体上股票变动的预测趋势和实际相似,但是从图像来看,还是存在较大误差的。

在1982年,Engle开创性地提出了自回归条件异方差模型(简称ARCH模型),较好地模拟了股票波动中的丛聚性和时变性。后来国外多次实证应用等都证实ARCH能够提供较理想的数据模拟与预测效果。


1986年,伟大的科学家Taylor提出了随机波动模型,简称SV模型。这个模型是一类极具应用前景的金融波动模型。利用基本的SV对新西兰股市记性预测分析,发现该模型有很好的预测能力。G.B.Durham利用SV-mix模型对标准普尔500指数做了预测,认为预测效果很好。


ARCH模型和SV模型都是国外学者提出来的,能较好地预测国外的股市变化,但是对我国股市却不太适用。原因在于ARCH模型和SV模型都是基于传统统计学原理的模型,要求数据量大和数据有较好的分布。但由于我国股市从1900年上证交易所成立并开始交易算起,至今仅有18年历史。


在这18年中,政策、监管、股改等原因影响我国股市经历几次大起大落,加之上市公司数量有限并不断变化,造成原始数据在分布,样本量,数据完整性方面均不理想,因此基于统计学原理的预测模型ARCH模型和SV模型对我国股票收益率波动情况预测效果都不是那么好。


除了样本量的要求大这一缺点之外,ARCH和SV模型都是结构模型相对稳定、简单的,而且都属于单因素模型。但在实际中,预测环境复杂多变,一旦系统变量出现新的关系,该类模型则无法调整和适应。


由于样本量的要求问题,对我国股市的预测不适合采用SV模型和ARCH模型。那么,我国是否存在对股市预测的研究?有的话,是否存在适合我国股市预测的模型或者方法呢?

这里超模君用万方数据库进行股票预测的文章的检索,探究在国内对股票预测的研究情况。如下图所示



刚开始起点比较低,是和上文提及的我国成立股市交易所的时间相关的。成立时间较晚,学者在这方面的研究就相对较晚,相应的文献就较少。另外,从曲线图,我们可以得出结论:我国对股票预测是曲折向前的过程。


(在这里超模君为读者解释一下为什么是向前的。在2012~2014年的曲线变化不明显,可近似认为是直线。分析曲线上的极大值,总体上来看,极大值点是逐渐增大的,因此股票预测研究在国内是曲折增长的。)


进一步,超模君总结了在股市预测上所采用的方法,其中包括神经网络,时间序列,灰色预测,支持向量机,灰色预测,遗传算法等。


超模君针对以上几种方法对股市预测的效果进行分析。


1
灰色预测


灰色预测是一种对含有不确定因素的系统进行预测的方法。灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。其中,灰色GM(1,1)模型是最常用的一种灰色模型。


 2002年,陈海明,段进东两位学者将GM(1,1)模型马尔可夫模型结合起来,建立灰色—马尔可夫预测模型对上证指数进行预测,都高于GM(1,1)结果。后来,还有其他学者利用灰色GM(1,1)对股票进行预测,都得到好的成果。如,覃思乾应用灰色GM(1,1)对股票价格进行短期预测,精度明显高于ARIMA的结论。


学者施久玉利用灰色预测建立上海证券指数65日平均值运行轨道的最高点预测模型,其预测模型与市场值非常吻合。


2
神经网络


神经网络模型采用数据驱动,黑箱建模,无需先验信息,能够在信息资源不完整、不确定等复杂的数据环境下,通过自身结构的调整,提取数据特征,并对未来进行有效预测。

        

刘永福、伍海华等建立BP神经网络预测模型,对上证指数进行了预测,发现模型收敛速度快,学习能力强,预测精度高,误差率低,对股指的短期预测十分有效。我国学者通过实证研究表明,人工神经网络应用于我国股票市场的预测是可行的和有效的,有良好的前景。


但是利用神经网络进行股票价格波动预测,需要设定隐含层和权重,为了使模型达到令人满意的预测精度,需要对模型不断地进行调整。

3
支持向量机(SVM)


支持向量机是通过寻求结构风险化最小,实现经验风险和置信范围的最小,从而达到在统计样本较少的情况下,亦能获得良好统计规律的目的。SVM算法是一个凸优化问题,因此局部最优解一定是全局最优解。


学者杨一文等利用SVM对上海证券综合指数趋势做较准确的多步预测。学者赵金晶通过实验结果表明,该方法比神经网络方法以及时间序列方法的预测精度更高。


支持向量机有效地克服了神经网络收敛速度慢和局部极小点等缺陷,但是运用支持向量机需要确定核函数。核函数的确定对模型的预测效果起着重要作用。


然而目前没有一种好的方法来确定针对某一个问题,采用哪个函数是最适合的。


但是,如果对股市研究有一定深度的人就一定能够了解到,影响股票价格的变动的因素有很多。其中某些因素起着至关重要的作用,如政策,心理波动,国际突发事件等。然而这些因素由于受到模型本身处理方法和处理技术的限制,无法加入到上述模型中,导致模型的预测效果和真实值存在一定的误差。