《模型理论》连载八:第三章<股市统计信息>第一节 在信息中发现规律

标签:
模型理论连载孙国生 |
分类: 模型理论1 |
万物皆有规律,股市最明显的规律就是趋势。如何发现趋势的规律呢?股市的规律往往要依靠统计学和信息学的知识,统计建立在股市记忆的基础上,信息建立在股市周期的基础上。
第一节在信息中发现规律
炒股既简单又复杂,说它简单是因为炒股只有两种结果:不是赚就是赔(当然也有不赚不赔的情况,这种情况太少见而且不典型,故不予考虑);说它复杂是因为几乎每个股民都在股市里赚到过钱,但很少有人能够持久地赚下去;同样,每个投资者都在股市里赔过钱,但却很少有人知道如何才能不赔钱。
因此无数的人都想弄清楚股市的逻辑和内涵,上百年来无数的专家学者都在试图揭开股市的谜底。但是很遗憾,至今为止虽然有人发现了股市的一部分规律,甚至因此获得了诺贝尔奖,但是这些理论的有效性和持久性仍然受到质疑或者存在争议。
研究股市的逻辑和内涵需要的知识涉及了多种学科,影响股市变化的因素远远超出大多数人的想象。在众多的学科中,对股市的预测往往是建立在统计学和信息学的基础上,这两个学科是股市规律发现的源泉。
统计学和信息学是两个不同的学科,在某些问题上,它们互相接界、互相汇合。股市中的统计预测和信息预测就分别是以统计学和信息学这两门学科为基础的,所以,根据习惯上的理解,这两个学科各有独特的性质,但也并不排除它们之间的边缘接界或互相汇合。有一种学科分类把统计学归属到信息学中,把统计量也作为信息的一类特例,这样,统计预测也就包含在信息预测之中了。
当然,作为一名普通的投资者,没有必要精通这两个学科,规律的发现很艰难,规律的使用则是很简单。投资者虽不用掌握规律推导的过程,但也要有一定的了解,做到知其然并且知其所以然,这样在使用这些规律的时候,就能更加地得心应手,而且也能够在原有规律的基础上发现新的规律。
统计学与信息学
统计学(statistics)是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化分析、总结,做出推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。随着数字化的进程不断加快,人们越来越多地希望能够从大量的数据中总结出一些经验规律从而为后面的决策提供一些依据。统计学专业不是仅仅像其表面的文字表示的那样,只是统计数字,而是包含了调查、收集、分析、预测等。应用的范围十分广泛。
统计学的起源:统计学的英文statistics 最早源于现代拉丁文statisticumcollegium(国会)以及意大利文statista(国民或政治家)。德文Statistik,最早是由Gottfried Achenwall 于1749 年使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在19 世纪,统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair 引进到英语世界。
统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”“政治算数”和“统计分析科学”3 个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说,它是统计学在第3 个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴[1]。
实际上笔者认为,在股市中,统计学的概念更加贴近于应用统计学,即主要是调查、收集观察对象的数据信息,并通过描述统计等技术,分析观察对象的特征,发现事物的规律,进行预测、监督,以实现社会经济良性运行[2]。
信息学是研究信息的获取、处理、传递和利用的规律性的一门学科。信息可以认为是信息体系中的元素、元素集或子体系。那么,什么是信息体系?本文认为信息体系是受人们主观定义约束的秩序类。主观定义的约束可以是:某种理解、信念、设想、定理、法则、规律、法律、契约、编码等。
注[1]:以上内容援引自百度百科及百度文库。
注[2]:应用统计学的概念援引自百度文库。
有许多关于信息的定义。如“使消息中所描述事件出现的不定性减少”、“消息中所含的意义,它不随载荷它的物理设备形式的改变而改变”,又如“信息这个名称的内容是我们对外界进行调节,并使我们的调节为外界所了解时而与外界交换来的东西”[3]。
前文中有很多学术性的内容,有些读者读过之后仍然难以理解统计学和信息学和股市有什么关系,那么在股市中什么叫做统计学,什么叫做信息学呢?举个例子,比如某一只股票在10 个交易日内股价从1 元涨到100元,那么我们可以知道这只股票平均每天上涨10 元,这种通过统计数据得出规律的学科,就是统计学。
什么叫做信息学?同样以股价为例,通过研究,我们可以发现股价运行的高低点和这只股票历史走势中的高低点之间的关系。简单来说,就是研究某一个信息的出现对未来会产生什么样影响的学科,叫做信息学。
统计学在股市中的应用
统计学在股市中的应用,其实就是统计数据,进而得出结论或者发现规律的过程。
图3.1.A 年线统计规律
注[3]:本段内容部分引用自互联网。
如图3.1.A 是上证指数从1990 年至2016 年的年线图。这幅图所反映的信息实质上是把历年上证指数的高低点数据统计出来。仔细观察,就会发现其中的规律,指数出现连续2 年的上涨以后就容易出现高点。反映在上面的图中,就是连续的两根阳线之后指数就会发生转折,出现高点。
但是有些读者会发现,图中最左侧从1990 年到1993 年,连续4 年的上涨才出现高点1558.95,难道在最开始的一段时间,指数的运行就不符合这条规律么?实际上并非如此,上证指数是从1990 年12 月19 日才“上市”的,也就是说这一年总共也没有多少交易日;而高点1558.95 点出现在1993 年2 月16 日,也就是在1993 年刚开始没多久,揭开这些容易使投资者迷惑的“假象”,我们会发现股市中的规律更加清晰。
我们不妨来分析一下图3.1.A 中指数的走势,指数经历过1994、1995年两根阴线之后,同样在1996 年1 月出现了低点512.83;低点之后指数经过1996、1997 年2 年的上涨,在1997 年出现高点1510.180;1998 年指数走出一个阴十字星走势,1999 年到2000 年又是连续2 年的上涨,在2001 年出现高点2245.435;2001、2002 连续2 年下跌之后,在2003 年指数出现低点1307.395,2003 年短暂的上涨之后2004 至2005 年指数又是连续的下跌,2005 年出现低点998.228;2006 至2007 年股市走牛,指数出现连续2 年的大幅上涨,最终在2007 年出现高点6124.044;之后在2010、2011 年又是连续两根阴线,随后在2013 年指数出现了著名的“建国底”1949.457 点;2014、2015 年牛市启动,同样是两根阳线,指数出现了高点5178.190。
通过走势分析,我们可以发现,低点产生的规律与高点产生的规律正好是相对应的,即指数在连续2 年的下跌之后往往也会出现低点。
根据上图中指数走势反映出的数据,除了高低点产生的规律之外,细心的投资者还能够发现这样一条规律——大盘每隔4 年就会出现一个重要的顶部或者底部。如图3.1.B 所示:
图3.1.B 大盘重要顶底统计表
如图3.1.B 是指数重要顶底统计表格,可以看到,每间隔4 年,指数的走势就会出现一个重要的顶底,我们把每个重要的顶底在图3.1.A 中用黑色的折线标识出来,这样读者可以更加直观地看到这条规律。
这些规律比较直观,可以简单地用肉眼去发现,我们把周期缩小,规律的发现就会变得艰难,但不可否认的是,规律一直都是存在的。我们不妨来看一看把统计学应用到月线上又会发现什么样的规律,如图3.1.C
所示:
图3.1.C 月线统计规律
如图3.1.C 是上证指数从1997 年7 月到2016 年3 月的月K 线走势图。同样分析图中的走势来探寻指数在月线上的运行规律。
我们可以看到1998 年的6 月,指数产生了高点1422.979 点;经历过一轮涨跌之后,1999 年6 月指数再一次出现高点1756.183 点;下一个高点出现在2001 年6 月的2245.435 点;之后指数开始下跌,2002 年6 月出现波段高点1748.890 点;3 年之后指数在2005 年6 月出现低点998.228 点;之后开始了持续将近2 年的牛市行情,并且在2007 年6 月指数宽幅震荡,出现波段低点3404.146 点;牛市结束之后指数开始下跌,反弹之后开始震荡下跌走势,并于2010 年6 月出现波段转折行情,2013 年6 月出现牛市起涨点1849.653 点;2014 年6 月附近出现波段转折点;最终于2015 年6月出现重要高点5178.190 点。
图中标出了每年中6
月份出现转折的情况,可以看到,每年的6
月份是指数最容易出现转折的月份,大多数的转折都是发生在6
月份,就连近期的5178
点都是在6
月份产生的,如图3.1.D
所示:
图3.1.D 1998 年至2015 年6 月统计表
上图是1998 年至2015 年指数在6 月产生顶底的数据统计表,图中我们可以看到,从1998 年至今,几乎每一次指数的重要转折都是发生在6 月,并且月线上还可以发现一条规律:几乎每年的6 月份指数都会出现剧烈的震荡。
如果我们把图3.1.C 和表格3.1.B 结合起来的话就会发现,每隔4 年大盘都会在6 月出现重要点位,比如2001 年6 月是指数重要顶部;2005年6 月“千股下跌”;还有最近的2013 年1849 点牛市启动。
我们把统计学应用于日线,又会有怎样的发现呢?如图3.1.E
所示:
图3.1.E 日线统计规律
如图3.1.E 是上证指数从2015 年7 月24 日到2016 年3 月25 日的日K 线走势图。在日线上的规律我们就很难通过肉眼去发现了,但是借助数据的统计,仍然可以发现其中隐藏的秘密。
在图3.1.E中,笔者标注出了所有在星期四下跌的情况,可以看到的是,指数在星期四下跌的概率是比较高的,具体的统计数据如下表所示:
图3.1.F 近期周四涨跌情况统计表
图3.1.F 是指数从2015 年7 月24 日到2016 年3 月25 日之间所有星期四的涨跌情况统计表。图表中共统计了35 周中星期四的涨跌情况,排除2016 年2 月11 日、2015 年10 月1 日、2015 年9 月3 日3 个星期四不开盘之外,一共有17 根阴线,15 根阳线。也就是说这段时间的统计中星期四下跌的比例是53.125%。
通过近8 个月的走势统计,我们可以发现在一周中星期四指数出现下跌的概率是比较大的,这种“坑四跌”的现象是短期表现还是长期规律呢?
在进行统计时,我们可以通过延长统计时间来排除偶然因素的影响,笔者统计了上证指数从1990 年12 月19 日到2016 年3 月28 日共6180 根K 线,其中星期四下跌的概率在51% 左右,也就是说指数在星期四下跌的概率偏高这条规律是一直存在的。
通过统计我们可以发现,一周中指数在星期四下跌的概率比较高,那么在其他的日子里涨跌的概率又是如何呢?如图3.1.G 所示:
图3.1.G 指数一周中涨跌情况统计表
图3.1.G 是上证指数从1990 年12 月19 日到2016 年3 月28 日共6180 根K 线中,星期一到星期五的涨跌情况。可以看到,在一周中星期四指数下跌的概率是最高的,而星期五指数上涨的概率是最高的。
通过统计,我们可以发现这条规律,但规律的使用同样是一门学问,就像竹蜻蜓在中国千百年来都是玩具,而到了莱特兄弟手里却成了帮助飞机起飞的关键部件一样。如果投资者知道了这条规律,只是尽量避免在星期四进行买入的话,只能说明你对这条规律的理解还不够透彻。
其实对于短线投资者来说,这条规律的价值是最大的,做短线时完全可以在星期四的尾盘买进而在星期五收盘前卖出,这样的操作从概率上来说是最稳健的。
当然,在规律的使用中也有很多需要注意的地方,有些规律需要特殊的条件才能成立,而有些规律则具有时效性,例如股市中的很多规律都是通过历史的走势对未来走势的影响来实现的(比如前期重要的高低点对于股价的支撑和压力作用),包括笔者在内的许多研究者通过多个系统的测试和验证,发现中国股市的记忆时长是233 个交易日,233 个交易日之前的股价变动几乎不会对当前的股价走势造成影响。也就是说,参数超过233 个交易日的指标或者方法,其准确性是值得质疑的。