加载中…
个人资料
珠峰剑情的博客
珠峰剑情的博客
  • 博客等级:
  • 博客积分:0
  • 博客访问:718,088
  • 关注人气:36,312
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
相关博文
推荐博文
谁看过这篇博文
加载中…
正文 字体大小:

大数据在彩票预测中的作用

(2019-01-13 21:12:51)
标签:

杂谈

大数据在彩票预测:《最简单的科学决策法》书中提到有很多基于统计的判断决策,使用简单的几个指标就能做得很好,再上更多的数据也不能让判断更准确。 作者赛斯也举了个例子。一个烧红的炉子,你只要触碰一下就知道这东西危险不能碰;可是要想知道喝咖啡能不能导致头痛,你大概要喝上几千杯才能看出效果来。

从上面的结果看:明显的效应只要小数据就够了,不明显的效应才需要大数据。 但必须用大数据才能得出的结论,并不是不重要的结论。

彩票研究的核心算法本身只需要几个指标参数调整好就可以得出很好的预测结果,但要做到长期有效达到盈利的目标就需要大数据作为验证和回归测试,这样才能确保算法的参数不止是在某个范围内有效而是能够达到长期有效的平衡点。

网上很多各种公式算法都声称自己99%命中而且给出了几十期的验证数据,在这个数据范围内验证确实非常有效非常令人心动,但往往一放大到500期,一千期,一万期,十万期历史开奖去验证就失效了,就跟理论概率差不多,甚至比理论概率更低了。

大数定律是概率预测不能绕过的,算法只能调整参数取一个接近理论概率的平衡值,跳过一些低于平均概率的范围投注。很多遗漏值在一千期内看已经达到很大了,比如遗漏了50期,直觉判断认为这个就是最大值了就是极值了,一旦达到45期开始投注应该很安全了可以加倍投注了,但往往一放大十万期的历史数据一验证超过50期遗漏的一大把,甚至超过100期遗漏的还有不少。

当你的维度太多而数据量太少的时候,你就容易发现这种假的强相关性。 实际上,如果你再用一组新的数据测试,你会发现那个变量根本不好使。这个假相关性,会给人一个可预测的错觉。就连专业研究人员都可能会犯这样的错误。

所以这也体现了“大”数据的必要性。如果你的数据量不够大,千万不要贸然声称自己发现了什么隐藏的规律。大数据,不是万能的。但是人很容易为数据痴迷。目前流行的深度学习算法也是通过输入大量数据进行训练才使得算法得出的结果越来越准确。

所以说彩票预测算法是核心,大数据是保证,通过大数据分析可以发现一些反直觉的结论,让投注的时候能够更加理性,更加不会盲目相信小部分历史数据得出的概率。


0

阅读 评论 收藏 转载 喜欢 打印举报/Report
  • 评论加载中,请稍候...
发评论

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有