加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

知识图谱

(2018-03-25 07:29:55)
分类: 投资札记
  老网友应该比较了解,从2011年开始,我每天都会从财经网站转载几篇文章,并标注点评。这个习惯,坚持了7年。有很多人不理解,这样做到底有什么价值?当时,我是从李录对芒格的生活习惯描述中看到芒格每天早晨有晨读习惯,不看完报纸不会谈事,受此启发,我也开始规律性的大量阅读关注期刊文章。实话实说,当时我并没有深刻的意识到这种行为背后的科学原理
  有些网友,指出这种行为是无价值的,产生一堆博客,毫无意义。你不试过,你不会懂。这种习惯持续一年后,我自己能感受到变化。常人看来成群结队的所谓的软文,量达到一定程度之后,你的大脑计算能力和结果就会发生变化。现在我很清楚,这种行为恰恰是国内最顶级数据分析团队要求的,这套方法严格遵循大数据时代知识图谱构建理论,是知识形成与内化的重要方法
  我的做法,有些缺陷,已经导致数据脏化。博客,是有标签系统的。我转载的每篇文章,标签系统设计过于简单,仅转载一项5056篇,其中每篇文章的标签设计太简单,不利于数据分析。另外,文章的数量不够,量还没达到要求,我看到的顶尖高手量化速度,大概每天1小时,每年2500篇,全部采用量化分析系统标注,并且,运用大数据分析处理形成知识图谱。同样都是在2011年前后意识到这种方法会带来惊人效率,我和国内该领域最高水平选手之间的差距在于,我是潜意识、无理论支持,对方是该领域国内最高水平,这就是人与人之间的差距。即使,我在信息科技领域也存在多年知识和应用积累,我也无法超过业内最强数据分析专家对知识如何形成的理论和执行力。
  如果,你感兴趣,你可以努力去找哪本书、哪个人,系统的阐述过此方法的应用原理。我也是看过这本书,才更加深化了对该方法的理解。这个道理,就像是我做了,但我没悟透过。即使,我当下明白了,数据已经过去7年,已经脏化了,无法被有效的分析,只因数据收集阶段方法有问题。虽然,我有大量阅读,但是,现代科技要求在阅读的过程中,就要形成大数据化处理,以利于数据分析。有时候,我也想要去找自己曾经看过、写过的一篇文章,在漫山遍野的博客里找起来很麻烦,我也会意识到出问题了。同样是金融科技,你认为的Tech和真实的Tech之间的差异性,大概就是如此。懂和真懂,有很大差异性。
  知识图谱,是一种非常奇妙的数据结构。人工智能,不需要理解逻辑,只是需要处理海量数据中的关系性,通过相关性解决问题。无论是人脑,还是电脑,想要提高智能,很关键一点,就要形成足够庞大的知识图谱,从中逐步挖掘出因果
  
  

0

阅读 收藏 喜欢 打印举报/Report
前一篇:思维与进化
后一篇:井底之蛙
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有